R语言实现简单的网页数据抓取

全栈程序员-站长 • 2026年3月17日下午5:02 • 未分类 • 阅读 3

R语言实现简单的网页数据抓取在知乎遇到这样一个问题 https www zhihu com question answer 这是要爬取的内容的网页 R 语言的代码的实现方式如下安装 XML 包 install packages XML 载入 XML 包 library XML

在知乎遇到这样一个问题。

https://www.zhihu.com/question//answer/

R语言的代码的实现方式如下：

#安装XML包 >install.packages("XML") #载入XML包 > library(XML) #确定网页地址，通过网页地址分析网页表格 > url<-"http://hz.house.ifeng.com/detail/2014_10_28/50087618_1.shtml" > tbls<-readHTMLTable(url) > sapply(tbls,nrow) NULL NULL  93 8 #读取网页url的第一张表 > pop<-readHTMLTable(url,which = 1) #存储pop为CSV文档 > write.csv(pop,file="F:/pop.csv")

我们还可以保存为其他格式：

#保存为简单文本： >write.table(x, file = "*.txt") #保存为R格式文件： >save(x, file = "*.Rdata")

这里写图片描述

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们举报，一经查实，本站将立刻删除。

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/221896.html原文链接：https://javaforall.net

赞 (0)

0 0

关于作者

全栈程序员-站长

133.5K 文章

3 粉丝

本网站汇聚当前互联网主流语音，持续更新，欢迎关注公众号“全栈程序员社区”

Linux curses库使用

上一篇 2026年3月17日下午5:02

因果图法设计测试用例

下一篇 2026年3月17日下午5:03

java类的加载_Java高并发实战

java类的加载_Java高并发实战【版权申明】未经博主同意，谢绝转载！（请尊重原创，博主保留追究权）http://blog.csdn.net/javazejian/article/details/73413292出自【zejian的博客】关联文章：深入理解Java类型信息(Class对象)与反射机制深入理解Java枚举类型(enum)深入理解Java注解类型(@Annotation)深入理解

全栈程序员-站长
2022年8月11日
8
月之暗面

融资传言背后，月之暗面再向海外走了一步

融资传言背后，月之暗面再向海外走了一步

全栈程序员-站长
2026年3月12日
4
HTML占位符_怎么使用占位符

HTML占位符_怎么使用占位符HTML空格位占位符&#32;——普通的英文半角空格；&#160;、&nbsp;、&#xAO;、no-breakspace——普通的英文半角空格但不换行&#160;——中文全角空格（一个中文宽度）&#8194;、&ensp——en空格(半个中文宽度)&#8195;、&emsp…

全栈程序员-站长
2026年4月15日
4
tar打包的时候忽略一些目录[通俗易懂]

tar打包的时候忽略一些目录[通俗易懂]tar打包的时候忽略版本管理文件目录、日志文件目录、storage/app目录tar-zcvfweb.tar.gzweb–exclude-vcs–exclude=storage/logs–exclude=storage/app

全栈程序员-站长
2022年5月6日
218
阿里云服务器centos 7上安装Apache

阿里云服务器centos 7上安装Apache阿里云服务器centos 7上安装Apache

全栈程序员-站长
2022年4月23日
49
date类和calendar类的区别_java类中可以定义类吗

date类和calendar类的区别_java类中可以定义类吗Date类在JDK1.0中，Date类是唯一的一个代表时间的类，但是由于Date类不便于实现国际化，所以从JDK1.1版本开始，推荐使用Calendar类进行时间和日期处理。这里简单介绍一下Date类的使用。1、使用Date类代表当前系统时间 Dated=newDate(); System.out.pr

全栈程序员-站长
2025年12月7日
5

发表回复

关注全栈程序员社区公众号