R语言实现简单的网页数据抓取-USB迷|专注于互联网分享

在知乎遇到这样一个问题。

这是要爬取的内容的网页：

R语言的代码的实现方式如下：

#安装XML包
>install.packages("XML")
#载入XML包
> library(XML)
#确定网页地址，通过网页地址分析网页表格
> url<-".shtml"
> tbls<-readHTMLTable(url)
> sapply(tbls,nrow)
NULL NULL 93    8 #读取网页url的第一张表
> pop<-readHTMLTable(url,which = 1)
#存储pop为CSV文档
> write.csv(pop,file="F:/pop.csv")

我们还可以保存为其他格式：

#保存为简单文本：
>write.table(x, file = "*.txt")
#保存为R格式文件：
>save(x, file = "*.Rdata")

R语言实现简单的网页数据抓取

在知乎遇到这样一个问题。

这是要爬取的内容的网页：

R语言的代码的实现方式如下：

#安装XML包
>install.packages("XML")
#载入XML包
> library(XML)
#确定网页地址，通过网页地址分析网页表格
> url<-".shtml"
> tbls<-readHTMLTable(url)
> sapply(tbls,nrow)
NULL NULL 93    8 #读取网页url的第一张表
> pop<-readHTMLTable(url,which = 1)
#存储pop为CSV文档
> write.csv(pop,file="F:/pop.csv")

我们还可以保存为其他格式：

#保存为简单文本：
>write.table(x, file = "*.txt")
#保存为R格式文件：
>save(x, file = "*.Rdata")

USB迷 | 专注于互联网分享

R语言实现简单的网页数据抓取

R语言实现简单的网页数据抓取

R语言实现简单的网页数据抓取

与本文相关的文章

评论列表 (0)