草根程序员

吾生也有涯,而知也无涯。

  C++博客 :: 首页 :: 新随笔 :: 联系 :: 聚合  :: 管理 ::
  6 随笔 :: 0 文章 :: 0 评论 :: 0 Trackbacks
有关R语言的网络数据操作:
Rcurl包操作:
1)安装Rcurl ubuntu10.10
cmd:
install.packages(“RCurl”)
如果期间报错大致信息如下:
curl-config is not found in your path
 curl-config and related devlopment libraries (libcurl) are not installed.

 ERROR: configuration failed for package 'RCurl'
curl-config没有安装类似。。。使用apt-get install libcurl4-gnutls-dev
安装完毕。
library(bitops)
library(RCurl)

sina<-getUrl("http://www.sohu.com",encoding="utf-8")
Encoding(sina)
html <- readLines(con=textConnection(sina),encoding='utf8')
write.table(file="/tmp/f1.html',html)

利用RCurl包实现抓取。
R语言的base包socket通信
posted on 2011-12-12 09:46 向东 阅读(811) 评论(0)  编辑 收藏 引用