R之数据读取

转自:

fishatbanelo@yeah的博客

用R做数据分析的第一步,一定是将数据读入到R内存中。

下面我将总结下R读取各种数据的方法。想大家工作中常
遇到数据源一般就是txt/csv文档,excel文档以及数据库数据和网页数据。
 
我归纳下R读取这几种数据源的方法。
(1)txt/csv文件
read.table(file, header = FALSE,sep = "", quote = "\"'",
                  dec = ".", row.names, col.names,as.is = !stringsAsFactors,
                   na.strings = "NA", colClasses = NA, nrows = -1,
                   skip = 0, check.names = TRUE, fill = !blank.lines.skip,
                   strip.white = FALSE, blank.lines.skip = TRUE,comment.char = "#",
                   allowEscapes = FALSE, flush = FALSE,
                   stringsAsFactors = default.stringsAsFactors(),
                   fileEncoding = "", encoding = "unknown", text)
 
read.csv(file, header = TRUE, sep = ",", quote="\"", dec=".",fill = TRUE, comment.char="", ...)
函数参数较多,详细介绍可以在R中输入?read.table命令获得。
 
(2)excel 文件
由于excel可以另存为csv或txt文档故上面的方法是可以读取的。
其实用读取数据库数据份额方式是可以直接读取excel问文件的。
 
(3)数据库文件
http://f.dataguru.cn/forum.php?mod=viewthread&tid=12104
该贴很详细的介绍了如何读取数据库数据。
 
(4)网页数据
从网页直接读取数据,需要XML包
例子:
library(XML)
u="http://www.basketball-reference.com/players/b/bryanko01.html"
kobe <- readHTMLTable(readLines(u), which=2, header=TRUE)
heads(kobe,5)
以上例子读取的是NBA运动员Kobe的数据。
posted @ 2013-01-29 12:07  小Z&  阅读(548)  评论(0编辑  收藏  举报