R之数据读取
转自:
fishatbanelo@yeah的博客
用R做数据分析的第一步,一定是将数据读入到R内存中。
下面我将总结下R读取各种数据的方法。想大家工作中常
遇到数据源一般就是txt/csv文档,excel文档以及数据库数据和网页数据。
我归纳下R读取这几种数据源的方法。
(1)txt/csv文件
read.table(file, header = FALSE,sep = "", quote = "\"'",
dec = ".", row.names, col.names,as.is = !stringsAsFactors,
na.strings = "NA", colClasses = NA, nrows = -1,
skip = 0, check.names = TRUE, fill = !blank.lines.skip,
strip.white = FALSE, blank.lines.skip = TRUE,comment.char = "#",
allowEscapes = FALSE, flush = FALSE,
stringsAsFactors = default.stringsAsFactors(),
fileEncoding = "", encoding = "unknown", text)
read.csv(file, header = TRUE, sep = ",", quote="\"", dec=".",fill = TRUE, comment.char="", ...)
函数参数较多,详细介绍可以在R中输入?read.table命令获得。
(2)excel 文件
由于excel可以另存为csv或txt文档故上面的方法是可以读取的。
其实用读取数据库数据份额方式是可以直接读取excel问文件的。
(3)数据库文件
http://f.dataguru.cn/forum.php?mod=viewthread&tid=12104
该贴很详细的介绍了如何读取数据库数据。
(4)网页数据
从网页直接读取数据,需要XML包
例子:
library(XML)
u="http://www.basketball-reference.com/players/b/bryanko01.html"
kobe <- readHTMLTable(readLines(u), which=2, header=TRUE)
heads(kobe,5)
以上例子读取的是NBA运动员Kobe的数据。