随笔分类 - R语言小技巧
摘要:#随机抽样:dataset是数据集;nrow是行,对应数据集样本个数。即随机抽样数据集的20%样本。 #设置随机种子数 set.seed(1) data_test<-sample(1:nrow(dataset),floor(.2*nrow(dataset))) #等距抽样:从1开始每个5个样本进行一
阅读全文
摘要:数组a 1)检查数组各元素是否为NA,NA返回TRUE,非NA返回FALSE is.nan(a) 2)检查数组个各元素是否为Inf,Inf返回TRUE,非Inf返回FALSE is.infinite(a) 3)确定NA或Inf元素在数组中的位置 which(is.na(a)==TRUE)) whic
阅读全文
摘要:#通过向量建立时间序列格式,frequency是频率,比如季度为1年4季,月为1年12月,start为开始的时间 Timeseries<-ts(Vector,frequency=4,start=c(2012,1)) #展示时间序列 tsdisplay(Timeseries)
阅读全文
摘要:1)R语言读取csv,txt数据 #读取txt文件,header文件首行是否包含变量名,sep表示文件中的分隔符,col.names列名称 col_names<-c("col1","col2","col3") data_txt<-read.table("traindata.txt",header=T
阅读全文
摘要:使用for循环向向量中循环添加计算之后的变量: #建立空向量vector vector<-c() m=1 #向vector中循环添加m的计算结果 for (i in 1:10) { m=m+5 vector<-c(vector,m) } #Out vector=6 11 16 21 26 31 36
阅读全文