随笔分类 -  R语言小技巧

摘要:#随机抽样:dataset是数据集;nrow是行,对应数据集样本个数。即随机抽样数据集的20%样本。 #设置随机种子数 set.seed(1) data_test<-sample(1:nrow(dataset),floor(.2*nrow(dataset))) #等距抽样:从1开始每个5个样本进行一 阅读全文
posted @ 2022-05-18 10:05 MisakaYier 阅读(1129) 评论(0) 推荐(0) 编辑
摘要:数组a 1)检查数组各元素是否为NA,NA返回TRUE,非NA返回FALSE is.nan(a) 2)检查数组个各元素是否为Inf,Inf返回TRUE,非Inf返回FALSE is.infinite(a) 3)确定NA或Inf元素在数组中的位置 which(is.na(a)==TRUE)) whic 阅读全文
posted @ 2022-03-24 16:07 MisakaYier 阅读(811) 评论(0) 推荐(0) 编辑
摘要:#通过向量建立时间序列格式,frequency是频率,比如季度为1年4季,月为1年12月,start为开始的时间 Timeseries<-ts(Vector,frequency=4,start=c(2012,1)) #展示时间序列 tsdisplay(Timeseries) 阅读全文
posted @ 2022-03-18 15:42 MisakaYier 阅读(685) 评论(0) 推荐(0) 编辑
摘要:1)R语言读取csv,txt数据 #读取txt文件,header文件首行是否包含变量名,sep表示文件中的分隔符,col.names列名称 col_names<-c("col1","col2","col3") data_txt<-read.table("traindata.txt",header=T 阅读全文
posted @ 2022-03-18 15:37 MisakaYier 阅读(2477) 评论(0) 推荐(0) 编辑
摘要:使用for循环向向量中循环添加计算之后的变量: #建立空向量vector vector<-c() m=1 #向vector中循环添加m的计算结果 for (i in 1:10) { m=m+5 vector<-c(vector,m) } #Out vector=6 11 16 21 26 31 36 阅读全文
posted @ 2022-03-18 11:00 MisakaYier 阅读(287) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示