随笔分类 -  R

摘要:应用ARIMA(1,1,0)对2015年1月1日到2015年2月6日某餐厅的销售数量做为期5天的预测 setwd('D:\\dat') #install.packages("forecast") #install.packages("plyr") #install.packages("fUnitRo 阅读全文
posted @ 2018-11-29 21:55 Cynical丶Gary 阅读(719) 评论(0) 推荐(0) 编辑
摘要:聚类分析 百度百科:传送门 聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程 聚类与分类的不同在于,聚类所要求划分的类是未知的 聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。聚类分析所使用方法的不同,常常 阅读全文
posted @ 2018-11-29 21:14 Cynical丶Gary 阅读(3055) 评论(0) 推荐(0) 编辑
摘要:BP神经网络 百度百科:传送门 BP(back propagation)神经网络:一种按照误差逆向传播算法训练的多层前馈神经网络,是目前应用最广泛的神经网络 #设置文件工作区间 setwd('D:\\dat') #读入数据 Gary=read.csv("sales_data.csv")[,2:5] 阅读全文
posted @ 2018-11-29 20:39 Cynical丶Gary 阅读(2655) 评论(0) 推荐(0) 编辑
摘要:dvdtrans.csv数据:该原始数据仅仅包含了两个字段(ID, Item) 用户ID,商品名称(共30条) #导入arules包 #install.packages("arules") library (arules) setwd('D:\\data') Gary=read.csv(file=" 阅读全文
posted @ 2018-11-02 23:15 Cynical丶Gary 阅读(591) 评论(0) 推荐(0) 编辑
摘要:RGui的arules程序包里含有Groceries数据集,该数据集是某个杂货店一个月真实的交易记录,共有9835条消费记录,169个商品 #install.packages("arules") library(arules) setwd('D:\\data') #读入数据 #Groceries数据 阅读全文
posted @ 2018-11-01 22:53 Cynical丶Gary 阅读(3630) 评论(3) 推荐(0) 编辑
摘要:查看数据menu_orders.txt文件存在多少条关联规则,并按支持度降序排序输出 #导入arules包 install.packages("arules") library ( arules ) setwd('D:\\data') Gary<- read.transactions("menu_o 阅读全文
posted @ 2018-11-01 21:41 Cynical丶Gary 阅读(906) 评论(0) 推荐(0) 编辑
摘要:对book3.csv数据集,实现如下功能: (1)创建训练集、测试集 (2)用rpart包创建关于类别的cart算法的决策树 (3)用测试集进行测试,并评估模型 book3.csv数据集 setwd('D:\\data') list.files() dat=read.csv(file="book3. 阅读全文
posted @ 2018-10-20 14:13 Cynical丶Gary 阅读(1379) 评论(0) 推荐(0) 编辑
摘要:鸢尾花卉数据集Iris是一类多重变量分析的数据集 通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类 针对iris数据集实践决策树算法(C4.5、C5.0),并用交叉矩阵评估模型 iris数据RStudio 阅读全文
posted @ 2018-10-20 08:40 Cynical丶Gary 阅读(3322) 评论(0) 推荐(0) 编辑
摘要:data(churn)导入自带的训练集churnTrain和测试集churnTest 用id3、cart、C4.5和C5.0创建决策树模型,并用交叉矩阵评估模型,针对churn数据,哪种模型更合适 决策树模型 ID3/C4.5/CART算法比较 传送门 data(churn)为R自带的训练集,这个d 阅读全文
posted @ 2018-10-20 08:40 Cynical丶Gary 阅读(1544) 评论(0) 推荐(0) 编辑
摘要:使用R语言对"教师经济信息"进行逻辑回归分析 (1)按3:1的比例采用简单随机抽样方法,创建训练集和测试集 (2)用训练集创建逻辑回归模型 (3)用测试集预测贷款结果,并用table统计分类的最终结果 (4)计算 评价指标:总体准确率、准确(分类)率、误分类率、正例的覆盖率、正例的命中率、负例的命中 阅读全文
posted @ 2018-10-13 10:23 Cynical丶Gary 阅读(1339) 评论(0) 推荐(0) 编辑
摘要:对11_1_4.csv成绩表进行主成分分析处理 setwd('D:\\data') list.files() #读取数据 dat=read.csv(file="11_1_4.csv",header=TRUE) dat=dat[,-c(1,2,10,11)] #主成分分析 PCA=princomp(d 阅读全文
posted @ 2018-09-28 23:40 Cynical丶Gary 阅读(615) 评论(0) 推荐(0) 编辑
摘要:对“癌症.csv”中的肾细胞癌组织内微血管数进行连续属性的离散化处理 增加“微血管数分类1”属性,取值为等宽类别值(分为5类),增加“微血管数分类2”属性,取值为自定义类别值(0~40,41~60,61~120,121~150,151~200,201~250),增加“微血管数分类3”属性,取值为等频 阅读全文
posted @ 2018-09-28 23:23 Cynical丶Gary 阅读(568) 评论(0) 推荐(0) 编辑
摘要:对成绩表"11_1_1.csv" "11_2_1.csv"进行集成,并重新计算4门课程的平均分为综合测评,增加“排名”属性,并按排名排序 "11_1_1.csv","11_2_1.csv"是两个不同班级的学生 setwd('D:\\data') #读取数据 dat1=read.csv('./11_1 阅读全文
posted @ 2018-09-28 19:28 Cynical丶Gary 阅读(555) 评论(0) 推荐(0) 编辑
摘要:农场申请贷款.csv 对“农场申请贷款.csv”中农场大小、降雨量、农场质量、农场收入进行数据规范化处理 行数[4 5 6 7] “农场申请贷款.csv”中存在缺失值,已对数据进行预处理 setwd('D:\\data') list.files() #数据读取 dat=read.csv(file=" 阅读全文
posted @ 2018-09-27 20:41 Cynical丶Gary 阅读(3240) 评论(0) 推荐(0) 编辑
摘要:对“Gary.csv”中数据进行进行属性构造处理,增加“总成绩”属性 Gary.csv setwd('D:\\data') list.files() #数据读取 dat=read.csv(file="Gary.csv",header=TRUE) #构造属性 sum=(dat[,2]+dat[,3]+ 阅读全文
posted @ 2018-09-27 01:10 Cynical丶Gary 阅读(367) 评论(0) 推荐(0) 编辑
摘要:对“癌症.csv”中的肾细胞癌组织内微血管数进行连续属性的等宽离散化处理(分为3类),并用宽值找替原来的值 癌症.csv setwd('D:\\data') list.files() dat=read.csv(file="癌症.csv",header=TRUE) #等宽离散化 v1=ceiling( 阅读全文
posted @ 2018-09-27 00:54 Cynical丶Gary 阅读(863) 评论(0) 推荐(0) 编辑
摘要:“Gary1.csv”、“Gary2.csv”、“Gary3.csv”中保存了一个班级学生三个学期的成绩 对三个学期中的成绩数据进行集成并重新计算综合成绩和排名,并按排名顺序排布(学号9位数111304001~11304047) Gary1.csv中数据 Gary2.csv中数据 Gary3.csv 阅读全文
posted @ 2018-09-25 00:23 Cynical丶Gary 阅读(2047) 评论(0) 推荐(0) 编辑
摘要:对“Gary.csv”中的成绩数据进行统计量分析 用cor函数来计算相关性,method默认参数是用pearson;并且遇到缺失值,use默认参数everything,结果会是NA 相关性分析 当值r>1时,正相关,一个变量增加或减少时,另一个变量也相应增加或减少 当值r=1时,无相关,说明两个变量 阅读全文
posted @ 2018-09-15 20:21 Cynical丶Gary 阅读(2168) 评论(0) 推荐(0) 编辑
摘要:对“Gary.csv”中的成绩数据进行统计量分析 基础数据分析 均值 中位数 极差 标准差 变异系数 1/4分位数 3/4分位数 四分位间距... ...分析 setwd('D:\\data') #更改工作目录 list.files() #列出当前工作目录下的文件 dat=read.csv(file 阅读全文
posted @ 2018-09-15 16:44 Cynical丶Gary 阅读(1428) 评论(0) 推荐(0) 编辑
摘要:对“Gary.csv”中的成绩数据进行分布分析 (1)按0-59,60-69,70-79,80-89,90-100分组绘制高级语言程序设计成绩的频率分布直方图。 (2)按0-59,60-69,70-79,80-89,90-100分组绘制计算机导论成绩的分布饼图。 (3)绘图前4门课程的折线比较图。 阅读全文
posted @ 2018-09-15 16:00 Cynical丶Gary 阅读(8192) 评论(0) 推荐(0) 编辑