摘要: k折交叉验证(R语言) 原创: 三猫 机器学习养成记 2017-11-26 “ 机器学习中需要把数据分为训练集和测试集,因此如何划分训练集和测试集就成为影响模型效果的重要因素。本文介绍一种常用的划分最优训练集和测试集的方法——k折交叉验证。” k折交叉验证 K折交叉验证(k-fold cross-v 阅读全文
posted @ 2018-06-05 20:47 DianaLi 阅读(8467) 评论(0) 推荐(0) 编辑
摘要: R语言之Random Forest随机森林 什么是随机森林? 随机森林就是通过集成学习的思想将多棵树集成的一种算法,它的基本单元是决策树,而它的本质属于机器学习的一大分支——集成学习(Ensemble Learning)方法。随机森林的名称中有两个关键词,一个是“随机”,一个就是“森林”。“森林”我 阅读全文
posted @ 2018-06-05 20:40 DianaLi 阅读(4105) 评论(0) 推荐(0) 编辑
摘要: #####缺失值判断以及处理##### #举例1:向量类型判断缺失值is.na和缺失值的填补which (x<-c(1,2,3,NA)) is.na(x) #返回一个逻辑向量,TRUE为缺失值,FALSE为非缺失值 table(is.na(x)) #统计分类个数 sum(x) #当向量存在缺失值的时 阅读全文
posted @ 2018-06-05 20:36 DianaLi 阅读(858) 评论(0) 推荐(0) 编辑