摘要: 海阔凭鱼跃,天高任鸟飞! 阅读全文
posted @ 2018-09-05 09:41 DianaLi 阅读(118) 评论(0) 推荐(0) 编辑
摘要: 最近一段时间累惨了,学校生活是各种论文代码PPT,家庭生活是各种老妈孩子和忙碌。 我深深感受到了生活赋予我的压力与苦累,是真的很累,不管是心理还是生理。。。 我开始慢慢觉醒,慢慢感受生活的温度,我的思想和灵魂每天都在燃烧,每天都在重复激励自己一定要努力, 生活已然成为一种温度的体验,但是我不能因此怯 阅读全文
posted @ 2018-06-10 12:00 DianaLi 阅读(142) 评论(0) 推荐(0) 编辑
摘要: k折交叉验证(R语言) 原创: 三猫 机器学习养成记 2017-11-26 “ 机器学习中需要把数据分为训练集和测试集,因此如何划分训练集和测试集就成为影响模型效果的重要因素。本文介绍一种常用的划分最优训练集和测试集的方法——k折交叉验证。” k折交叉验证 K折交叉验证(k-fold cross-v 阅读全文
posted @ 2018-06-05 20:47 DianaLi 阅读(8467) 评论(0) 推荐(0) 编辑
摘要: R语言之Random Forest随机森林 什么是随机森林? 随机森林就是通过集成学习的思想将多棵树集成的一种算法,它的基本单元是决策树,而它的本质属于机器学习的一大分支——集成学习(Ensemble Learning)方法。随机森林的名称中有两个关键词,一个是“随机”,一个就是“森林”。“森林”我 阅读全文
posted @ 2018-06-05 20:40 DianaLi 阅读(4105) 评论(0) 推荐(0) 编辑
摘要: #####缺失值判断以及处理##### #举例1:向量类型判断缺失值is.na和缺失值的填补which (x<-c(1,2,3,NA)) is.na(x) #返回一个逻辑向量,TRUE为缺失值,FALSE为非缺失值 table(is.na(x)) #统计分类个数 sum(x) #当向量存在缺失值的时 阅读全文
posted @ 2018-06-05 20:36 DianaLi 阅读(858) 评论(0) 推荐(0) 编辑
摘要: awesome-machine-learning. 这里是包的导航清单,看起来更方便 >>>导航清单 通过这些翻译了解这些工具包,以后干活也就方便多了。不过翻译这个东西的确要靠耐心,翻译,编辑花费了至少一周的空余时间。 在编辑本文的过程中,惊喜的发现Awesome系列的其他资源:地址在github: 阅读全文
posted @ 2018-05-31 20:00 DianaLi 阅读(1130) 评论(0) 推荐(0) 编辑
摘要: 一、异常值检验 异常值大概包括缺失值、离群值、重复值,数据不一致。 1、基本函数 summary可以显示每个变量的缺失值数量. 2、缺失值检验 关于缺失值的检测应该包括:缺失值数量、缺失值比例、缺失值与完整值数据筛选。 [plain] view plain copy #缺失值解决方案 sum(com 阅读全文
posted @ 2018-05-31 13:33 DianaLi 阅读(2019) 评论(0) 推荐(0) 编辑
只有注册用户登录后才能阅读该文。 阅读全文
posted @ 2018-05-30 11:46 DianaLi 阅读(2) 评论(0) 推荐(0) 编辑