08 2016 档案

摘要:一、贝叶斯网络与朴素贝叶斯的区别 朴素贝叶斯的假设前提有两个第一个为:各特征彼此独立;第二个为且对被解释变量的影响一致,不能进行变量筛选。但是很多情况这一假设是无法做到的,比如解决文本分类时,相邻词的关系、近义词的关系等等。彼此不独立的特征之间的关系没法通过朴素贝叶斯分类器训练得到,同时这种不独立性 阅读全文
posted @ 2016-08-18 15:23 payton数据之旅 阅读(3366) 评论(0) 推荐(0) 编辑
摘要:Introduction In R, we often use multiple packages for doing various machine learning tasks. For example: we impute missing value using one package, th 阅读全文
posted @ 2016-08-08 15:20 payton数据之旅 阅读(935) 评论(0) 推荐(0) 编辑
摘要:简单说下安装过程,一般不会有问题,重点是RMySQL的使用方式。 系统环境说明 Redhat系统:Linux 460-42.6.32-431.29.2.el6.x86_64 系统编码:LANG=zh_CN.UTF-8(中文UTF-8格式) mysql版本:mysql Ver 14.14 Distri 阅读全文
posted @ 2016-08-02 19:01 payton数据之旅 阅读(1440) 评论(0) 推荐(0) 编辑
摘要:参考:xccd ,肖凯大牛的博客 ########## caret 包总结 ########### 使用caret::mdrr 1、降维 a)删除的变量是常数自变量,或者是方差极小的自变量: nearZeroVar:诊断预测变量是唯一值(即0方差自变量) nearZeroVar(x, freqCut 阅读全文
posted @ 2016-08-01 15:17 payton数据之旅 阅读(1123) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示