摘要: 来源:http://www.cnblogs.com/jasonfreak/p/5619260.html 目录 1 为什么要记录特征转换行为?2 有哪些特征转换的方式?3 特征转换的组合4 sklearn源码分析 4.1 一对一映射 4.2 一对多映射 4.3 多对多映射5 实践6 总结7 参考资料 阅读全文
posted @ 2017-12-23 16:03 蘭亭客 阅读(370) 评论(0) 推荐(0) 编辑
摘要: 目录 1 使用sklearn进行数据挖掘 1.1 数据挖掘的步骤 1.2 数据初貌 1.3 关键技术2 并行处理 2.1 整体并行处理 2.2 部分并行处理3 流水线处理4 自动化调参5 持久化6 回顾7 总结8 参考资料 1 使用sklearn进行数据挖掘 1.1 数据挖掘的步骤 数据挖掘通常包括 阅读全文
posted @ 2017-12-23 15:58 蘭亭客 阅读(503) 评论(0) 推荐(0) 编辑
摘要: 目录 1 特征工程是什么?2 数据预处理 2.1 无量纲化 2.1.1 标准化 2.1.2 区间缩放法 2.1.3 标准化与归一化的区别 2.2 对定量特征二值化 2.3 对定性特征哑编码 2.4 缺失值计算 2.5 数据变换 2.6 回顾3 特征选择 3.1 Filter 3.1.1 方差选择法 阅读全文
posted @ 2017-12-23 15:52 蘭亭客 阅读(205) 评论(0) 推荐(0) 编辑
摘要: 1.环境查看a.系统版本查看 [hadoop@p168 ~]$ cat /etc/redhat-release CentOS Linux release 7.2.1511 (Core) b.系统中文字体查看 [hadoop@p168 ~]$ fc-list :lang=zh /usr/share/f 阅读全文
posted @ 2017-12-23 11:15 蘭亭客 阅读(1670) 评论(0) 推荐(0) 编辑