2017年9月11日

谁动了我的特征?——sklearn特征转换行为全记录

摘要: 目录 1 为什么要记录特征转换行为?2 有哪些特征转换的方式?3 特征转换的组合4 sklearn源码分析 4.1 一对一映射 4.2 一对多映射 4.3 多对多映射5 实践6 总结7 参考资料 1 为什么要记录特征转换行为? 使用机器学习算法和模型进行数据挖掘,有时难免事与愿违:我们依仗对业务的理 阅读全文

posted @ 2017-09-11 18:12 多一点 阅读(418) 评论(0) 推荐(1) 编辑

使用sklearn做单机特征工程

摘要: 目录 1 特征工程是什么?2 数据预处理 2.1 无量纲化 2.1.1 标准化 2.1.2 区间缩放法 2.1.3 标准化与归一化的区别 2.2 对定量特征二值化 2.3 对定性特征哑编码 2.4 缺失值计算 2.5 数据变换 2.6 回顾3 特征选择 3.1 Filter 3.1.1 方差选择法 阅读全文

posted @ 2017-09-11 18:07 多一点 阅读(269) 评论(1) 推荐(0) 编辑

使用sklearn优雅地进行数据挖掘

摘要: 目录 1 使用sklearn进行数据挖掘 1.1 数据挖掘的步骤 1.2 数据初貌 1.3 关键技术2 并行处理 2.1 整体并行处理 2.2 部分并行处理3 流水线处理4 自动化调参5 持久化6 回顾7 总结8 参考资料 1 使用sklearn进行数据挖掘 1.1 数据挖掘的步骤 数据挖掘通常包括 阅读全文

posted @ 2017-09-11 18:06 多一点 阅读(393) 评论(1) 推荐(0) 编辑

matplotlib 散点图scatter

摘要: 最近开始学习python编程,遇到scatter函数,感觉里面的参数不知道什么意思于是查资料,最后总结如下: 1、scatter函数原型 2、其中散点的形状参数marker如下: 3、其中颜色参数c如下: 4、基本的使用方法如下: [python] view plain copy #导入必要的模块 阅读全文

posted @ 2017-09-11 17:58 多一点 阅读(2781) 评论(2) 推荐(0) 编辑

使用Python进行描述性统计

摘要: 目录 1 描述性统计是什么?2 使用NumPy和SciPy进行数值分析 2.1 基本概念 2.2 中心位置(均值、中位数、众数) 2.3 发散程度(极差,方差、标准差、变异系数) 2.4 偏差程度(z-分数) 2.5 相关程度(协方差,相关系数) 2.6 回顾3 使用Matplotlib进行图分析 阅读全文

posted @ 2017-09-11 17:39 多一点 阅读(8538) 评论(0) 推荐(0) 编辑

pandas将字段中的字符类型转化为时间类型,并设置为索引

摘要: 假设目前已经引入了 pandas,同时也拥有 pandas 的 DataFrame 类型数据。 import pandas as pd 数据集如下 df.head(3) date open close high low volume code 0 2006-12-18 3.905 3.886 3.9 阅读全文

posted @ 2017-09-11 17:26 多一点 阅读(2492) 评论(1) 推荐(0) 编辑

导航