https://www.cnblogs.com/jasonfreak/p/5448385.html 使用sklearn做单机特征工程 目录 1 特征工程是什么?2 数据预处理 2.1 无量纲化 2.1.1 标准化 2.1.2 区间缩放法 2.1.3 标准化与归一化的区别 2.2 对定量特征二值化 2 Read More
posted @ 2019-02-18 13:08 大树的博客 Views(140) Comments(0) Diggs(0) Edit
地址 https://github.com/apachecn/hands-on-ml-zh 目录结构 零、前言 第一部分 机器学习基础 一、机器学习概览 二、一个完整的机器学习项目 三、分类 四、训练模型 五、支持向量机 六、决策树 七、集成学习和随机森林 八、降维 第二部分 神经网络与深度学习 九 Read More
posted @ 2019-02-18 13:06 大树的博客 Views(1232) Comments(0) Diggs(0) Edit
预处理 离散化 等值分箱 等量分箱 独热 one-hot 标准化 最小最大 min-max z-score l2 标准化 归一化 特征选择 ANOVA 信息增益/信息增益率 模型验证 评价指标 回归 MSE R 方 分类 准确率 精确率 召回率 F1 得分 宏平均 F1 微平均 F1 聚类 互信息 Read More
posted @ 2019-02-18 12:54 大树的博客 Views(386) Comments(0) Diggs(0) Edit
机器学习概念 定义:对于某给定的 ,在合理的 的前提下,某计算机程序可以自主学习任务T的 ; 随着提供合适、优质、大量的经验E,该程序对于任务T的性能逐步提高。 从机器学习的概念转化为实际的开发思路: 算法T:根据业务需要和数据特征,选择则相关的算法。模型E:基于数据和算法构建出来的模型。评估/测试 Read More
posted @ 2019-02-18 12:41 大树的博客 Views(398) Comments(0) Diggs(0) Edit