Fork me on GitHub

# 机器学习算法总结-第四天(SKlearn/数据处理and特征工程)

总结:

  1. 量纲化(归一化,标准化)
  2. 缺失值处理(补0、均值、中值、众数、自定义)
  3. 编码/哑变量:忽略数字中自带数学性质(文字->数值类型)
    Alt text
  4. 连续特征离散化(二值化/分箱处理)
    Alt text
    Alt text
    Alt text
    Alt text
    Alt text
    Alt text
    Alt text
    Alt text
    Alt text
    Alt text
    Alt text
    Alt text
posted @ 2019-05-17 15:08  Afant1  阅读(189)  评论(0编辑  收藏  举报