摘要: 关于缺失值(missing value)的处理 在sklearn的preprocessing包中包含了对数据集中缺失值的处理,主要是应用Imputer类进行处理。 首先需要说明的是,numpy的数组中可以使用np.nan/np.NaN(Not A Number)来代替缺失值,对于数组中是否存在nan 阅读全文
posted @ 2019-01-08 20:58 溜哒兔 阅读(3626) 评论(0) 推荐(0) 编辑
摘要: 机器学习:从源数据清洗到特征工程建立谈金融反欺诈模型训练 本文旨在通过一个完整的实战例子,演示从源数据清洗到特征工程建立,再到模型训练,以及模型验证和评估的一个机器学习的完整流程。由于初识机器学习,会比较多的困惑,希望通过借助这个实战的例子,可以帮助大家对机器学习了一个初步的认识。 本文旨在通过一个 阅读全文
posted @ 2019-01-08 07:45 溜哒兔 阅读(6685) 评论(1) 推荐(0) 编辑