03 2019 档案
摘要:1.数据处理的主要操作 2.离散化与连续化 3.特征提取与构造 4.数据选择与构造 5.缺失值的处理 6.多重共线性和内生性 1. 数据处理的主要操作 映射与收集数据 :我们获得数据后需要对数据的每一列都定义属性,这样才方便我们接下来的数据处理。 缩放大型数据:对于使用数据不一定要全部使用,我们应该
阅读全文
摘要:1. 看待机器学习问题的两个角度 2.假设检验的思路 3.模型陷阱与模型幻觉 4.二元分类的原理 5.ROC与AUC曲线 1. 看待机器学习问题的两个角度 在看待一个数据问题时,我们需要从两个角度去看待问题,一是从机器学习角度去看待问题,另一个就是从概率的角度看待问题,这样我觉得可以解释很多初学者在
阅读全文