机器学习实践02
今天主要观看了数据预处理部分的视频,完成了数据预处理部分的学习
数据预处理模块主要是对缺失值进行填补、删减数据列、统计一些最大值最小值之类的
缺失值处理包括将缺失值填充为平均数、众数、或者是建立模型进行预测,并对不同类型的特征进行不同缺失值的处理
离群值检测有基于统计的方法,基于近邻的方法,实例有sklearn中的离群值检测,以及怎样处理离群值
标准化就是将数据按照原有规模进行缩放到特定区间,有Z-Score标准化和Min-Max标准化两种‘
离散化和特征值编码就是将非数值特征转化为数值型特征,有多种编码方式
最后学习了一个基于共享单车时租数量预测的案例,综合运用了上面的数据预处理方法。
posted on 2021-02-28 22:17 yangliuliu 阅读(28) 评论(0) 编辑 收藏 举报