数据挖掘------数据预处理之缺失值可视化
对于数据挖掘问题,经常遇到超过1000M的数据量,600多个特征,十万条数据,其中难免属性数据的缺失以及脏数据
数据预处理的过程,在特征选择之后往往进行缺失值和异常值的处理,缺失值的可视化非常直观地展示了缺失数据的结构。
1.未缺失数据:
2.构造缺失数据与可视化:
3.另外几种可视化方法,为特征选择做了足够的准备:
可视化的参考博客:
https://blog.csdn.net/andy_shenzl/article/details/81633356
数据挖掘基本流程和入门级别的方法如下:
每一个不曾起舞的日子,都是对生命的辜负。