数据清洗--缺失值与重复值的处理
1.df.info()查看是否有缺失值:
2.df.isnull和df.notnull判断缺失值:
3.df.dropan()删除缺失值:
4.删除课程总数量为空的行:
5.将为NaN的值指定填充为0:
6.去除全部的重复值:
7.去除指定列的重复数据行:
8.直接删除数据生成新的副本,不修改原数据:
2.df.isnull和df.notnull判断缺失值:
3.df.dropan()删除缺失值:
4.删除课程总数量为空的行:
5.将为NaN的值指定填充为0:
6.去除全部的重复值:
7.去除指定列的重复数据行:
8.直接删除数据生成新的副本,不修改原数据: