知识点小结1

1.通过pd.DataFrame新建数据框

2.通过df.iloc[]选择特定的列或对象

3.使用Pandas的isnull()判断值是否为空

4.使用all()和any()判断每列包含至少一个为Ture或全部为Ture的情况

5.使用pandas的dropna可以直接删除缺失值

6.使用SKlearn.preprocessing中的Imputer方法对缺失值进行填充和替换,支持3种填充方法

7.使用pandas的fillna填充缺失值,支持更多自定义的值和常用预定义方法

8.通过copy()获得一个对象副本,常用于原始对象和复制对象同时操作的场景

9.通过for循环遍历可迭代的列表值

10.自定义了Z-Score计算公式

11.通过pandas的duplicated()判断重复数据记录

12.通过pandas的drop_duplicated()删除重复数据记录,可指定特定列或全部

posted @ 2018-12-06 11:02  秋雨秋雨秋雨  阅读(101)  评论(0编辑  收藏  举报