我想这篇博客内容可能比较散,因为我没有任何思路,可能想到哪里写到哪里,工作中用到什么功能写什么功能。
1. drop_duplicates
drop_duplicates()
的作用是删除重复行,首先,有这么一个DataFrame
![在这里插入图片描述](https://img-blog.csdnimg.cn/20181031201234747.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3h0ZmdlMDkxNQ==,size_16,color_FFFFFF,t_70)
df.drop_duplicates()
后的结果:
![在这里插入图片描述](https://img-blog.csdnimg.cn/20181031201857477.jpg)
drop_duplicates()
还可以指定要判断的列,比如我们要删除A,B,C重复的行:
df.drop_duplicates(['A','B','C'])
2. fillnan
fillnan
可以用指定值填充无效值(NAN)
![在这里插入图片描述](https://img-blog.csdnimg.cn/20181031202233909.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3h0ZmdlMDkxNQ==,size_16,color_FFFFFF,t_70)