去重与替换

# 去重 duplicated()

s = pd.Series([1,1,1,1,2,2,2,3,4,5,5,5,5,5])
print(s[s.duplicated()==False])
 
out:      0    1
          4    2
          7    3
          8    4
          9    5
          dtype: int64        

 

# 移除重复值,默认inplace为False,生成新数据。 True则直接修改原数据。
s.drop_duplicates(inplace=True)
print(s)

 

# 替换 replace

s =pd.Series(list('ascaazsd'))
print(s)
print(s.replace(['a','s'],np.nan))
print(s.replace({'a':'hello','s':123})) # 多值,可以使用字典的形式的。

 

posted @ 2020-05-06 22:02  籽俊  阅读(119)  评论(0编辑  收藏  举报