去重与替换
# 去重 duplicated() s = pd.Series([1,1,1,1,2,2,2,3,4,5,5,5,5,5]) print(s[s.duplicated()==False]) out: 0 1 4 2 7 3 8 4 9 5 dtype: int64
# 移除重复值,默认inplace为False,生成新数据。 True则直接修改原数据。 s.drop_duplicates(inplace=True) print(s)
# 替换 replace s =pd.Series(list('ascaazsd')) print(s) print(s.replace(['a','s'],np.nan)) print(s.replace({'a':'hello','s':123})) # 多值,可以使用字典的形式的。