数据转换--替换值(replace函数)
替换值
replace函数
1 data=Series([1,-999,2,-999,-1000,3]) 2 3 data 4 Out[34]: 5 0 1 6 1 -999 7 2 2 8 3 -999 9 4 -1000 10 5 3 11 dtype: int64
假设-999这个值可能表示缺失数据的标记值,将其替换为pandas能理解的NA值:
1 data.replace(-999,np.nan) 2 Out[35]: 3 0 1.0 4 1 NaN 5 2 2.0 6 3 NaN 7 4 -1000.0 8 5 3.0 9 dtype: float64
一次替换多个值,可以传入一个由待替换值组成组成的列表以及一个替换值:
data.replace([-999,-1000],np.nan) Out[36]: 0 1.0 1 NaN 2 2.0 3 NaN 4 NaN 5 3.0 dtype: float64
对不同的值进行不同的替换,传入一个由替换关系组成的列表:
data.replace([-999,-1000],[np.nan,0]) Out[37]: 0 1.0 1 NaN 2 2.0 3 NaN 4 0.0 5 3.0 dtype: float64 #传入的参数可以是字典 data.replace({-999:np.nan,-1000:0}) Out[38]: 0 1.0 1 NaN 2 2.0 3 NaN 4 0.0 5 3.0 dtype: float64