数据转换--替换值(replace函数)

替换值
replace函数
 1 data=Series([1,-999,2,-999,-1000,3])
 2 
 3 data
 4 Out[34]: 
 5 0       1
 6 1    -999
 7 2       2
 8 3    -999
 9 4   -1000
10 5       3
11 dtype: int64

假设-999这个值可能表示缺失数据的标记值,将其替换为pandas能理解的NA值:

1 data.replace(-999,np.nan)
2 Out[35]: 
3 0       1.0
4 1       NaN
5 2       2.0
6 3       NaN
7 4   -1000.0
8 5       3.0
9 dtype: float64

一次替换多个值,可以传入一个由待替换值组成组成的列表以及一个替换值:

data.replace([-999,-1000],np.nan)
Out[36]: 
0    1.0
1    NaN
2    2.0
3    NaN
4    NaN
5    3.0
dtype: float64

对不同的值进行不同的替换,传入一个由替换关系组成的列表:

data.replace([-999,-1000],[np.nan,0])
Out[37]: 
0    1.0
1    NaN
2    2.0
3    NaN
4    0.0
5    3.0
dtype: float64

#传入的参数可以是字典
data.replace({-999:np.nan,-1000:0})
Out[38]: 
0    1.0
1    NaN
2    2.0
3    NaN
4    0.0
5    3.0
dtype: float64

 

 

posted @ 2018-07-23 10:16  平淡才是真~~  阅读(4101)  评论(0编辑  收藏  举报