Pandas 常用方法集
fillna()会填充nan数据,返回填充后的结果。如果希望在原DataFrame中修改,则把inplace设置为True
df =pd.DataFrame({ 'data1':[1,2,np.nan,3,np.nan,4,5], 'data2':[34,67,np.nan,np.nan,52,77,np.nan] }) df.fillna(888,inplace=True) # inplace为True 代表替换原数据 df
# 去除特定列下面的重复行 df.drop_duplicates(subset=None, keep='first', inplace=False) # subset 指定 列名 # keep 'first' 删除重复项并保留第一次出现的项 # keep 'last' 最后一次出现的项
pandas的分段函数cut()
# 更改行名,或列名 df = pd.DataFrame({'A':[1,2] ,'B':[3,4]}) df.rename(columns={'B':'K'},inplace=True) df