pandas如何逐行需改DataFrame
逐行修改DataFrame而不会报SettingwithCopyWarning警告的方法:
df.iloc[行数,df.columns.get_loc(列名)]=new_value
参考:https://cloud.tencent.com/developer/ask/168023/answer/270064
逐行修改数据时,我们可能关注或只记得列名,这时使用df.iloc或者df.loc都不合适,因为是混合索引,但使用df.ix[行号,列名]=new_value又会报SettingwithCopyWarning,因此只能用上述方法,df.columns.get_loc(列名)这个方法会返回列名所在的列数,得到这个数值,就可以使用df.iloc了。
'''以下方式逐行修改数据,但由于需要读取、写入两个操作,会报警告 num=df.shape[0] for i in range(num): row=.iloc[i] row['my_col']=(num+1)/num df.iloc[i]=row '''
#以下方式不会报警,且避免了df.ix[index,column]已过时的警告 df.iloc[i,df.columns.get_loc('my_col')]=(num-i)/num
引申:df[布尔表达式]['my_col']=new_value 这样的写法为何会报SettingwithCopyWarning ?
因为这种写法存在修改副本(即类似表与视图的关系)的情况,其中df[布尔表达式]会返回一个df的子集副本,而['my_col']=new_value 是写入,是写入到副本,这种写入可能是无效的,因为副本不会自动保存到原始DataFrame。解决办法是使用df.loc或者df.iloc,且loc或iloc后面只使用一个中括号[],这样可以保证,df.loc[行索引,列名]=new_value直接操作原始表。
参考:Pandas 中 SettingwithCopyWarning 的原理和解决方案