pandas处理重复、NaN数据及读取excel空值

1.删除重复的数据

 
df.drop_duplicates();默认删除完全一样的行数据。
 

 

 

2.删除NaN数据

df.dropna() ;默认删除掉行数据,只要一行中有NaN;

 

 

 

3.pandas读取excel空白单元格默认设置修改

 

pandas读取excel表格空值为NaN;用df.fillna没有效果。原因是pandas默认读取空字符串时读出的是nan,在使用pandas.read_excel(file)这个方法时可以在后面加上keep_default_na=False,这样读取到空字符串时读出的就是”而不是nan了。

df = pd.read_excel(data_path, keep_default_na=False)
posted @ 2023-07-18 13:59  Oops!#  阅读(663)  评论(0编辑  收藏  举报