pandas处理重复、NaN数据及读取excel空值

1.删除重复的数据

 
df.drop_duplicates();默认删除完全一样的行数据。
 

 

 

2.删除NaN数据

df.dropna() ;默认删除掉行数据,只要一行中有NaN;

 

 

 

3.pandas读取excel空白单元格默认设置修改

 

pandas读取excel表格空值为NaN;用df.fillna没有效果。原因是pandas默认读取空字符串时读出的是nan,在使用pandas.read_excel(file)这个方法时可以在后面加上keep_default_na=False,这样读取到空字符串时读出的就是”而不是nan了。

df = pd.read_excel(data_path, keep_default_na=False)
posted @   Oops!#  阅读(925)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
历史上的今天:
2018-07-18 zabbix报错listener failed: zbx_tcp_listen() fatal error: unable to serve on any address
2018-07-18 shell脚本中执行mysql 语句,去除warning using a password on the command line interface can be insecure信息
2018-07-18 zabbix_get :command not found 解决办法
2018-07-18 CentOS7 升级到7.4
2018-07-18 jumpserver v0.5.0 创建用户和管理机器
2017-07-18 linux下双网卡的绑定
点击右上角即可分享
微信分享提示