pandas处理重复、NaN数据及读取excel空值

df.drop_duplicates();默认删除完全一样的行数据。

df.dropna() ；默认删除掉行数据，只要一行中有NaN；

pandas读取excel表格空值为NaN；用df.fillna没有效果。原因是pandas默认读取空字符串时读出的是nan，在使用pandas.read_excel(file)这个方法时可以在后面加上keep_default_na=False，这样读取到空字符串时读出的就是”而不是nan了。

df = pd.read_excel(data_path, keep_default_na=False)

posted @ 2023-07-18 13:59 Oops!# 阅读(925) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· python pandas 数据处理str.replace()，替换异常双括号，字符类似字段重新添加双括号

· pandas python re模块匹配不同的sheet_name

· 处理pandas读取数据为nan时

· pandas 保持excel的null值原有输入

· 基于pandas的数据清洗

历史上的今天：
2018-07-18 zabbix报错listener failed: zbx_tcp_listen() fatal error: unable to serve on any address
2018-07-18 shell脚本中执行mysql 语句,去除warning using a password on the command line interface can be insecure信息
2018-07-18 zabbix_get :command not found 解决办法
2018-07-18 CentOS7 升级到7.4
2018-07-18 jumpserver v0.5.0 创建用户和管理机器
2017-07-18 linux下双网卡的绑定

昵称： Oops!#
园龄： 7年10个月
粉丝： 96
关注： 0

2025年3月

日

一

二

三

四

五

六

Oops!