Pandas 笔记(四)
本文主要介绍Pandas数据类型和空值处理
- 数据类型dtype
pandas数据导入后会自动转变为dtype类型,查看类型:
reviews.price.dtype
类型转换:
reviews.points.astype('float64')
关于dtypes的详细信息参考: https://pandas.pydata.org/pandas-docs/stable/user_guide/basics.html#dtypes
- Nah类型
如果导入的数据项为空,则数据在dataframe中自动转换成NaN类型,而默认NaN的数据类型为float64。
如果数据为空,则不能被如count, groupby方法所统计。
可以用missingno库查看数据空值分布
import pandas as pd
import missingno as msno
from matplotlib import pyplot as plt
matplotlib.rcParams['font.family'] = 'SimHei'
original_data = pd.read_excel('datasets/XXX.xlsx', 'Sheet1')
msno.matrix(original_data)
plt.show()
- isnull和notnull
这两个方法可以用来过滤选择是否为空的数据项
reviews_null_country = reviews[pd.isnull(reviews.country)]
reviews_notnull_country = reviews[pd.isnull(reviews.country)]
- fillna
可以用来填充na内容
reviews.country.fillna('Unknown')
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具
2021-02-05 Angular 学习笔记 (三) - LifeCycle和ViewEncapsulation