Pandas常用操作
pandas常用操作
1. 增加数据
1.1 新增列并依据其他列赋值
# col: 新增列名
# col1、col2: 已有列名
df = df.eval("col=col1 - col2")
2. 删除数据
df.dropna(subset=['col'], inplace=True) # 删除col列值为nan的行
3. 更改数据
3.1 更改列值
df['机构名称'].apply(lambda x: x.replace('汇总', ''))
3.2 重置行索引
self.df.reset_index(drop=True)
4. 查询数据
4.1 依据某列值过滤数据,得到符合条件的数据
df = df.query("col > 0")
query, eval 主要有点是语法简介,以及大数据量的时候节省内存;
涉及Numpy数组的符合表达式都会导致隐式的创建临时数组
5. 求差集
df = pd.concat([df1, df2, df2]).drop_duplicates(subset=['依据某列去重'], keep=False)
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律