(pandas)合并重复列实例
问题:合并111.xls、222.xls,最终效果如图3
import pandas as pd
df=pd.read_excel(r"111.xls")
df1=pd.read_excel(r"222.xls")
方法1:merge合并
思路:
1.以姓名为关键词,以并集的方法合并
2.以0替换缺失值Nan
3.新建"年龄"列,值为"年龄_x"列+"年龄_y"列
4.删除"年龄_x"列、"年龄_y"列
df2=pd.merge(df,df1,on="姓名",how="outer")
df2=df2.fillna(0)
df2["年龄"]=df2["年龄_x"]+df2["年龄_y"]
df2=df2.drop(["年龄_x","年龄_y"], axis=1)
方法2:concat合并
思路:
1.默认合并
2.筛选"年龄”列大于0的数据
df3=pd.concat([df,df1])
df3=df3[df3.年龄>0]
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix