[pandas] 两个相同列的df求差集
求在df1不在df2的数据
使用Pandas中的drop_duplicates()和merge()方法来计算两个相同列的DataFrame的差异。
例子:
import pandas as pd
# 创建两个相同列的DataFrame
df1 = pd.DataFrame({'value': ['A', 'B', 'C', 'D', 'E']})
df2 = pd.DataFrame({'value': ['C', 'D', 'E', 'F', 'G']})
print("df1:")
print(df1)
print("df2:")
print(df2)
# 使用merge()方法获取df1中不在df2中的元素
diff = pd.merge(df1, df2, how='outer', indicator=True)
result = diff[diff['_merge'] == 'left_only'].drop(columns=['_merge'])
# 打印结果
print("result:")
print(result)
本文来自博客园,作者:蛇啊蛇啊,转载请注明原文链接:https://www.cnblogs.com/afra17/p/17478001.html
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 三行代码完成国际化适配,妙~啊~
· .NET Core 中如何实现缓存的预热?