[pandas] 两个相同列的df求差集

求在df1不在df2的数据

使用Pandas中的drop_duplicates()和merge()方法来计算两个相同列的DataFrame的差异。

例子:

import pandas as pd

# 创建两个相同列的DataFrame
df1 = pd.DataFrame({'value': ['A', 'B', 'C', 'D', 'E']})
df2 = pd.DataFrame({'value': ['C', 'D', 'E', 'F', 'G']})
print("df1:")
print(df1)
print("df2:")
print(df2)
# 使用merge()方法获取df1中不在df2中的元素
diff = pd.merge(df1, df2, how='outer', indicator=True)
result = diff[diff['_merge'] == 'left_only'].drop(columns=['_merge'])

# 打印结果
print("result:")
print(result)

posted @   蛇啊蛇啊  阅读(436)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 三行代码完成国际化适配,妙~啊~
· .NET Core 中如何实现缓存的预热?
点击右上角即可分享
微信分享提示