Python: Dataframe中的并集/合集/差集
最近要取Dataframe中的差集,顺便把并集和合集一起处理了。
df1 = pd.DataFrame([[1,11,111],[2,22,222],[3,33,333]],columns=['id','data','comment']) df2 = pd.DataFrame([[0,00,000],[1,11,111],[2,22,222],[4,44,444]],columns=['id','data','comment']) # 取交集:既在df1中,也在df2中 intersection_result = pd.merge(df1, df2) print(intersection_result) # 取合集:df1和df2所有数据的集合 union_result = pd.merge(df1, df2, how='outer') print(union_result) #取差集 在df1中但不在df2中的 df1 = df1.append(df2) df1 = df1.append(df2) differenct_set_result = df1.drop_duplicates(['id'],keep=False) print(differenct_set_result)