获取两个 DataFrame 中某两列相同的项

要获取两个 DataFrame 中某两列相同的项,可以使用 pandasmerge 方法或 isin 方法。以下是两种方法的示例。

方法 1: 使用 merge

merge 方法可以用来根据多个列将两个 DataFrame 合并。通过设置 how='inner',可以得到两个 DataFrame 中在指定列上相同的项。

import pandas as pd

# 创建两个示例 DataFrame
df1 = pd.DataFrame({
    'ID': [1, 2, 3, 4, 5],
    'Value': ['A', 'B', 'C', 'D', 'E']
})

df2 = pd.DataFrame({
    'ID': [3, 4, 5, 6, 7],
    'Value': ['C', 'D', 'E', 'F', 'G']
})

# 使用 merge 查询相同项
common_items = pd.merge(df1, df2, on=['ID', 'Value'], how='inner')

# 输出结果
print(common_items)

方法 2: 使用 isin

如果你只想获取在某两列中相同的项,可以使用 isin 方法结合布尔索引。以下是示例代码:

import pandas as pd

# 创建两个示例 DataFrame
df1 = pd.DataFrame({
    'ID': [1, 2, 3, 4, 5],
    'Value': ['A', 'B', 'C', 'D', 'E']
})

df2 = pd.DataFrame({
    'ID': [3, 4, 5, 6, 7],
    'Value': ['C', 'D', 'E', 'F', 'G']
})

# 查询 df1 中 (ID, Value) 在 df2 中存在的项
common_items = df1[(df1['ID'].isin(df2['ID'])) & (df1['Value'].isin(df2['Value']))]

# 输出结果
print(common_items)
posted @ 2024-09-24 08:35  华小电  阅读(247)  评论(0编辑  收藏  举报