pandas中series求交集

在进行数据探索的时候会遇到求交集的情况,比如说:优惠卷预测的时候,有多张表,表1有用户id,表2也有用户id,但是不能确定表1的用户有多少出现在表2当中。

un_id1,un_id2 为两个 Series 对象:

un_id1 = set(un_id1)
un_id2 = set(un_id2)
tmp = un_id1.intersection(un_id2)
len(tmp)

即可求出交集的个数。。

 

 

后来又找到一个去重函数:drop_duplicates

posted on 2017-07-11 11:27  潇洒的麦兜  阅读(2156)  评论(0编辑  收藏  举报

导航