使用Python筛选出两列中的未重复的值，应该怎么操作呢？

大家好，我是皮皮。

一、前言

国庆期间在Python最强王者交流群【维哥】问了一个Python自动化办公的问题，提问截图如下：

需求澄清：“两列中的未重复的值”指的是两列中只出现一次的值，比方说上图中的J01140300030，就是想要的目标数据。说白了，就是两列数据合并起来，只出现一次的值。

二、实现过程

这里【瑜亮老师】给了一个代码，如下所示：

import pandas as pd
df = pd.read_excel('test1(1).xlsx', header=None)

# df_unique = pd.concat([df[0], df[1]], ignore_index=True).drop_duplicates(keep=False)
df_unique = pd.concat([df[0], df[1]]).drop_duplicates(keep=False).reset_index(drop=True)
print(df_unique)

顺利地解决了粉丝的问题。

关于去除的参数，这里有个细节，如下图所示。

三、总结

大家好，我是皮皮。这篇文章主要盘点了一个Python网络爬虫后正则表达式处理的问题，文中针对该问题，给出了具体的解析和代码实现，帮助粉丝顺利解决了问题。

最后感谢粉丝【维哥】提问，感谢【瑜亮老师】、【郑煜哲·Xiaopang】、【super】给出的思路和代码解析，感谢【dcpeng】、【群除我佬】等人参与学习交流。

posted @ 2022-11-08 22:13 dcpeng 阅读(314) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· 如果想要删除四列中都有相同项的数据，有什么方便的方法吗？

· 盘点一个Python处理Excel两列单元格中有类似字符串就返回1，没有就返回0的操作

· 记录python语言的数组去重并输出

· 数据库某字段会存在重复值，要找出表里所有不重复的数据

· python 迅速判断重复值

阅读排行：
· winform 绘制太阳，地球，月球运作规律
· 超详细：普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 上周热点回顾（3.3-3.9）
· AI 智能体引爆开源社区「GitHub 热点速览」
· 写一个简单的SQL生成工具

历史上的今天：
2021-11-08 服装打版界的扛把子------ET自定义操作

公告

昵称： dcpeng
园龄： 6年10个月
粉丝： 76
关注： 4

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔分类

Python那些事儿(2)

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:手把手教你使用Python网络爬虫下载一本小说（附源码）
@30874 特殊字符引起的...
--dcpeng
2. Re:手把手教你使用Python网络爬虫下载一本小说（附源码）
请问，小说章节名字有问号，为什么导致代码停止呢？
--30874
3. Re:手把手带你进行Golang环境配置
详细，谢了
--萌新小豪
4. Re:手把手教你使用HttpCanary抓取手机App上的视频
为啥点开始抓包后，视频就加载不出来了
--jdvbna
5. Re:一篇文章教会你用Python爬取淘宝评论数据（写在记事本）
@黄泊源 Python爬虫与数据挖掘，Python共享之家，都是我的，欢迎关注。加我微信，pdcfighting，拉你进入高质量Python交流群。...
--dcpeng