pandas去除重复的列

Pandas提供了duplicated、Index.duplicated、drop_duplicates函数来标记及删除重复记录。

duplicated函数用于标记Series中的值、DataFrame中的记录行是否是重复，重复为True，不重复为False。

函数定义：

其中参数解释如下：

若index有相同的

d = df[~df.index.duplicated(keep='last')]
keep可取 first，last. first指保留第一个值，last则保留最后一个值。

posted @ 2022-06-21 09:40 c++11 阅读(1609) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 数字货币各个交易所认证方式

· c++ rest websocket的使用方式

· pandas学习-函数drop_duplicates的用法

· pandas刷题梳理

阅读排行：
· TypeScript + Deepseek 打造卜卦网站：技术与玄学的结合
· Manus的开源复刻OpenManus初探
· 写一个简单的SQL生成工具
· AI 智能体引爆开源社区「GitHub 热点速览」
· C#/.NET/.NET Core技术前沿周刊 | 第 29 期（2025年3.1-3.9）

昵称： c++11
园龄： 6年5个月
粉丝： 8
关注： 1

2025年3月

日

一

二

三

四

五

六

c++life