随笔 - 15 文章 - 5 评论 - 9 阅读 - 23674

pandas学习-函数drop_duplicates的用法

pandas函数drop_duplicates用于去除DataFrame中的重复行。

语法：

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

参数说明：

subset：指定要考虑的列名或列名的列表。默认值为None，表示考虑所有列。
keep：指定保留哪个重复的行。可选值为'first'（保留第一个出现的重复行）、'last'（保留最后一个出现的重复行）或False（删除所有重复行）。默认值为'first'。
inplace：指定是否在原始DataFrame上进行修改。如果为True，则在原始DataFrame上删除重复行并返回None。如果为False（默认值），则返回一个新的DataFrame，其中删除了重复行。

示例：

import pandas as pd

data = {'name': ['John', 'Mary', 'John', 'Peter'],
        'city': ['London', 'Paris', 'London', 'Berlin']}
df = pd.DataFrame(data)

# 删除所有重复行
df.drop_duplicates(inplace=True)
print(df)

输出：

   name    city
0  John  London
1  Mary   Paris
3  Peter  Berlin

在上述示例中，使用drop_duplicates函数删除了DataFrame中的重复行，并返回了新的DataFrame。

posted on 2023-09-20 18:30 SoftWareBoy 阅读(591) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· groupby函数作用

· pandas判断和删除重复——duplicated()、drop_duplicates()

· Lesson11——Pandas去重函数：drop_duplicates()

· df.drop_duplicates() 详解,df.drop()

· 软件测试|数据处理神器pandas教程（十五）

阅读排行：
· 无需6万激活码！GitHub神秘组织3小时极速复刻Manus，手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
· Manus爆火，是硬核还是营销？
· 一文读懂知识蒸馏
· 终于写完轮子一部分：tcp代理了，记录一下

昵称： SoftWareBoy
园龄： 18年6个月
粉丝： 1
关注： 4

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

最新随笔

随笔分类 (5)

随笔档案 (15)

文章分类 (4)

我的链接

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:如何配置Win2003的NTFS文件系统权限及IIS权限设置参考(供使用Win2003服务器参考)
不错楼主讲得很仔细了
--blueker_li
2. Re:如何配置Win2003的NTFS文件系统权限及IIS权限设置参考(供使用Win2003服务器参考)
太乱太杂了。。。
--石高飞
3. Re:如何让薪资体系方案四两拨千斤
你也做HR吗？
--Dava
4. Re:面试题
技术这么好，怎么就没有自己创业呢?
欢迎来我的博客指导指导，共同进步啊
--Dava
5. Re:如何配置Win2003的NTFS文件系统权限及IIS权限设置参考(供使用Win2003服务器参考)
博主，我按您如上的配置，本地连接却消失了~郁闷中。。。
--长风大侠1

淘宝女人专卖

天猫商城