随笔 - 15  文章 - 5  评论 - 9  阅读 - 23674

pandas学习-函数drop_duplicates的用法

pandas函数drop_duplicates用于去除DataFrame中的重复行。

语法:

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

参数说明:

  • subset:指定要考虑的列名或列名的列表。默认值为None,表示考虑所有列。
  • keep:指定保留哪个重复的行。可选值为'first'(保留第一个出现的重复行)、'last'(保留最后一个出现的重复行)或False(删除所有重复行)。默认值为'first'。
  • inplace:指定是否在原始DataFrame上进行修改。如果为True,则在原始DataFrame上删除重复行并返回None。如果为False(默认值),则返回一个新的DataFrame,其中删除了重复行。

示例:

import pandas as pd

data = {'name': ['John', 'Mary', 'John', 'Peter'],
        'city': ['London', 'Paris', 'London', 'Berlin']}
df = pd.DataFrame(data)

# 删除所有重复行
df.drop_duplicates(inplace=True)
print(df)

输出:

   name    city
0  John  London
1  Mary   Paris
3  Peter  Berlin

在上述示例中,使用drop_duplicates函数删除了DataFrame中的重复行,并返回了新的DataFrame。

posted on   SoftWareBoy  阅读(591)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
· Manus爆火,是硬核还是营销?
· 一文读懂知识蒸馏
· 终于写完轮子一部分:tcp代理 了,记录一下
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

淘宝女人专卖 天猫商城
点击右上角即可分享
微信分享提示