pandas常用函数详解——drop()函数
drop函数基本介绍:
功能:删除数据集中多余的数据
DataFrame.drop(labels=None, axis=0, index=None, columns=None, level=None, inplace=False, errors='raise')
常用参数详解:
labels:待删除的行名or列名;
axis:删除时所参考的轴,0为行,1为列;
index:待删除的行名
columns:待删除的列名
level:多级列表时使用,暂时不作说明
inplace:布尔值,默认为False,这是返回的是一个copy;若为True,返回的是删除相应数据后的版本
errors一般用不到,这里不作解释
举例说明:
#构件一个数据集 df1=pd.DataFrame(np.arange(36).reshape(6,6),columns=list('ABCDEF'))
'1.删除行数据' #下面两种删除方式是等价的,传入labels和axis 与只传入一个index 作用相同 df2=df1.drop(labels=0,axis=0) df22=df1.drop(index=0)
#删除多行数据 df3=df1.drop(labels=[0,1,2],axis=0) df33=df1.drop(index=[0,1,2])
'2.删除列数据' df4=df1.drop(labels=['A','B','C'],axis=1) df44=df1.drop(columns=['A','B','C'])
'3.inplace参数的使用' dfs=df1 #inplace=None时返回删除前的数据 dfs.drop(labels=['A','B','C'],axis=1)
#inplace=True时返回删除后的数据 dfs.drop(labels=['A','B','C'],axis=1,inplace=True)
'4.drop函数在多级列表中的应用(实例copy自pandas官方帮助文档)‘ #构建多级索引 midx = pd.MultiIndex(levels=[['lama', 'cow', 'falcon'], ['speed', 'weight', 'length']], codes=[[0, 0, 0, 1, 1, 1, 2, 2, 2], [0, 1, 2, 0, 1, 2, 0, 1, 2]]) #构造数据集 df = pd.DataFrame(index=midx, columns=['big', 'small'], data=[[45, 30], [200, 100], [1.5, 1], [30, 20], [250, 150], [1.5, 0.8], [320, 250], [1, 0.8], [0.3, 0.2]])
#同时删除行数据和列数据 df.drop(index='cow', columns='small')
#删除某级index的对应行 df.drop(index='length',level=1)
标签:
pandas常用操作
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通