Python学习笔记:select_dtypes选取指定数据类型的列
一、背景
近期想对比两个不同数据集的数据分布时,遇到一个问题:数据集同时包括离散、连续、时间等不同类型特征。
使用 seaborn.kdeplot
报错,仅只能针对数值型特征进行统计。
遂诞生一个需求:针对数据框,筛选指定数据类型的列。
二、select_dtypes介绍
使用语法为:
data.select_dtypes(include=['object'], exclude=['float64'])
- include -- 符合类型
- exclude -- 排除类型
可以单独使用参数,也可以结合使用,返回的是符合筛选后的数据框。
data.select_dtypes(include=['object']).columns
返回列名。
参数选择有:
数字:number、int、float
buer:bool
时间:datetime64
类别:category
字符串:string
对象:object
三、实操
df.select_dtypes(include=['object'])
df.select_dtypes(include=['object', 'float'])
df.select_dtypes(exclude='object')
四、手动选取
df.loc[:, (df.dtypes == 'float64').values]
五、类型智能转换
df = df.convert_dtypes()
参考链接:pandas选取指定数据类型的列
分类:
Python
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)