Python学习笔记:select_dtypes选取指定数据类型的列

一、背景

近期想对比两个不同数据集的数据分布时,遇到一个问题:数据集同时包括离散、连续、时间等不同类型特征。

使用 seaborn.kdeplot 报错,仅只能针对数值型特征进行统计。

遂诞生一个需求:针对数据框,筛选指定数据类型的列。

二、select_dtypes介绍

使用语法为:

data.select_dtypes(include=['object'], exclude=['float64'])
  • include -- 符合类型
  • exclude -- 排除类型

可以单独使用参数,也可以结合使用,返回的是符合筛选后的数据框。

data.select_dtypes(include=['object']).columns

返回列名。

参数选择有:

数字:number、intfloat
buer:bool
时间:datetime64
类别:category
字符串:string
对象:object

三、实操

df.select_dtypes(include=['object'])
df.select_dtypes(include=['object', 'float'])
df.select_dtypes(exclude='object')

四、手动选取

df.loc[:, (df.dtypes == 'float64').values]

五、类型智能转换

df = df.convert_dtypes()

参考链接:pandas选取指定数据类型的列

参考链接:pandas.DataFrame中提取(选择)特定类型dtype的列

参考链接:Python学习笔记:Pandas数据类型转化

posted @   Hider1214  阅读(3174)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)
点击右上角即可分享
微信分享提示