2-Pandas数据初探索之数据类型与数据筛选
一、数据类型
1、Pandas的数据类型主要结合了pandas和numpy两个模块中的数据类型,包括以下几种:
- float
- int
- bool
- datetime64[ns]------>日期类型
- datetime64[ns,tz]--->日期类型
- timedelta[ns]------->时间差类型
- category
- object---->当一个Series仅包括字符串或是包括多种数据类型时为object类型
2、通过DateFrame对象的dtypes属性,可得到各个特征的数据类型。
例如:df.dtypes
3、类型转换:
(1)通过astype()转换数据类型,默认情况下会产生对象转换后的一个副本
df['A'] = df['A'].astype('int8')
(2)对多列进行类型转换时,对astype()传入一个字典。字典的键值对格式为列名:目标数据类型
df = df.astype({'A':'int8','B':'int32'})
二、数据筛选
select_dtypes()筛选出特定数据类型的特征
包括两个参数:
- include:筛选时选取的数据类型
- exclude:筛选时排除的数据类型
df.select_dtypes(include=['float'],exclude=['int'])