Pandas:数据分类
1、分类数据
1.1创建分类数据
1.2 pd.Categorical()
pandas.Categorical 可以创建一个类型数据序列到 DataFrame 中:
1.3CategoricalDtype对象
CategoricalDtype 是 pandas 的类型数据对象,它可以传入以下参数:
categories: 没有缺失值的不重复序列
ordered: 布尔值,顺序的控制,默认是没有顺序的
CategoricalDtype 可以在 Pandas 指定 dtype 的任何地方,例如pandas.read_csv(),pandas.DataFrame.astype() 或 Series 构造函数中。
只要 CategoricalDtype 的两个实例具有相同的类别和顺序,它们的比较就相等。 比较两个无序分类时,不考虑类别的顺序。
1.4 类型转换
用 df.astype('category') 进行转换。
2、分类的操作