摘要: 单层索引index中,我们可以轻松通过df.loc[index]来获取某一行数据,多重索引是怎么样来实现的呢,下面进行介绍。 1、行多层索引 1 import pandas as pd 2 3 df = pd.DataFrame({'class':['A','A','A','B','B','B',' 阅读全文
posted @ 2019-05-26 23:18 beyondChan 阅读(38164) 评论(0) 推荐(0) 编辑
摘要: 在实际分析中,经常遇到连续值需要离散化,或者离散值需要哑元化的问题,下面将分别举例说明。 1、连续指标离散化 可以根据自己的需求划分不同的区间,然后使用pandas中cut()、qcut()函数来完成连续变量离散化操作。 2、离散指标哑元化 分类变量哑元化是指将分类变量转换成“哑变量矩阵”(dumm 阅读全文
posted @ 2019-05-26 23:05 beyondChan 阅读(4521) 评论(0) 推荐(0) 编辑
摘要: 集合是一种组合型的数据类型,分为可变的set和不可变的frozenset。 1、可变集合set 集合set是一种无序的、唯一的的元素集,与数学中集合的概念类似,可对其进行交、并、差、补等逻辑运算。不支持索引、切片等序列操作,但仍支持成员关系运算符in-not in、推导式等操作。在特定的场合中可以体 阅读全文
posted @ 2019-05-26 21:14 beyondChan 阅读(1051) 评论(0) 推荐(0) 编辑