摘要: 在数据聚合与分组中,主要包括: 根据一个或多个键(函数、数组、或dataframe的列名)拆分pandas对象 计算分组后数据的统计值,包括:计数,平均值,标准差,自定义函数 对dataframe的列应用各种各样的函数 实现组内转换或其他运算,规整化,线性回归,排名,选取子集 透视表,交叉表 分组分 阅读全文
posted @ 2018-09-10 21:54 积水聚沙 阅读(579) 评论(0) 推荐(0) 编辑
摘要: 1、合并数据集 ①、多对一合并 我们需要用到pandas中的merge函数,merge函数默认情况下合并的是两个数据集的交集(inner连接),当然还有其他的参数: how里面有inner、outer、left、right,四个参数可以选择,分别代表:交集,并集,参与合并的左侧DataFrame,以 阅读全文
posted @ 2018-09-02 17:13 积水聚沙 阅读(311) 评论(0) 推荐(0) 编辑
摘要: 读取数据我们通常用到: read_csv():默认分隔符为逗号 read_table():需要指定分隔符 当pd.read_csv('....._csv',header = None)是,pandas会分配默认的列名, 自己定义列名时,names = ['...','...',...]; 当我们想用 阅读全文
posted @ 2018-08-31 20:25 积水聚沙 阅读(94) 评论(0) 推荐(0) 编辑
摘要: pandas主要的两个数据结构是:Series 和DataFrame 1、Series series 类似于一维数组,由 索引+数据组成 若不指定索引,则会自动创建0到N-1的整数型索引, 可以用series的values获取数组值,用index获取索引值。 Numpy的数组运算(布尔型数组过滤、标 阅读全文
posted @ 2018-08-26 21:01 积水聚沙 阅读(247) 评论(0) 推荐(0) 编辑
摘要: 恢复内容开始 1、通用函数——ufunc(数组函数)numpy包里面有许多的简单函数 一元通用函数np.abs 计算整数、浮点数、复数的绝对值fabs 非负数的绝对值sqrt 元素平方根square 各元素的平方exp 指数e的x次方.. 二元通用函数add(加) subtract(减) multi 阅读全文
posted @ 2018-08-26 14:56 积水聚沙 阅读(270) 评论(0) 推荐(0) 编辑
摘要: ndarray Numpy的N维数组对象 所以创建数组的话,首先想到的就是Numpy里面的array函数 1、创建ndarry-列表的转换 因此可以看到array函数会为新建的数组推断出一个比较合适的数据类型。 另外 zeros 和 ones 也可以创建指定长度的数组 一些其他的数组函数 asarr 阅读全文
posted @ 2018-08-26 10:33 积水聚沙 阅读(285) 评论(0) 推荐(0) 编辑