摘要: 之前已经写过pandas DataFrame applymap()函数 还有pandas数组(pandas Series)-(5)apply方法自定义函数 pandas DataFrame 的 applymap() 函数和pandas Series 的 apply() 方法,都是对整个对象上个各个值 阅读全文
posted @ 2018-07-29 14:18 诗&远方 阅读(32406) 评论(0) 推荐(1) 编辑
摘要: 上一篇pandas DataFrame apply()函数(1)说了如何通过apply函数对DataFrame进行转换,得到一个新的DataFrame. 这篇介绍DataFrame apply()函数的另一个用法,得到一个新的pandas Series: apply()中的函数接收的参数为一行(列) 阅读全文
posted @ 2018-07-29 14:18 诗&远方 阅读(8219) 评论(0) 推荐(0) 编辑
摘要: 之前已经学过DataFrame与DataFrame相加,Series与Series相加,这篇介绍下DataFrame与Series的相加: 首先将Series的索引值和DataFrame的索引值相匹配, s[0] 是 1 , df[0] 是 [10,20,30,40] 然后相当于向量化运算: [10 阅读全文
posted @ 2018-07-29 14:18 诗&远方 阅读(10019) 评论(0) 推荐(0) 编辑
摘要: pandas Series的 sort_values() 方法能对Series进行排序,返回一个新的Series: 升序排列: 降序排列: 无论升序还是降序,NaN都会被排在最后 阅读全文
posted @ 2018-07-29 14:18 诗&远方 阅读(4806) 评论(0) 推荐(0) 编辑
摘要: 上一篇通过公式自己写了一个计算两组数据的皮尔逊积矩相关系数(Pearson's r)的方法,但np已经提供了一个用于计算皮尔逊积矩相关系数(Pearson's r)的方法 np.corrcoef() : 需要注意的是, np.corrcoef() 接受的参数是一个矩阵,返回的结果也是一个矩阵 以上面 阅读全文
posted @ 2018-07-29 14:17 诗&远方 阅读(16171) 评论(0) 推荐(0) 编辑
摘要: pandas DataFrame.shift()函数可以把数据移动指定的位数 period参数指定移动的步幅,可以为正为负.axis指定移动的轴,1为行,0为列. eg: 有这样一个DataFrame数据: 如果想让 a和b的数据都往下移动一位: 如果是在行上往右移动一位: 如果想往上或者往左移动, 阅读全文
posted @ 2018-07-29 14:17 诗&远方 阅读(37425) 评论(0) 推荐(1) 编辑
摘要: pandas DataFrame的 applymap() 函数可以对DataFrame里的每个值进行处理,然后返回一个新的DataFrame: 一个栗子: 这里有一组数据是10个学生的两次考试成绩,要求把成绩转换成ABCD等级: 转换规则是: 90-100 -> A 80-89 -> B 70-79 阅读全文
posted @ 2018-07-29 14:17 诗&远方 阅读(7836) 评论(0) 推荐(0) 编辑
摘要: pandas的qcut可以把一组数字按大小区间进行分区,比如 比如我要把这组数据分成两部分,一半大的,一半小的,如果是小的数,值就变成'small number',大的数,值就变成'large number': qcut() 方法第一个参数是数据,第二个参数定义区间的分割方法,比如这里把数字分成两半 阅读全文
posted @ 2018-07-29 14:17 诗&远方 阅读(14144) 评论(0) 推荐(1) 编辑
摘要: 和numpy数组(5)-二维数组的轴一样,pandas DataFrame也有轴的概念,决定了方法是对行应用还是对列应用: 以下面这个数据为例说明: 这个数据是5个车站10天内的客流数据: 这个数据里,行表示每一天里各个站的客流,列表示每一个站里各天的客流 如果要计算每天各个站的平均客流: 如果要计 阅读全文
posted @ 2018-07-29 14:14 诗&远方 阅读(923) 评论(0) 推荐(0) 编辑
摘要: pandas DataFrame进行向量化运算时,是根据行和列的索引值进行计算的,而不是行和列的位置: 1. 行和列索引一致: 2. 行索引一致,列索引不一致: 没有对应索引的值,会用空来代替进行计算 3. 行索引不一致,列索引一致: 其实总结下来就是,行列索引相同的,进行计算,没有的全部用空进行计 阅读全文
posted @ 2018-07-29 14:14 诗&远方 阅读(3149) 评论(0) 推荐(0) 编辑
摘要: 皮尔逊积矩线性相关系数(Pearson's r)用于计算两组数组之间是否有线性关联,举个例子: 计算两组数据的线性相关性,就是,b是否随着a的增长而增长,或者随着a的增长而减小,或者两者不相关: 皮尔逊积矩线性相关系数的公式是: (标准化数据a * 标准化数据b).mean() *注意: 在计算皮尔 阅读全文
posted @ 2018-07-29 14:13 诗&远方 阅读(2535) 评论(0) 推荐(1) 编辑