随笔分类 - pandas数据分析
摘要:这次我们聊一聊pandas中的rolling函数,这个函数可以被Series对象调用,也可以被DataFrame对象调用,这个函数主要是用来做移动计算的。 举个栗子,假设我们有10天的销售额,我们想每三天求一次总和,比如第五天的总和就是第三天 + 第四天 + 第五天的销售额之和,这个时候我们的rol
阅读全文
摘要:cumsum() :连加函数numpy.cumsum(a, axis=None, dtype=None, out=None)axis=0,按照行累加。axis=1,按照列累加。axis不给定具体值,就把numpy数组当成一个一维数组。例子 a= np.array([[1,2,3],[4,5,6]])
阅读全文
摘要:diff函数是用来将数据进行某种移动之后与原数据进行比较得出的差异数据,举个例子,现在有一个DataFrame类型的数据df,如下: 如果执行: df.diff() 则会得到: 怎么得到的呢,其实是经过了两个步骤,首先会执行: df.shift() 然后再将该数据与原数据做差,即: df-df.sh
阅读全文
摘要:(1)df.pct_change()DataFrame.pct_change(periods=1, fill_method=‘pad’, limit=None, freq=None, **kwargs)表示当前元素与先前元素的相差百分比,当然指定periods=n,表示当前元素与先前n 个元素的相差
阅读全文
摘要:数据清洗是对一些没有用的数据进行处理的过程。 很多数据集存在数据缺失、数据格式错误、错误数据或重复数据的情况,如果要对使数据分析更加准确,就需要对这些没有用的数据进行处理。 在这个教程中,我们将利用 Pandas包来进行数据清洗。 本文使用到的测试数据 property-data.csv 如下: 上
阅读全文