DataFrame运算
算术运算
- 加法—series对象.add(值)
- 减法—series对象.sub(值/对象)
逻辑运算符号<、 >、|、 &
- 逻辑运算符号<、 >、|、 &—等价于sql中的where语句
- 等价于numpy的逻辑运算
- 返回的是布尔类型的对象(series/df)
- 逻辑运算函数
- df.query()—相当于查询
- series.isin(列表)---返回一个布尔series —sql里的 in关键词
统计运算
describe()
综合分析: 能够直接得出很多统计结果,count, mean, std, min, max 等
# 计算平均值、标准差、最大值、最小值
data.describe()
统计函数
min(最小值), max(最大值), mean(平均值), median(中位数), var(方差), std(标准差),mode(众数)结果
对于单个函数去进行统计的时候,坐标轴还是按照这些默认为“columns” (axis=0, default),如果要对行“index” 需要指定(axis=1)
- df.max(axis=0/1) 0-列 1-行 min sum
- df.idxmax(axis=0/1)- 最大值所在索引值
累计统计函数
- 观察原数据不容易观察到的信息
- series.cumsum--返回结果不是一个值
自定义运算
df.apply(func,axis)
- func—函数
- axis指定计算的轴
data[['open', 'close']].apply(lambda x: x.max() - x.min(), axis=0)
open 22.74
close 22.85
dtype: float64