pandas(二)
1.Series序列
一维的数组数据,构建是传二维数据会报错,数据具有索引,构建时如果不传索引,默认为数字rang索引。
series存在列名和索引,sr.at[0]是通过列名来定位数据(iat定位行和列),sr.loc通过索引来定位数据(iat定位行和列)。
Conversion
series可以直接转化为numpy.array(to_numpy),和list(to_list)
另外series实现了所有的数学运算,
groupby & window
groupby根据列名进行聚合,聚合之后形成若干个grouping,每个grouping包含一个索引
在groupby的基础上可以调用agg函数
要将自定义或其他库的函数应用于Pandas对象,有三个重要的方法,下面来讨论如何使用这些方法。使用适当的方法取决于函数是否期望在整个DataFrame
,行或列或元素上进行操作。
- 表合理函数应用:
pipe()
- 行或列函数应用:
apply()
- 元素函数应用:
applymap()
Reindexing / selection / label manipulation
实现了where,head,tail函数
Combining / joining / merging
append 序列中添加数据
replace 替换指定元素
update 用指定序列更新当前序列
s = pd.Series([1, 2, 3]) s.update(pd.Series([4, np.nan, 6])) s 0 4 1 2 2 6 dtype: int64
此外对于特殊的几个类型,有专门的扩展方法