[Python学习笔记(二)] Pandas库基础学习——01
在 Python 中,可以用 Pandas 对数据做处理,以满足建模的需求
1、Pandas 的核心结构是 DataFrame ;
2、DataFrame.head(x) 返回 DataFrame 中前 x 行数据,也就是前 x 个样本,x参数的默认值为 5 ;
3、DataFrame.tail(x) 返回 DataFrame 中后 x 行数据,也就是后 x 个样本,x参数的默认值为 5 ;
4、DataFrame.columns 属性以类似 list 的结构返回 DataFrame 中的所有列名,也就是所有指标名;
5、DataFrame.shape 属性返回 DataFrame 实例的大小,也就是行和列的数量;
6、DataFrame.loc[0] 获取第一个样本的数据,此操作通过内置函数 loc[] 完成;
7、Pandas 中的数据类型:
object - For string values
int - For integer values
float - For float values
datetime - For time values
bool - For Boolean values
8、DataFrame.dtypes 返回数据中各项指标的数据类型;
9、DataFrame.loc[x:y] 同样可以像 list 一样切片;
10、DataFrame [ column_name1 , column_name2 , column_name3 ] 可以获取这几列,也就是这几个指标的所有数据;
11、DataFrame.columns.tolist() 将 DataFrame 中所有列名以 list 格式返回;
12、可以将 11 中获得的 list 作为索引,输出 DataFrame 中这些列的数据;
13、跟 numpy 的 ndarray 一样,DataFrame 也可以作为一个整体进行 加减乘除 和 与或非 的运算操作;
14、两个维度一致的列做运算时,用对应位置的元素完成运算;
15、取列的最大值 DataFrame[ column_name ].max()