3.1 series介绍
pandas简介
pandas是一个强大的 Python数据分析的工具包,是基于NmPy构建的。
pandas的主要功能
具备对其功能的数据结构 Dataframe, Series
集成时间序列功能
提供丰富的数学运算和操作
灵活处理缺失数据
安装方法:pip install pandas
引用方法:import pandas as pd
Series-一维数据对象
Series是一种类似于一维数组的对象,由一组数据和一组与之相关的数据标签(索引)组成。
创建方式: In [7]: pd.Series([4,7,-4,2]) Out[7]: 0 4 1 7 2 -4 3 2 dtype: int64 In [8]: pd.Series([3,2,1,-5],index=['a','b','c','d']) Out[8]: a 3 b 2 c 1 d -5 dtype: int64 In [9]: pd.Series({'a':1,'b':2}) Out[9]: a 1 b 2 dtype: int64 In [10]: pd.Series(0,index=['a','b','c','d']) Out[10]: a 0 b 0 c 0 d 0 dtype: int64 获取值数组和索引数组:values属性和 index属性 Series比较像列表(数组)和字典的结合体
Series-使用特性
Series 支持arry的特性(下标): 从 ndarray 创建 Series: Series(arr) 与标量运算:sr*2 两个 benes运算:sr1 + sr2 索引:sr[0],sr[[1,2,4]] 切片:sr[0:2] 通用函数:np.abs(sr) 布尔值过滤:sr[sr>0] Series支持字典的特性(标签) 从字典创建 Series: Series(dic), in运算:'a' in sr 键索引:sr['a'],sr[['a','b','d']]
In [1]: import pandas as pd In [2]: import numpy as np In [3]: pd.Series(np.arange(5)) Out[3]: 0 0 1 1 2 2 3 3 4 4 dtype: int32 In [4]: pd.Series([2,3,4,5],index=['a','b','c','d']) Out[4]: a 2 b 3 c 4 d 5 dtype: int64 In [5]: sr = pd.Series([2,3,4,5],index=['a','b','c','d']) In [6]: sr[0] Out[6]: 2 In [7]: sr + 2 Out[7]: a 4 b 5 c 6 d 7 dtype: int64 In [8]: sr + sr Out[8]: a 4 b 6 c 8 d 10 dtype: int64 In [9]: sr[0:2] Out[9]: a 2 b 3 dtype: int64 In [10]: sr Out[10]: a 2 b 3 c 4 d 5 dtype: int64 In [11]: sr[sr>4] Out[11]: d 5 dtype: int64 In [12]: sr = pd.Series({'a':1,'b':2}) In [13]: sr Out[13]: a 1 b 2 dtype: int64 In [12]: sr = pd.Series({'a':1,'b':2}) In [13]: sr Out[13]: a 1 b 2 dtype: int64 In [14]: sr['a'] Out[14]: 1 In [15]: 'a' in sr Out[15]: True In [16]: 'c' in sr Out[16]: False In [17]: for i in sr: ...: print(i) ...: 1 2 In [18]: sr.index Out[18]: Index(['a', 'b'], dtype='object') In [19]: sr.index[0] Out[19]: 'a' In [20]: sr.values Out[20]: array([1, 2], dtype=int64) In [21]: sr = pd.Series([1,2,3,4],index=['a','b','c','d']) In [22]: sr Out[22]: a 1 b 2 c 3 d 4 dtype: int64 In [24]: sr[['a','c']] Out[24]: a 1 c 3 dtype: int64 In [25]: sr['a':'c'] Out[25]: a 1 b 2 c 3 dtype: int64