Pandas数据结构(一)——Pandas Series

 

Pandas 是 Python 中基于Numpy构建的数据操纵和分析软件包,包含使数据分析工作变得快速简洁的高级数据结构和操作工具。通过Pandas Series 和 Pandas DataFrame这两个数据结构,我们可以轻松直观地处理带标签数据和关系数据。本节主要介绍Pandas Series的基本使用。

 

Pandas Series

Pandas Series是一种类似于数组的一维对象,可以存储不同类型的数据。其中,Series对象的数据存在一组与之关联的数据标签(索引),通过Series的values和index能够获取其数组表示形式和索引对象。你可以为Pandas Series 中的每个元素指定索引,并通过索引选取Series中的单个或一组值。

首先,在 Python 中导入 Pandas,通常使用pd导入 Pandas。

import pandas as pd

 

使用 pd.Series(data, index) 命令创建 Pandas Series, index 是一个索引标签列表。

我们创建 一个Pandas Series 对象来存储商品信息,其中单价为数据,商品名为索引标签。

import pandas as pd
goods = pd.Series(data = [39,8,15], index = ['pen', 'ice cream', 'notebook'])
goods

运行结果:

 

如果不指定索引标签,则默认索引从0开始。

import pandas as pd
words = pd.Series(data = ['a','b','c','d'])
words

 

 我们还可以单独输出 Pandas Series 的索引标签和数据来查看详细内容。

print('商品单价:', goods.values)
print('商品名:', goods.index)

运行结果:

 

 如果你不清楚是否存在某个索引标签,可以使用 in命令来判断该标签是否存在:

aa = 'notebook' in goods
bb = 'milk' in goods
cc = 'pen' in goods
print(aa,bb,cc)

运行结果:

 

 Pandas Series 的算术运算

还是使用上面存储商品信息的实例,我们来对其进行元素级算术运算。

print(goods + 1) 
print()
print(goods - 2) 
print()
print(goods * 3) 
print()
print(goods / 4) 

运行结果:

 

除此之外, 我们也可以对Series对象的部分条目应用算术运算。如下所示:

print(goods['pen'] + 5)
print(goods.iloc[0] - 2)
print(goods[['ice cream', 'notebook']] * 10)

运行结果:

 

 




 

 



posted @ 2020-02-23 22:09  圈er  阅读(341)  评论(1编辑  收藏  举报