爬虫与Python:(四)爬虫进阶扩展之Pandas——3.数据结构Series

1. 定义

Pandas Series 类似表格中的一个列(column),类似于一维数组,可以保存任何数据类型。

Series 由索引(index)和列组成,函数如下:

pandas.Series( data, index, dtype, name, copy)

2. 参数

参数 说明
data 一组数据(ndarray 类型)
index 数据索引标签,如果不指定,默认从 0 开始
dtype 数据类型,默认会自己判断
name 设置名称
False 拷贝数据,默认为 False

3. 实例

3.1 简单实例方法

1 import pandas as pd
2 
3 a = [1, 2, 3]
4 myvar = pd.Series(a)
5 print(myvar)

输出结果如下:

从上图可知,如果没有指定索引,索引值就从 0 开始,我们可以根据索引值读取数据:

1 import pandas as pd
2 
3 a = [1, 2, 3]
4 myvar = pd.Series(a)
5 print(myvar[1])

输出结果为: 2

3.2 指定索引值

我们可以指定索引值。例如,将原例子的[1,2,3]替换为[x,y,z]。

1 import pandas as pd
2 
3 a = ["Google", "Runoob", "Wiki"]
4 myvar = pd.Series(a, index = ["x", "y", "z"])
5 print(myvar)

只是,可以根据索引来读取:

1 import pandas as pd
2 
3 a = ["Google", "Runoob", "Wiki"]
4 myvar = pd.Series(a, index = ["x", "y", "z"])
5 print(myvar["y"])

输出结果为: Runoob

3.3 用对象来创建Series

我们也可以使用 key/value 对象,类似字典来创建 Series。

1 import pandas as pd
2 
3 sites = {1: "Google", 2: "Runoob", 3: "Wiki"}
4 myvar = pd.Series(sites)
5 print(myvar)

输出结果如下:

 从以上图可知,字典的“key”变成了索引值。

如果我们只需要字典中的一部分数据,只需要指定需要数据的索引即可,如下实例:

1 import pandas as pd
2 
3 sites = {1: "Google", 2: "Runoob", 3: "Wiki"}
4 myvar = pd.Series(sites, index = [1, 2])
5 print(myvar)

输出结果为:

  3.4 设置Series参数名称

1 import pandas as pd
2 
3 sites = {1: "Google", 2: "Runoob", 3: "Wiki"}
4 myvar = pd.Series(sites, index = [1, 2], name="RUNOOB-Series-TEST" )
5 print(myvar)

运行结果如下:

4. 参考网址

posted @ 2021-10-27 20:11  陆陆无为而治者  阅读(35)  评论(0编辑  收藏  举报