pandas基础知识(未完成)
pandas基础知识
pandas的数据结构
Series
- Pandas Series 类似表格中的一个列(column),类似于一维数组,可以保存任何数据类型
- Series 由索引(index)和列组成,函数如下:
- Series只能输出一个一维表格
pandas.Series( data, index, dtype, name, copy)
'''
data:一组数据(ndarray 类型)。
index:数据索引标签,如果不指定,默认从 0 开始
dtype:数据类型,默认会自己判断
name:设置名称
copy:拷贝数据,默认为 False
'''
#指定索引
import pandas as pd
a = ["Google", "Runoob", "Wiki"]
myvar = pd.Series(a, index = ["x", "y", "z"])
print(myvar)
#输出结果
'''
x Google
y Runoob
z Wiki
dtype: object
'''
import pandas as pd
a = ["Google", "Runoob", "Wiki"]
myvar = pd.Series(a, index = ["x", "y", "z"])
print(myvar["y"])
#输出结果
'''
"Runoob"
'''
#个人感觉,在写入的问题上,只要是有序的数据都是可以的
DataFrame
-
DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)
-
DataFrame 构造方法如下:
#DataFrame 构造方法如下:
pandas.DataFrame( data, index, columns, dtype, copy)
'''
参数说明:
data:一组数据(ndarray、series, map, lists, dict 等类型)。
index:索引值,或者可以称为行标签。
columns:列标签,默认为 RangeIndex (0, 1, 2, …, n) 。
dtype:数据类型。
copy:拷贝数据,默认为 False。
Pandas DataFrame 是一个二维的数组结构,类似二维数组。
'''
- 如果不加索引的值就是0或1,要记住可以定义数据类型
记录学习的点点滴滴