Python———pandas数据处理
pandas模块
更高级的数据分析工具
基于NumPy构建
包含Series和DataFrame两种数据结构,以及相应方法
基于NumPy构建
包含Series和DataFrame两种数据结构,以及相应方法
调用方法:
from pandas import Series, DataFrame
import pandas as pd
from pandas import Series, DataFrame
import pandas as pd
Series
又像数组又像字典:
有序
通常是同构的
元素采用NumPy中的数据类型
既以按键索引,又可以按序号索引
又像数组又像字典:
有序
通常是同构的
元素采用NumPy中的数据类型
既以按键索引,又可以按序号索引
默认创建:
以字典形式创建
以常规形式创建
Series算术运算中按照键来对齐
NaN和数字做运算,得NaN
DataFrame
很像一个Excel表格
含有一组有序的列
列内(应该)同构,列之间可以是不同的数据类型
既有列索引,也有行索引
以二维结构保存数据(高维数据视作二维表格的叠加)
含有一组有序的列
列内(应该)同构,列之间可以是不同的数据类型
既有列索引,也有行索引
以二维结构保存数据(高维数据视作二维表格的叠加)
改名?增加列
按列读取、、按行读取
按行、列索引
丢弃指定行、列
插入列
过滤
按索引排序