Pandas ( Python Data Analysis Library )是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一
python中有三种数据结构
- Series:一维数组,与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近,其区别是:List中的元素可以是不同的数据类型,而array和Series中则只允许存储相同的数据类型,这样可以更有效的使用内存,提高运算效率。Time- Series:以时间为索引的Series。
- DataFrame:二维的表格型数据结构。很多功能与R中的data.frame类似。可以将DataFrame理解为Series的容器。DataFrame是用的最多的数据结构
- Panel :三维的数组,可以理解为DataFrame的容器。
pandas可以读取很多种的数据,用的比较多的是读取 htm、json、csv的数据
import pandas
data1=pandas.read_html('1.html') #读取html格式数据
data2=pandas.read_json('2.json') #读取json格式数据
data3=pandas.read_csv('3.csv') #读取csv格式的数据
Series
系列(Series)是能够保存任何类型的数据(整数,字符串,浮点数,Python对象等)的一维标记数组。轴标签统称为索引
Series的创建函数:pandas.Series( data, index, dtype,copy )
参数 | 描述 |
data | 数据采取各种形式,如:ndarray, list, contants |
index | 索引值必须是唯一的和散列的,与数据的长度相同,默认np.arange(n) 如果没有索引被传递 |
dtype | dtype用户数据类型,如果没有,将推断数据类型 |
copy | 复制数据,默认为false |
序列的创建
创建一个空series序列
import pandas
data = pandas.Series()
print(type(data))
print(data)
从字典创建一个series序列
import pandas
data = {"name": "xie", "sex": "man", "id": 66}
ser = pandas.Series(data)
print(ser)
序列的读取
读取直接用[’行名‘], 序列只可以读取行的内容
import pandas
data = {"name": "xie", "sex": "man", "id": 66}
ser = pandas.Series(data)
print(ser)
print(ser['name'])
print(ser['sex'])
print(ser['id'])
DataFrame
数据帧(DataFrame)是二维数据结构,即数据以行和列的表格方式排列。
数据帧(DataFrame)的功能特点:
- 潜在的列是不同的类型
- 大小可变
- 标记轴(行和列)
- 可以对行和列执行算术运算
DataFrame的创建函数:pandas.DataFrame( data, index, columns, dtype, copy)
参数 | 描述 |
data | 数据采取各种形式,如:ndarray,series,map,lists,dict,contant和另一个DataFrame |
index | 对于行标签,要用于结果帧的索引是可选缺省值np.arrange(n),如果没有传递索引值 |
columns | 对于列标签,可选的默认语法是np.arange(n)这只有在没有索引传递的情况下才是这样 |
dtype | 每列的数据类型 |
copy | 如果默认值为false,则此命令用于复制数据 |
Dataframe的创建
创建一个空DataFrame序列
import pandas
df =pandas.DataFrame()
print(type(df))
print(df)
从字典创建一个DataFrame序列(必须加index)
import pandas
data = {"name": "xie", "sex": "man", "id": 66}
df = pandas.DataFrame(data, index=[0])
print(df)
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· winform 绘制太阳,地球,月球 运作规律
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 上周热点回顾(3.3-3.9)
· AI 智能体引爆开源社区「GitHub 热点速览」
· 写一个简单的SQL生成工具