pandas介绍
pandas是一个python包,它提供了快速、灵活、易用的数据结构,旨在处理“关系”或“带标签”数据既直观又高效,它是一个极强的数据分析工具。
官网:https://pandas.pydata.org/docs/,因为外网访问速度比较慢,我们可以下载整个文档的压缩包方便查看,如下所示
1 数据结构
Pandas主要提供了两种核心的数据结构:Series和DataFrame。
Series:
Series是一种一维的数组型对象,它包含值序列和数据标签。
每个Series对象实际上由两个数组组成:
值数组:存储数据,可以是任何NumPy数据类型。
索引数组:存储值数组中每个数据点的标签。
示例
import pandas as pd data = pd.Series([1, 3, 5, 7, 9])
DataFrame:
DataFrame是一个二维的表格型数据结构,非常类似于Excel表格或SQL数据库中的表。
它可以被看作是由多个Series组成的字典,每个Series作为DataFrame的一列。
DataFrame有两个索引:
行索引:沿着行的方向,可以通过index属性访问。
列索引:沿着列的方向,可以通过columns属性访问。
示例
data = { 'Country': ['Belgium', 'India', 'Brazil'], 'Capital': ['Brussels', 'New Delhi', 'Brasília'], 'Population': [11190846, 1303171035, 207847528] } df = pd.DataFrame(data)
其所有功能都可以从官方文档中查看,举例,读取csv文档
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
· 葡萄城 AI 搜索升级:DeepSeek 加持,客户体验更智能
· 什么是nginx的强缓存和协商缓存
· 一文读懂知识蒸馏