pandas介绍

pandas是一个python包,它提供了快速、灵活、易用的数据结构,旨在处理“关系”或“带标签”数据既直观又高效,它是一个极强的数据分析工具。

官网:https://pandas.pydata.org/docs/,因为外网访问速度比较慢,我们可以下载整个文档的压缩包方便查看,如下所示

1 数据结构

Pandas主要提供了两种核心的数据结构:Series和DataFrame。
Series
Series是一种一维的数组型对象,它包含值序列数据标签
每个Series对象实际上由两个数组组成:
值数组:存储数据,可以是任何NumPy数据类型。
索引数组:存储值数组中每个数据点的标签。
示例

import pandas as pd
data = pd.Series([1, 3, 5, 7, 9])

DataFrame
DataFrame是一个二维的表格型数据结构,非常类似于Excel表格或SQL数据库中的表。
它可以被看作是由多个Series组成的字典,每个Series作为DataFrame的一列。
DataFrame有两个索引:
行索引:沿着行的方向,可以通过index属性访问。
列索引:沿着列的方向,可以通过columns属性访问。
示例

data = {
'Country': ['Belgium', 'India', 'Brazil'],
'Capital': ['Brussels', 'New Delhi', 'Brasília'],
'Population': [11190846, 1303171035, 207847528]
}
df = pd.DataFrame(data)

其所有功能都可以从官方文档中查看,举例,读取csv文档

 

 

posted @ 2024-02-19 11:12  zhenjingcool  阅读(9)  评论(0编辑  收藏  举报