欢迎这位怪蜀黍来到《Python机器学习(八十一)Pandas Series 与 DataFrame - 大码王 - 博客园》

关闭页面特效

Pandas的两个主要数据结构是SeriesDataFrame

DataFrame可以理解为一张表,Series就是其中的一个列。

图

DataFrameSeries在许多操作上是相似的,通常在一个上能做的操作在另一个上也能做,如填充空值和计算平均值。

Pandas 创建 DataFrame

要创建DataFrame的方法很多,下面的方法使用字典创建DataFrame。

例如,水果订单数据可以表示为字典,每种水果一列,每个顾客一行,如下所示:

data = {
    'apples': [3, 2, 0, 1], 
    'oranges': [0, 3, 7, 2]
}

然后将其传递给Pandas DataFrame构造函数:

purchases = pd.DataFrame(data)

purchases

输出

   apples  oranges
0       3        0
1       2        3
2       0        7
3       1        2

字典中的每个(键、值)项对应于DataFrame中的一列。

DataFrame中默认索引是数字(0~3),我们也可以指定索引。

下面以客户名作为索引:

purchases = pd.DataFrame(data, index=['June', 'Robert', 'Lily', 'David'])

purchases

输出

        apples  oranges
June         3        0
Robert       2        3
Lily         0        7
David        1        2

现在我们可以用客户名来定位订单:

purchases.loc['June']

输出

apples     3
oranges    0
Name: June, dtype: int64

 

 posted on   大码王  阅读(355)  评论(0编辑  收藏  举报
编辑推荐:
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具

成都

复制代码

喜欢请打赏

扫描二维码打赏

了解更多

点击右上角即可分享
微信分享提示