Pandas的两个主要数据结构是Series
和DataFrame
。
DataFrame
可以理解为一张表,Series
就是其中的一个列。
DataFrame
和Series
在许多操作上是相似的,通常在一个上能做的操作在另一个上也能做,如填充空值和计算平均值。
Pandas 创建 DataFrame
要创建DataFrame的方法很多,下面的方法使用字典创建DataFrame。
例如,水果订单数据可以表示为字典,每种水果一列,每个顾客一行,如下所示:
data = { 'apples': [3, 2, 0, 1], 'oranges': [0, 3, 7, 2] }
然后将其传递给Pandas DataFrame构造函数:
purchases = pd.DataFrame(data)
purchases
输出
apples oranges 0 3 0 1 2 3 2 0 7 3 1 2
字典中的每个(键、值)项对应于DataFrame中的一列。
DataFrame中默认索引是数字(0~3),我们也可以指定索引。
下面以客户名作为索引:
purchases = pd.DataFrame(data, index=['June', 'Robert', 'Lily', 'David']) purchases
输出
apples oranges June 3 0 Robert 2 3 Lily 0 7 David 1 2
现在我们可以用客户名来定位订单:
purchases.loc['June']
输出
apples 3
oranges 0
Name: June, dtype: int64
本文来自博客园,作者:大码王,转载请注明原文链接:https://www.cnblogs.com/huanghanyu/
分类:
人工智能之机器学习
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具