pandas数据结构
1.Series是一种类似于一维数组的对象,它由一组数据和索引组成
1.1 仅有数据列表即可产生最简单的Series
import pandas as pd s1 = pd.Series([1,'a',5.2,7]) print(s1)
- 操作
s1.index##获取索引 #RangeIndex(start=0, stop=4, step=1) s1.values #array([1, 'a', 5.2, 7], dtype=object)
1.2 创建一个具有标签索引的Series
s2 = pd.Series([1, 'a', 5.2, 7], index=['d','b','a','c'])
s2.index #Index(['d', 'b', 'a', 'c'], dtype='object')
1.3 使用python字典创建Series
sdata={'Ohio':35000,'Texas':72000,'Oregon':16000,'Utah':5000} s3 = pd.Series(sdata)
1.4 根据标签索引查询数据
s2['c'] # 7 type(s2['a']) # float
2. DataFrame是一个表格型的数据结构
df = pd.DataFrame( { 'state':['Ohio','Ohio','Ohio','Nevada','Nevada'], 'year':[2000,2001,2002,2001,2002], 'pop':[1.5,1.7,3.6,2.4,2.9] } )
- 操作
df.dtypes ##查询数据类型 df.columns #列名 df.index #索引
3. 从DataFrame中查询出Series
- 如果只查询一行或者一列,则返回的是pd.Series
- 如果查询多行,多列,则返回的是pd.DataFrame
df['year'] #查询一列 type(df['year']) #pandas.core.series.Series df[['year','pop']] #查询多列 df.loc[2] #查询第三行 df.loc[1:3] #查询一到三行 type(df.loc[1:3]) #pandas.core.frame.DataFrame
微笑向暖安之若素,你若盛开清风自来
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 三行代码完成国际化适配,妙~啊~
· .NET Core 中如何实现缓存的预热?