pandas
数据结构介绍
series
- 给一组数据增加索引
- 索引在左,值在右
dataframe
- 表格型数据结构,包含一组有序的列,每列还可以是不同的数据类型
基本功能
重新索引 reindex
- 对索引重新排序,值也随之排序
data = np.arange(0,3)
a = pd.Series(data)
print(a)
print(a.reindex([3,2,1]))
print(a)
丢弃轴上的项 drop
索引,选取和过滤
- 利用标签切片,末端是包含的
使用 loc 和 iloc进行选取
- loc就是使用标签以及列名选取,iloc就是按照列的顺序选取
data = np.arange(16).reshape(4,4)
a = pd.DataFrame(data,index=['a','b','c','d'],columns=['一','二','三','四'])
print(a)
print(a.loc['a',['一','三']])
print(a.iloc[0,[0,2]])
算术运算和数据对齐
- 相加有空值 使用add()方法,fill_value填充
dataframe和series之间运算
- 广播 dataframe - series 每行都减
函数的应用和映射
- np的ufuncs方法也可以作用于 pd 上
排序和排名
- sort_index方法 按照索引排序 默认升序(ascending=false)
- sort_values 按值排序
根据多个列排序,传入名称列表即可
frame.sort-values(by=['a','b'])
214 cuizhijie
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 展开说说关于C#中ORM框架的用法!