pandas

数据结构介绍

series

  • 给一组数据增加索引
  • 索引在左,值在右

dataframe

  • 表格型数据结构,包含一组有序的列,每列还可以是不同的数据类型

基本功能

重新索引 reindex

  • 对索引重新排序,值也随之排序
data = np.arange(0,3)
a = pd.Series(data)
print(a)
print(a.reindex([3,2,1]))
print(a)

丢弃轴上的项 drop

索引,选取和过滤

  • 利用标签切片,末端是包含的

使用 loc 和 iloc进行选取

  • loc就是使用标签以及列名选取,iloc就是按照列的顺序选取
data = np.arange(16).reshape(4,4)
a = pd.DataFrame(data,index=['a','b','c','d'],columns=['一','二','三','四'])
print(a)
print(a.loc['a',['一','三']])
print(a.iloc[0,[0,2]])

算术运算和数据对齐

  • 相加有空值 使用add()方法,fill_value填充

dataframe和series之间运算

  • 广播 dataframe - series 每行都减

函数的应用和映射

  • np的ufuncs方法也可以作用于 pd 上

排序和排名

  • sort_index方法 按照索引排序 默认升序(ascending=false)
  • sort_values 按值排序
    根据多个列排序,传入名称列表即可
    frame.sort-values(by=['a','b'])

214 cuizhijie

posted @   braveman1021  阅读(69)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 展开说说关于C#中ORM框架的用法!
点击右上角即可分享
微信分享提示