pandas | value_counts()的用法
value_counts()
方法返回一个序列Series,该序列用于统计某列中各个值的出现次数的函数。当配合参数 bins
使用时,它可以将数据分成指定的区间,然后统计每个区间内值的出现次数。
value_counts()
是Series拥有的方法,一般在DataFrame中使用时,需要指定对哪一列或行使用。value_counts()
只能对应series,不能直接对整个Dataframe做操作。
例:假设有一个包含身高数据的DataFrame:
姓名 | 身高 |
---|---|
小明 | 175 |
小红 | 180 |
小刚 | 160 |
小丽 | 180 |
小美 | 162 |
小强 | 175 |
小林 | 180 |
可以使用 value_counts()
统计各个身高出现的次数:
height_counts = df['身高'].value_counts()
结果如下:
180 3
175 2
162 1
160 1
Name: 身高, dtype: int64
这表示在数据中,身高为180cm的出现了3次,175cm出现了2次,162cm出现了1次,160cm出现了1次。
如果想将身高分成几个区间并统计每个区间内的人数,可以使用 bins
参数:
height_counts_bins = df['身高'].value_counts(bins=[150, 160, 170, 180, 190])
这将把身高分成以下区间:(150, 160], (160, 170], (170, 180], (180, 190],然后统计每个区间内的人数。
那么 height_counts_bins 的输出结果:
(150.0, 160.0] 1
(160.0, 170.0] 1
(170.0, 180.0] 5
(180.0, 190.0] 0
Name: 身高, dtype: int64
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix