保存DataFrame.value_counts()的结果为字典

在实际应用中，经常需要把统计一段字符中，每个词出现的次数，也就是词频。统计次数有一个现成的方法就是DataFrame.value_counts()，问题是如何保存结果为我们所用。思路就是把value_counts的两列先分别转成列表，再讲两个列表转成字典。

复制代码

import pandas as pd
data = pd.DataFrame({'a':['a','b','c','a']})
data_counts = data.a.value_counts()  #通过value_counts计算词频
df_data_counts = pd.DataFrame(data_counts)  #将词频结果转成DataFrame格式。
                        # 但是需要注意，转成的DataFrame的索引是需要被统计的词，列是词出现的次数

print(df_data_counts.index.values.tolist())  #把词转成列表
print(df_data_counts['a'].tolist())  #把词出现的次数转成列表
print(dict(zip(df_data_counts.index.values.tolist(),df_data_counts.a.tolist())))  #转成字典

复制代码

posted @ 2020-08-23 18:58 理工—王栋轩阅读(5252) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

编辑推荐：
· .NET Core 中如何实现缓存的预热？
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列：向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列：如何用heaptrack跟踪.NET程序的非托管内存泄露

阅读排行：
· TypeScript + Deepseek 打造卜卦网站：技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗？
· 如何调用 DeepSeek 的自然语言处理 API 接口并集成到在线客服系统
· 【译】Visual Studio 中新的强大生产力特性
· 2025年我用 Compose 写了一个 Todo App

公告

昵称：理工—王栋轩
园龄： 6年6个月
粉丝： 19
关注： 1

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:深度学习-yolo标签xml转成txt
@理工—王栋轩好的，感谢博主...
--可能要下雪
2. Re:深度学习-yolo标签xml转成txt
@可能要下雪改成你需要识别的内容，没有类别就是一种。...
--理工—王栋轩
3. Re:深度学习-yolo标签xml转成txt
博主，我的数据集是标注出仪表盘的位置，没有什么类别，请问第7行应该怎么修改呢
--可能要下雪
4. Re:深度学习-yolo标签xml转成txt
@理工—王栋轩我也是一开始没有碰到，今天也才遇到的~猜测可能是有的用labelimage，有的用labelme标注的xml默认输出不一样的编码...
--我会发光啊
5. Re:深度学习-yolo标签xml转成txt
@我会发光啊感谢提供建议！暂时没有碰到这个问题啊，后续应用碰到这个问题，我注意一下...
--理工—王栋轩