【python】python玩转wordcloud词云
1.引入必要的库:
jieba:用于中文分词。 wordcloud:用于生成词云图。 matplotlib:用于显示词云图。 numpy和PIL:用于处理图像,如设置词云图形状。
2.读取文本:
使用open函数读取文本文件,例如: with open("yourfile.txt", "r", encoding="utf-8") as f: text = f.read()
3.分词处理:
利用jieba进行中文分词,并设置停用词过滤不需要的词汇。
4.设置词云图形状:
可以通过PIL库读取一个PNG图片作为词云的形状。
5.字体设置:
设置词云图使用的字体路径和大小,确保中文显示无误。
6.生成词云图:
使用wordcloud库的WordCloud类生成词云图,并通过matplotlib展示。
示例代码
import jieba from wordcloud import WordCloud import matplotlib.pyplot as plt from PIL import Image import numpy as np # 读取文本内容 text = open("yourfile.txt", encoding="utf-8").read() # 中文分词 words = jieba.cut(text) words = [word for word in words if len(word) >= 2] # 过滤单个字符 # 设置停用词 stopwords = set(["的", "和", "是"]) # 示例停用词 # 设置词云图形状 mask_image = np.array(Image.open("yourmask.png")) # 设置字体路径 font_path = "C:\\Windows\\Fonts\\STLITI.TTF" # 生成词云 wordcloud = WordCloud( font_path=font_path, mask=mask_image, background_color='white', stopwords=stopwords ).generate(' '.join(words)) # 显示词云图 plt.imshow(wordcloud, interpolation='bilinear') plt.axis('off') plt.show() # 保存词云图 wordcloud.to_file("wordcloud.png")
注意事项
- 确保安装了所有必要的库,否则代码将无法运行。
- 字体路径需要根据实际情况进行设置,以确保中文能够正确显示。
- PNG掩膜图片应该是透明背景的,以便词云能够呈现出预期的形状。
参考链接
- 知乎:Python库——词云库Wordcloud(附源码):由浅入深
- 知乎:python生成词云图太简单了|拿来就用能的Python词云图代码:进阶
- 【Python】生成词云图太简单了|拿来就用能的词云图代码:辅助参考
- 使用 Python 绘制词云图的详细教程:辅助参考
- csdn 使用 Python 绘制词云图的详细教程
TBD
分类:
语言Java|py|c
标签:
python
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 微软正式发布.NET 10 Preview 1:开启下一代开发框架新篇章
· 没有源码,如何修改代码逻辑?
· PowerShell开发游戏 · 打蜜蜂
· 在鹅厂做java开发是什么体验
· WPF到Web的无缝过渡:英雄联盟客户端的OpenSilver迁移实战
2019-01-02 【学习总结】C-翁恺老师-入门-总