在线生成词云图
- WordArt
定制性比较强,支持中文,但是图中的词需要手动输入。
https://wordart.com/
- 图悦
支持分析大段文字并生成词云图,但是功能相对比较简单。
http://www.picdata.cn/picdata/index.php
Python生成词云图
本文介绍使用Python程序生成词云图,它依赖的三方库wordcloud需要编译C++库,在Windows搭建环境比较复杂,建议在Linux系统中安装使用。
下例中使用了urllib库从抓取网页内容,jieba库用于分词,wordcould库用于生成词云,代码如下:
import matplotlib.pyplot as plt
import jieba
from wordcloud import WordCloud
import urllib.request
import html2text
%matplotlib inline
#url = 'https://mp.weixin.qq.com/s/Pr04533M2chdA3pVA8idNA'
url = 'http://baijiahao.baidu.com/s?id=1645663163087703799&wfr=spider&for=pc'
page = urllib.request.urlopen(url)
contents = page.read().decode()
h = html2text.HTML2Text()
h.ignore_links=True # 去掉超链接
text = h.handle(contents)
text = text.replace(' ', '')
text = text.replace('*', '')
text = text.replace('\n', ' ')
cut_text = jieba.cut(text) # 分词
result = " ".join(cut_text)
print(result)
wc = WordCloud(
font_path='simhei.ttf',
background_color='white',
width=1000,
height=600,
max_font_size=50,
min_font_size=10,
max_words=200,
mask=plt.imread('star.jpg') #mask图片
)
wc.generate(result)
wc.to_file('ciyun.png') #图片保存
plt.imshow(wc) # 显示图片
plt.axis('off') #关闭坐标
plt.show()
读者替换网址后,重新运行即可生成词云图。其中的mask图片用于设置词云的形状,本例中使用了背景为白色,前景为黑色的图片star.jpg(注意使用jpg格式图片),效果如下图所示(左侧为mask,右侧为生成的词云图):
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具