python词云生成-wordcloud库

python词云生成-wordcloud库

全文转载于'https://www.cnblogs.com/nickchen121/p/11208274.html#autoid-0-0-0'

一.wordclound库基本介绍

1.1wordclound

wordcloud是优秀的词云展示第三方库

049-模块6-wordcloud库的使用-01.jpg?x-oss-process=style/watermark

  • 词云以词语为基本单位,更加直观和艺术的展示文本

1.2 wordcloud库的安装

049-模块6-wordcloud库的使用-02.jpg?x-oss-process=style/watermark

二、wordcloud库使用说明

2.1 wordcloud库的使用

  • wordcloud.WordCloud()代表一个文本对应的词云
  • 可以根据文本中词语出现的频率等参数绘制词云
  • 绘制词云的形状、尺寸和颜色都可以设定

2.2 wordcloud库常规方法

  • 以WordCloud对象为基础
  • 配置参数、加载文本、输出文件
方法 描述
w.generate(txt) 向WordCloud对象w中加载文本txt,w.generate("Python and WordCloud")
w.to_file(filename) 将词云输出为图像文件,.png或.jpg?x-oss-process=style/watermark格式,w.to_file("outfile.png")
  • 步骤1:配置对象参数
  • 步骤2:加载词云文本
  • 步骤3:输出词云文件
复制import wordcloud

w = wordcloud.WordCloud()
w.generate("Python and WordCloud")
c.to_file("pywordcloud.png")

049-模块6-wordcloud库的使用-03.jpg?x-oss-process=style/watermark

049-模块6-wordcloud库的使用-04.jpg?x-oss-process=style/watermark

2.3 配置对象参数

参数 描述
width 指定词云对象生成图片的宽度,默认400像素
height 指定词云对象生成图片的高度,默认200像素
min_font_size 指定词云中字体的最小字号,默认4号
max_font_size 指定词云中字体的最大字号,根据高度自动调节
font_step 指定词云中字体字号的步进间隔,默认为1
font_path 指定字体文件的路径,默认None
max_words 指定词云显示的最大单词数量,默认200
stop_words 指定词云的排除词列表,即不显示的单词列表
mask 指定词云形状,默认为长方形,需要引用imread()函数
background_color 指定词云图片的背景颜色,默认为黑色
复制# mask
from imageio import imread 

mk=imread("pic.png")
w=wordcloud.WordCloud(mask=mk)

2.4 wordcloud应用实例

049-模块6-wordcloud库的使用-05.jpg?x-oss-process=style/watermark

中文需要先分词并组成空格分隔字符串

复制import jieba
import wordcloud

txt = "Nick 是上海虹桥最帅的男人,没有之一,因为他就是最帅的"

w = wordcloud.WordCloud( width=1000,\
font_path="/Library/Fonts/Heiti.ttc",height=700)
w.generate(" ".join(jieba.lcut(txt)))
w.to_file("pywcloud.png")
import jieba
import wordcloud

txt = "YWY"

w = wordcloud.WordCloud( width=1000,\
font_path="/Library/Fonts/Heiti.ttc",height=700)
w.generate(" ".join(jieba.lcut(txt)))
w.to_file("pywcloud.png")
Building prefix dict from the default dictionary ...
Loading model from cache /var/folders/mh/krrg51957cqgl0rhgnwyylvc0000gn/T/jieba.cache
Loading model cost 1.047 seconds.
Prefix dict has been built succesfully.


049-模块6-wordcloud库的使用-07.png?x-oss-process=style/watermark

posted @   小小咸鱼YwY  阅读(5877)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
欢迎阅读『python词云生成-wordcloud库』

目录导航

点击右上角即可分享
微信分享提示