[笔记] 利用词云图分析热词
1.安装第三方库(matplotlib,jieba,wordcloud,numpy)
1.1安装方法:pip命令在线安装(python3.x默认安装了pip,pip下载地址:https://pypi.python.org/pypi/pip#downloads)
已经配置好环境变量前提下,在cmd窗口直接运行:pip install 包名(应为我已经安装过了,所以提示已经安装过了),如 pip install numpy
1.2官网下载对应的whl进行安装
在 http://www.lfd.uci.edu/~gohlke/pythonlibs/ 下载所需的库的.whl文件,注意如果安装Python3.6,应下载对应的cp36的.whl文件,运行pip install **.whl
2. 导入对应的库
1 2 3 4 5 6 7 | import matplotlib import matplotlib.pyplot as plt #数据可视化 import jieba #词语切割 import wordcloud #分词 from wordcloud import WordCloud,ImageColorGenerator,STOPWORDS #词云,颜色生成器,停止 import numpy as np #科学计算 from PIL import Image #处理图片 |
3.主要实现代码
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 | def ciyun(): #打开文本 textfile = open ( '1.txt' ).read() #读取文本内容 wordlist = jieba.cut_for_search(textfile) #切割词语 space_list = ' ' .join(wordlist) # 链接词语 backgroud = np.array(Image. open ( '2.jpg' )) #背景图片,只有黑白图才能按照形状生成词云 mywordcloud = WordCloud(width = 1400 , height = 1200 , background_color = 'white' , #背景颜色 mask = backgroud, #写字用的背景图,从图片中提取颜色 max_words = 500 , #最大词语数 stopwords = STOPWORDS, #停止的默认词语 font_path = 'simkai.ttf' , #源码自带字体 max_font_size = 100 , #最大字体尺寸 random_state = 50 , #随机角度 scale = 1 ).generate(space_list) #生成词云 image_color = ImageColorGenerator(backgroud) #生成词云的颜色 plt.imshow(mywordcloud) #显示词云 plt.axis( 'off' ) #关闭坐标(x,y轴) #plt.savefig('4.png') #保存图片 plt.show() #显示 def main(): ciyun() if __name__ = = '__main__' : main() |
4.效果如下:
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· .NET Core 托管堆内存泄露/CPU异常的常见思路
· PostgreSQL 和 SQL Server 在统计信息维护中的关键差异
· C++代码改造为UTF-8编码问题的总结
· DeepSeek 解答了困扰我五年的技术问题
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· 清华大学推出第四讲使用 DeepSeek + DeepResearch 让科研像聊天一样简单!
· 实操Deepseek接入个人知识库
· CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库