听见涛声_数说张小桃

日拱一卒 | 梳理、沉淀、数据科学家踩坑之路 | 努力成为数据分析领域python最强的人

导航

Python -WordCloud安装、词云制作

 

一、WordCloud 安装

说明:Windows系统直接pip install wordcloud 是不行的,命令行会报错。

第一步:检查自己的Python 版本。Win+R ——>CMD——>命令行输入python,我的是python 3.7 win32位的

 

 

第二步:下载对应版本的WordCloud,进入 python 扩展包库 (非正式第三方whl文件包)下载

 

 

第三步:安装。命令行先定位到下载的wordcloud安装文件路径,再输入 pip install wordcloud-1.6.0-cp37-cp37m-win32.whl  回车安装

 

 

 

二、词云制作

# 导入相关库
import jieba
from wordcloud import WordCloud
from PIL import Image
import numpy as np
from matplotlib import pyplot as plt

 
# 分词(或者直接读取分词后的文件)
with open('C:/Users/Administrator/Desktop/test.txt') as f:
    f_read = f.read()
    key_words =" ".join(jieba.cut(f_read)) # 分词再组成字符串
    print(key_words)
    
# 增加一个词云图片(一定得白底背景图)
images = Image.open("C:/Users/Administrator/Desktop/map.jpg") # Image打开图片
images_array = np.array(images) # 然后用numpy转换一下成数组

   
# 生成词云(自动按词频展示大小)
wc =WordCloud( font_path="msyh.ttc"    # 注意:font_path字体样式不要漏掉,否则中文会乱码
              ,background_color="white" # 背景底色
              ,mask=images_array # 插入的图片
              ,collocations=False # 是否统计搭配词(默认True,会导致词云关键词重复)
#               ,max_font_size=100 # 最大字体大小
#               ,width=1500,height=1500 #设置图片长宽
#               ,max_words=10000 #词云允许最大显示词的个数
                )#设置词云属性
wc.generate(key_words) #根据文本生成词云
# wc.fit_words(key_words_cnts) #根据给定单词频率生成词云



# 展示&保存词云
plt.imshow(wc) # 展示词云
wc.to_file("C:/Users/Administrator/Desktop/key_words_cloud.jpg") # 保存词云图片
# 或者 wc.to_image().show() # 保存为图片&展示

 

未加入个性图片,普通输出:

 

 

插入下面图片(一定要是白底背景图)后,个性化输出:

      输出——>

 

 

 

 

posted on 2020-01-02 19:14  数说张小桃  阅读(1440)  评论(0编辑  收藏  举报