WordCloud

1. wordcloud概述

wordcloud是优秀的词云展示第三方
词云以词语为基本单位,更加直观和艺术地展示文本

2.安装wordcloud

在编写程序之前需要下载第三方库:
jieba
wordcloud
scipy

python3.0是:pip3 install module_name
python2.7是:pip install module_name

3.wordcloud库的使用

  • wordcloud库把词云当作一个WordCloud对象
  • wordcloud.WordCloud()代表一个文本对应的词云
  • 可以根据文本中词语出现的频率等参数绘制词云
  • 词云的绘制形状、尺寸和颜色都可以设定

4. wordcloud.WordCloud()中参数解释

参数 描述
width 指定词云对象生成图片的宽度,默认400像素>>>w=wordcloud.WordCloud(width=600)
height 指定词云对象生成图片的高度,默认200像素>>>w=wordcloud.WordCloud(height=400)
min_font_size 指定词云中字体的最小字号,默认4号>>>w=wordcloud.WordCloud(min_font_size=10)
max_font_size 指定词云中字体的最大字号,根据高度自动调节>>>w=wordcloud.WordCloud(max_font_size=20)
font_step 指定词云中字体字号的步进间隔,默认为1>>>w=wordcloud.WordCloud(font_step=2)
font_path 指定字体文件的路径,默认None>>>w=wordcloud.WordCloud(font_path="msyh.ttc")
max_words 指定词云显示的最大单词数量,默认200>>>w=wordcloud.WordCloud(max_words=20)
stop_words 指定词云的排除词列表,即不显示的单词列表>>>w=wordcloud.WordCloud(stop_words={"Python"})
mask 指定词云形状,默认为长方形,需要引用imread()函数>>>from scipy.misc import imread>>>mk=imread("pic.png")>>>w=wordcloud.WordCloud(mask=mk)
background_color 指定词云图片的背景颜色,默认为黑色>>>w=wordcloud.WordCloud(background_color="white")

5.程序模版

import jieba
import wordcloud

file1 = open("country.txt", "r")     #打开文本
t = file1.read()                                     #读取全部内容
file1.close()                                         #关闭文件

ls = jieba.lcut(t)                                  #将读取内容转化成列表形式
txt = " ".join(ls)                                   #用空格连接内容,必须是空格

w = wordcloud.WordCloud(font_path="ukai.ttc", width=1000, height=700,\
		background_color="white")
w.generate(txt)                #向wordcloud对象中添加txt文本
w.to_file("map.png")    #将词云输出成图像文件

5.图片实例

  • 在自定义图片输出格式之后,比如输出中国地图样式的图片,只需在上述代码中添加如下几行代码即可:
from scipy.misc import imread
mask=imread("chinamap.jpg")       #自定义要输出的词云形状,注意添加的图片背景颜色必须与要输出的图片一致。

在wordcloud.WordCloud()中添加参数mask=mask

posted @ 2019-01-27 18:37  你好,果果  Views(2175)  Comments(0Edit  收藏  举报