模块wordcloud库的使用

模块wordcloud库的使用

一 wordcloud库基本介绍

1.1 wordcloud库概述

wordcloud是优秀的词云展示第三方库
 
  • wordcloud库的安装

1.2 wordcloud库的安装

pip install wordcloud

二 wordcloud库使用说明

2.1 wordcloud库基本使用

wordcloud库把词云当作一个WordCloud对象
  • wordcloud.WordCloud()代表一个文本对应的词云
  • 可以根据文本中词语出现的频率等参数绘制词云
  • 绘制词云的形状,尺寸和颜色都可以设定

2.2 wordcloud库常用方法

W = wordcloud.WordCloud()
  • 以WordCloud对象为基础
  • 配置参数,加载文本,输出文件
 
  • 步骤1:配置对象参数
  • 步骤2:加载词云文本
  • 步骤3:输出词云文件
 

2.3 配置对象参数

2.4 wordcloud应用实例

中文需要先分词并组成空格分隔字符串

代码示例

# pip install wordcloud
from wordcloud import WordCloud
import matplotlib.pyplot as plt
# from scipy.misc import imread
from matplotlib.image import imread
 
txt = 'you can get better everday'
txt1 = '中国,是以华夏文明为源泉、中华文化为基础,并以汉族为主体民族的多民族国家,\
通用汉语、汉字,汉族与少数民族被统称为“中华民族”,又自称为炎黄子孙、龙的传人。\
中国是世界四大文明古国之一,有着悠久的历史,距今约5000年前,以中原地区为中心开始出现聚落组织进而形成国家,\
    后历经多次民族交融和朝代更迭,直至形成多民族国家的大一统局面。20世纪初辛亥革命后,君主政体退出历史舞台,\
    共和政体建立。1949年中华人民共和国成立后,在中国大陆建立了人民代表大会制度的政体。\
中国疆域辽阔、民族众多,先秦时期的华夏族在中原地区繁衍生息,到了汉代通过文化交融使汉族正式成型,\
    奠定了中国主体民族的基础。后又通过与周边民族的交融,逐步形成统一多民族国家的局面,而人口也不断攀升,\
    宋代中国人口突破一亿,清朝时期人口突破四亿,到2005年中国人口已突破十三亿.\
中国文化渊远流长、博大精深、绚烂多彩,是东亚文化圈的文化宗主国,在世界文化体系内占有重要地位,\
    由于各地的地理位置、自然条件的差异,人文、经济方面也各有特点。传统文化艺术形式有诗词、戏曲、\
    书法、国画等,而春节、元宵、清明、端午、中秋、重阳等则是中国重要的传统节日。 [1-7]'
color_mask = imread('demo=jpg.jpg')  # 设定图片
 
wc = WordCloud(
    font_path=r'C:\Windows\Fonts\STXINGKA.TTF',  # 设置字体(本机子自带的)
    background_color='red',  # 修改背景颜色
    width=1000,  # 定义宽度
    height=960,  # 设置高度
    min_font_size=2,  # 字体间距
    mask=color_mask  # 引用图片
)
 
wc.generate(txt1)
wc.to_file('cy.png')
plt.imshow(wc)
plt.show()
 
显示效果
 
本地文档实现词云显示
import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt
from matplotlib.image import imread
 
f = open('工作报告.txt',  encoding='gbk')
data = f.read()
res = jieba.lcut(data)
 
# result = ""
# for i in res:
result = "".join(res)
# print(result)
 
 
color_mask = imread('demo=jpg.jpg')
wc = WordCloud(
    font_path=r'C:\Windows\Fonts\STXINGKA.TTF',
    width=1000,
    height=800,
    mask=color_mask,
    background_color='red'
)
 
wc.generate(result)
wc.to_file('小康社会.png')
plt.imshow(wc)
plt.show()
 
得到的效果为

posted on 2019-10-28 19:41  Everuse  阅读(709)  评论(0编辑  收藏  举报

导航