【Python】以词云分析文章

import wordcloud,jieba
from scipy.misc import imread #安装scipy库才可以
mk = imread('love.jpg')  #选择形状图片
#对象的创建与参数设置
w = wordcloud.WordCloud(mask=mk,width=1000,height=700,font_path='msyh.ttc',background_color = 'white')  #形状,宽,高,字体路径,背景色
#文本文件的解析,并整合成一段以空格为间断的字符串
txtjb = open('C:/Users/eternal/中国.txt','r',encoding='UTF-8')  #路径,打开模式,编码模式
txt = txtjb.read() #ok
for rev in '。,·1234567890-=【】;‘、~!@#¥%……&*()——+{}:“《》?|\n ':  #去掉这些东西,但是jieba库自带去掉..我白忙活
txt = txt.replace(rev,'') #居然需要返回到txt
#以jieba库来变成以空格为间断的字符串
newtxt = ' '.join(jieba.lcut(txt))
#以wordcloud库把这些以空格分成的字符串变成图
w.generate(newtxt)  #赋予词云对象-字符串
w.to_file('中国.png')  #产生词云图的名称
print(newtxt)
posted @ 2018-05-04 18:39  想成为黑客  阅读(1530)  评论(0编辑  收藏  举报