3步教你做酷炫词云图,小白都能轻松学会!
经常做数据分析的人肯定不会对词云图感到陌生,尤其是近几年来非常流行,不管是发布会、行业报告还是新闻,都喜欢使用词云这种形式,将信息的关键词组成酷炫亮眼的图案,一下子就能抓住众人眼球。
但是词语云图的最大优点,其实并不是它的颜值,而是它能够能够直观地展示数据频率,对出现频率较高的关键词予以重点突出,从而过滤掉大量的文本信息,帮助我们进行数据分析。
接下来,Smartbi就给大家详细介绍一下什么是词云。
词云(Word Cloud),又称文字云、标签云(Tag Cloud)、关键词云(Keyword Cloud),是文本数据的视觉表示,由词汇组成类似云的彩色图形。相对其它诸多用来显示数值数据的图表。
简而言之,词云图的独特之处在于,可以展示大量文本数据。因为词云的本质是点图,是在相应坐标点绘制具有特定样式的文字的结果。所以词云可以很好地表明每个单词在特定文本体中被提及的频率(即词频分布),通过使用不同的颜色和大小来表示不同级别的相对显着性。简单来说,越大越c位的词语,提及频率就越高。
一、词云图——在任何场景都能百搭
01
对比大量文本
今年春节疫情爆发,全民进入了紧急战“疫”状态,我们分析了人民日报多篇关于疫情的报道,对比了大量文本,最终提取出“武汉”、“发热”、“稳定”、“检测”、“密切接触”“隔离”等高频词!
02
特定形状的词云
通过使用不同的图片形状做边界限制,可以绘制出形形色色的词云图,这也是词云图个性化的魅力所在。
花花公子数字设计师Sean Noyce曾设计了下面的词云图,对Bowie发行歌曲中最常用的单词进行了统计和分类。从图中我们可以看出情感类的"love"、行动类的"dance"和感叹词"oh"等都是其歌曲中的高频词汇。这样的词云图不仅是一份数据图表,也是一副美丽的图片。
03
结合地图的特殊词云
通过不同大小和颜色来反应对应的属性,一些与位置点相关的文本信息在地图上展示出来。这种结合地图的词云图的特殊之处在于,词汇的大小并不与其频次直接相关,而是与词汇所处地区区域的大小有关。地图词云需要做好标签的避让,防止标签叠在一起而影响阅读。
二、词云图的制作
接下来!Smartbi就结合场景来给大家演示一遍如何利用一款简单好用的数据分析工具Smartbi制作词云图,让你的图表在"表群中独自美丽"。
这是一个天猫零售店为了应对3.8女神节“囤货”现象而进行大数据营销项目的场景:零售店要为商品补货和调货进行前期的评估,为3.8女神节提前做好充足准备。为了直观地了解热销商品和滞销商品,现在需要制作词云图。
第一步,创建数据集。
创建数据集,输出字段是各种产品类别下的“产品名称”和“销售量”字段,如下。其中“产品名称”字段的数据类型为“字符串”,“销售量”字段的数据类型为“数值”。
第二步,创建仪表分析,图形类型选择“词云图”
第三步,词云图制作。
通过词云图,我们可以直观的察觉的两点关键信息:
第1,母婴类、食品类、日用百货类商品仍然是女性消费者的最爱,奶粉、纸尿裤、牛奶、香米、水果、红酒、海鲜水产成为购买商品中的C位商品。针对此现象,3.8女神节活动需要对母婴类、食品类、日用百货类商品集中进货。
第2,不同地高频词商品具有较强关联性,例如“奶粉”和“尿布”,“红酒”和“啤酒”,因此我们可将关联性强地产品一起打包促销,增加营业额。
词云作为数据可视化的一种常用手段,视觉冲击力强,制作方法也简单易操作。词云可以包含丰富的业务信息,但是脱离了业务的词云只是一幅华丽的皮囊。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· DeepSeek 开源周回顾「GitHub 热点速览」