运用可视化技术需要考虑的问题
面对大量的数据,重要信息常常被淹没其中,或者被误解忽视。根据生理学研究,图形所能表达的信息,远远超过文字的涵盖范围。使用可视化技术,有助于有效使用图表,有助于建立精美的图表。
可视化就是把数据呈现为图形、表格等可以一目了然的景象,变数据为可视化的图。也就是把专家理解分析的大数据的核心要点通过图表等可视方式解释给普通用户,直观地呈现大数据特点,把数字置于视觉空间中,让人们一目了然地发现其中的规律、关系、模式、特点等等,从而达到突出重要信息。
运用可视化技术时,需要考虑三个问题:
(1) 如何将数据映射到图形元素
(2) 如何组织数据进行映射
(3)如何解决数据维度问题
如何将数据映射到图形元素
一般的可视化中,需要映射的是数据对象、数据对象的属性、数据对象间的联系这几种信息。
数据对象通常用几何图形表示,如圆圈、星号、叉号等。
属性的表示方法取决于属性的类型。对于取值连续的属性,可以用位置、亮度、颜色、尺寸等可以连续变化的图形元素表示;对于序数型属性,也可以用位置、亮度、颜色、尺寸等表示,不过变化不再是连续的,因此为了对不同属性取值加以区分,可以将图形元素间的区别放大一些;对于标称型属性,要注意避免表示出“序”的信息,此时可以将属性的每个取值用不同类型的图形元素表示,
数据对象间的关系有显式、隐式两种。显式的关系是已知、不需要去发掘的,我们只需要在图形中表示出来,常用的显式关系表示方法是用线条连接数据对象,或者将具有联系的数据对象赋予某一相同的图形特征;隐式的关系则需要我们采用合理的图表、合理的数据组织形式进行映射来帮助发现数据对象间的关系,例如在分类中将相同类型的数据对象放在一起显示就容易帮助发现数据对象间的联系,他们具有相似的属性取值。
如何组织数据进行映射
在一些需要映射数据对象的可视化技术中,以特定的形式组织数据更能帮助发现数据对象间的联系。数据组织形式可简单理解为在图表的每个维度(即每个属性)上,坐标值(属性值)分布的形式。一般情况下,对于连续型、序数型属性,通常按属性取值大小排列组织数据显示,这使得图表呈现的信息易于理解;对于标称型属性,数据的组织形式并没有约定成俗的方式,此时不同的数据组织形式呈现的信息差异可能就比较明显了。
如何解决数据维度问题
当前只能在三维空间中显示图标,再加上颜色、亮度等一个属性,一个图表上一般最多能显示四个属性信息了,对于多属性数据来说,如何解决维度问题就是一个值得考虑的问题。
一种做法是只显示属性子集(通常是两个属性),当属性数量不算太多时可以绘制双属性的矩阵图。当属性数量较多、以致于影响图形观察时则需要另想办法了。
另外一种做法是采用主成分分析(如PCA)等降维方法了。
其实我们一直在讲数据可视化的目的是有两个:一个是更好地分享和传达数据信息,二个是通过设计之美有效地缩短信息的传达。这是可视化的最根本的目的,这里推荐一款我自用的新一代数据可视化工具——Smartbi。
Smartbi可视化效果图:
关于Smartbi
Smartbi强大的数据分析能力,人人可用的自助式BI。简便的操作,专业化的要求不高,可以大范围的应用,这两年在BI行业口碑很好,个人版全功能模块永久免费使用的!感兴趣的朋友可以上Smartbi官网试用,还可联系客服获得更多的方案、案例和模板。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· DeepSeek 开源周回顾「GitHub 热点速览」