tableau学习记录--基础知识

tableau可以连接到很广泛的数据源,有三个特征:实时连接,数据缓存,组合数据源。

作为数据分析工具,Tableau将每个数据分为四个类别之一,即 - String,Number,Boolean(true false)和datetime。从源加载数据后,tableau会自动分配数据类型,但如果满足数据转换规则,也可以更改某些数据类型。此外,用户必须指定计算字段的数据类型。

读取CSV格式出现乱码可能是因为保存的是没有选择好编码类型,选择utf-8,然后重新连接该文件,即能正确显示。

图形大小可以在工具栏中,标准,适应宽度下拉菜单中调整

可以通过拖拉属性到标记-颜色,调整工作表区间颜色深浅程度,以便更好地区分对比数值大小

标签页可以选择不重复计数,排除重复项。


 

筛选

1.创建计算字段
2.在维度里找到创建的筛选器,拖入筛选器
3.将所需查看的属性和需被筛选的字段拖入工作表行列中

添加到上下文,即进行漏斗式筛选

 

标记-颜色,可以在已经生成的条形图中,继续通过颜色进行属性划分


堆积条形图:标记分类出应有两个标签,一个判断条形图应该表示的类别,一个表示单个条形内部的分类需求

交叉表:图表由一个或多个维度和一个或多个度量组成。此图表还可以显示对度量字段的值的各种计算,如运行总计,总百分比等。添加表计算,注意选择不同的计算区域便于分析。

圆环图:先创建一个饼图,然后再创建一个饼图,进行双轴合并同步,删去所有信息修改颜色为白色,调整大小作为圆环中心的那个圆即可。拖拽sales总额到第二个标签中,会在圆环中心显示总额数据。

 气泡图:将数据显示为圆形群集。维度字段中的每个值表示一个圆,而度量值表示这些圆的大小。

盒形图也称为盒 - 须图。 它们显示沿轴的值的分布。框表示中间50%的数据,即数据分布的中间两个四分位数。剩余50%的数据在两侧由线也称为晶须,以显示1.5倍四分位距范围内的所有点,该范围是邻接框宽度的1.5倍内的所有点,或在数据最大范围内的所有点。

箱形图采用一个或多个零个或多个维度的度量。


 

凹凸图用于比较几种类别的物品的表现变化情况,非常适合用来做对比。它们对于探索时间维度或地方维度或与分析相关的其他维度的值的变化非常有用。但是对于同一属性的变化情况并没有体现。

:1.选择字段,sub-category,需要查看的字段

    2. 分析-创建计算字段,用Rank作为字段名称,并在计算区域中写入表达式rank(sum(Sales))。单击确定,新字段将显示在度量部分。 

    3.将订单日期拖动至列,修改为月显示,segament拖动至颜色,将rank拖动至行

   4. 修改行上的rank,修改计算为特定维度,segment。

  5.重复(若前面将rank转化为离散则无法显示两张图),双轴,修改其中一个表现为圆,即可。


甘特图:

甘特图显示了一段时间内任务或资源的值的进度。它广泛用于项目管理和其他类型的变化在一段时间的研究。 因此,在甘特图中,时间维度是一个重要领域。以图示通过活动列表和时间刻度表示出特定项目的顺序与持续时间。除了时间维度之外,甘特图至少还需要一个维度和一个度量。

通过时间和顺序的比较,可以了解到工作作业的情况,了解哪些属性一直在工作,便于调整计划安排。


 

瀑布图:
行列选好,行选择创建表计算,移动计算(为了计算与前面的差异值);将标记类型改为甘特条,创建-profit的计算字段,并拖动到标签-大小上(为了表示出利润大小), 利润中的负值将向下延伸,而正值则会向上延伸。拖动利润到颜色,可以清晰的通过颜色区别利润变化大小。


 

连接数据库

数据混合,补充一个数据源的数据表的数据与另一个数据源的数据列进行行合并。

数据混合需要主数据源和至少一个辅助数据源。注意,多维数据集数据源必须作为主数据源,不能作为辅助数据源。

posted on 2018-12-18 11:24  椰汁黑糯米  阅读(658)  评论(0编辑  收藏  举报

导航