Tableau数据聚合

使用不同的聚合函数查看数值非常有用。Tableau支持许多不同的聚合类型,例如:

  • 总和
  • 平均
  • 计数
  • 唯一值
  • 中位数
  • 最小值
  • 最大值
  • 方差
  • 总体方差
  • 标准偏差
  • 总体标准差
  • 属性
  • 维度

在Tableau中,您可以创建聚合维度和度量。每当向视图添加度量时,默认情况下会对这些度量应用聚合。使用的聚合类型取决于视图的上下文。

如果您不熟悉数据库,请参阅Tableau手册以获取这些聚合类型的详细定义。默认情况下将字段添加到可视化文件中,然后将显示该字段。

Tableau允许更改或更改特定视图的聚合级别。要更改默认聚合,请右键单击数据工具架内的该字段,然后通过选择菜单选项(默认属性或聚合)来更改其默认值。

还可以更改工作表中特定用途的字段的聚合。

例如:通过右键单击SUM(Sales)药丸并选择Measure(SUM)菜单选项,可以选择突出显示的任何聚合。

聚合

上图中使用的数据源是Excel电子表格的数据提取。重要的是要理解,如果依赖于与Excel的直接连接,则中位数和计数(不同)聚合将不可用。Access,Excel和文本文件不支持这些聚合类型。Tableau的提取引擎执行此任务。

1. 汇总度量

向度视图添加度量时,Tableau会自动聚合其值。平均值,总和和中值是常见的聚合函数。当前聚合看起来像视图中度量名称的一部分。

例如:Sales变为SUM(Sales),并且每个度量都有一个默认聚合,当连接到数据源时由Tableau设置。可以更改或查看度量的默认聚合。

  • 可以仅使用Tableau为关系数据源聚合度量。
  • 多维数据源包含已聚合的数据源。
  • 在Tableau中,仅在窗口中支持多维数据源。

2. 设置度量的默认聚合

可以为任何度量设置默认聚合。它不是一个本身包含聚合的计算字段,例如AVG([Discount])。默认聚合是用于汇总离散或连续字段的首选计算。将度量自动拖动到视图时,将使用默认聚合。

要更改默认聚合

右键单击“数据”字段中的度量菜单选项,然后选择“默认属性”,然后选择“聚合”,然后选择其中一个聚合选项。

  • 无法为已发布的数据源设置默认聚合。仅在最初发布数据源时设置默认聚合。

设置默认聚合

3. 如何度量数据

向视图添加度量时,会自动将聚合应用于该度量。此默认值由“分析”菜单中的“聚合度量”设置控制。

如果要在模型的最详细级别查看视图中的所有标记,可以分解视图。分解数据意味着Tableau将为数据源的每一行中的每个数据值显示单独的标记。

4. 视图中所有度量的分解

单击分析,然后转到聚合度量选项。选择“聚合度量”时,Tableau将自动尝试在视图中聚合度量。表示它将数据源中的各个行值收集到一个值中,该值会根据视图中的详细程度进行调整。

可用于度量的不同聚合确定如何收集各个值:它们可以是平均值(AVG),添加(SUM),或者设置为各个行值的最小值(MIN)或最大值(MAX)。

视图中所有度量的分解

如果已选中,则单击聚合度量一次以取消选择。然后可以看到更改。
视图中所有度量的分解

分解数据对于分析希望在视图中依赖和独立使用的度量非常有用。

注意:如果数据源非常巨大,那么,分解数据会导致显着性能降低。

5. 聚合维度

可以在视图中将维度聚合为最大值,最小值,计数和计数区别。汇总维度时,必须创建新的临时度量列,因此维度采用度量的特征。

聚合维度

注意:Count Distinct聚合不支持使用继承连接的文本文件和Microsoft Excel数据源。如果您连接到这些类型的数据源之一,则Count Distinct聚合不可用,并显示“需要提取”的注释。如果将数据源保存为数据提取,则可以使用Count Distinct聚合。

另一种将维度视为属性的方法。可以通过从维度的上下文菜单中选择“属性”来更改它。

属性聚合有几个用途:

  • 它在混合多个数据源时确保一致的细节级别。
  • 它提供了一种在计算表计算时聚合维度的方法,这需要聚合表达式。
  • 由于本地计算,它提高了查询性能。

Tableau使用以下给定公式计算属性:

If MIN (dimension) = MAX (dimension) then MIN (dimension) else "*" end

在从初始查询中检索数据后,在Tableau中计算此给定公式。星号(*)是当有多个值时出现特殊Null值的可视指示符。

公式计算属性

以上是在表计算中使用属性的示例。此表显示市场,市场规模,状态和市场销售额(SUM)(销售额)。假设想根据每个州对市场的贡献来计算总销售额的百分比。当在沿着状态计算的表计算中添加一些总计百分比时,计算将在上图所示的黑色区域内计算,因为维度的市场大小正在对数据进行分区。

将市场大小汇总为属性时,计算在市场(东)内计算,市场大小信息用作显示中的标签。


上一篇:Tableau数据类型和数据窗口

下一篇:Tableau文件类型

关注微信小程序
程序员编程王-随时随地学编程

扫描二维码
程序员编程王

扫一扫关注最新编程教程