Tableau 的较快发布周期不仅意味着您可以更快获取具有吸引力的新功能,还意味着某些较旧、较基本的功能可能无法跟上潮流。统计相关功能比以往更受追捧,但 Tableau 的简单易用性往往比分析严谨性更为人所知。尽管统计工具会让人联想到复杂公式和计算,但 Tableau 通过拖放来完成许多此类计算。

本文将介绍几种简单但强大的统计分析功能并提供其他资源,以便您能够通过正确分析充分利用数据。

直方图:不仅仅是条形图

直方图是用于理解大型数据集的强大工具。直方图可显示分为相等大小数据桶的数据频率。绘制此数据可显示其呈正态分布还是偏斜分布。

在 Tableau 中,只需点击两次即可创建直方图。很多用户不知道通过右键单击某一度量并导航到“创建”菜单,即可轻松创建数据桶、参数、计算和组。Tableau 甚至会为您推荐数据桶大小!

直方图的典型示例是 SAT 分数分布。以 50 或 100 分为增量将分数划分成数据桶,条形表示获得该数据桶中分数的学生数。学生们大可放心,1600 分非常罕见,大多数分数都处于中间范围。

残差:此趋势线究竟有多准确?

残差也称为误差,是观测值或实际值与预测值之间的差值。创建残差图是确定回归模型准确度的可视化方法。当然,您还可以在 Tableau 中检查 R 平方值和 p 值。

在 Windows 上,可通过 Tableau 导出包含趋势线的视图中的残差值。从工作表菜单中,导航到“导出”、“数据”,选择数据文件,即可将残差保存为 Access 文件。可选择直接连接到具有 X 轴上的维度(本例中为“订单日期”)以及预测和残差度量的新数据源。将残差拖至“行”、预测拖至“列”,然后将维度拖至“详细信息”。生成的散点图上的点越分散,模型越准确。

标准差:我的数据离散程度如何?

标准差是您高中时可能学过,但从此以后就没怎么用过的公式。标准差是自平均值数据离散程度的度量值。实际上可通过两种方法计算该值:一种用于总体,另一种用于样本。顾名思义:如果您有一个完整的数据集,则使用总体公式;如果是较大型数据集的样本,则使用样本公式。

在 Tableau 中找出标准差只需更改某一度量的聚合。总体和样本标准差均为内置的聚合选项。在下例中,标准差在上下文中列入了平均值 - 复印机的平均销售价值和标准差都较高。在下图中,我们可以看到一种极昂贵商品的销量使平均值变得较高。

快速表计算:移动平均和百分位数

表计算是 Tableau 中非常受欢迎的功能,但某些计算并未得到太多用户的喜爱,尤其是移动平均和百分位数。

移动平均有助于筛选掉某些干扰数据,并对趋势进行可视化。在 Tableau 中,可自定义移动平均计算。您可以选择作为计算依据的周期数、要使用的维度,甚至可以在移动平均顶部添加另一个表计算,例如百分比差异。

百分位数会让人联想到,您的儿科医生告诉您,您的身高在同龄段处于第 90 个百分位。但它有助于将数据点(或聚合)与较大分布进行比较。百分位数计算可排列数据点在分布中所处的位置,而不仅仅是提供数字(例如,销售额)。

非快速表计算:窗口和引用计算

LOOKUP()、PREVIOUS_VALUE() 和 FIRST() 等函数乍一看可能很复杂。您可能在从 Tableau 博客文章复制的计算中,或者在具体化快速表计算时见到过这些函数。LOOKUP() 是许多函数的基础,例如百分比差异。

通过此函数,可使用指定的偏移量(或通过参数使其动态化)来引用分区中的其他值。尽管可通过快速表计算实现最简单的百分比变化计算,但使用 LOOKUP() 有助于理解基础函数的工作原理。然后,可在逻辑语句和日期计算等更复杂的计算中引入这些函数。

窗口计算非常适合在视图中汇总数据。利用窗口计算,可在已聚合的度量上添加聚合。例如,WINDOW_AVG(SUM([Sales])) 将返回视图中每个销售总和的平均值,添加平均线将返回该相同值。需要引用汇总较大数据集的值时,窗口计算尤其适用。在下例中,使用 WINDOW_AVG 和 WINDOW_STDEV 计算 Z 分数。该表达式计算(窗口中数据的)观测值与平均值之间的标准差是多少。

扩展内容:R 和 Python 集成

希望将统计分析提升到下一级别?连接到 R 服务器或安装 TabPy,可在计算字段中用 R 或 python 编写脚本。阅读使用 Tableau 进行高级分析白皮书,详细了解这些功能。

准备进行更高级的分析?

我们相信,要帮助每个人查看和理解数据,我们需要为技术能力参差不齐的用户提供丰富的功能。从简单方便的指标到高级分析技术,Tableau 提供了既灵活,又能满足数据科学家分析深度要求的数据探索前端。借助复杂计算、R 和 Python 集成、快速同期群分析以及预测功能,数据科学家可以在 Tableau 中进行复杂的定性分析并共享可视化结果,提高数据理解水平,促进数据协作。

加入与 #HardcoreAnalytics 的对话,查看以下资源,获取更深入的见解:

您可能会感兴趣的内容…

添加新评论 

订阅我们的博客