使用 Tableau Prep 的最初几个月:我学到了什么以及喜欢哪些功能

了解客户 Josh Milligan 的 Tableau Prep 学习心得和他喜欢的功能。

编者按:今天的文章来自 Joshua Milligan,他是 Tableau 专业大师、Teknion Data Solutions 首席顾问、VizPainter 博客作者。Joshua 参加了 Tableau Prep(前身为 Project Maestro)的预发布计划

我的职业生涯始于 Teknion Data Solutions,最初我是一名软件开发人员。几年后,我进行了职业转型,开始在商业智能领域从事数据建模和 ETL 工作。我喜欢处理数据,但我发现,在 ETL 包的构建过程中,大部分工作都相当枯燥,而且很花时间。 而测试工作可能成为噩梦! 完成数小时的开发工作后,还要再花几个小时运行相关流程,最后可能发现,大部分的值都是缺失或错误的。如果出现这种情况,我必须找出故障点,尝试进行修复,然后再次测试。我并不是在抱怨;我喜欢帮助客户,而且这份工作待遇也不错。但是后来,我的一个发现改变了一切。

这个发现就是 Tableau。

Tableau 太神奇了!这是一款无缝、透明、直观的应用程序。我可以拖放数据字段,然后立即看到可视化结果。我可以提出问题,然后马上看到答案;还可以在这些答案的基础上提出更加深入的新问题,然后快速找出答案。它既改变了我的世界,又让我能够为客户提供更好的服务,在更短的时间内获得更加深入的见解。

但它并没有免除所有数据组织工作。某些类型的分析需要与之对应的数据结构类型。“从现在起,让其他团队成员来构建这些结构!”我当时这样想。我痴迷于 Tableau 和可视化分析,不想再在 Tableau 数据连接屏幕之外进行太多数据组织工作。至少我是这样想的。

Tableau 的神奇之处

秘密就是:Tableau 的神奇之处并不在于功能。最新版的 Tableau 和最新的功能让我非常兴奋。但这些功能本身并不神奇。神奇的是,所有功能无缝衔接为一个完整体系。可以用一个词来描述这种神奇的效果 - 连贯

连贯意味着我可以专注于一个任务或问题,并且在不中断思路的情况下寻找解决方案或答案。我无需为了完成某个步骤而离开这款应用程序,也不会在执行一个步骤后因为过久地等待反馈而忘了自己在做什么。相反,我可以获得即时反馈,还可以使用各种选项,轻松快捷地进行迭代。

另一个秘密:Tableau Prep 同样神奇!

发现 Tableau Prep 工作模式

我从第一个 Alpha 测试版(前身为 Project Maestro)开始使用 Tableau Prep。当时,基础引擎已经就位,但界面仍有待充实。现在的体验肯定和当时不同。但在使用第一个版本的 UI 时,为了真正掌握 Tableau Prep 的工作模式,我花了不少时间。但通过一些尝试和修正,一切突然变得豁然开朗!

从那时起,我就开始喜欢 Tableau Prep,如同我喜欢 Tableau 一样。与其他 Tableau 产品相同,Tableau Prep 以直观的方式处理数据。它有连贯的流程:

  • 通过拖放和点击鼠标,我可以连接、清理、联接和转换数据。
  • 我可以实时看到数据转换的直观效果!我再也不会在等待数小时之后,发现错误的假设导致联接失败。
  • 我可以后退到前面的步骤,并马上看到当时的结构。
  • 我可以非常轻松地调整数据流,并使用各种选项进行迭代。
  • 我可以即时看到以前无法发现的数据问题。“哇哦!超过一半的行有 Null 值。我必须在进行联接前解决这个问题...”
  • 我可以即时发现问题,解决问题,然后看到解决效果。
  • 我每次只需要关注一个任务。我可能有一个最终目标,但在处理后续事务前,我可以专注于需要首先解决的数据问题。此外,我可以在执行下一个步骤前确定问题是否已经解决。
  • 我可以在该流程中的任何节点将数据输出到 Tableau,以便根据需要对其进行可视化,获得更深入的见解。

Tableau Prep 助您腾飞

发现 Tableau Prep 的工作模式后,我兴奋地尝试在 Tableau Prep 中解决自己最近遇到的一些真实数据问题。

比如,某个客户在 SQL Server 中存储了一些员工航空差旅数据。不过,有个航空公司使用了不同的订票系统,因此某个目录中会定期出现一些无序的文件。此外,客户还想看看用 Tableau 制作的精彩航班路线地图,这个想法很棒!但我知道,要创建这样的地图,我需要使用额外的地理编码数据源,并且需要重新对这些数据进行组织,将起点和终点放到不同的记录中,然后使用 Tableau 中的“路径”功能区对其进行可视化。

创建这个流程的操作非常有趣,如同使用 Tableau 一样。事实上,我都迫不及待地想在这里分享构建一个类似流程的经验:

我会连接数据,然后每次专注于一个步骤:

  • 使用平面文件通配符并集来合并 SQL Server 数据。
  • 清理不匹配数据并移除无关字段。
  • 在 Person 表中查找旅行者。
  • 将路线拆分为起点和终点。
  • 对数据进行透视,将每组起点和终点放在同一行中。
  • 从另一个数据源中查找地理编码。
  • 进行最后清理。
  • 导出最终数据结构。我选择的是 Hyper 数据提取,但我也可以将其导出为 .tde、.csv,甚至可以将其发布到 Tableau Server!

最后,我在 Tableau 中获得了非常好用的数据集,我可以分析员工航空差旅情况,帮助客户进行成本节约、旅行模式、航班、购票时间等方面的决策,甚至可以创建航班路线地图:

我非常高兴在生产环境中开始使用 Tableau Prep。我仍然急切期待使用每个新版本中的新功能,但我已经知道了这款产品的神奇之处。