为了将数据准备成便于分析的格式,常常需要设置筛选器、复制字段或者将值标准化。所有这些工作都很容易出错,而且往往需要编写复杂的计算。在最新版的 Tableau Prep Builder (2019.2.3) 中,我们简化了这方面的工作流程。借助新推出的可视化筛选器,您可以选择要筛选的非重复值,包括不在样本内的值。复制字段现在只需点击一下即可完成。最后,“建议”功能会检测并建议数据角色(即数据值的实际含义),以帮助验证您的数据字段。现在,数据角色还可以自动将无效值与有效值匹配。

使用数据角色自动将无效值标准化

去年,我们在 Tableau Prep Builder 中增加了数据角色,以帮助您自动发现数据质量问题;今年 4 月,我们又推出了根据数据角色匹配情况进行分组的算法,让您可以自动将无效值替换成最接近的有效值,以此方式修正它们。这种一键式操作可以为您节省清理混乱数据的时间,但可惜的是,它只适用于英语数据。现在,我们增添了不受语言限制的算法!

在这次发布的版本中,您在使用数据角色时,可以选用两种算法之一来轻松修正无效的数据。“拼写”算法可以将无效值与最接近的有效值匹配,两个值之间的差别可能是多了一些字符、少了一些字符或者是有些字符不一样。“发音 + 拼写”算法(以前称作“数据角色匹配”)则可以根据拼写和发音情况,将无效值与最相似的有效值匹配。要使用这两种算法,只需将相应的数据角色应用到字段,以便自动验证数据值;然后在“分组和替换”菜单中,使用您选择的一种模糊分组算法轻松将所有无效值标准化。此外,我们还更新了 Tableau Prep Builder 中的“建议”功能。现在该功能不仅会建议数据角色,还会建议使用相应的模糊分组算法自动修正无效值。

一键复制字段功能和直观的可视化筛选功能

您是否曾编写计算来筛选所选的值,特别是可能不在样本内的值?或者说,您是否经常只是为了复制一个字段而编写计算,因而十分希望一键就可以完成这项工作?现在,您就可以做到了!

如今,您可以从可视化筛选器中选择其中选定的值,以这种直观的方式添加样本外的值来创建包含筛选器或排除筛选器。此外,复制字段也变得轻松简单,只需在字段菜单中选择“复制字段”即可。

赶快下载最新版 Tableau Prep Builder,试试这些新功能!

抢先试用新版本

此外,我们还即将推出下面这些精彩功能,您现在就可以在 2019.3 Beta 版的 Prep Builder 和 Conductor 中试用它们:

  • 连接到已发布的数据源来获得输入数据:使用您的 Tableau 环境中的数据构建 Tableau Prep 流程。
  • R 和 Python 集成:在 Tableau Prep 流程中采用您的数据科学工作流程或复杂分析技术。
  • 自定义数据角色:创建您自己的数据角色以便自动验证数据,而且可在 Tableau Server 上分享这些数据角色,让其他人也可以轻松将他们的数据标准化。
  • 连接到 Google BigQuery 中的数据

我们很高兴能根据我们社区中一些呼声很高的创意开发出具体功能,也十分欢迎您提供宝贵的反馈意见。您可以注册加入预发布社区来试用 Beta 版本。

希望通过电子邮件收到 Tableau Prep 的最新动态?点此即可注册接收这类邮件。

详细了解 Tableau Prep 

订阅我们的博客