Tableau Prep Builder 再添新功能:自动连接到 SAP HANA 并实现数据标准化

在数据准备过程中,数据值的标准化是一项既枯燥又重要的工作。最新版 Tableau Prep Builder (2019.1.4) 让用户可以更加轻松、快捷地完成这项工作。手动输入或不同的业务流程都可能导致数据值不一致,在处理这样的数据时,您常常需要艰难地寻找相似的值,然后将它们分到一组,或者将它们与预期值关联。现在,借助 Prep Builder 的模糊分组算法,您可以控制分组级别,从而获得所需的数据集。您甚至可以使用新的匹配算法,将地理数据角色的无效值替换为预期值。

除 Azure SQL 数据仓库和 MariaDB 之外,我们还添加了连接到 SAP HANA 的功能,这是请求人数最多的数据源之一赶快下载最新版 Tableau Prep Builder 吧!同时也不要离开,下文介绍了更多精彩内容。

调整自动分组的灵敏度

Tableau Prep Builder 使用模糊分组算法自动对类似的数据值进行分组。但您不想让自己能够调整自动分组的灵敏度,从而增加或减少生成的组数么?你现在就可以做到!按照拼写或发音对值进行分组时,只需调整滑块即可要求更严格的分组。这样可以节省您的时间并使您更接近预期的数据值集,而无需为所有的组手动添加或删除内容。

模糊滑块动画

使用数据角色自动实现无效值标准化

去年,我们将数据角色添加到 Tableau Prep Builder 以帮助您自动识别数据质量问题。但我们发现,修复无效值时需要使用最接近的有效值来进行替换,这仍然是一项枯燥的工作。现在,您可以使用名为“数据角色匹配”的新分组算法,通过一键式操作完成这项工作!

“分组和替换”菜单中提供的这个新选项可基于拼写和发音,将无效值与最相似的有效值相匹配。首先,只需将适当的数据角色应用于您的字段,即可自动验证数据值。然后,使用新的“数据角色匹配”选项轻松对任何无效值进行标准化。此功能适用于 Tableau Desktop 支持的五种地理数据角色。

数据角色匹配动画

立即下载 Tableau Prep Builder 最新版本!