Tableau Prep 新功能:通过“数据角色”自动发现数据质量问题

了解这些功能如何帮助您在更短的时间内准备好用于分析的数据。

实事求是地讲,数据常常包含差错,您必须找出并更正这些差错。如果数据准备工具能够为您找出这些数据质量问题,您就可以节省大量时间。我们很高兴向您介绍 9 月份发布的新版 Tableau Prep (2018.2.3) 中的“数据角色”功能。只要您告诉 Prep 自己的数据值代表什么,它就可以自动找出不匹配的值。

此版 Tableau Prep 还改进了用户体验,例如让用户能够直接更正联接子句,以及在对值进行重命名和分组时获得更好的反馈。另外,您现在还可以连接到 MongoDB 中的数据。

让我们看看这些功能如何帮助您在更短的时间内准备好用于分析的数据。

通过分配数据角色发现数据质量问题 

清理数据时,您常常需要从代表真实实体(例如国家/地区或机场名称)的数据值中找出不准确的条目。在手动验证数据值或者从其他数据源导入预期值时,都需要执行这项工作,这个过程可能枯燥乏味又容易出错。Tableau Prep 现在可以识别一系列真实实体,包括 Tableau Desktop 知道的八种地理角色,以及电子邮件地址和 URL(单击此处了解详情)。

现在,您可以为字段设置数据角色,让 Tableau Prep 知道字段代表哪种真实实体。Tableau Prep 使用该信息来验证数据值并自动发现无效值,让您能够轻松清理数据。您可以对字段进行筛选,集中处理无效值,并通过重命名或筛除操作来更正这些值。数据角色可以帮助您设置关于数据字段的预期,然后让 Prep 代替您完成分析数据质量的繁重工作。我们将在后续版本中继续添加角色,同时欢迎您在论坛上提供反馈。

直接在联接子句中更正不匹配的数据 

对于 Tableau Prep 用户而言,联接子句中的不匹配字段值显而易见,因为它们显示为红色文本。然而,在此之前,您无法在联接步骤直接更正这些不匹配的字段值。现在,您可以在由一个或多个字段组成的联接子句中直接编辑意外的值,使它们正确匹配。这有助于您保持工作的连贯性。