使用 Tableau 和 Amazon Aurora 实现 SQL 分析

在大多数组织中,SQL 数据库神圣不可侵犯。日复一日,DBA 对数据库的写入操作和存储要求进行保护,确保无论发生什么事情,我们都可以为后世留下准确记录的完整数据。分析?在大多数情况下,分析可延后进行。数据提取可安排在一天中活动较少的时间(例如清晨)进行。在工作时间(业务用户真正需要提问的时间)实时连接到数据库既危险,又没有必要。然而,此举却让这些精心存储和甄选的数据在使用价值上受到了限制。

一个季度即将结束,您的团队整周都在忙着完结交易。您需要知道自己离目标配额还有多远的距离,但这里出现了一个问题。

您使用的是提取的数据集,该数据集会在每天晚上进行更新。因此,数据集中还不包含今天完结的交易。您可以连接到 SQL 数据库,但是为了保护写入操作,该数据库已经锁定。你只能凭感觉做事,因为您的数据库无法在存储和收集数据的同时可靠地满足贵公司的分析需求。

你们中的很多人常常会遇到上述情况。在大多数组织中,SQL 数据库神圣不可侵犯。日复一日,DBA 对数据库的写入操作和存储要求进行保护,确保无论发生什么事情,我们都可以为后世留下准确记录的完整数据。

分析?在大多数情况下,分析可延后进行。数据提取可安排在一天中活动较少的时间(例如清晨)进行。在工作时间(业务用户真正需要提问的时间)实时连接到数据库既危险,又没有必要。然而,此举却让这些精心存储和甄选的数据在使用价值上受到了限制。

至少可以说,这种情况直到最近才得到改变。借助 Amazon Aurora(及其只读副本),Tableau 用户可以在不影响或损害主数据库写入操作的情况下随时直接连接到数据库并进行任何类型的分析。

Tableau 与 Aurora 如何配合使用

只读副本实际上是 Aurora DB 群集中专门用于读取操作的独立端点。您可以在数据库使用的 AWS 区域内,将多达 15 个副本分配到三个可用性分区。单个 Reader 端点即可访问所有只读副本。所有读取请求会在 Aurora 群集中的各个只读副本之间进行负载平衡,确保任何只读副本都不会在为贵公司的分析需求提供服务的过程中出现过载。

只读副本对于实现与 Tableau 的直接连接具有重要作用,因为借助这些副本,分析师可以对任何字段进行拖放或者生成任何查询,而无需考虑这些操作对数据库本身有何影响。Tableau 的优化型连接器可以生成针对 Aurora 预先优化的 SQL,从而获得高效、直接的 SQL 来自动优化性能。

此外,Tableau 可以创建分层结构、文件夹、群组、计算,还可以修改任何字段的别名以便于进行数据清理和甄选。您可以将该元数据定义,连同与 Aurora 只读副本的直接连接发布到 Tableau Server。实际上,这样就可以保存一个任何人都可以连接和随意使用(当然,这是在获得权限的情况下)的单一事实版本。

Aurora 中的只读副本架构

Tableau Server 还允许嵌入的权限依赖于已经在 Aurora 实例中设置的行级别权限。您也可以为 Tableau Server 上的任何视图、工作簿、文件夹或群组设置该级别的权限。借助特异性如此之高的权限分配,您可以确信,只有适当的人员才能查看敏感信息,而且此类人员在查看信息时不会遇到任何问题和阻力。

总之,Tableau 和 Aurora 是一对功能强大的组合,可以让您的组织摆脱多数 SQL 数据库在分析方面的限制。这就意味着,数据的分析和数据提取的更新不会再延迟;您可以与 Aurora 实现直接、安全和高效的连接,通过拖放操作创作可视化,轻松进行共享。

如果想观看 Tableau 和 Aurora 的实际效果,请参加 11 月 2 日举行的深度网络讲座和演示。