白皮书

Tableau Online:了解数据更新

Authors: 

无论您的数据存储在内部数据库、数据库、数据仓库、云应用程序还是 Excel 文件中,都可以使用 Tableau 进行分析。您可以创建数据视图并将其共享给同事、客户和合作伙伴、 可以使用 Tableau 将这些数据与其他数据合并到一起, 还可以使这些数据自动保持最新状态。

对于云中存储的数据,Tableau Online 提供了众多方法来使其保持最新状态。对于 Google Analytics 或 Salesforce.com 这类云应用程序,Tableau Online 可以按照预定计划自动更新数据快照(Tableau 数据提取)。对于 Google BigQuery 和 Amazon Redshift 这类基于云的数据仓库,Tableau Online 可以直接进行连接。这种实时连接意味着无需创建提取,因为 BigQuery 和 Redshift 支持通过互联网快速查询大量数据。

当然,并不是所有数据都存储在云中。对于防火墙内的数据源,可以使用桌面工具将数据推送到 Tableau Online 进行刷新。 这些更新的计划和管理在您自己的环境中完成。这种方法既最大限度地降低了所有安全风险,又便于您根据适当的计划灵活更新数据。

Tableau Online 架构

Tableau Online 是一个基于云的安全解决方案,用于共享、协作和分发可视化效果和仪表板。Tableau Online 构建在 Tableau Server 平台上,具有易于使用、高速、高可用性和安全性等特点,无需管理物理基础设施。Tableau Online 在云中运行,因此没有权限访问您的内部数据。

Tableau Online 在一个安全的数据中心运行,客户端可以使用 Tableau Desktop、浏览器和移动设备对此进行远程访问。与 Tableau Online 建立的所有通信都通过 SSL 执行。

连接到 Google Analytics 和 Salesforce.com

Tableau 支持从本机连接到 Google Analytics 和 Salesforce.com。您可以从 Tableau Desktop 直接连接这些数据源,并将这些数据作为提取下载到桌面。初次建立连接后数据即被提取,您可以将工作簿或数据源发布到 Tableau Online。Tableau 将为您提供按照特定计划刷新提取的选项。您可以选择增量刷新,这种情况下 Tableau 只会从数据源下载最新的行。或者,您也可以选择下载所有行,执行完全刷新。

为了计划这些刷新,您需要提供用于连接和下载这些数据的用户的凭据。这将与数据源之间建立安全连接并创建一个身份验证密钥,该密钥可在刷新期间确保与您的数据建立最为安全的连接。

连接到 Google BigQuery 和 Amazon Redshift

Tableau Online 可以实时连接 Google BigQuery 和 Amazon Redshift。由于这些云数据仓库是用作交互分析大量数据集的可扩展平台,因此,Tableau 支持与这些数据源中的任意一种建立实时交互连接。因而在将数据源或工作簿发布到 Tableau Online 时无需创建提取。这样可以确保您始终从服务器获得最新的数据,而无需在 Tableau Online 中重复这些数据。

连接到内部数据

由于 Tableau Online 在云中运行,因此没有权限访问您公司网络内部的数据源。若要访问此类数据,您需要将相关数据“推送”到 Tableau Online,既可以手动推送,也可以按照给定的计划自动推送。

要发布此类数据,您必须先将相关数据提取到 Tableau 的快速数据引擎中。创建提取后,即可将工作簿或数据源发布到 Tableau 在线。我们建议的最佳做法是将数据源与工作簿分开发布,从而简化数据更新并确保各工作簿间保持一致。

将数据发布到 Tableau Online 后,可通过 3 种方法更新数据:

1. 重新发布数据源或工作簿

刷新本地数据提取后,即可手动将数据源或工作簿重新发布到 Tableau 在线,更新数据和元数据。此过程通过 Tableau Desktop 来完成,将覆盖 Tableau Online 中的数据。

建议将常用数据源与工作簿分开发布。数据发布后,即可通过连接到 Tableau Server 数据源在工作簿中对其进行访问。这样可确保各工作簿间保持一致,并且最大限度地减少传输到服务器的数据量。利用集中式数据源的工作簿将始终拥有最新的数据,而且可以更加安全地控制您的数据。

2. 刷新 Tableau Server 数据源

已经发布的数据源称为 Tableau Server 数据源。使用 Tableau Server 数据源时,可以手动刷新服务器数据源。这种方法将在您的数据源与 Tableau Online 之间使用 Tableau Desktop 作为代理。将要连接到数据库的所有元数据都嵌入在数据源中,用于更新之用。之后,Tableau 将连接到您的内部数据源,提取数据(完全提取或增量提取)并将更新内容发送到 Tableau Online 以刷新提取。

希望阅读更多内容? 下载白皮书其余部分!

继续阅读...

About the authors

Francois Ajenstat

Chief Product Officer, Tableau Software

您可能会感兴趣的内容…