Tableau Online: データの更新について


概要: 

オンプレミスデータベース、データベース、データウェアハウス、クラウドアプリケーション、Excel ファイルなど、どこに格納されたデータでも、Tableau は分析できます。データからビューを作成し、同僚、顧客、パートナーと共有することもできます。さらにそのビューと他のデータを融合させることもできます。そのうえ、データを常に最新の状態に自動更新することまでできます。

クラウド上のデータを常に最新の状態にしておく方法が、Tableau Onlineにはいくつも用意されています。Google AnalyticsやSalesforce.com などのクラウドアプリケーションでは、Tableau Onlineにあらかじめ設定されたスケジュールに従って、データのスナップショット(Tableau データ抽出)が自動更新されます。Google BigQuery、Amazon Redshift などの、クラウド ベースのデータ ウェアハウスの場合、Tableau Onlineは直接接続できます。BigQueryやRedshiftは、インターネット経由での大規模データに対する高速クエリをサポートしているため、このようなライブ接続を利用すると、データ抽出の手間が不要となります。

もちろんクラウド以外の場所にもデータは格納されています。ファイアウォールの内側にあるデータソースからは、デスクトップツールでTableau Onlineにデータをプッシュすると更新できます。自分が普段使っている環境で、このような更新のスケジュール作成や管理が可能です。このアプローチなら、セキュリティリスクを最小に抑え、適切なスケジュールで、柔軟にデータを更新できます。

Tableau Onlineのアーキテクチャ

Tableau Onlineは、ビジュアライゼーションとダッシュボードの共有、共同作業、配布に最適の安全なクラウドベースのソリューションです。Tableau Onlineは、Tableau Serverプラットフォームに内蔵されており、物理的なインフラストラクチャを管理することなく使いやすさとスピード、可用性、セキュリティを提供します。Tableau Onlineは、クラウドで実行されるため、オンプレミスデータにアクセスする必要がありません。

Tableau Onlineは、安全なデータセンターで稼働しており、クライアントはTableau Desktop、ブラウザ、モバイルデバイスのいずれからでもリモートアクセスできます。Tableau Online とのあらゆる通信には、SSLを使用しています。

Google AnalyticsやSalesforce.com への接続

Tableauは、Google Analyticsや Salesforce.comへのネイティブ接続機能をサポートしています。Tableau Desktopからは、こうしたデータソースに直接接続し、データ抽出の形でデータをデスクトップにダウンロードできます。一度接続とデータ抽出を行った場所からなら、ワークブックやデータソースをTableau Onlineに発行できます。Tableau には、特定のスケジュールに従ってデータ抽出を更新するオプションが用意されています。Tableauなら、データソースから最新行のダウンロードのみを実行する「増分更新」も選択できます。また、すべての行をダウンロードして、完全更新を実行することもできます。

このような更新のスケジュールを組むときは、データの接続とダウンロードを実行するユーザーの資格認証情報を入力するよう求められます。資格認証情報の入力でデータソースへの安全な接続が可能となり、更新中に使用する認証キーが作成されます。この認証キーを使用すると、毎回、極めて安全にデータに接続できます。

Google BigQueryやAmazon Redshiftへの接続

Tableau Onlineを使用すると、Google BigQueryやAmazon Redshift にライブ接続できます。これらのクラウド型データウェアハウスは、大規模データセットのインタラクティブな分析を可能にするスケーラブルなプラットフォームとして設計されています。Tableau なら、これらのデータソース1つ1つに対しインタラクティブなライブ接続をサポートできます。そのため、データソースやワークブックをTableau Onlineに発行するときも、データ抽出が不要です。これで常時サーバーの最新データを確実に取得できるうえに、Tableau Onlineのデータを複製する必要もありません。

オンプレミスデータへの接続

Tableau Online はクラウド上で稼働しているため、お客様の社内ネットワークにあるデータソースへのアクセス権がありません。このデータにアクセスするには、データを Tableau Online に「プッシュ」しておく必要があります。この操作は手動で行うことも、スケジュールを組んで自動化することもできます。

このデータを発行する場合は、まずデータをTableauの高速データエンジンに抽出します。データの抽出作成後は、目的のワークブックやデータソースをTableau Onlineに発行できます。データソースとワークブックを個別に発行すれば、データ更新の手間がかからずワークブック全体の整合性を確保できるため、この方法をベストプラクティスとしておすすめします。

データを Tableau Online に発行した後、更新する方法は3つあります。

1. データソースやワークブックの再発行

ローカルデータの抽出を更新したら、データソースやワークブックをTableau Onlineに手動で再発行し、データやメタデータを更新できます。Tableau Onlineでのデータ上書きは自動的に実行されるため、この操作は Tableau Desktopで実行します。

共用データソースをワークブックとは別個に発行するようおすすめします。データを発行した後は、Tableau Server データソースに接続したときにワークブック内のデータにアクセスできるようになります。そのため、ワークブック全体の整合性を確保し、サーバーへのデータ転送量を最少に抑えることができます。中央管理されたデータソースを活用するワークブックで常に最新データが維持され、データの安全性を厳守できます。

2. Tableau Serverのデータソースをリフレッシュ

発行されたデータソースは、Tableau Serverのデータソースとして参照されます。Tableau Serverのデータソースを使用している場合は、サーバーのデータソースを手動で更新できます。この方法では、ローカルのTableau DesktopをデータソースとTableau Online との間のプロキシとして使用できます。データベースに接続するメタデータは、どれもデータソースに組み込まれ、更新に使用されます。そこでTableauは、オンプレミスデータソースに接続し、データを抽出(完全または増分)し、更新分をTableau Onlineに送信して抽出を更新します。

さらに詳細を知りたい方は、 ホワイトペーパーをダウンロードしてください。

続きを読む...

こちらもご覧ください