終わらない進歩

2003年にスタンフォード大学で生まれた Tableau には、ドラッグアンドドロップ機能だけで高度なビジュアライゼーションを作成し、データの処理方法を完全に変えるテクノロジー VizQL™ が備わっています。VizQLは、ユーザーによる操作をデータベースクエリに変換した後、その応答をグラフィックで表現する、特許取得済みのクエリ言語です。 続いての進歩が、何百万行ものデータのアドホック分析を数秒で実行する機能を持つTableauのデータエンジンです。データエンジンは、PC 上で動作する高性能の分析データベースです。データをメモリに合わせるといった制限はなく、従来のインメモリソリューションの速度をそのまま活用できます。パワフルなツールを誰もが使用できるようにというTableau の伝統により、データエンジンを使用するために独自のスクリプトを作成する必要がありません。

VizQL™

自然な視覚化により処理が高速化。

Tableauの中核にあるのが、データ理解の中心にインタラクティブなデータビジュアライゼーションを置くという、特許取得済みのテクノロジーです。これまでの分析ツールでは、行と列のデータを分析し、表示するデータのサブセットを選択し、選択したデータをテーブルに整理した後、そのテーブルからグラフを作成する必要がありました。VizQL ではこのような手順が必要なく、データのビューをすぐに生成し、得られた視覚的なフィードバックを使用し、分析を進めることができます。その結果、データをより詳細に把握でき、従来の方法よりも最高100倍の速さで作業を実施できます。
VizQLでは、広範囲のビジュアライゼーションが可能です

データに新しい言語を使用することで、より詳細な分析が可能に。

このまったく新しいアーキテクチャでは、SQLがテキスト形式で行っていた操作よりも、多くのデータ操作を視覚的に行うことができます。VizQLステートメントは、高度なマルチディメンションのビジュアライゼーションに膨大なクラスを記述します。VizQLを使用することで、単一の分析インターフェイスとデータベースビジュアライゼーションツールを使用して、広範囲の視覚的なサマリーを作成できます。 Tableau は、棒グラフや折れ線グラフからマップや高度なリンクされているビューまで、衝撃的な多彩さを誇るビジュアライゼーションを作成できます。このような柔軟性は、まったく新しい方法でのデータの理解を可能にします。柔軟性のないグラフ作成テンプレートにデータを押し込むだけでは得られなかった分析情報を発見できます。

自然な思考パターンのサポート。

思考とは本来、質問と回答、段階的な進歩、新たな情報の考慮というパターンで行われます。分析を始めたときに目的地がはっきりとわかることはほとんどありません。従来の BI ツールではいまだにそのような制限があります。 別の手段である VizQLを使用すれば、データを視覚的に調査し、最適な表示形式を見つけることができます。作業を続けることでさらに理解が深まり、必要に応じてデータを追加し、最終的により詳細な分析情報を手に入れることになります。これをビジュアル分析のサイクルと呼びます。このサイクルを通じて作業すれば、データをよりわかりやすく伝えることができます。

世界中探してもどこにもないもの。

VizQLにより、迅速な分析とビジュアライゼーションが現実のものとなりました。トレーニングをほとんど、又は、まったく行っていないユーザーでも、従来よりも短期間で、これまでになかった方法でデータを表示を理解できます。これが他のツールとの最大の違いです。

データエンジン

制約を克服

データエンジンは、既存のデータベースやデータサイロが持つ制約を克服し、ビジュアル分析を真にサポートする、画期的な分析データベースです。最新のハードウェアが持つ性能と、ディスクから L1 キャッシュまでの完全なメモリ階層を反映できます。 Tableauのデータエンジンは、ビッグデータと迅速な分析の間の曲線を移動させます。
データエンジン: 膨大なデータの分析

大規模データの革命

データベースは過去数年間で大幅に進歩してきました。従来のデータベースは、ディスクに常駐するデータと事前計算に焦点を当てています。そのため、今まで以上の計算能力が可能になりましたが、データベースを構築する前に、答えを知るための質問 (クエリワークロード) を理解するまで時間がかかるというデメリットがありました。 より新しいデータベースは、メモリ階層の最上位レベルのみを使用し、すべてのデータをメモリに常駐させることで、パフォーマンスを向上させました。これらの「インメモリ」ソリューションにより計算速度は大幅に高速化されましたが、利用可能なメモリサイズに合わせてデータサイズを制限しなければならないという制約がありました。

Tableauデータエンジンの目標

データエンジンの機能:
  1. 最新世代のハードウェアを十分に活用し、企業のノートパソコンのような市販のハードウェア上で、何百万行ものデータに関する瞬間的なクエリレスポンスを実現
  2. あらゆるクエリに対して予測可能で一貫性のあるクエリパフォーマンスを持ち、既知のクエリワークロードや集計/サマリーの事前計算を必要としないため、真のアドホッククエリをサポート
  3. 既存の企業データウェアハウスやインフラストラクチャとシームレスに統合
  4. パフォーマンス目標達成のために、データセット全体をメモリに常駐させるという制約を解消
  5. データソースの迅速なロードと接続を提供

アーキテクチャを意識した設計

データエンジンの中核の構造は、解凍の必要がない、クエリ実行をサポートする圧縮を使用した、列ベースの表現形式です。コンピューターグラフィックの新しい手法を活用することで、L1 と L2 キャッシュをほぼ最適に利用する最新のプロセッサー、中間結果の最小化、ディスクからのデータストリーミングを管理するための革新的な技術を十分に活用できるように慎重に設計されており、スループットの減少を回避することで、分析を実行する前にメモリ内にデータセットを完全にロードしておかなければならないという一般的な制約を回避できます。

データエンジンライブ接続への統合の切り替え

データエンジンは、Tableau 既存の「ライブ接続」技術に直接統合できるため、ユーザーはワンクリックで企業データベースへの直接接続 (プラットフォーム固有の高度に調整されたSQLを発行) から、データエンジンにロードしたデータに対する、計算と照合の意味を注意深く一致させた抽出のクエリに切り替えることができます。このような統合を行うことで、企業はデータのサンプル (GB) で分析を行い、その後、Teradata のような大規模な並行ウェアハウスに分析をリダイレクトすることで、ペタバイトのデータに対して最終的な分析 (またはレポート) を実行できます。

真のアドホッククエリ

データエンジンはクエリ言語とクエリ最適化ツールで構築されており、その場で行うビジネス分析で通常使用するクエリをサポートしています。思考の速度でデータを処理する場合、通常は、大規模なマルチディメンションのフィルターなどの複雑なクエリや複雑な共起クエリを実行する必要があります。既存のデータベースは通常、このようなタイプのクエリを十分に実行できませんが、データエンジンであれば即座に処理できます。

柔軟性の高いデータモデル

データエンジンとその他のインメモリソリューションとの主な違いの1つが、ディスク上のデータベース内のそのままの形式でデータを直接操作できる点です。データエンジンを使用するのに、データのモデリングやスクリプトの作成は必要ありません。 データエンジンの高い性能を示す例として、他のリレーショナルデータベースと同じように、新たに計算した列を定義できる点が挙げられ、いつでもアドホックデータをモデル化できます。

短時間でのロードと接続時間

データエンジンには、データを一度データエンジンにロードすると、起動時間が大幅に短縮されるという独自の機能があります。読み込みが必要なのは、実際にクエリの対象となる部分のデータのみです。特定の分析には関係のない膨大なデータがデータベース内にある場合でも、データエンジンがそのようなデータを読み込むまで待つ必要はありません。