ビッグデータについての Tableau のビジョン


概要: 

Tableau Software のミッションは、お客様がデータを見て理解できるように支援することです。 このミッションを達成するため、データを誰にでも使いやすくすること、つまり「データのことを知る人が、データに問いかけられるようにする」ことが Tableau の基本的な理念といえます。 知識のある一般的な社員が、どこからでも簡単にデータにアクセスでき、 データサイエンティストや IT 開発者などといった一部のエリートの力を借りなくても、データの分析を行いそこからインサイトが得られるようになるべきです。

データの規模に関係なく、データを可視化することは重要です。単なる情報がインサイトに変わり、次のとるべきアクションを導き出すからです。 ビッグデータの場合、データの保管、準備、クエリ実行の費用がさらに高額になることから、可視化の方法が特に重要になります。 そのため企業では、知識のある社員たちが直接ビッグデータに問いかけを行えるように、データソースを適切に構造化し、ベストプラクティスをきっちりと実施しなければなりません。 近年ビッグデータは革新の源としてその重要性が高まっており、さまざまな特徴を持つ多くのプラットフォームが使われるようになりました。 Tableau のビジョンは、Tableau ユーザーが使用するものであればどのビッグデータプラットフォームもサポートし、ユーザーがデータからリアルタイムで情報を得られるように支援することです。

本ページではホワイトペーパーの一部をお読みいただけます。 全ページをお読みいただくには、右にあるボタンで PDF をダウンロードしてください。


Tableau の (ビッグ) データ戦略

Tableau Software のミッションは、お客様がデータを見て理解できるように支援することです。 このミッションを達成するため、データを誰にでも使いやすくすること、つまり「データのことを知る人が、データに問いかけられるようにする」ことが Tableau の基本的な理念といえます。 知識のある一般的な社員が、どこからでも簡単にデータにアクセスでき、 データサイエンティストや IT 開発者などといった一部のエリートの力を借りなくても、データの分析を行いそこからインサイトが得られるようになるべきです。

データの規模に関係なく、データを可視化することは重要です。単なる情報がインサイトに変わり、次のとるべきアクションを導き出すからです。 ビッグデータの場合、データの保管、準備、クエリ実行の費用がさらに高額になることから、可視化の方法が特に重要になります。 そのため企業では、知識のある社員たちが直接ビッグデータに問いかけを行えるように、データソースを適切に構造化し、ベストプラクティスをきっちりと実施しなければなりません。 近年ビッグデータは革新の源としてその重要性が高まっており、さまざまな特徴を持つ多くのプラットフォームが使われるようになりました。 Tableau のビジョンは、Tableau ユーザーが使用するものであればどのビッグデータプラットフォームもサポートし、ユーザーがデータからリアルタイムで情報を得られるように支援することです。

このビジョンを実現するために、Tableau は6つの軸に注力します。

  1. ビッグデータ プラットフォームへの広範なアクセス - どこにあるかに関係なく、ビッグデータを分析できるようにするというビジョン。 Tableau がサポートするデータソースは 40 種類を超え、拡張オプションによりその他多数のデータと接続することができます。 新しいデータソースが生まれ、それが Tableau ユーザーにとって価値があるものであれば、Tableau はそのデータソースへの接続機能を組み込み、データアクセスにかかる障壁を緩和します。 Tableau で用意しているビッグデータエコシステムのコネクタ:
    • Hadoop: Cloudera Impala & Hive、Hortonworks Hive、MapR Hive、Impala と
    • Hive を使用する Amazon EMR、Pivotal HAWQ、IBM BigInsights
    • NoSQL: MarkLogic、Datastax
    • Spark: Apache Spark SQL
    • クラウド: Amazon Redshift、Google BigQuery
    • オペレーショナルデータ: Splunk
    • 高速分析用データベース: Actian Vectorwise & ParAccel、Teradata Aster、HP Vertica、SAP Hana、SAP Sybase、Pivotal Greenplum、EXASOL EXASolution
  2. ビジネスユーザーによるセルフサービスでのビッグデータの可視化 - 複雑な SQL、Java コード、MapReduce ジョブを記述する必要はなく、ビジネスユーザーがドラッグ & ドロップだけでデータを可視化できます。 Tableau がデータ分析タスクを簡素化 - ユーザーは、これまでにないスピードでデータを可視化し、そこからインサイトを見つけ出すことができます。
  3. クエリパフォーマンスを最適化するハイブリッドのデータアーキテクチャ - Tableau はデータソースにライブ接続できます。また、データソースをインメモリに取り込むこともできます。 ライブ接続は、高速のインタラクティブなクエリエンジンや大きなデータセットに接続する際に活躍します。 速度の遅いデータソースでも、抽出データを作成したり、インメモリデータエンジンにデータを取り込むことで、高速化しパフォーマンスを向上させることができます。
  4. 複数データソースを使った分析を行うためのデータブレンディング - 多くの場合において分散データはビッグデータよりも扱いが難しいと言えます。 分析用のデータがきっちりと一ヵ所にまとめられているのは珍しいことです - データは、さまざまなテクノロジーやプラットフォームで、あちこちの場所に存在します。 Tableau は、ビッグデータと他のデータソース (たとえば、Salesforce、MySQL、Excel ファイル) をブレンドすることができます。ブレンドすることによって、分析中にユーザーがデータソース間を行き来できるようになり、企業はデータの置き場所を変更する必要がなくなります。
  5. プラットフォームクエリの総合的なパフォーマンス - データ規模が大きくなってもユーザーがデータとリアルタイムで会話できるように、コアとなるクエリパフォーマンスを Tableau は向上させていきます。 最近ではパラレルクエリ、クエリ統合、外部クエリキャッシュなどの機能が含まれるようになりました。 Tableau は、それをサポートするプロセッサのベクトル化も利用しています。
  6. 使いやすく統一されたデータとのビジュアルインターフェイス - Tableau は、データのフィルタリング、予想、傾向線分析をシンプルなアクションで行える分析ツールを用意しています。 ユーザーのアクションを解析し、視覚的なベストプラクティスに基づいてデータを表示する最適な方法を選択します。 Tableau は、どんなデータソースでも、いったんデータに接続すれば同じビジュアル インターフェイスで操作できます。

これからもデータをとりまく環境の変化にあわせて、Tableau のビジョンも変化します。 多くのお客様がビッグデータテクノロジーを多様に使用することが、新しい常識になりました。 Hadoop や Spark といったテクノロジーは、データの保存・処理を行うことから、データウェアハウスと併せてデータアーキテクチャの一部として扱われるようになりました。 これと並行して、Hadoop を導入することにより、お客様はデータウェアハウスを縮小しています。 NoSQL データベースは、柔軟なデータモデル、短い待ち時間、アプリケーションにあわせた設計を行えるという理由で、アプリケーションのバックエンドとしてリレーショナルデータベースよりも選ばれる傾向にあります。 最後に、クラウド CRM & ERP システムがビジネスプロセスを管理するための方法として好まれるようになり、クラウドストレージやデータ処理においても「使った分だけ支払う」消費モデルが一般的になってきたことから、クラウドデータソースはユビキタスであると言えます。 バックエンドが多様に変化しますが、ユーザーには、ビッグデータプラットフォームやクラウドデータソース、リレーショナルデータベースのいずれにも柔軟に接続し、アジャイルにデータを分析できる Tableau のようなフロントエンドツールが必要です。

さらに詳しく読みたい方は、 ホワイトペーパーをダウンロードしてください。

続きを読む...

こちらもご覧ください