全社規模の分析ソリューションの鍵となるのが、意思決定の基となるデータの信頼性です。

以前は、データにアクセスできるようにすることでこの信頼性が失われていました。データ自体もデータから得られたレポートもロックされていて、組織全体でこれらにアクセスできるのはほんの一握りの人々だけでした。

しかし、このモデルでは今日の従業員によるデータへの高いニーズに十分対応することができません。そして多くの方法で、あらゆる規模の企業で急速に Tableau が導入されていることは、セルフサービス分析へのニーズが増えている証拠です。

データの信頼性とガバナンスは、Tableau の開発と大規模な分析の導入のガイダンスの両方において、常に Tableau のアプローチの中心にありました。

Tableau Server の Data Server を使用すると、ユーザーが新しいデータソースを中央サーバーにパブリッシュし、組織全体で使えるように共有および管理することができます。

このようなオープンなデータモデルを使用していることが広く導入されている理由であり、分析プラットフォームの管理者は多くのガバナンスと監督機能が利用できます。

Tableau はお客様が強力なツールとベストプラクティスを活用して大規模な分析の導入を進めた素晴らしいストーリーをコミュニティの皆様に伝え、教訓を分かち合いたい考えています。GoDaddy は Tableau とデータカタログパートナーの Alation で、まさににそれを実現しています。

Alation はエンドユーザーが複数ソースからデータを発見しやすくし、データのニュアンスを深く理解できるようにすることで、Tableau のデータガバナンスへのアプローチをサポートします。Alation は組織内の利用可能なデータだけでなく、分析に使用されたビジネスセマンティクスと SQL クエリに埋め込まれたロジックもクローリングとカタログ生成のプロセスに含める、独自の自動プロセスを使用しています。

Alation はこの自動化されたデータ知識の基礎を使用して、アナリストの生産性を高めると同時に、プラットフォームの管理者に、ユーザーの Tableau ワークブックでソースデータの出所とインパクト分析を提供しています。

GoDaddy での Tableau と Alation の活用状況

何百ものデータソースが何十ものプラットフォームに広がり、850 人以上の Tableau Server ユーザーがいる GoDaddy のチームは、大規模なセルフサービス分析のガバナンス方法に改善が必要でした。そこで、GoDaddy の Tableau エバンジェリストでありシステム管理者の Sharon Graves 氏は、この課題に立ち向かいました。

Sharon 氏は次のように述べています。「データが複数のサーバープラットフォームにありました。」「その中で、重複データもいくつもありました。文書化されていない計算フィールドもありました。BI の視点から、レポート作成に必要なデータはこれだという確信を持てませんでした。」

Sharon 氏は、データソースのガバナンス不足が、チームがデータからインサイトを得る能力に深刻な影響を与えていたと言っています。

「分析とデータディスカバリが思い通りにできませんでした。データを詳細に分析し「これらの変則を見てみよう」というものではありませんでした。むしろ、「このデータを見つけて何のデータなのか、どのように使えるのか見てみよう」というものでした。思っているほど楽しいものではありませんでした」と、Sharon 氏は語ります。

GoDaddy の IT チームは、データソースのガバナンス方法を改善する必要がありました。このチームは MySQL、MSSQL、Cassandra、Hive、Pig、Spark、そして Google Analytics や LinkedIn などのサードパーティーデータシステムを使っていました。アナリストはどのデータソースのどのフィールドを使えばいいのかを判断するのにすべての時間を費やし、有意義な分析に十分な時間を費やすことができませんでした。非常にストレスがたまり時間がかかるプロセスでした。

そこで、GoDaddy は Alation と Tableau を使うことにしました。Alation と Tableau の組み合わせにより、GoDaddy の IT チームは大規模な Tableau の管理、データのカタログ生成とタグ付け、表のデータのソースの調査、各分野の複数データソースの検索、可視性とコントロールの向上が可能になりました。

Alation の検索機能では各データソースのトップユーザーが表示されるため、どの内部リソースがさらに役立つかがわかります。Alation は Tableau とシームレスに連携し、Data Server へのパブリッシュやワークブックの作成および閲覧が Alation から直接簡単に行えます。

Alation と Tableau を使うことで、GoDaddy のアナリストは最も得意とするデータの探索と分析に集中できるようになりました。

Sharon 氏は次のように語りました。「BI アナリストが自由に分析できるようになりました。」「アナリストのやりたいこと、専門とすることができるようになりました。データを探し出して「集客率とは何だろう」と考えるのはアナリストの仕事ではありません。アナリストをこのような作業に使うべきではありません。」

Alation と Tableau の連携

Alation は Tableau Server に接続し Tableau の既存のガバナンス機能を補足して、大規模なセルフサービス分析を可能にします。

  1. プロジェクトの統合: Alation は Tableau プロジェクトを通じて Tableau のデータガバナンスプロセスをネイティブでサポートしています。データスチュワードとデータガバナンスチームは、Alation で Tableau のデータソースとデータガバナンスで承認された Tableau プロジェクトの関連付けをパブリッシュし、自動的に更新できます。
  2. Tableau タグ: データスチュワードは Alation と Tableau を使用して、データガバナンスポリシーとベストプラクティスのコンテキストを、タグで直接 Tableau のデータユーザーに伝えることができます。タグは Alation と Tableau Server の間で自動的に同期されるため、Tableau ユーザーは直ちにタグをフィルター条件として利用でき、Tableau ワークブックやデータソースの検索や理解に役立てることができます。
  3. 深いインパクトの分析: Alation は自動的に、Tableau ユーザーへのデータの提供に使用されるデータパイプラインの詳細情報を提供します。Alation は、ソースデータベースやファイル構造における変更が分析の正確性に影響を与える可能性があった場合、Tableau のデータユーザーにメールで通知を送ることで、次のプロセスに関する意識を高めます。
  4. Data Catalog: また、Alation の Alation Data Catalog により、Tableau ユーザーは非常に広く分散したビッグデータ環境でのデータの検索が可能になり、Alation から直接ワークブックを生成できます。システム全体で利用できるすべてのデータセットのサンプルに加え、このように単一の参照基準を設定することで、専門のデータ管理者とデータユーザーの両方によって促進されるデータの詳細な説明や用途が提供されます。

Alation と Tableau が連携して大規模なガバナンスを可能にする方法の詳細は、こちらの Web サイトホワイトペーパーをご覧ください。

こちらもご覧ください

ブログの更新情報を受け取る