編集者注: このブログは、Teknion Data Solutions 社でプリンシパルコンサルタントを務め、VizPainter ブログ (英語) も執筆している、Tableau Zen Master の Joshua Milligan 氏が寄稿したものです。Milligan 氏は、Tableau Prep (以前の Project Maestro) のプレリリースプログラムにご協力くださいました。

私は、Teknion Data Solutions のソフトウェア開発者としてキャリアをスタートさせました。その数年後、BI に転向し、データモデリングとデータ準備を担当しました。データをいじるのは好きでしたが、データ準備パッケージを作成するプロセスの大半はかなり面倒で時間がかかると感じていました。 そして、四苦八苦することがあったのは検証です。 作成に何時間もかけ、プロセスの実行でさらに長い時間をかけた後で、値の半分がないことや間違っていることにようやく気づくのです。すると、どこでミスしたかを突き止め、できれば修正し、もう一度検証する必要が出てきます。誤解がないように言っておきますが、私は喜んでクライアントの役に立とうとしていましたし、楽しくない仕事だったわけでもありません。しかしやがて、私の仕事をすっかり変えるものに出会いました。

それが Tableau です。

Tableau には驚かされました。シームレスで使いやすく、直感的なアプリケーションだったからです。データフィールドをドラッグ & ドロップして、結果をすぐに視覚化することができます。質問をするとすぐに答えが得られ、そこからさらに深い質問が新たに生み出されて、その答えもすぐに出せます。また、私の仕事がすっかり変わっただけではありません。クライアントへの対応を向上させることができ、深いインサイトもはるかに短い時間で得られるようになりました。

しかし、データの構造化を行う必要性が完全になくなったわけではありません。ある種の分析では、特定のデータ構造が必要になります。「これからは別のチームメンバーに構造化を担当してもらおう」と私は考えました。私は Tableau とビジュアル分析の虜になり、Tableau のデータ接続画面以外でデータの構造化を行うことはもうほとんどないだろう、と思ったのです。

Tableau の魅力

驚かれるかもしれませんが、Tableau の最大の魅力は機能ではありません。もちろん私も、最新バージョンの Tableau と最新の機能には、皆さんと同じように喜んでいます。ですが、それ自体が最大の魅力だというわけではありません。最大の魅力は、すべての機能がシームレスな環境で連携している点です。つまり、一言で言えばフローこそが最大の魅力なのです。

フローとは、思考の流れを妨げずに、作業や質問に集中して解決方法や答えを求められるということです。Tableau が何かのステップを終わらせるまで待つ必要はありません。操作と操作の間で、何をしていたか忘れるほど長時間待つ必要もありません。Tableau なら反応がすぐに返ってくるので、さまざまな選択肢を短時間で簡単に繰り返し試せます。

そして、その同じ魅力を持っているのが Tableau Prep なのです。

Tableau Prep の思想を理解する

Tableau Prep (以前の Project Maestro) は、最初のアルファ版リリースから使っています。当時、基盤のエンジンはもう搭載されていましたが、インターフェイスの詰めがまだまだでした。今ならそういうこともないでしょうが、その最初のバージョンの UI では、Tableau Prep の思想をしっかり理解できるまでしばらくかかりました。しかし、あれこれと少し試行錯誤しているうちに、突然すべてが腑に落ちたのです。

その瞬間、Tableau と同じように Tableau Prep も気に入ってしまいました。他の Tableau 製品とまったく同様に、Tableau Prep ではデータ準備が簡単に行えるようになります。フローがあるからです。

  • データの接続、クリーニング、結合、変換は、ドラッグ & ドロップ操作とマウスクリックで行えます。
  • 目の前でリアルタイムに、データの形が変わるのを見ることができます。何時間も待たされたあげく、自分の仮定が間違っていたために結合できなかった、ということはありません。
  • 以前のステップに戻って、その時点でどのような構造だったかをすぐに確認することができます。
  • データフローを修正して、いろいろな選択肢を試してみることもとても簡単です。
  • 以前なら見逃していたデータの問題もすぐに見つけられます。「あっ! 行の半分以上が NULL 値だ。結合する前に直さなきゃ...」という感じです。
  • 見つかった問題はすぐに修正でき、修正の結果も確認できます。
  • 一度に 1 つの作業に集中できます。最終的な目標が頭にあっても、次の問題に手を着ける前にまず直さなければならないデータの問題に集中できるということです。また、先に進む前に、問題を解決できたと確かめることもできます。
  • フローのどの段階でも、必要に応じて Tableau に出力して視覚化し、理解を深めることができます。

Tableau Prep で体験する新しいデータ準備

Tableau Prep の思想を理解した私はうれしくなり、当時実際にデータで直面したばかりの課題に Tableau Prep で取り組んでみることにしました。

一例を挙げましょう。あるクライアントが、従業員の飛行機出張データを SQL Server 上に持っていました。しかし、ある航空会社は異なる予約システムを使っており、ファイルがディレクトリに定期的に入れられていました。またクライアントは、Tableau の素晴らしい航空路マップを見たがっていました。渡りに船とはこのことです。ただそれには、ジオコーディングデータの別のソースが必要になるうえ、Tableau の [パス] シェルフを使って視覚化できるように、出発地と目的地を別々のレコードに分離するデータの再構造化も行わなければならないとわかっていました。

フローの構築は、Tableau を使うのとまったく同じようにとても楽しい作業でした。実際とても楽しかったので、似たようなフローをここで構築してお見せします。

データを取り込んで、一度に 1 つのステップに集中することができました。

  • SQL Server データを、フラットファイルから作成したワイルドカードユニオンとユニオンします。
  • 一致していないデータをクリーニングし、無関係のフィールドを削除します。
  • [Person] 表の出張者を参照します。
  • 経路を出発地と目的地に分離します。
  • データをピボットし、それぞれの出発地と目的地を単一の行にします。
  • 他のデータソースのジオコーディングデータを参照します。
  • 最後のクリーニングを行います。
  • 完成したデータ構造をエクスポートします。ここでは Hyper 形式の抽出を選択しましたが、.tde や .csv にエクスポートすることも、Tableau Server にパブリッシュすることもできます。

これで、とても便利なデータセットが Tableau で完成しました。これを使うと、従業員の飛行機出張を分析して、費用の節約、出張のパターン、航空会社、購入するべき時期についてクライアントの意思決定を支援することができ、航空路マップも作成できます。

本稼働環境で Tableau Prep を使い始められることをうれしく思います。新しいリリースごとにどんな新機能が追加されるのか、早く見たいのは確かですが、Tableau Prep はすでに十分な魅力を持っています。

Tableau Prep のさらに詳しい情報

こちらもご覧ください

ブログの更新情報を受け取る