Tableau Prep の新機能: データの役割機能によるデータ品質の問題の自動検出

分析前のデータ準備にかかる時間の短縮に役立つ機能をご紹介します。

データには、見つけて修正すべき不正確な値が含まれていることがよくあります。ですから、データ準備ツールがユーザーに代わって、そのようなデータ品質の問題を見つけることができれば、時間の大きな節約につながります。そこで、9 月リリースの Tableau Prep (2018.2.3) では、データの役割機能が登場しました。Prep でデータ値に相当するものを設定すると、Prep は一致しない値を自動的に検出します。

今回リリースされた Tableau Prep では、結合句の直接修正、値の編集やグループ化を行った場合の結果表示の改善など、ユーザーエクスペリエンスも向上しています。また、MongoDB のデータにも接続できるようになりました。

分析前のデータ準備にかかる時間の短縮に役立つ機能をご紹介します。

データの役割の割り当てによるデータ品質の問題の検出 

データのクリーニング作業では多くの場合、実世界にあるもの (国や空港名など) を指すデータ値で、不正確な値を見つけ出す必要があります。しかし、データ値を手作業で検証したり、他のデータソースから取り込んだりするために、面倒でミスが起こりやすい作業になりがちです。Tableau Prep では、Tableau Desktop が認識できる 8 種類の地理的役割、メールアドレス、URL という、実世界にあるものを指すデータを認識できるようになりました (詳細はこちら)。

フィールドが実世界にあるものを示している場合、Tableau Prep にその種類を認識させるには、フィールドでデータの役割を設定します。すると Tableau Prep はデータの役割を基にしてデータ値を検証し、ユーザーがデータをクリーニングできるように無効な値を自動的に検出します。そしてユーザーは、フィールドをフィルタリングして無効な値のみを表示し、値を編集したり無効な値を削除してデータを修正することができます。データの役割機能を使うと、データフィールドで想定している情報の種類を指定できるため、データ品質の分析という手間のかかる作業を Prep に行わせることが可能です。今後のリリースでも役割が追加されていく予定です。ご意見がございましたら、フォーラムまでお寄せください。

データの不一致を結合句で直接修正 

Tableau Prep では、結合句内の不一致が赤いテキストで表示され、簡単に見つけられるようになっています。しかしこれまでは、結合ステップで不一致を直接修正することはできませんでした。それが今回のリリースでは、結合句のフィールドが 1 つでも複数でも、結合句中の想定外の値を直接編集して、必要に応じて一致させることができるようになりました。これにより、フローに沿って作業が進められます。

Tableau は、データ準備をシンプルに、短時間で行えるようにし、ミスを起こりにくくするための機能を追加し続けています。ぜひ Tableau Prep をお試しください。

Tableau Prep の詳しい情報について