詳細レベル (LOD) 表現について


概要: 

分析で LOD 表現を使用し活用する方法をご覧ください。

Tableau は、快適な操作でデータ分析を行えるようにすることを目標にしています。 Tableau を使ったデータ分析に夢中になると、製品の使用方法について考えなくなり、ただデータに問いかけることが楽しくなってしまうという声をよく聞きます。 私たちはこの状態をフロー (流れ) と呼んでいます。作業に夢中になって没頭している状態のことです。

問題を解決するためにツールの使用方法を考えるようになると、フローの状態が壊れてしまいます。 このようなことが起きる原因の 1 つに、異なる詳細レベルで集計されたデータで作業しなければならないという点があります。 このような場合、質問を考えるのは簡単でも、答えを見つけるのが難しいということがよくあります。 たとえば、次のような質問が考えられます。 会社に 100 件を超える注文があった日数を四半期ごとにプロットできるか?

こういったタイプの質問を処理するために、Tableau 9.0 には詳細レベル (Level of Detail, LOD) 表現と呼ばれる構文が新たに導入されました。 この新しい構文により、詳細レベルが関わる質問を直接処理できるようになるため、Tableau の計算言語が簡略化されると共に、その機能も拡張されます。

このホワイトペーパーでは、LOD 表現の動作について本質を理解すると共に、各種の LOD 表現とそれぞれの利用方法についても、さらに深く把握することができます。

本ページではホワイトペーパーの一部をお読みいただけます。 全ページをお読みいただくには、右にあるボタンで PDF をダウンロードしてください。


LOD 表現の仕組み — 「詳細レベル」の説明

データを分析するうえで重要になってくるのが、ソースとなるデータの構造を理解することです。 たとえば、レストランの調査データがあるとします。このデータで最も粒度の高い (最も詳細な) 情報は住所です。 そのデータを集計し、郵便番号、都市、州、さらには国別のプロパティを表示するとします。

通常、Tableau でこのような作業を行う場合は、関心のあるディメンション ([City (都市)]、[State (州)] など) をビューにドロップします。 ビューに追加するディメンションに応じて、データが適切に集計されます。この時に集計されるレベルが「Viz 詳細レベル」 (略して Viz LOD) です。

ここで重要なのは、 LOD 表現を使用すると、これらのディメンションをビジュアライゼーションにドロップしなくても、計算で使用する詳細レベル (ディメンションなど) を決定できるということです。 つまり、Viz LOD とは関係なく、計算を実行する詳細レベルを定義できます。

次の例では (レストランの調査データを使用)、ビューに [City (都市)] と [State (州)] の 2 つのディメンションが追加されています。

ビュー内のデータは Viz LOD (この場合は [City (都市)] と [State (州)] で構成される) に基づいて集計され、参照元のデータソースよりも集約度が高く集計されています。 画像内で選択されたポイントには、エディンバラのニューブリッジにあるすべてのレストランのファンの平均人数が表示されています。

より粒度の高い (細かい) ディメンションをビューに追加すると、集約度の低い Viz LOD となります。 たとえば、各レストランのファンの平均人数を表示するには、[Business ID (ビジネス ID)] をビジュアライゼーションに追加 ([詳細] シェルフにドロップ) します。 これでビジュアライゼーションが変更され、 マップには、それぞれのビジネス ID が表すレストランごとの円が表示されます。 しかし、ビジュアライゼーションを変更したくない場合はどうすればよいでしょう? レストラン、つまりビジネス ID ごとのファンの合計数と、その合計の平均値を都市ごとに計算して円で表示するにはどうすればよいでしょう? 各都市のレストランのファンの平均人数を確認するにはどうすればよいでしょう?

このような場合は、ディメンションをビジュアライゼーションにドラッグせずに、ビューにそのディメンションを追加する必要があります。 これには LOD 表現を使用します。

[Fans per Business (レストランごとのファン)] という名前の新しい計算フィールドを作成します。 構文を簡単に説明します。

(Image hidden)

この表現では、Viz で使用されているその他のディメンションに関係なく、[Business ID] ごとに集計を行います。[Business ID] ごとの[User Fans (ファン)] の合計を計算するには、LOD 表現を使用します。 この新しいフィールドをビューにドラッグしたら、都市ごとの平均値を求めることができます。

LOD 表現に FIXED 演算子を使用することで、どの都市で、レストランのファンの平均人数が多いのかを確認できます。 より濃い青色で表示された都市には人気が高いレストランが多いことを意味します (あるいは、レストランの数が多くなれば、レストランのファンの合計数も多くなります)。

LOD 表現のキーワードには、EXCLUDE、INCLUDE、FIXED の 3 つがあり、これによって LOD 表現のスコープを変更します。

さらに詳しく読みたい方は、 ホワイトペーパーをダウンロードしてください。

続きを読む...

こちらもご覧ください