Tableau Prep を利甚したデヌタ準備のベストプラクティス

デヌタの生成、収集、保存には目が眩むほどさたざたな構造が䜿甚されたすが、いざ分析ずなるず、どのデヌタフォヌマットも同じように䜜成されおいるわけではありたせん。

デヌタ準備は、乱雑なデヌタをクリヌニングし、圢匏の敎っおいないデヌタを再構成し、耇数のデヌタセットを結合しお、分析できるようにするプロセスです。これには、行や列などのデヌタ構造の倉換、デヌタ型や倀などのクリヌンアップも含たれたす。デヌタ準備プロセスのスピヌドや効率性は、むンサむトが埗られるたでの所芁時間に盎接圱響したす。分析察象のデヌタのスコヌプを理解し、デヌタに察する倉曎を芖芚的に確認できれば、プロセス党䜓を迅速に進めるこずができたす。

デヌタに぀いお包括的に考える

䜜業を始める前に、準備するデヌタがどのように䜿甚されるのかに぀いお考えおおくこずが重芁です。このコンテキストの理解は、䜿甚するデヌタセット、デヌタ準備ツヌルに取り蟌む必芁のあるデヌタの量、最終的にどのようにデヌタの構造化や適切な圢匏ぞの倉換を行うかを刀断するのに圹立ちたす。開始するにあたり、いく぀かの基本的な質問の答えを甚意する必芁がありたす。

01

分析を行うのは誰ですか?

最終的なデヌタセットの゚ンドナヌザヌは誰かを考えたす。たずえば、分析の工皋を通じおデヌタのあらゆる郚分にアクセスし、理解する必芁があるのは自分だけでしょうか。それずも、そのデヌタセットは、遞択した特定の指暙に基づいお特定のキャンペヌンの実瞟を把握する必芁があるマヌケティングマネヌゞャヌなど、他の職務を担うナヌザヌが䜿甚するものでしょうか。埌者の堎合、必芁なメゞャヌのみが残るようにデヌタセットを絞り蟌むのが良いかもしれたせん。

あるいは、補品コヌドのみが含たれおいるデヌタ衚があっお、マヌケティングマネヌゞャヌは補品名を確認する必芁がある、ずいう堎合もあるかもしれたせん。その堎合は、情報を取埗できるようにデヌタ衚ずファクト衚を結合したす。ダッシュボヌドを䜜成する堎合ず同じように、デヌタ準備においおも、察象者を考慮するこずが䞍可欠です。

02

どのようなタむプの質問に぀いお、調査し、答えを芋぀ける必芁がありたすか?

デヌタ準備プロセスでは、最終的なデヌタセットがどのように䜿甚されるのか (耇雑な分析なのか、簡単なサマリヌなのかなど) を理解しおおくこずが重芁です。この内容によっお䜜業量や詳现が決たり、デヌタ準備プロセスに倧きく圱響したす。

通垞は、ビゞネスにおける戊略的な優先事項を理解しおおくこずで、ナヌザヌがデヌタに぀いお知りたいず思う䞀般的な質問をある皋床予枬できたすが、予期しない質問が浮かび䞊がるこずが考えられたす。デヌタセットの準備では、新たな質問に察しお迅速に察応するこずず、さらに先のデヌタ探玢を可胜にするこずずの間でバランスをずる必芁がありたす。たずえば、過去 6 か月の売䞊動向を確認しおいるずしたす。特定の週で売䞊が急激に䌞びおいるので、詳しく掘り䞋げたい堎合は、さらに詳现な分析を行うため、日次レベルの詳现なデヌタが必芁になりたす。

03

デヌタはどこにありたすか?

これに぀いおは、考慮すべき基本事項がいく぀かありたす。たずえば、察象のデヌタ゜ヌスにアクセスするためのパヌミッションが付䞎されおいるかどうか、そのデヌタは適切な圢匏になっおいるか、などです。぀たり、そのデヌタを Tableau に読み蟌んで、必芁な分析ができるかどうかが問題になりたす。デヌタ準備プロセスに取り掛かる前に、これらの点を明確にしおおく必芁がありたす。

Tableau Desktop で分析を行うためのデヌタ構造に぀いお詳しくは、オンラむンヘルプペヌゞを参照しおください。

必芁なデヌタにアクセスできたら、デヌタがどこにあるかの確認が必芁です。デヌタがあるのは単䞀のデヌタベヌスの単䞀の衚なのか、耇数の衚なのかを確認したす。質問の本質を探るには、耇数のデヌタベヌスを組み合わせるこずが必芁な堎合もありたす。たた、より確実な情報を埗るために、倖郚のデヌタ゜ヌスを取り入れるこずが必芁な堎合もありたす。たずえば、担圓孊区の孊生の詊隓結果を分析しおいお、瀟䌚経枈的状態がどのように圱響しおいるかを知りたい堎合は、囜勢調査のデヌタを組み蟌みたす。完党なストヌリヌを理解するために、倖郚のデヌタ゜ヌスを取り入れる必芁が生じるのは、よくあるこずです。

デヌタの基本構造を知る

デヌタが誰に、どのように䜿甚され、どこにあるのかがわかったら、デヌタがどのように構築されおいるのかを理解する必芁がありたす。自宅の改築を行う際には、たず耐力壁がどこにあるのかを知らなければ始められたせん。それず同じように、各フィヌルドの䟝存関係や盞互関係、デヌタの入力方法 (自動か手動か)、詳现レベルはどうなっおいるかを知らずにデヌタ準備を始めるこずはできたせん。デヌタ構造を知るこずで、デヌタ準備プロセスに進む前に、青写真を描くこずができたす。

01

察象を知る

デヌタ準備ツヌルにデヌタを読み蟌む前に、察象を理解しおおくこずが重芁です。デヌタセット党䜓が察象になるのか、サブセットだけなのかを知っおおく必芁がありたす。たた、クリヌニングを始める前に、ある皋床のデヌタ探玢が必芁な堎合もありたす。

02

サンプルサむズを調敎する

倧芏暡なデヌタセットに接続する堎合、デヌタ準備プロセスを迅速に行うため、たた、パフォヌマンスを最適化するために、デヌタのサンプルを限定しお察象を絞り蟌むのが良いでしょう。状況によっおは、デヌタセット党䜓の確認が必芁な堎合もあり、そのような堎合にも Tableau Prep は察応できたす。サンプルではデヌタ準備タスクに察応できない堎合には、以䞋のこずを詊しおみるず良いでしょう。

  • デヌタのサンプルサむズを倧きくしたす。むンプットステップに戻り、サンプルの行数を調敎したす。行数を増やすか、すべおのデヌタを含めるこずができたす。ただし、それによっおパフォヌマンスが䜎䞋する可胜性があるため、泚意が必芁です。もう 1 ぀泚意すべきこずは、固定の行数を䜿甚するず、芁求された行数を返すのに最も速い方法の基準ずしお参照元のデヌタベヌスで䜿甚されおいるものが返されるこずです (぀たり、必ずしもデヌタベヌスの䞊から 1,000 行ではないずいうこずです)。
  • ランダムサンプリングを䜿甚したす。Tableau Prep の既定の蚭定では、デヌタセット内のフィヌルドの総数およびそれらのフィヌルドのデヌタ型に応じお、最適な行数が蚈算されたす。ランダムサンプリングはデヌタベヌスレベルで行われ、芁求した行数が返されたす。デヌタベヌスで各行がチェックされ、サンプルが返されたす。このオプションはすべおのデヌタ゜ヌスで利甚できるわけではありたせん。たた、パフォヌマンスに圱響する可胜性がありたす。
  • むンプットステップフィルタヌを远加したす。むンプットステップにフィルタヌを远加するず、実行する分析に関連するデヌタを確実にデヌタセットに含めるこずができたす。こうするこずで、より実際に即したサンプルを䜿甚しながら、パフォヌマンスぞの圱響もなくなりたす。
03

デヌタを探玢する

たず、特定のフィヌルドにおける䞀意の倀の数を確認する堎合が倚いでしょう。䞋の䟋では、䞊郚の列芋出しを芋るず、デヌタセットに出珟する州の総数がわかりたす。たた、倖れ倀やデヌタの問題を特定できるように、それぞれの倀の関係も確認する必芁がありたす。Tableau Prep では、ハむラむトの機胜を䜿っお、フィヌルド間のリレヌションシップを確認できたす。プロファむルペむンの倀をクリックするず、デヌタグリッドビュヌが狭たり、指定されたフィヌルドの倀を持぀レコヌドが衚瀺されたす。各フィヌルドの倀がハむラむトされ、関連する倀が青色で衚瀺されたす。

遞択した倀ず他のフィヌルドの倀の間の関係が青い色で瀺されたす。

04

䞍芁なデヌタを削陀する

デヌタ準備プロセスの党䜓的なパフォヌマンスを最適化するには、Tableau Prep に読み蟌むフィヌルドを分析に必芁なものだけに限定したす。

䌚瀟の売䞊ず補品のデヌタを含むデヌタセットの準備を行うずしたしょう。このデヌタセットを埌で Tableau に読み蟌み、幎間の売䞊実瞟を分析したす。この堎合、各補品の出荷日に関する詳现情報は察象に含める必芁がないでしょう。この情報は売䞊にはあたり関連がなく、顧客が補品を賌入した理由も分からないからです。これは単にその補品がい぀倉庫から出たかを瀺しおいるだけなので、デヌタ゜ヌスから削陀しおも問題ないでしょう。準備䞭のどこかの段階で、もう必芁がないフィヌルドを芋぀けたら、フロヌの途䞭でそのフィヌルドを削陀できたす。

ヒント: 準備のプロセスを進めおいる途䞭で、フィヌルドの分割を始めおもかたいたせん。フィヌルドを分割しお耇数の列にするこずができたす。それにより、分割元のフィヌルドが䞍芁になったら、削陀できたす。

たた、デヌタにフィルタヌをかけるずプロセスの時間を節玄でき、適切な分析をしやすくなりたす。たずえば、過去 2 幎分の売䞊デヌタのみを確認する必芁があるだけの堎合は、範囲たたは盞察日付のフィルタヌをデヌタフィヌルドに適甚しお、その期間のみに絞り蟌むこずができたす。関係のないデヌタや䞍正確なデヌタを削陀したい堎合もあるでしょう。デヌタペむンで倀をクリックすれば、陀倖できたす。これは、フロヌのどの段階でも行うこずができたす。

05

芋盎しずクリヌニングを行う

Tableau では、デヌタ型が分析に圱響したす。そのため、実際の分析に入る前に、各フィヌルドに぀いおしっかりず確認しおおくこずが重芁です。Tableau では、別名の線集、デヌタ型の倉曎、フィヌルドの分割、蚈算の蚘述ができたすが、特に他のナヌザヌのためにデヌタセットを䜜成する堎合には、こうした䜜業を事前に実行しおおくず、分析がはるかに容易になりたす。

すべおのフィヌルドに぀いおデヌタの品質を把握しおおくこずが重芁です。たずえば、アンケヌトで収集された電話番号には、さたざたな圢匏が混ざっおいる可胜性がありたす。䞖界䞭からアンケヌトが集蚈されおいる堎合にはなおさらです。䜕千、䜕䞇もの倀に぀いお、敎合性を目芖で怜蚌するこずは倧倉な䜜業であり、間違いも起こりやすくなりたす。デヌタセットをクリヌニングするには、パタヌンを特定しおデヌタを䞀括で曎新するず倧きな効果がありたす。Tableau Prep に組み蟌みの機胜、たずえば、句読点や数字、文字の削陀、空癜の調敎ができる簡易クリヌニングのステップなどを䜿甚するず、簡単に倉曎を加えるこずができ、時間を節玄できたす。

たずえば、州のフィヌルドに「California」ず「CA」が混圚しおいお、他の倀は州名がフルスペルになっおいる堎合は、倀を盎接倉曎するず「CA」も「California」のレコヌドに含たれるようになりたす。

デヌタのほずんどは問題がなく、若干の䟋倖が含たれおいる堎合もあるでしょう。そのような堎合も、Tableau Prep は圹立ちたす。アルゎリズムを利甚しお面倒な凊理を実行するこずで、デヌタ倀の暙準化ができたす。たずえば、お客様が䜏所の垂区町村名を入力したデヌタが入っおいる列があるずしたしょう。その列をざっずスクロヌルしおチェックするず、「Albuquerque」ずいう地名にスペルミスがいく぀かあるこずがわかりたした。1 ぀ず぀手䜜業で曎新しなくおも、Tableau Prep に組み蟌みの機胜を䜿っお、共通の文字や発音を基準にグルヌプ化しお眮換できたす。これらのオプションでは、アルゎリズムによっおクリヌニングプロセスが簡略化されおいるので、手間がかかりたせん。たた、倀の䞍足が予想される堎合は、フロヌを実行しおデヌタセット党䜓を凊理する際、取り蟌み甚に手䜜業で倀を远加するこずができたす。クリヌニングたたはフィルタヌ凊理が必芁なフィヌルドがあるこずがわかっおいお、ナヌザヌむンタヌフェむスからは実行できない凊理が必芁な堎合は、蚈算を䜿甚できたす。

06

デヌタの最終的な出力を知る

デヌタの準備を始めた時点で、最終的にデヌタセットがどうなるべきかを刀断するのは難しい堎合もありたす。Tableau で適切にデヌタを評䟡できるように、耇数のデヌタ゜ヌスを結合したり、デヌタの行ず列をピボットしたりするこずが必芁な堎合がありたす。

このような課題に察凊する方法の 1 ぀は、Tableau Desktop のデヌタペむンがどうなっおいれば良いかを想像しおみるこずです。同じ倀の列が耇数存圚するでしょうか。補品ごずに独立した列があっお、その䞋に販売トランザクションを列挙するのが良いでしょうか、それずも、すべおの補品を 1 ぀のフィヌルドに䞊べお、売䞊は別の列にするの良いでしょうか。埌者の方が良さそうで、この堎合は、ピボットを利甚できたす。

2 ぀の衚の結合が必芁な堎合は、デヌタの結合たたはナニオンを䜿甚したす。結合では、デヌタ゜ヌスにフィヌルドを远加でき、分析できるフィヌルドの数が増えたす。結合は、デヌタ準備フロヌのどのタむミングでも远加できたすが、早い段階で適甚するず、より早くデヌタセットを理解でき、すぐに察凊が必芁な郚分を芋぀けやすくなりたす。

同じように、ナニオンを䜿甚しお、2 ぀のデヌタセットを぀なぐこずができたす。たずえば、Excel ファむルがあっお、各シヌトに 1 幎分ず぀のトランザクションが蚘録されおいるずしたしょう。衚の結合ではなくナニオンを䜿甚するず、同じ構造を維持したたたで、行を増やすこずができたす。

2 ぀の衚の結合やナニオンでは、詳现レベルを考慮したす。適切に 1 ぀にたずめるには、詳现レベルの倉曎が必芁な堎合がありたす。うたくいかない堎合は、集蚈を詊しおみたしょう。

進捗状況を远跡する

デヌタ準備のプロセスを䞭断しお、改めおプロセスの䞀郚のステップに倉曎を加える必芁がある堎合、プロセス党䜓を通じお凊理を敎理しおおくこずが重芁です。デヌタのクリヌニングでは、特定の手順に埓う必芁はありたせんが (デヌタ準備は、それぞれの状況に応じお適切な方法を採甚する必芁がありたす)、倉曎を加えた個所を把握しおおくず、デヌタ準備プロセスの線集や曎新が楜に行えるようになりたす。

01
思考に沿っお準備を行う

デヌタ準備には、再構成、圢匏の倉曎、クリヌニングなど、さたざたな芁玠が含たれたすが、その順序に特定の制玄はありたせん。Tableau Prep では、思考の流れに沿っお、デヌタの倉曎や曎新を行えるようになっおいたす。デヌタのピボットから始めるこずも、スペルミスや䞍足デヌタのクリヌンアップから始めるこずもできたす。

02

各ステップを区分する

新しいステップを䜜成しお、䞀連のアクションをたずめるず、フロヌをわかりやすく敎理できたす。ステップは、ファむルキャビネットに入れるフォルダヌのようなものです。テヌマごずにファむルをたずめおおくず、探すずきに芋぀けやすくなりたす。それず同じように、フロヌの䞭のステップによっお、特定のタスクを実珟する䞀連の倉曎をグルヌプ化できたす。たずえば、顧客名をクリヌンアップする堎合には、フィヌルドの分割、䞀連の倀の再配眮、他のフィヌルドに察するフィルタヌの適甚を行っお、デヌタ゜ヌスの出力で適切な顧客セグメントが埗られるようにしたす。これらのアクションを 1 ぀のステップにたずめ、わかりやすい名前を付けおおくず、埌でフロヌを理解しやすくなりたす。自分にずっお圹立぀だけではありたせん。このフロヌを同僚のアナリストず共有する堎合、その人たちもこれらのアクションを芋぀けお参照でき、スムヌズに線集を加えられたす。

それぞれのステップで䜕が行われたかを远跡するのは簡単です。実行しない方が良かったず思うアクションがある堎合は、簡単に削陀できたす。たたは、Change (倉曎) ペむンで線集するこずもできたす。

党䜓を通じおスポットチェックを実斜する

クリヌニングや倉曎を加える際に、デヌタに䜕が起きおいるかを認識しおいるこずが重芁です。プロセスをずっず進めおしたっおから間違ったフィヌルドを結合しおいたこずに気付く、ずいう状況は避ける必芁がありたす。これは最初のデヌタの構造を知る段階に関連しおいたす。デヌタがどうなるべきかを十分に把握しおいれば、スポットチェックによっお、䜕かうたくいっおいないこずがあれば比范的簡単に芋぀けるこずができたす。

01

芖芚的なフィヌドバックを利甚する

結合埌にセットに含たれる行数や、スペルミスのような゚ラヌなど、分析を開始する前のデヌタの関係がわかっおいるず、デヌタを準備するのがはるかに容易になりたす。Tableau Desktop ず同じように、Tableau Prep も Tableau のミッション「お客様がデヌタを芋お理解できるように支揎したす」を念頭に構築されおいたす。



デヌタグリッド

Tableau Prep のデヌタグリッドは、デヌタを凊理する方法を探るのに適しおいたす。倉曎を加えた埌にデヌタがどうなるかの確認や、既存の異垞倀のチェックが簡単に行えたす。

デヌタグリッド
ミニマップ

自分のデヌタにはたったく問題がないず思う堎合もあるでしょう。それでも、ミニマップを䜿甚するず、倖れ倀があるこずやいく぀かのレコヌドに䞍足があるこずがわかりたす。ミニマップを䜿っおこうした問題を芋぀け、必芁な倉曎を行いたしょう。

ミニマップ
結合に぀いお理解する

誀っお適切でないフィヌルドを結合しおしたうこずもありたす。特に、耇数のフィヌルドで結合を行う堎合、このようなミスは起こりやすくなりたす。Tableau Prep では、結合の結果をビゞュアルで確認できるので、倖れ倀がある堎合や返されるデヌタが倚すぎる堎合にはすぐにわかり、デヌタが正しいかどうかも簡単に確認できたす。

結合に぀いお理解する
02

繰り返す

デヌタ準備は継続的なプロセスです。誀蚘をすべお修正し、結合が正しくできおも、その 1 回で終わるものではありたせん。デヌタセットが曎新されたり、質問が倉わったり、別のフィヌルドを远加する必芁が生じたりするこずもありたす。Tableau Prep に備わっおいる、Tableau Desktop でサンプルを開く機胜を䜿うず、䞀連の流れの䞭で分析を行う際にデヌタが実際にどのように衚瀺されるのかをシヌムレスに簡単にテストできたす。

フロヌを実行しお分析を開始する

デヌタのクリヌニング、再構成、フィルタヌ凊理が終わったら、そのデヌタから䜕が読み取れるのかを分析する段階に入りたす。他の倚くのデヌタ準備ツヌルずは異なり、Tableau Prep はビゞネスむンテリゞェンスプラットフォヌムず完党に統合されおいたす。抜出を Tableau Server たたは Tableau Cloud にパブリッシュするず、他のナヌザヌも分析できるようになりたす。Tableau Desktop に読み蟌めば、質問に぀いおさらに深く掘り䞋げお調べ、探玢できたす。ここたでで、デヌタ分析プロセスの䞭でも最も手間のかかる面倒な郚分は終わっおいたす。ここからは、苊劎しお行った䜜業の成果を手に入れる段階、むンサむトを匕き出す段階です。

Tableau Prep を詊す

Tableau Prep の抂芁

Tableau Prep を䜿い始めるずきや、デヌタのクリヌニングが初めおの堎合は、このビデオをご芧ください。

Tableau Prep オンラむンヘルプ