Tableau의 사명은 사람들이 데이터를 보고 이해하는 일을 돕는 데 있습니다. Tableau 기능은 사용자가 데이터를 의미 있는 정보로 변환할 수 있도록 신중하게 설계되었습니다. Tableau에서 중점적으로 다루는 부분 중 하나는 계산입니다. 아이디어를 계산 언어로 표현하기 쉬울수록 사용자가 의미 있는 정보를 더 많이 만들 수 있습니다. 이러한 면에서 Tableau 9.0에서 세부 수준 표현식을 도입한 것은 획기적이라고 할 수 있습니다. 이러한 새 표현식을 사용하면 사용자는 간단한 구문으로 강력한 개념을 표현할 수 있습니다.

세부 수준 표현식을 통해 비주얼라이제이션의 세부 수준에 없는 집계를 쉽게 계산할 수 있습니다. 그런 다음 해당 값을 임의의 방법으로 비주얼라이제이션 내에 통합할 수 있습니다. 어렵게 느껴질 수도 있으므로 이 글에서는 일련의 일반적인 질문을 통해 해당 개념을 설명합니다. 끝 부분에서는 고급 분석 예제를 좀 더 살펴보겠습니다. 세부 수준 표현식에 대한 백서에서는 더 일반적인 개요가 제공됩니다. 구문 및 사용법에 대한 자세한 내용은 Tableau Desktop 온라인 도움말 섹션의 세부 수준 표현식을 참조하십시오.

다음 15가지 통합 문서는 각각 맞춤 데이터 원본이 포함되어 있으며 다운로드하여 세부 정보를 볼 수 있습니다. Tableau Desktop이 설치되어 있지 않은 경우 여기서 14일 무료 평가판을 다운로드할 수 있습니다. 안내에 따라 뷰를 다시 작성해 보려면 이 맞춤 데이터 원본을 사용하는 것이 좋습니다.

1. 고객 주문 빈도

고객별 주문 수를 확인하기는 비교적 쉽지만 한 번, 두 번, 세 번의 주문을 한 고객의 수를 파악해야 한다면 어떨까요? 이 뷰를 작성하려면 고객 수를 주문 수별로 세분화해야 합니다. 질문은 간단하지만 세부 수준 표현식을 사용하지 않고서는 측정값을 다른 측정값으로 분류하기 어렵습니다.

한 주문에 항목이 여러 개 있는 Superstore의 매출 데이터베이스를 생각해 보십시오. 고객별 주문 수는 각 고객이 주문한 횟수를 나타냅니다. 간단한 LOD 표현식을 사용하면 주문 수를 고객 수로 세분화하는 차원으로 변환할 수 있습니다.

2. 집단 분석

오랫동안 거래해 온 고객이 매출에 더 많이 기여할까요? 아래 뷰는 첫 번째 구매 연도별로 고객을 그룹화하여 집단별 연간 매출 기여도를 비교합니다. 고객별 최소 주문 날짜는 첫 구매 날짜를 나타냅니다. 하지만 뷰의 데이터가 고객별로 표시되지 않으므로 LOD 표현식을 사용하여 고객별 최소 주문 날짜를 수정해야 합니다.

3. 일일 수익 KPI

시간별 수익 트렌드는 파악할 수 있습니다. 하지만 영업일별 총 수익을 기반으로 성공 여부를 측정해야 한다면 어떨까요? 월별 또는 연별 수익이 발생한 일 수를 파악해야 하며 이는 특히 계절 효과가 궁금할 때 유용합니다. 다음 뷰에서 볼 수 있듯이 LOD 표현식을 사용하면 초기 데이터를 거래 수준에서 기록하면서 일일 수익과 같은 집계 데이터에 대한 구간차원을 쉽게 만들 수 있습니다.

4. 구성 비율

전 세계 매출 대비 국가별 수익 기여도는 어떻게 확인할까요? 기여도의 비율에 색상을 지정하면 미국의 세계적 매출 수익 기여도가 가장 높다는 것을 즉시 파악할 수 있습니다. 하지만 절대적인 기여도가 낮은 유럽연합과 같은 시장에 집중하려는 경우를 가정해 보겠습니다. LOD 표현식 없이 시장을 필터링하면 구성 비율이 다시 계산되어 각 시장 대비 국가별 기여도가 표시됩니다. 간단한 LOD 표현식을 사용하면 시장을 필터링하면서 전 세계 판매 기여도를 측정할 수 있습니다.

5. 신규 고객 유치

시장별로 유치된 총 고객 수의 일일 트렌드는 어떨까요? 이 데이터의 트렌드를 파악하면 지역 마케팅 및 영업 조직의 신규 비즈니스 유치 실적을 이해할 수 있습니다. 라인의 기울기가 급할수록 고객 확보가 활발하게 이루어지고 있다는 것을 의미하며 라인의 기울기가 완만할수록 잠재 고객을 더 활발하게 확보하기 위한 조치가 필요하다는 것을 의미합니다.

LOD 표현식을 사용하면 데이터가 시장별 및 일별로 표시되더라도 고객 수준에서 평가되므로 재방문 고객이 신규 고객으로 잘못 기록되지 않습니다.

6. 비교 매출 분석

평균과의 차이를 구하는 것은 상대적으로 간단하지만 선택한 범주와의 차이를 구하려는 경우는 어떨까요? 먼저 선택한 범주의 매출을 격리해야 합니다. 그런 다음 모든 기타 범주에서 해당 값을 반복하기 위해 EXCLUDE 표현식을 사용해야 합니다. 이렇게 하면 각 범주의 매출 차이를 나머지에서 분리할 수 있습니다.

7. 영업 담당자별 평균 최대 거래

각 영업 담당자별로 성사된 최대 규모의 거래는 어떻게 찾을까요? 또한, 영업 담당자별 최대 규모 거래를 고려할 때 국가별 평균은 어떻게 될까요? LOD 표현식을 사용하면 데이터가 시각적으로 국가 수준으로 표시되더라도 영업 담당자 세부 수준으로 파악할 수 있습니다. 아래 뷰의 경우 영업 담당자별 평균 최대 규모 거래가 파란색으로 표시된 국가에서 높고 주황색으로 표시된 국가에서 낮습니다. 이 정보를 활용하면 국가에서 영업 담당자로 드릴다운 분석을 수행할 수 있습니다.

8. 실제 및 목표 비교

이 비주얼라이제이션에는 커피 체인점의 실제 수익과 주별 목표 수익 간의 차이가 표시되어 있습니다. 위쪽 뷰를 보면 목표를 초과 달성한 주와 달성하지 못한 주를 한눈에 파악할 수 있습니다. 하지만 이렇게 집계하면 중요한 뉘앙스를 놓칠 수 있습니다. 일부 주는 해당 주에서 판매되는 모든 제품이 목표를 초과하기 때문에 목표를 초과 달성했습니다. 다른 일부는 단일 제품이 목표를 큰 차이로 초과 달성하여 목표를 달성하지 못한 모든 다른 제품의 수익을 만회했기 때문에 목표를 초과 달성했습니다. LOD 표현식을 사용하면 주에서 목표를 초과하여 판매된 제품의 비율을 파악할 수 있습니다.

9. 기간 마지막 날의 값

인벤토리 숫자, 직원 수, 주식 일일 종가 등 특정일의 상태를 나타내는 데이터는 매출, 수익 등 집계되는 측정값과 다르게 처리해야 합니다. 이러한 경우 월 마지막 날의 값을 표시하는 것이 좋습니다. 또한, 월에서 주로 세분화할 때 주 마지막 날의 값이 표시되도록 업데이트되어야 합니다. 아래 예의 경우 일별 수준으로 여러 티커의 주식 데이터가 표시되어 있습니다. 이 뷰는 일일 평균 종가를 기간 내 마지막날의 종가와 비교합니다. 간단한 LOD 표현식을 사용하면 데이터가 상위 수준으로 표시되더라도 일별 수준으로 확인할 수 있습니다.

다음 6가지 예제는 세부 수준 표현식을 고급 시나리오 및 Tableau의 광범위한 기능을 활용하는 사용 사례에 적용할 수 있는 방법을 설명합니다. 기본적인 시나리오에 대한 추가 예제를 보려면 LOD 표현식에 대한 온디맨드 교육 동영상을 참조하십시오.

10. 집단별 재구매

신규 고객을 유치하려면 비용이 많이 들 수 있으므로 기존 고객이 재구매하도록 유도하는 것이 좋습니다. 1분기, 2분기, 3분기, N분기마다 재구매를 하는 고객의 수는 얼마나 될까요? 재구매를 한 번도 하지 않은 고객은 몇 명입니까? 분기별 집단으로 세분화할 때 이 행동이 어떻게 보이나요? FIXED 표현식을 사용하여 고객별 첫 번째 및 두 번째 구매 날짜를 구한 다음 이를 기반으로 재구매할 때까지의 분기 수를 파악할 수 있습니다.

11. 범위 내 평균과의 비율 차이

예제 6은 선택한 단일 항목과 비교를 하는 방법을 보여주지만 여러 값의 범위와 비교를 하려는 경우는 어떨까요? 예를 들어 업계에 큰 영향을 미친 주요 이벤트가 발생하기 전의 일일 주식 종가와 평균 일일 종가를 비교할 수 있습니다.

12. 관련 기간 필터링

실적을 분석할 때 자주 사용되는 메트릭은 이번 연도와 작년의 연간 누계 및 월간 누계를 비교하는 것입니다. 이 작업은 오늘 날짜의 관련값을 필터링하면 간단하게 처리할 수 있지만 데이터가 매주 업데이트되는 경우에는 어떻게 해야 할까요? 데이터가 최종으로 업데이트된 날짜는 3월 1일이고 현재 날짜는 3월 7일이라고 가정해 보겠습니다. 이 경우 월간 누계를 비교하면 작년 3월 1~7일의 값과 올해 3월 1일의 값을 비교하게 됩니다. 이 비교 결과는 현실과 큰 괴리를 보일 수 있으며 우리에게 아무런 소용이 없습니다. 간단한 LOD 표현식을 사용하면 데이터 집합에서 최대값 날짜를 찾을 수 있습니다.

13. 사용자 로그인 빈도

웹 사이트 또는 응용 프로그램에 한 달에 한 번, 두 달에 한 번, 세 달에 한 번 등으로 로그인하는 사용자는 몇 명일까요? 평균 로그인 비율은 어떻게 될까요? 이 평균을 기준으로 분포는 어떻게 되나요? 세분화된 데이터는 사용자 ID별 로그인 날짜입니다. 즉, 사용자가 로그인한 모든 날짜에 대해 행이 있습니다. 이 뷰를 작성하려면 고객 수를 로그인 비율로 나눠야 하며, 이는 측정값을 측정값으로 나눠야 한다는 것을 의미합니다. 예제 1에서 LOD 표현식을 사용하면 이러한 유형의 분석을 손쉽게 수행할 수 있다는 것을 살펴봤습니다.

14. 비례 선긋기(Proportional Brushing)

모든 분석의 가장 근본적인 질문은 '비교 기준이 무엇입니까?'입니다. 경우에 따라 필터링을 할 때 선택한 항목으로 세분화만 하는 것이 아니라 선택 항목을 총 금액과 비교해야 할 때가 있습니다. 이 기술을 비례 선긋기라고 합니다.

15. 고객 집단별 연간 구매 빈도

기간을 고객 유치 연도로 가정하고 충성도를 연간 구매 빈도로 측정할 경우 오랫동안 거래해 온 고객의 충성도가 더 높을까요?

예제 1을 통해 구매 횟수가 정확히 한 번, 두 번 등인 고객의 수를 파악할 수 있습니다. 하지만 마케팅 담당자가 정확히 5번 구매한 모든 고객을 파악하려는 경우는 드물고 최소 5번 구매한 고객의 수를 파악하는 것이 더 유용할 수 있습니다.

또한, 예제 2를 통해 2011년에 가장 많은 고객이 유치되었고 2014년에 가장 적은 수의 고객이 유치되었다는 사실을 알 수 있습니다. 고객의 절대 숫자만 보면 동일한 트렌드만 파악할 수 있습니다. 따라서 집단별 고객 구성 비율을 충성도에 대한 측정값으로 사용하면 더 효율적일 수 있습니다.

초기 질문을 더욱 구체화해 보겠습니다. 집단별 연간 한 번, 두 번, 세 번, N 번 구매한 고객의 비율은 어떻게 될까요?

이 예제에는 예제 1의 주문 수 LOD 표현식의 변형, 예제 2의 집단 표현식 및 예제 4의 구성 비율 표현식의 변형이 조합되어 있습니다.

다음 내용도 확인해보는 것이 좋습니다.

새 댓글 추가 

블로그 구독