LOD 표현식 자세히 살펴보기—제3주

이번 게시글에서 우리는 다음과 같이 비주얼라이제이션에서 초점을 맞추고 있는 수준이 아닌 다른 수준의 데이터를 집계해야 하는 경우 발생하게 되는 일반적인 분석 문제의 예를 지속적으로 살펴보도록 하겠습니다. 각 영업사원이 체결한 가장 큰 계약과 이 계약의 국가별 평균은 무엇인가요? 시장별로 하루 당 누적 고객 수는 몇 명인가요? 데이터를 마지막으로 업데이트한 날짜를 기준으로 이번 연도와 작년을 비교했을 때 연간 누계 판매량의 차이는 얼마인가요?

Tableau는 고객에게 기쁨을 선사하기 위해 항상 노력하고 있습니다. 기쁨을 선사한다는 것은 어떤 때에는 시장의 수요에 따라 새로운 데이터 커넥터를 추가하는 경우와 같이 많은 고객이 요청하는 기능을 제작하는 것을 의미하기도 하고 또 어떤 때에는 오랜 시간 축적되어 온 다양한 의견에서 비롯된 혁신적인 아이디어를 실현하기 위해 모험을 하는 것을 의미하기도 합니다. Tableau는 항상 지원 사례와 고객 요청 뒤에 숨겨진 패턴을 파악하기 위해 노력합니다. 이러한 패턴은 Tableau의 역량을 한층 격상하게 해 줄 뛰어난 솔루션을 제작할 수 있는 발판이 되기 때문입니다. LOD 표현식은 단순히 한 고객의 요청으로 만들어진 기능이 아니라 커뮤니티 구성원들의 적극적인 참여와 오랜 시간의 고민이 빚어낸 결과라 할 수 있습니다.

LOD 표현식에 대한 간략한 소개를 확인하려면 이 연재글의 첫 번째두 번째 게시글을 참조하세요. 이번 게시글에서 우리는 다음과 같이 비주얼라이제이션에서 초점을 맞추고 있는 수준이 아닌 다른 수준의 데이터를 집계해야 하는 경우 발생하게 되는 일반적인 분석 문제의 예를 지속적으로 살펴보도록 하겠습니다.

  1. 각 영업사원이 체결한 가장 큰 계약과 이 계약의 국가별 평균은 무엇인가요?
  2. 시장별로 하루 당 누적 고객 수는 몇 명인가요?
  3. 데이터를 마지막으로 업데이트한 날짜를 기준으로 이번 연도와 작년을 비교했을 때 연간 누계 판매량의 차이는 얼마인가요?

위 세 가지 질문의 경우 각 질문의 초점은 분명하지만 각 질문이 참조하는 맥락은 다릅니다. *Tableau의 UI와 동일하게 집계된 데이터는 녹색, 집계된 데이터를 그룹으로 분류하는 데 사용된 차원은 파란색으로 표시됩니다.

서로 다른 세부 수준을 참조하는 방법에는 몇 가지가 있습니다. 위 세 가지 예에서 첫 번째 예는 현재보다 낮은 세부 수준을 참조하고 두 번째 예는 현재 초점이 맞춰져 있는 수준이 아닌 외부의 세부 수준을 참조하며 세 번째 예는 현재보다 높은 세부 수준을 참조합니다.

최대값의 평균
각 영업사원이 체결한 가장 큰 계약과 이러한 계약의 국가별 평균은 무엇인가요? 아래 뷰를 살펴보면 파란색으로 표시된 국가의 평균값은 높은 반면 주황색으로 표시된 국가의 평균값은 낮습니다. 이 정보를 활용하면 드릴다운 분석을 수행하여 집계 데이터에 있는 예외를 찾아낼 수 있습니다.

이 예를 일반화할 때에는 총계의 평균을 구하거나 고유 카운트의 총계를 구하거나 합계의 합계를 구하는 등 집계된 데이터를 다시 한 번 집계하는 시나리오와 유사한 방법을 적용할 수 있습니다.

고객 확보
각 시장에서 오늘까지 확보한 고객 수의 누계는 몇 명인가요? 이 질문은 시장 및 판매량이 새 비즈니스를 창출하는 데 얼마나 기여하고 있는지를 파악하려고 할 때 유용합니다. 이 예의 경우 라인의 기울기가 급하면 급할수록 고객 확보가 활발하게 이루어지고 있다는 것을 의미하며 라인의 기울기가 완만하면 완만할 수록 잠재 고객을 더 활발하게 확보하기 위한 조치가 필요하다는 것을 의미합니다.

이는 매우 단순한 질문이지만 LOD 표현식이 없을 경우 고객이 여러 날짜에 걸쳐 물건을 구매할 수 있으므로 답을 구하기가 어렵습니다. 이 질문에 대한 답을 구하기 위해서는 각 고객이 처음 물건을 구매한 날짜를 구한 다음 반복 구매를 필터링하여 제외해야 합니다.

관련 기간 필터링
운영 보고서에서 실적을 분석할 때 자주 사용되는 기준 중 하나로는 이번 연도와 작년의 연간 누계 판매량과 월간 누계를 비교하는 방법이 있습니다. 이 작업은 오늘 날짜의 관련값을 필터링하면 간단하게 처리할 수 있지만 데이터가 매주 업데이트되는 경우에는 어떻게 해야 할까요? 데이터가 최종으로 업데이트된 날짜는 3월 1일이고 현재 날짜는 3월 7일이라고 가정해 보겠습니다. 이 경우 월간 누계를 비교하면 작년 3월 1~7일의 값과 올해 3월 1일의 값을 비교하게 됩니다. 이 비교 결과는 현실과 큰 괴리를 보일 수 있으며 우리에게 아무런 소용이 없습니다.

하지만 LOD 표현식을 사용하면 중괄호만으로도 문제를 해결할 수 있습니다.

지금까지 연재한 블로그 게시물이 현재 직면한 문제를 더욱 간단하게 해결하는 데 도움이 되었기를 바라며 데이터를 시각적으로 살펴보고 분석하는 새로운 방법을 제시했기를 바랍니다.

다음 주에 연재되는 4번째 게시글과 마지막 게시글에서는 가장 유용한 15개의 LOD 표현식을 살펴보도록 하겠습니다.