Tableau는 고객이 현재 필요로 하는 기능을 고민하는 것만큼이나 앞으로 필요로 하게 될 기능 또한 고민하며 이러한 고민을 바탕으로 더 심도 있는 정보를 제공하도록 고안된 제품을 출시합니다. Ian A. Coe가 작성한 이전 Tableau 9 게시글인 흐름에 맞는 데이터 분석에서 여러분은 Tableau가 어떠한 방식으로 더욱 신속하고 간편하며 어려움 없이 계산식을 작성하고 사용할 수 있도록 지원하는지를 확인하셨을 것입니다. 오늘은 Tableau 계산 언어에 새롭게 추가된 기능인 세부 수준 표현식(LOD 표현식)에 대해 조금 더 자세하게 다루어보도록 하겠습니다. 세부 수준 표현식으로 인한 언어의 변화는 거의 없다고 할 수 있을 정도로 적지만 그 변화가 데이터 분석에 미치는 영향은 매우 획기적이라 할 수 있습니다. Tableau 9의 세부 수준 표현식(LOD 표현식)을 활용하면 비주얼라이제이션을 더 다채롭게 사용할 수 있을 뿐만 아니라 재사용할 수도 있습니다.

이 게시글은 현재 베타 버전으로 제공되는 Tableau 9에 대한 연재글 중 하나입니다. Tableau 9에 대한 다른 게시글도 확인해 보세요.

이번 게시글에서는 개념과 용어를 먼저 확인한 다음 몇 가지 예를 살펴보도록 하겠습니다.

대개 데이터 분석에서 가장 어려운 문제로는 구두로 명확하게 설명할 수 있는 질문에 대해 데이터로 답하는 것을 들 수 있습니다. Tableau는 비주얼라이제이션을 통해 이러한 질문에 답할 수 있도록 도와줍니다. 분석을 수행하기 위해서는 다양한 집계 수준에 걸쳐 데이터를 자주 비교하고 참조해야 합니다. 하지만 분석을 수행하다 보면 비주얼라이제이션이 초점을 맞추고 있는 데이터의 수준과 질문이 참조하고 있는 데이터의 수준이 다른 경우가 종종 발생합니다. 이에 대한 예로는 맵에서 국가 수준의 판매 수익을 시각화하는 도중에 국가 수준의 판매 수익을 전 세계 판매량과 비교하려는 경우를 들 수 있습니다.

Tableau는 기본 비주얼라이제이션 집계 수준을 '세부 수준'으로 지칭합니다. LOD 표현식을 사용하면 비주얼라이제이션의 세부 수준 그 이상의 정보를 살펴볼 수 있습니다. 비주얼라이제이션의 데이터는 대개 특정 데이터 원본의 데이터를 필터링한 결과입니다. LOD 표현식은 필터링되기 전 상태의 데이터를 확인하여 더욱 강력한 분석을 수행할 수 있도록 도와줍니다.

먼저 일반적인 분석 질문을 던져보도록 하겠습니다. 다음 질문은 모든 언어에서 쉽게 표현할 수 있습니다.

  1. 국가별 판매량이 전 세계 판매량에 어떻게 기여하고 있나요? 전 세계 판매량과 각 국가의 상대적 실적을 비교하고 싶습니다.
  2. 특정 주의 실제 순익이 목표치와 비교하여 어느 정도인지는 확인했습니다. 하지만 주별 제품 중 어느 정도의 비율이 목표치를 달성했는지 또는 달성하지 못했는지를 확인하려면 어떻게 해야 하나요?
  3. 고객 계약 기간 연장은 구매량에 어떠한 영향을 미치나요?

위 예에서 각 질문은 분명한 초점 또는 맥락을 가지고 있습니다.

위 예는 서로 다른 세부 수준을 다양한 유형으로 참조하는 방식을 설명하기 위해 선택되었습니다. 첫 번째 질문은 현재 수준보다 높은 세부 수준을 참조하는 반면, 두 번째 질문은 현재 수준보다 낮은 세부 수준을 참조하며, 세 번째 질문은 두 데이터 집합을 동일한 세부 수준에서 비교합니다. 위 세 가지 예는 데이터를 비교하고 대비합니다. 대비를 통해 정보는 더욱 명확해지며 데이터는 의미를 가지게 됩니다.

그렇다면 이제 Tableau 9에서 LOD 표현식을 사용하여 위 질문에 대한 답을 어떻게 구할 수 있는지 확인하도록 하겠습니다.

1. 판매 기여도
위 예에서 우리는 맵을 통해 국가별 판매 수익 기여도를 전 세계 판매 수익과 비교하여 시각화할 수 있습니다. 이때 기여도의 비율에 색상을 지정하면 기여도가 높을수록 색상이 어둡게 표시됩니다. 전 세계 시장을 살펴보면 미국 시장이 18%를 기록하며 전 세계 판매 수익에 크게 기여한 것으로 나타나고 있습니다.

그렇다면 이 예에서 유럽연합과 같이 절대적인 판매 기여도는 작지만 신흥 시장으로 대두되고 있는 시장에 초점을 맞추고 싶다고 가정해 보겠습니다. LOD 표현식을 사용하면 아래와 같이 유럽연합 시장을 필터링하는 것과 동시에 전 세계 판매 기여도를 측정할 수 있습니다.

여기서 주목할 점은 유럽연합 시장을 필터링하면 전 세계 판매 수익이 비주얼라이제이션에 표시되지 않지만 LOD 표현식을 사용하면 이를 참조할 수 있다는 점입니다. 이 예를 참조할 때 LOD 표현식을 방법 필드에 입력하는 방법 등 세세한 사항은 걱정하지 마시기 바랍니다. 구문과 사용법에 대한 자세한 내용은 이후 연재글에서 다룰 예정입니다. 여기서 핵심은 유럽에 초점을 맞춘 상태에서 전 세계 판매량을 참조할 수 있다는 점입니다. 이처럼 LOD 표현식을 사용하면 뷰에서 비유럽 데이터를 필터링하여 제외해도 전 세계 판매량의 합계를 참조할 수 있습니다.

2. 실제와 목표 비교
이 비주얼라이제이션에는 커피 체인점의 실제 순익과 목표 순익 간의 차이가 차트로 표시되어 있습니다. 보시다시피 사용자는 목표를 초과 달성한 주와 달성하지 못한 주를 한눈에 파악할 수 있습니다 그렇다면 이제 주별 순익의 분산을 관리 및 보고하는 본래의 용도와 달리 이 비주얼라이제이션에서 각 주의 제품 순익성을 확인하고 싶다고 가정해 보겠습니다. 물론, 각 주를 선택하여 세부 정보를 확인하는 것도 방법이지만, 이는 매우 기초적인 기능에 불과하므로 조금 더 복잡한 방법을 사용해 보도록 하겠습니다.

다음 차트에서 우리는 간단한 LOD 표현식을 사용하여 주별로 목표 순익을 달성한 제품의 비율을 계산할 수 있습니다.

차트를 살펴보면 매사추세츠가 주별 목표는 달성했지만 실제 목표치를 달성한 제품의 비중은 비교적 적으며 이에 대한 조사가 필요하다는 것을 알 수 있습니다.

이 예에서 우리는 비주얼라이제이션 세부 수준(주)보다 낮은 세부 수준(제품)의 순익 간 차이를 강조 표시하고 있습니다. 다시 말해 LOD 표현식을 사용하여 제품을 주별 분산 계산에 추가한 것입니다.

3. 고객 계약 기간 연장
LOD 표현식은 다른 유형의 계산식과 결합하고 다시 사용할 수 있습니다. 이 예에서는 LOD 표현식을 테이블 계산과 결합하여 매우 중요한 시각화 정보를 제공해 보도록 하겠습니다.

이 예에서 LOD 표현식은 각 고객의 첫 구매 날짜를 계산합니다. 이렇게 하면 같은 연도에 처음 상품을 주문한 고객 집단을 시각화할 수 있습니다. 이 비주얼라이제이션에서는 판매 수익과 총 판매량에서 특정 고객 집단이 차지하는 구성 비율을 고객 집단별로 확인할 수 있습니다. 또한 이 LOD 표현식은 다시 사용할 수도 있습니다. 예를 들어, 사용자는 동일한 표현식을 사용하여 물품을 수령한 달을 기준으로 고객 집단을 정의할 수 있습니다.

지금까지 우리는 LOD 표현식에 대해 간단히 살펴봤습니다. 커뮤니티 최고 기여자(Community Zen Master) 또는 Tableau 팀의 블로그 게시글도 참조해 보세요. 블로그 게시글에서는 LOD 표현식을 기존 및 새로운 Tableau 기능과 결합하여 뛰어난 시각 분석 자료를 만드는 방법을 확인하실 수 있으며 범주화, 비례 선긋기에 필요한 고급 기술뿐만 아니라 더 광범위한 집단의 예를 확인하실 수 있습니다.

Tableau의 기술을 활용하여 데이터 분석의 새로운 장을 개척해 보세요. Tableau 9의 LOD 표현식과 80여 개에 달하는 새로운 기능을 통해 여러분이 어떠한 데이터 분석을 수행할 수 있을지 기대하겠습니다.

새 댓글 추가