팁과 요령: 고유 카운트의 대안

고유 카운트는 병원의 개별 환자 수, 고유한 소매 거래 수 또는 비행단의 항공기 수 등을 분석하는 데 매우 중요합니다. Tableau에서 고유 카운트를 구하는 것은 믿을 수 없이 쉽습니다. 한 번의 클릭으로 고유 카운트에 대한 집계를 변경하는 방법이 있습니다. 그러나 이것은 많은 주의를 기울여야 하는 계산 중 하나이며 특히 데이터 규모가 클 경우 매우 느릴 수 있습니다. 여기에서 고유 카운트와 동일한 답을 얻기 위한 몇 가지 대안을 소개하려 합니다.

고유 카운트는 병원의 개별 환자 수, 고유한 소매 거래 수 또는 비행단의 항공기 수 등을 분석하는 데 매우 중요합니다. Tableau에서 고유 카운트를 구하는 것은 믿을 수 없이 쉽습니다. 한 번의 클릭으로 고유 카운트에 대한 집계를 변경하는 방법이 있습니다. 그러나 이것은 많은 주의를 기울여야 하는 계산 중 하나이며 특히 데이터 규모가 클 경우 매우 느릴 수 있습니다. 여기에서 고유 카운트와 동일한 답을 얻기 위한 몇 가지 대안을 소개하려 합니다.

우선 고유 카운트의 작동 방식을 간단히 설명하겠습니다. 데이터 집합에 몇 개의 고유한 항목이 있는지 확인하려면 모든 단일 레코드를 다른 모든 레코드와 비교해야 합니다. 데이터 집합이 매우 방대할 경우 이는 고된 작업일 수 있으며, 특히 텍스트 필드와 문자열을 비교할 때 더욱 힘들 수 있습니다.

다음은 고유 카운트를 얻기 위한 8가지 다른 방법입니다. 각 방법에는 단점도 있지만, 적절한 상황에서는 더 빠른 방법이 될 수 있습니다. 이 모든 팁을 더 잘 설명하기 위해 고유 카운트를 얻고자 하는 차원에 '차원 X'라는 이름을 지정하겠습니다. 8가지 모든 옵션의 예제를 제공하는 통합 문서도 끝부분에 마련되어 있습니다.

  1. 시각적 커닝페이퍼: '차원 X'를 '세부 정보'에 놓고, '레코드 수' 필드를 '행'에 놓은 다음 '최소값'(또는 최대, 평균, 중앙값)으로 변경합니다. 이렇게 하면 여러 개의 작은 막대(차원 X의 각 인스턴스에 대해 하나씩)가 만들어지는데 이를 쌓아 올리면, 그 총계가 차원 X의 고유 카운트와 동일합니다.

  2. 추출 및 집계: 차원 X의 인스턴스에 따라 데이터를 추출하여 집계합니다. 이제 고유 카운트 대신 개수를 세기만 하면 되므로 계산이 훨씬 쉬워집니다.

  3. SIZE() 사용: 이것은 첫 번째 방법과 비슷하지만, 시각적으로 더 나으며 다른 분석에도 더 유연하게 사용할 수 있습니다. 테이블 계산 'SIZE()'는 하나의 파티션에 있는 행의 수를 셉니다. 계산된 필드에 SIZE()'를 입력하고 워크시트에 끌어 놓으면 차원 X(차원 X를 '세부 정보'로 끌어야 함)를 따라 계산됩니다.

  4. 고유한 목록으로 필터링: 이것은 차원 X의 모든 인스턴스를 하나만 제외하고 필터링할 수 있다고 가정하는 단순한 방법입니다. 이상적으로 이것은 또한 차원 X가 같은 횟수로 나타나는 것을 의미합니다. 예를 들어, 설문조사에서 모든 응답자는 동일한 개수의 답변을 제공해야 합니다. 응답자에 대해 고유 카운트를 수행하는 대신, 먼저 하나의 질문으로 필터링한 다음 단순히 카운트하면 됩니다.

  5. 고유한 목록 혼합: 모든 인스턴스가 간단하게 한 행이 되도록 차원 X에 대한 새 데이터 연결을 만듭니다. 그런 다음, 이 데이터를 첫 번째 데이터 원본과 혼합하고 두 번째 데이터 원본의 '레코드 수' 필드를 사용합니다. 이 작업을 수행하려면 Tableau Desktop 8.0이 필요합니다.

  6. 수학적 계산 작성: 말 그대로, 차원 X가 나타나는 횟수만큼 차원 X를 조정할 계산을 작성합니다. 예제는 샘플 통합 문서를 참조하십시오.

  7. 데이터 모델 수정: 이 방법은 네 번째 방법이 가능하도록 데이터 자체를 변경해야 합니다. 차원 X의 첫 번째 인스턴스에 열 또는 플래그나 표시기 같은 것을 추가합니다. 데이터를 Tableau에 다시 연결한 다음, 고유 카운트를 수행하고 싶으면, 추가해 놓은 표시기로 필터링하고 단순히 카운트하면 됩니다.

  8. 사용자 지정 SQL: 이것은 가장 덜 유연한 옵션으로서 SQL 작성 방법을 알아야 하며, 상황에 따라 매우 복잡해질 수 있습니다. 이 옵션을 사용할 가치가 있는지 보려면 먼저 Tableau의 COUNTD 함수를 사용해 보십시오.

샘플 통합 문서에는 8개 옵션 모두에 대한 작동 사례가 포함되어 있습니다(Marc Rueter 제공).