Dicas e truques: alternativas à contagem distinta

Contagens distintas são essenciais para a análise, seja para contar os pacientes de um hospital, as transações de uma loja ou os aviões de uma frota. Fazer contagens distintas no Tableau é extremamente fácil, bastando um clique para alterar as agregações para a contagem distinta. No entanto, esse cálculo é um dos mais pesados e pode ser bastante lento, principalmente quando o volume de dados é muito grande. Gostaria de compartilhar algumas formas alternativas de chegar à mesma resposta que seria obtida com uma contagem distinta.

Contagens distintas são essenciais para a análise, seja para contar os pacientes de um hospital, as transações de uma loja ou os aviões de uma frota. Fazer contagens distintas no Tableau é extremamente fácil, bastando um clique para alterar as agregações para a contagem distinta. No entanto, esse cálculo é um dos mais pesados e pode ser bastante lento, principalmente quando o volume de dados é muito grande. Gostaria de compartilhar algumas formas alternativas de chegar à mesma resposta que seria obtida com uma contagem distinta.

Para começar, segue uma breve explicação de como a contagem distinta funciona. Para descobrir quantos itens exclusivos existem em um conjunto de dados, é necessário comparar cada registro um com o outro. Com números, esse processo pode ser complicado caso o conjunto de dados seja consideravelmente grande, mas fica ainda pior quando é necessário comparar campos de texto e cadeias de caracteres.

Veja a seguir oito maneiras alternativas de chegar a uma contagem distinta. Todas elas têm alguma desvantagem, mas, nas circunstâncias certas, podem oferecer uma forma mais rápida de fazer esse cálculo. Para todas as dicas, chamarei de “Dimensão X” a dimensão da qual desejamos fazer a contagem distinta. No final deste artigo, você também encontrará uma pasta de trabalho com exemplos de todas as oito opções.

  1. Um atalho visual: solte a Dimensão X em Detalhe e, em seguida, coloque o campo Número de registros em Linhas e altere-o para Mínimo (ou MÁX., MÉD. ou Mediana). Isso criará uma série de barras pequenas (uma para cada instância da Dimensão X) de tal forma que, quando elas forem agrupadas, o total será idêntico a uma contagem distinta da Dimensão X.

  2. Extraia e agregue: crie uma extração dos seus dados e agregue-a com base nas ocorrências da Dimensão X. Agora, em vez de uma contagem distinta, basta fazer uma contagem normal, que é muito mais fácil de calcular.

  3. Use SIZE(): este método é semelhante ao primeiro, mas apresenta um visual melhor e é mais flexível com outras análises. O cálculo de tabela “SIZE()” conta o número de linhas em uma partição. Basta digitar “SIZE()” em um campo calculado e soltá-lo na sua planilha para que ele seja calculado com a Dimensão X (não se esqueça de arrastar a Dimensão X para Detalhe).

  4. Filtre uma lista de valores exclusivos: este é um método simples, pressupondo que você possa filtrar todas as instâncias da Dimensão X, exceto uma. Idealmente, a Dimensão X também deve aparecer o mesmo número de vezes. Por exemplo, em uma pesquisa, todos os participantes devem responder ao mesmo número de perguntas. Em vez de fazer uma contagem distinta dos participantes, você pode primeiro filtrar uma pergunta e depois fazer uma contagem simples.

  5. Mescle uma lista de valores exclusivos: estabeleça uma nova conexão de dados com a Dimensão X para que todas as instâncias sejam apenas uma linha. Em seguida, mescle esses dados com sua primeira fonte de dados e use o campo Número de registros da segunda fonte de dados. Esse processo só é possível a partir do Tableau Desktop 8.0.

  6. Crie cálculos matemáticos: é simples, basta criar um cálculo que ajuste a Dimensão X com base no número de vezes que ela aparece. Consulte a pasta de trabalho de exemplo para ver como.

  7. Modifique o modelo de dados: para isso, é necessário fazer uma alteração nos dados em si para que seja possível implementar o método 4. Adicione uma coluna ou algum tipo de sinalizador ou indicador à primeira ocorrência da Dimensão X. Depois que você conectar os dados ao Tableau e quiser fazer uma contagem distinta, bastará filtrar os dados pelo indicador adicionado e fazer uma contagem simples.

  8. SQL personalizado: esta é a opção menos flexível e é necessário saber escrever SQL, o que pode ser bastante complexo dependendo da situação. Tente usar a função COUNTD do Tableau primeiro para ver se vale a pena o esforço.

Esta pasta de trabalho de amostra traz um exemplo funcional de cada uma das oito opções (cortesia de Marc Rueter).