Tips en trucs: Alternatieven voor een afzonderlijke telling

Unieke aantallen zijn cruciaal voor analyse, of het nu gaat om het tellen van individuele patiënten in een ziekenhuis, het aantal unieke retailtransacties of het aantal vliegtuigen in een vloot. Het maken van unieke aantallen in Tableau is bijzonder gemakkelijk: met één klik kun je samenvoegingen omzetten in afzonderlijke tellingen. Het is echter ook een van de intensievere berekeningen die veel tijd kan vergen, vooral bij enorme hoeveelheden data. Ik wil graag een paar alternatieve manieren bespreken die hetzelfde resultaat opleveren als een afzonderlijke telling.

Unieke aantallen zijn cruciaal voor analyse, of het nu gaat om het tellen van individuele patiënten in een ziekenhuis, het aantal unieke retailtransacties of het aantal vliegtuigen in een vloot. Het maken van unieke aantallen in Tableau is bijzonder gemakkelijk: met één klik kun je samenvoegingen omzetten in afzonderlijke tellingen. Het is echter ook een van de intensievere berekeningen die veel tijd kan vergen, vooral bij enorme hoeveelheden data. Ik wil graag een paar alternatieve manieren bespreken die hetzelfde resultaat opleveren als een afzonderlijke telling.

Maar eerste even iets over wat een afzonderlijke telling is. Als je wilt bepalen hoeveel unieke items een dataset bevat, moet elke record worden vergeleken met elke andere record. Dit kan al lastig zijn bij grote datasets van getallen, maar het is nog lastiger als je tekstvelden en tekenreeksen vergelijkt.

Hier zijn acht andere methoden om een afzonderlijke telling uit te voeren. Elke methode heeft ook een keerzijde, maar in de juiste situatie zijn ze wel sneller. De dimensie waarvan je afzonderlijke tellingen wilt berekenen, zal ik hier voor het gemak de 'X-dimensie' noemen. Aan het einde vind je ook een werkmap met een voorbeeld van alle acht opties.

  1. Visuele cheatsheet: Plaats de X-dimensie op Detail en zet het veld Aantal records op Rijen en wijzig het in Minimum (of MAX, AVG of Median). Hierdoor genereer je een aantal kleine staafjes (één voor elk exemplaar van de X-dimensie), die bij elkaar opgeteld identiek zijn aan een afzonderlijke telling van de X-dimensie.

  2. Extraheren en aggregeren: Maak een extract van je data en aggregeer ze op basis van het aantal exemplaren van de X-dimensie. Je kunt ze dan gewoon tellen, in plaats van een afzonderlijke telling uit te voeren. Dit is ook veel gemakkelijker om te berekenen.

  3. Berekenen met FORMAAT(): Dit is vergelijkbaar met de eerste methode, maar geeft een betere visualisatie en is flexibeler te gebruiken met andere analyses. Met de tabelberekening FORMAAT() wordt het aantal rijen in een partitie geteld. Typ gewoon FORMAAT() in een berekend veld en zet dit neer op je werkblad. Laat dit dan berekenen langs de X-dimensie (vergeet niet om de X-dimensie naar Detail te slepen).

  4. Filteren naar een unieke lijst: Dit is een eenvoudige methode die ervan uitgaat dat je elke instantie van de X-dimensie kunt filteren, behalve één. Idealiter wordt de X-dimensie dan hetzelfde aantal keren weergegeven. In een enquête moet elke respondent bijvoorbeeld hetzelfde aantal antwoorden geven. In plaats van een afzonderlijke telling uit te voeren voor de respondenten, kun je eerst filteren op één vraag en dan een eenvoudige telling uitvoeren.

  5. Een unieke lijst blenden: Maak een nieuwe dataverbinding met de X-dimensie, zodat elke instantie één rij is. Blend die data vervolgens met je eerste databron en gebruik het veld Aantal records van de tweede databron. Hiervoor heb je Tableau Desktop 8.0 nodig.

  6. Wiskundige berekeningen schrijven: Zoals de titel al zegt: schrijf een berekening waarbij de X-dimensie wordt aangepast aan het aantal keren dat de dimensie wordt weergegeven. Zie de voorbeeldwerkmap voor meer details.

  7. Het datamodel wijzigen: Hiervoor moet je de data zelf wijzigen, zodat je methode 4 kunt toepassen. Voeg een kolom of een soort vlag of indicator toe aan het eerste exemplaar van de X-dimensie. Zodra je de data terugkoppelt naar Tableau en een afzonderlijke telling wilt uitvoeren, filter je op de toegevoegde indicator en voer je een gewone telling uit.

  8. Aangepaste SQL: Dit is de minst flexibele optie en je moet weten hoe je SQL schrijft. Afhankelijk van de situatie kan dit nogal complex worden. Probeer eerst de functie COUNTD van Tableau te gebruiken om te zien of dit de moeite waard is.

Hier is een voorbeeldwerkmap dat een praktisch voorbeeld geeft van alle acht opties (met dank aan Marc Rueter).