5 integrierte Statistikfunktionen in Tableau, die Sie dort vielleicht nicht vermutet haben

5 integrierte Statistikfunktionen in Tableau, die Sie dort vielleicht nicht vermutet haben

Tableau bringt neue Versionen jetzt noch schneller heraus. Das bedeutet für Sie, dass Sie neue, attraktive Funktionen jetzt noch schneller an die Hand gegeben bekommen. Aber es bedeutet auch, dass einige ältere, einfachere Funktionen möglicherweise im Innovationshype untergehen. Statistikfunktionen sind stärker gefragt als je zuvor, aber Tableau ist im Allgemeinen eher für seine Benutzerfreundlichkeit bekannt als für seine analytische Strenge. Während einem beim Gedanken an Statistiktools Bilder von komplexen Gleichungen und Berechnungen in den Sinn kommen, leistet Tableau viele dieser Berechnungen durch einfaches Drag & Drop.

In diesem Beitrag werden einige einfache, aber leistungsstarke Funktionen für statistische Analysen erörtert. Außerdem erhalten Sie weitere Ressourcen, damit Sie mit den geeigneten Analysen ein Maximum aus Ihren Daten herausholen.

Histogramme: Mehr als nur ein Balkendiagramm

Histogramme sind ein leistungsstarkes Werkzeug, um sinnvolle Erkenntnisse aus großen Datensätzen zu beziehen. Sie zeigen die Häufigkeit von Daten, aufgeschlüsselt in gleich große Partitionen. Durch die grafische Darstellung dieser Daten können Sie feststellen, ob die Daten eine Normalverteilung oder eine Schieflage in eine Richtung aufweisen.

In Tableau können Sie Histogramme mit nur zwei Klicks erstellen. Vielen Benutzern ist nicht bekannt, dass Partitionen, Parameter, Berechnungen und Gruppen mühelos mit einem Rechtsklick auf eine Kennzahl und den Menübefehl Erstellen erstellt werden können. Tableau schlägt Ihnen sogar eine Partitionsgröße vor!

Ein klassisches Beispiel für ein Histogramm ist die Verteilung der Punktzahlen der SAT-Tests für die Studienzulassung. Die Punktzahlen werden in Partitionen à 50 oder 100 Punkte unterteilt, und die Balken stellen die Anzahl der Studienplatzbewerber dar, die eine Punktzahl in der jeweiligen Partition erzielt haben. Den Studienplatzbewerbern wird so aufgezeigt, dass ein Ergebnis von 1600 Punkten selten ist. Die meisten Bewerber liegen mit ihrer Punktzahl im mittleren Bereich.

Residuen: Wie genau ist die Trendlinie eigentlich wirklich?

Ein Residuum (auch als Fehler bezeichnet), ist die Differenz zwischen dem beobachteten, tatsächlichen Wert und dem prognostizierten Wert. Ein Residuenplot ist eine visuelle Möglichkeit, um die Genauigkeit eines Regressionsmodells zu untersuchen. Natürlich können Sie auch die Werte für R-Quadrat und p in Tableau untersuchen.

Unter Windows können Sie in Tableau Residuen aus Ansichten mit einer Trendlinie exportieren. Navigieren Sie im Arbeitsblatt-Menü zu Exportieren -> Daten, wählen Sie Ihre Datendatei aus, und die Residuen werden als Access-Datei gespeichert. Sie können sich direkt mit dieser neuen Datenquelle verbinden. Diese hat die Dimension, die auf der x-Achse dargestellt war (in diesem Beispiel „Order Date“, d. h. Auftragsdatum), und Kennzahlen für die Vorhersagen und Residuen. Ziehen Sie Residuen auf „Zeilen“ und „Vorhersagen“ auf „Spalten“, und ziehen Sie dann Ihre Dimension auf „Details“. Je weiter die Punkte auf dem Streudiagramm gestreut sind, desto genauer ist das Modell.

Standardabweichung: Wie verstreut sind meine Daten?

Der Standardabweichung sind Sie vermutlich schon in Ihrer Schulzeit begegnet – und haben seitdem vielleicht nicht mehr viel an sie gedacht. Die Standardabweichung ist einfach eine Kennzahl, die angibt, wie verstreut die Daten im Verhältnis zum Mittelwert sind. Tatsächlich gibt es zwei Methoden zur Berechnung des Werts: anhand der Population oder anhand einer Stichprobe. Das ist genau das, wonach es sich anhört: Wenn Sie einen vollständigen Datensatz haben, verwenden Sie die Populationsgleichung. Handelt es sich um eine Stichprobe aus einem größeren Datensatz, müssen Sie die Stichprobengleichung verwenden.

Für die Ermittlung der Standardabweichung in Tableau brauchen Sie nur die Aggregation einer Kennzahl zu ändern. Die Standardabweichung für die Population und für eine Stichprobe sind beide integrierte Aggregationsoptionen. In dem nachfolgenden Beispiel stellt die Standardabweichung den Mittelwert in seinen Kontext: Kopierer haben einen hohen mittleren Umsatzwert, aber auch eine hohe Standardabweichung. In dem Diagramm unten können wir sehen, dass der Verkauf eines sehr teuren Artikels den Mittelwert nach oben zieht.

Schnelle Tabellenberechnungen: Gleitender Mittelwert und Perzentil

Tabellenberechnungen sind eine sehr beliebte Funktion in Tableau, aber einige Berechnungen erhalten weniger Beachtung. Hierzu gehören insbesondere gleitender Mittelwert und Perzentil.

Mit dem gleitenden Mittelwert können Sie einige unwesentlichen Daten herausfiltern und einen Trend visualisieren. Die Berechnung des gleitenden Mittelwertes ist in Tableau anpassbar. Sie können jetzt auswählen, wie viele Perioden berechnet, wie viele Dimensionen verwendet werden sollen, und Sie können sogar eine weitere Tabellenberechnung zum gleitenden Mittelwert hinzufügen, zum Beispiel eine Differenz in Prozent zu einem anderen Wert.

Beim Gedanken an Perzentil kommt Ihnen jetzt vielleicht das Bild von Ihrem Kinderarzt in den Sinn, der Ihnen sagt, mit Ihrer Körpergröße gehören Sie in Ihrer Altersgruppe zum 90. Perzentil. Aber dieser Wert kann hilfreich sein, um Datenpunkte (oder Aggregationen) mit der größeren Verteilung zu vergleichen. Anstatt bloß auf Zahlen zu starren (z. B. Umsatzzahlen), gibt die Perzentilberechnung an, an welcher Stelle sich Datenpunkte in der Verteilung befinden.

Nicht ganz so schnelle Tabellenberechnungen: Fenster- und Referenzberechnung

Funktionen wie LOOKUP(), PREVIOUS_VALUE() und FIRST() können auf den ersten Blick einschüchternd wirken. Wahrscheinlich haben Sie sie in einer Berechnung gesehen, die Sie aus einem Blog-Beitrag zu Tableau kopiert haben, oder als Sie eine schnelle Tabellenberechnung durchgeführt haben. LOOKUP() ist die Grundlage vieler Berechnungen, zum Beispiel von Differenz in Prozent.

Mit der Funktion können Sie einen anderen Wert in der Partition referenzieren, und zwar durch die Angabe des Versatzes (oder Sie können ihn mit einem Parameter dynamisch machen). Mit der schnellen Tabellenberechnung können zwar äußerst einfache Berechnungen der Veränderung in Prozent durchgeführt werden, aber mit LOOKUP() lässt sich besonders gut nachvollziehen, wie die zugrunde liegenden Funktionen aufgebaut sind. Anschließend können Sie diese in komplexere Berechnungen einbeziehen, zum Beispiel als logische Behauptungen und Datenberechnungen.

Fensterberechnungen eignen sich besonders gut für die Summierung von Daten in einer Ansicht. Bei dieser Art der Berechnungen können Sie eine Aggregation zu einer Kennzahl hinzufügen, die bereits aggregiert ist. Beispielsweise gibt WINDOW_AFG(SUM([Sales])) den Mittelwert von jeder Umsatzsumme in der Ansicht zurück, also denselben Wert, den auch eine hinzugefügte Mittelwertlinie zurückgeben würde. Fensterberechnungen sind besonders dann geeignet, wenn Sie einen Wert referenzieren müssen, der den größeren Datensatz zusammenfasst. In dem Beispiel unten wird der Z-Wert mit WINDOW_AVG und WINDOW_STDEV berechnet. Der Ausdruck berechnet, wie viele Standardabweichungen (der Daten im Fenster) eine Beobachtung vom Mittelwert entfernt liegt.

Bonus: R- und Python-Integration

Sie möchten mit Ihrer statistischen Analyse noch einen Schritt weiter gehen? Verbinden Sie sich mit einem R-Server oder installieren Sie TabPy, damit Sie Skripte in R oder Python in berechneten Feldern schreiben können. Weitere Informationen zu diesen Funktionen finden Sie in unserem Whitepaper zum Thema Advanced Analytics with Tableau (Fortgeschrittene Analytik mit Tableau).

Sie sind bereit für noch ausgeklügelteren Analysen?

Wir sind der Überzeugung, dass wir umfangreiche Funktionen für Benutzer aller technischen Kenntnisstufen bereitstellen müssen, damit jeder Daten sehen und verstehen kann. Von einfachen, aufrufbaren Kennzahlen bis hin zu erweiterten Analysemethoden bietet Tableau ein flexibles Front-End für die Daten mit der nötigen analytischen Tiefe für Datenwissenschaftler. Durch die Nutzung ausgeklügelter Berechnungen, die Integration von R und Python, die schnelle Kohortenanalyse und Prognosefunktionen können Datenwissenschaftler komplexe quantitative Analysen in Tableau erstellen und die visuellen Ergebnisse teilen, um ein besseres Verständnis von Daten und eine bessere Zusammenarbeit mit Daten zu fördern.

Nehmen Sie an der Unterhaltung mit #HardcoreAnalytics teil und lesen Sie die folgenden Ressourcen, um Ihre Kenntnisse noch weiter zu vertiefen: