Vorschau auf Tableau 9.0: Mit der automatischen Datenaufbereitung konzentrieren Sie sich auf das, was für Sie zählt

Analysen setzen nicht unbedingt perfekt aufbereitete Daten voraus. Tableau 9.0, derzeit in der Beta-Version, automatisiert die Bereinigung unstrukturierter Daten, insbesondere in Excel-Tabellen. Dafür sorgen neue Funktionen: etwa der Tableau Data Interpreter, der automatisch die Struktur einer Excel-Datei erkennt, neue Tools zum Pivotieren und Aufteilen von Daten sowie ein neues Layout für den schnellen Zugriff auf Metadaten. In Kombination mit der automatischen Datenmodellierung, die in der Version 8.2 eingeführt wurde, können Sie mit diesen beiden Funktionen Ihre Daten rasch für die Analyse bereitstellen.

Der allererste Schritt bei der Nutzung von Tableau – bevor Sie Fragen schnell beantworten oder auf die leistungsstarke Analysefunktion zugreifen, bevor Sie Ihre umfangreichen Erkenntnisse im Web oder an mobile Benutzer weitergeben können – ist die Verbindung mit Ihren Daten.

Fest steht: Analysen setzen nicht unbedingt perfekt aufbereitete Daten voraus. Viele Anwender nutzen regelmäßig spezielle Tools und Skripte, um Daten für Tableau bereitzustellen, oder wenden viel Zeit für das Schreiben komplexer Berechnungen auf, um Datenprobleme zu beheben.

Tableau 9.0 automatisiert viele dieser mühsamen Schritte zur Bereinigung unstrukturierter Daten, insbesondere in Excel-Tabellen. Zu den Verbesserungen gehören neue Funktionen wie etwa der Tableau Data Interpreter, der automatisch die Struktur einer Excel-Datei erkennt, neue Tools zum Pivotieren und Aufteilen von Daten sowie ein neues Layout für den schnellen Zugriff auf Metadaten. In Kombination mit der automatischen Datenmodellierung, die in der Version 8.2 eingeführt wurde, können Sie mit diesen beiden Funktionen Ihre Daten rasch für die Analyse bereitstellen.

Tableau hat sich für die Datenvorbereitung das Ziel gesetzt, dass jeder Anwender seine Datenverbindung jederzeit grundlegend ändern kann. Die Grundlage hierfür bieten vier wesentliche Eigenschaften für Ihre Datennutzung:

  • intelligent – Funktionen werden automatisch angewendet und ermöglichen einen tiefen Einblick in die Daten
  • schnell – nahezu Echtzeit-Funktionalität, sogar bei Big Data
  • wiederholbar – Änderungen zugrunde liegender Daten sind möglich, wie etwa neue Werte, Zeilen oder Spalten
  • flexibel – es können jederzeit wichtige Änderungen vorgenommen werden und gleichzeitig wird alles gespeichert

In Tableau 9.0 werden zahlreiche neue Funktionen vorgestellt, die dies ermöglichen. Hier ein kurzer Überblick:

Tableau Data Interpreter
Sehen Ihre Excel-Dateien so oder ähnlich aus?

Tableau erkennt automatisch die Anordnung (Datenwerte starten in Zelle B8) und die Struktur der Daten (z. B. sind zusammengesetzte Überschriften vorhanden, die quer über das Blatt laufen), um sie für die Analyse vorzubereiten.

Pivotieren
In vielen Text- und Excel-Dateien enthalten Spaltennamen nützliche Datenwerte. Diese Daten verwenden beispielsweise Jahre und Monate als Feldname.

Ein optimales Analyseergebnis ist möglich, wenn diese Daten in einer Spalte „Datum“ und einer weiteren mit dem Datenwert erscheinen, anstatt Dutzende von Spalten mit Datumsangaben zu haben. Mit anderen Worten: ein Teil des Datensatzes sollte pivotiert werden. Wählen Sie einfach die entsprechenden Spalten und klicken Sie auf „Pivot“, wie hier gezeigt:

Aufteilen
Es gibt viele Spalten mit zusammengesetzten Informationen, beispielsweise Telefonnummern (Vorwahl), E-Mail-Adressen, URLs und viele weitere Varianten, die nur in Ihren Daten vorkommen. Der Befehl „Aufteilen“ weist Tableau an, die Daten automatisch zu durchsuchen, mehrfache Trennzeichen zu erkennen und neue Spalten zu erstellen. Hier ist eine Spalte mit kombinierter Postleitzahl und Ort. Ein Datenwert sieht so aus: 90001 (33,973271508000494, -118,24896959899968). Stellen Sie sich einmal die aufwändige Berechnung vor, die für die Analyse dieser drei Werte erforderlich ist.

Die Nutzung regulärer Ausdrücke ist eine Verbesserung, die nun auch in Tableau verfügbar ist. Für viele Benutzer ist das Schreiben regulärer Ausdrücke trotzdem kein durchführbarer Ansatz. Ganz bequem wählen Sie per rechtem Mausklick „Aufteilen“ und erhalten:

Ganz ohne Aufforderungen, Auswahloptionen erhalten Sie drei sauber getrennte Spalten. Wenn die automatische Aufteilungsfunktion im Feld keine Struktur ermitteln kann, werden Sie aufgefordert, ein Trennzeichen einzugeben (in der Regel ein Komma, ein Leerzeichen oder ein anderes Zeichen). Danach können Sie die so erstellten Berechnungen mit der einfachen Aufteilungsfunktion jederzeit weiter bearbeiten. Damit stehen drei neue Möglichkeiten zur Verfügung, um eine Spalte in die gewünschten Bestandteile aufzugliedern.

Metadaten-Raster
Bei der Datenvorbereitung für Analysen ist eine Liste mit Feldern mitunter praktischer als eine Datenvorschau. Wir haben daher eine „Metadaten“-Vorschau für Ihre Verbindung hinzugefügt.

Auf einen Blick erhalten Sie mehr Informationen über Ihre Felder, können Felder umbenennen und Bulk-Vorgänge für ausgewählte Felder ausführen. Soll eine Gruppe von Feldern ausgeblendet werden? Ganz einfach. Markieren Sie sie und wählen Sie „Ausblenden“.

Das Beste an diesen Funktionen ist, dass sie nicht in einer bestimmten Reihenfolge angewendet werden müssen. Sie können in jedem Stadium Ihrer Analyse auf die neue Registerkarte „Daten“ klicken und Änderungen an Ihrer Verbindung vornehmen. Fügen Sie Tabellen hinzu, ändern Sie Verknüpfungen, nutzen Sie eine der neuen Funktionen ... und gehen Sie dann wieder zu Ihrer Analyse zurück, um die Auswirkungen Ihrer Änderungen sofort zu betrachten. So konzentrieren Sie sich allein auf das, was für Sie in der Analyse zählt - und das ist ganz und gar neuartig.

Natürlich ist die ganze Datenvorbereitung nur die Pflicht vor der echten Kür, die einfach Spaß macht: ansprechende und nützliche Analysen zu erstellen. Möglicherweise bleiben Sie mit Ihrem Wissen darüber, welchen Aufwand die Bereinigung Ihrer Daten erfordert hat, allein. Aber alle, die das Endprodukt Ihrer Visualisierungen nutzen, werden vom Ergebnis beeindruckt sein.