Arbeiten Sie mit einer Vielzahl von Daten inklusive XML


Eine wichtige Anwendungsmöglichkeit von Hadoop und Hive ist die Arbeit mit einer Vielzahl von Daten wie etwa XML-Dateien. Dies bedeutet oft, dass Sie verschachtelte Daten entpacken, Datenumwandlungen ausführen und URLs verarbeiten müssen. Tableau unterstützt eine Reihe von neuen Funktionen für Zeichenketten beim Arbeiten mit Hive und Hadoop inklusive URL-Verarbeitung, regulären Ausdrücken und hexadezimalen/binären numerischen Operatoren.

Hier verwenden wir die XPATH-Funktion, um ein Feld für die Stadt zu erstellen, damit wir diese Daten auf eher herkömmliche, relationale Weise darstellen können. XML-Funktionen werden im Berechnungsfenster von Tableau beim Arbeiten mit Hive-/Hadoop-Daten eingeblendet, sodass beim Arbeiten mit XML-Objekten keine spezielle Programmierung erforderlich ist.