Revolutionäre Fortschritte ohne Ende

Im Jahr 2003 wurde Tableau mit der VizQL™-Technologie als Ableger der Stanford University gegründet. Durch die Verwendung dieser Technologie ändert sich der Umgang mit Daten grundlegend, da anspruchsvolle Visualisierungen mithilfe einfacher Drag & Drop-Funktionen erstellt werden können. Die zugrunde liegende Innovation ist eine patentierte Abfragesprache, die Ihre Aktionen in eine Datenbankabfrage übersetzt und das Ergebnis dann grafisch darstellt. Die nächste revolutionäre Entwicklung gelang mit der Tableau-Daten-Engine, mit der Sie für Ad-hoc-Analysen von Millionen von Datenzeilen nur wenige Sekunden benötigen. Die Daten-Engine ist eine Hochleistungs-Analysedatenbank für Ihren PC. Sie verfügt über die Vorteile herkömmlicher Lösungen, die im Arbeitsspeicher ausgeführt werden, jedoch ohne die Einschränkung, dass Ihre Daten vollständig im Arbeitsspeicher vorliegen müssen. Und weil es bei Tableau Tradition ist, dass leistungsfähige Tools für alle Benutzer verfügbar gemacht werden, ist für die Nutzung der Daten-Engine keine Erstellung eines benutzerdefinierten Skripts erforderlich.

VizQL™

Durch und durch visuell – und damit schneller.

Das Herzstück von Tableau ist eine unternehmenseigene Technologie, die die interaktive Datenvisualisierung zu einem wesentlichen Bestandteil beim Verstehen von Daten macht. Bei einem herkömmlichen Analysetool müssen Sie Daten in Zeilen und Spalten analysieren, eine Teilmenge der Daten für die Darstellung auswählen, die Daten in einer Tabelle organisieren und aus dieser Tabelle dann ein Diagramm erstellen. Bei VizQL werden diese Schritte übersprungen, und es wird sofort eine visuelle Darstellung Ihrer Daten erstellt, damit Sie bereits während der Analyse ein grafisches Feedback erhalten. Auf diese Weise können Sie für die Daten ein viel tieferes Verständnis entwickeln und deutlich schneller als mit konventionellen Methoden arbeiten – bis zu
100-mal schneller.
VizQL ermöglicht viele unterschiedliche Arten der Visualisierung

Eine neue Sprache für Daten bedeutet, dass Sie mehr ausdrücken können.

Diese grundlegende neue Architektur bewirkt für Dateninteraktionen in visueller Form, was SQL für Dateninteraktionen in Textform erreicht hat. Mit VizQL-Anweisungen lässt sich eine unbegrenzte Klasse anspruchsvoller mehrdimensionaler Visualisierungen beschreiben. Mithilfe von VizQL verfügen Benutzer über eine zentrale Analyseoberfläche und ein zentrales Datenbankvisualisierungstool zum Erzeugen der unterschiedlichsten grafischen Zusammenfassungen. Die Vielfalt der Visualisierungen, die mit Tableau erstellt werden können, ist beeindruckend – von Balken- und Liniendiagrammen bis zu Karten und anspruchsvoll verknüpften Ansichten. Dank dieser Flexibilität können Sie ein ganz neues Verständnis Ihrer Daten entwickeln. Sie gewinnen Erkenntnisse, die Ihnen entgehen würden, wenn Sie Ihre Daten in starre Diagrammvorlagen zwängen müssten.

Natürliche Denkmuster werden unterstützt.

Das Denken ist ein natürliches Muster aus Fragen und Antworten, wobei nach und nach ein Fortschritt erzielt wird und neue Informationen einbezogen werden. Es ist die Ausnahme, dass Sie zu Beginn einer Analyse bereits genau wissen, wo Sie landen werden. Genau dies ist bei herkömmlichen BI-Tools jedoch erforderlich. Es gibt eine Alternative: Mithilfe von VizQL können Sie Ihre Daten visuell auswerten und die beste Darstellungsart dafür auswählen. Während dieses Prozesses gewinnen Sie neue Erkenntnisse, fügen bei Bedarf weitere Daten hinzu und erlangen schließlich immer tiefere Einblicke. Wir bezeichnen dies als den Zyklus der visuellen Analyse. Wenn Sie diesen Zyklus durchlaufen haben, können Sie für die Daten einen viel besseren Bericht erstellen.

Weltweit existiert kein vergleichbares Produkt.

Mit VizQL sind schnelle Analysen und Visualisierungen Realität geworden. Nur sehr wenig oder auch gar nicht geschulte Benutzer können Daten jetzt schneller als jemals zuvor zeigen und verstehen. Und das ist der entscheidende Faktor.

Daten-Engine

Beschränkungen überwinden

Die Daten-Engine ist eine bahnbrechende Analysedatenbank. Sie wurde entwickelt, um die Beschränkungen bestehender Datenbanken und Datensilos zu überwinden und eine wirkliche Unterstützung für den Prozess der visuellen Analyse zu schaffen. Die Daten-Engine ist für die Funktionen der neuesten Hardware und die komplette Speicherhierarchie vom Datenträger bis zum L1-Cache ausgelegt. Die Tableau-Daten-Engine bewirkt, dass große Datenmengen und schnelle Analysen sich nicht mehr gegenseitig ausschließen.
Die Daten-Engine: Analyse riesiger Datenmengen

Evolution großer Datenmengen

Datenbanken haben sich im Laufe der letzten Jahre stark weiterentwickelt. Bei älteren Datenbanken liegt der Schwerpunkt auf Daten, die auf Datenträgern vorliegen, und auf Vorabberechnungen. Dies ermöglichte zwar mehr Rechenleistung als jemals zuvor, aber der Nachteil war die Langsamkeit. Benutzer mussten vor dem Erstellen der Datenbank wissen, welche Fragen beantwortet werden sollten (Abfrageaufwand). In neueren Datenbanken konnten Leistungsvorteile erzielt werden, indem nur die obersten Ebenen der Speicherhierarchie verwendet wurden und alle Daten im Arbeitsspeicher vorliegen mussten. Dank dieser „In-Memory-Lösungen“ konnte die Berechnungsdauer stark verkürzt werden, aber die Datenmenge war auf die Größe des verfügbaren Arbeitsspeichers beschränkt.

Ziele der Tableau-Daten-Engine

Die Daten-Engine wurde mit folgender Zielsetzung entwickelt:
  1. Umfassende Nutzung modernster Hardwareausrüstung, um auf gängiger Hardware, z. B. Unternehmens-Laptops, auch bei mehreren hundert Millionen Datenzeilen extrem kurze Abfragereaktionszeiten zu erzielen
  2. Unterstützung wirklicher Ad-hoc-Abfragen mithilfe einer vorhersagbaren und einheitlichen Abfrageleistung für alle Abfragen, ohne dass der Abfrageaufwand bekannt sein muss, eine Vorabberechnung von Aggregationen erforderlich ist oder Zusammenfassungen erstellt werden müssen
  3. Nahtlose Integration in vorhandene Datenlager und Infrastrukturen von Unternehmen
  4. Keine Beschränkung aufgrund der Anforderung, dass ein gesamter Datensatz in den Arbeitsspeicher geladen werden muss, um die angestrebte Leistung erzielen zu können
  5. Sehr kurze Ladezeiten und schnelle Verbindungsherstellung zu Datenquellen

Architekturbezogenes Design

Kern der Daten-Engine-Struktur ist eine auf Spalten basierende Darstellung, bei der eine Komprimierung verwendet wird, die die Ausführung von Abfragen ohne Dekomprimierung unterstützt. Es wurden neue Ansätze im Bereich der Computergrafiken genutzt, und die Algorithmen wurden sehr sorgfältig konzipiert. Dies ermöglicht die vollständige Ausnutzung moderner Prozessoren mit einer nahezu optimalen Nutzung der L1- und L2-Caches, minimalen Zwischenergebnissen und revolutionären Verfahren zum Verwalten des Datenstreamings vom Datenträger, um Durchsatzverluste zu vermeiden. So konnte die bekannte Einschränkung umgangen werden, bei der Datensätze vor Beginn der lokalen Analyse vollständig in den Arbeitsspeicher geladen werden müssen.

Von der Daten-Engine zur Liveverbindung – und zurück

Die Daten-Engine wurde so konstruiert, dass sie direkt in die bestehende Tableau-Technologie für „Liveverbindungen“ integriert ist. So können Benutzer mit nur einem Klick zwischen einer direkten Verbindung mit der Unternehmensdatenbank (zur Ausgabe spezieller plattformspezifischer SQL-Abfragen) und der Abfrage eines Extrakts dieser Daten umschalten, bei der die Daten in die Daten-Engine (und zurück) geladen werden und die Berechnungs- und Sortierungssemantik sorgfältig aufeinander abgestimmt ist. Diese Integration ermöglicht Unternehmen das Analysieren von Beispieldaten (GB-Bereich) und die anschließende Umleitung in ein massiv paralleles Lager, z. B. Teradata, für die endgültige Analyse der Daten (oder Berichterstellung) im Petabyte-Bereich.

Echte Ad-hoc-Abfragen

Die Daten-Engine wurde mit einer Abfragesprache und einem Abfrageoptimierer entworfen, um Abfragen zu unterstützen, die für On-the-fly-Geschäftsanalysen typisch sind. Wenn Daten mit der gleichen Geschwindigkeit verarbeitet werden, mit der Sie denken, müssen häufig komplexe Abfragen ausgeführt werden, z. B. sehr große mehrdimensionale Filtervorgänge oder komplexe Ko-Okkurrenzabfragen. Herkömmliche Datenbanken schneiden bei dieser Art von Abfragen im Allgemeinen schlecht ab, während die Verarbeitung mit der Daten-Engine sofort erfolgt.

Flexibles Datenmodell

Einer der wichtigsten Unterschiede zwischen der Daten-Engine und anderen In-Memory-Lösungen ist die Möglichkeit, die Daten direkt in der Datenbank auf der Festplatte zu verarbeiten. Es ist somit bei Verwendung der Daten-Engine keine Datenmodellierung und kein Scripting erforderlich. Eine der leistungsfähigen Funktionen der Daten-Engine ist, dass Sie wie bei jeder anderen relationalen Datenbank auch neue berechnete Spalten definieren können. Sie können sich die Daten-Engine auch als ein Mittel zur Ad-hoc-Datenmodellierung vorstellen, das jederzeit verfügbar ist.

Laden von Instanzen und Verbindungszeit

Die Daten-Engine ist einzigartig, weil die Startzeit nach dem Laden der Daten in die Daten-Engine sehr kurz ist. Es muss nur der Teil der Daten gelesen werden, mit dem die Abfragen in Berührung kommen. Es kann durchaus sein, dass die Datenbank viele Daten enthält, die für die jeweilige Analyse gar nicht relevant sind. Sie werden also niemals unnötig warten müssen, bis die Daten-Engine diese Daten gelesen hat.