Révolution après révolution

En 2003, la technologie VizQL™, qui révolutionne complètement la manière de travailler avec les données en permettant l’utilisation de simples fonctions de glisser-déposer pour créer des visualisations avancées, a permis à Tableau de naître des recherches menées par l’Université de Stanford. L’innovation fondamentale repose sur un langage de requête breveté qui traduit vos actions en une requête de base de données, puis exprime la réponse sous forme graphique. Une autre innovation importante réside dans la possibilité d’effectuer des analyses spécifiques de millions de lignes de données en quelques secondes grâce au moteur de données Tableau. Le moteur de données est une base de données d’analyse haute performance hébergée sur le PC. Il présente les mêmes avantages que les solutions en mémoire traditionnelles en termes de vitesse sans toutefois être limité par les capacités de mémoire. De plus, comme Tableau crée des outils puissants accessibles à tous, iaucun script personnalisé n'est nécessaire pour utiliser le moteur de données.

VizQL™

Nativement visuel, et donc plus rapide

Au cœur de Tableau se trouve une technologie propriétaire qui intègre parfaitement la visualisation des données interactives au processus de compréhension des données. Un outil d’analyse traditionnel vous oblige à analyser les données en lignes et en colonnes, à choisir les sous-ensembles de données à présenter, à organiser ces données dans une table, puis à créer un graphe à partir de cette table. VizQL supprime ces étapes et crée directement une représentation visuelle de vos données, vous offrant alors un retour visuel tandis que vous réalisez votre analyse. Vous acquérez ainsi une compréhension bien plus approfondie de vos données et êtes à même de travailler beaucoup plus rapidement (jusqu’à cent fois plus vite) qu’avec les méthodes conventionnelles.
VizQL génère de nombreuses visualisations

Un nouveau langage vous permet d'en dire plus encore

Cette architecture fondamentalement nouvelle représente pour les interactions de données sous forme visuelle ce que SQL a représenté pour les interactions de données sous forme textuelle. Les instructions VizQL décrivent une gamme infinie de visualisations multidimensionnelles avancées. Grâce à VizQL, les utilisateurs disposent d’une interface d’analyse unique et d’un outil de visualisation de base de données permettant de produire un grand nombre de résumés graphiques. Tableau peut créer un nombre remarquable de visualisations sous différentes formes (graphes à barres, courbes, cartes et vues liées avancées). Cette souplesse vous permet de comprendre les données d’une toute nouvelle manière. Elle vous permet d’obtenir des informations qui seraient perdues si vous deviez essayer de faire rentrer vos données dans des modèles de graphes rigides.

Prise en charge des modèles de pensée naturels

La pensée est un modèle naturel selon lequel on se pose des questions et on y apporte des réponses, en progressant étape par étape et en prenant en compte de nouvelles informations. Il est rare de savoir exactement où l’on va lorsque l’on commence une analyse. C’est pourtant ce que les outils traditionnels d’informatique décisionnelle exigent. Il existe cependant une alternative : VizQL vous permet de parcourir visuellement vos données et d’en trouver la meilleure représentation possible. Vous apprenez au fur et à mesure, ajoutez plus de données si nécessaire et obtenez finalement un aperçu bien plus précis. C’est ce que nous appelons le cycle d’analyse visuelle. Une fois que vous avez réalisé ce cycle, vous obtenez une bien meilleure vue d’ensemble de vos données.

Un modèle unique au monde

Grâce à VizQL, la visualisation et les analyses rapides sont devenues réalité. Les utilisateurs avec peu ou pas d'expérience peuvent visualiser et comprendre les données plus rapidement que jamais et d’une manière impensable jusqu'alors. C’est ce qui distingue principalement VizQL.

Le moteur de données

Conçu pour dépasser les limites

Le moteur de données est une base de données d’analyse révolutionnaire conçue pour aller au-delà des limites des bases et des silos de données existants et pour véritablement prendre en charge le processus d’analyse visuelle. Il est conçu pour refléter les capacités du matériel récent et la totalité de la hiérarchie de la mémoire, du disque à la mémoire cache L1. Le moteur de données Tableau permet d’associer grande quantité de données et analyse rapide.
Le moteur de données : analyse de grands volumes de données

L’évolution des données volumineuses

Les bases de données ont considérablement évolué au cours des dernières années. Les bases de données anciennes sont généralement axées sur les pré-calculs et les données hébergées sur disque. Malgré des capacités de calcul plus puissantes qu’auparavant, cette solution était d’une extrême lenteur, exigeant des utilisateurs qu’ils connaissent les questions auxquelles ils voulaient obtenir une réponse (leur charge de travail de requête) avant de constituer la base de données. Grâce à la simple utilisation des plus hauts niveaux de la hiérarchie de la mémoire et en exigeant la présence de l’ensemble des données dans la mémoire, les bases de données plus récentes ont connu des améliorations en termes de performances. Ces solutions « en mémoire » ont permis d’accélérer les calculs de façon considérable, en limitant en contrepartie la taille des données à celle de la mémoire disponible.

Objectifs du moteur de données Tableau

Nous avons conçu le moteur de données pour qu’il :
  1. exploite pleinement la génération actuelle de matériel pour obtenir des réponses instantanées aux requêtes via l’analyse de centaines de millions de lignes de données sur du matériel d’utilisation commune tel que les ordinateurs portables d’entreprise,
  2. prenne en charge les requêtes spécifiques grâce à l’application de performances prévisibles et constantes pour toutes les requêtes et à l’absence de toute exigence relative aux charges de travail de requête connues ou au pré-calcul d’agrégations ou de données récapitulatives ;
  3. s’intègre en toute transparence aux infrastructures et aux entrepôts de données des entreprises,
  4. ne soit pas limité par une exigence relative au chargement d'un ensemble de données entier dans la mémoire résidente pour atteindre ses objectifs de performance,
  5. offre un chargement et des connexions aux sources de données rapides.

Une conception tenant compte de l’architecture

Le cœur de la structure du moteur de données est une représentation en colonnes à l'aide d'une compression qui prend en charge l’exécution de requêtes sans décompression. Grâce à de nouvelles approches de l’infographie, les algorithmes ont été conçus avec soin afin de permettre l’exploitation totale des processeurs modernes (avec une utilisation quasi-optimale des caches de mémoire  L1 et L2), un nombre minimal de résultats intermédiaires et l'utilisation de techniques innovantes pour la gestion des flux de données sur disque, ceci afin d’éviter toute perte de débit, ce qui nous permet d’éviter la limitation fréquente de la nécessité du chargement complet des ensembles de données dans la mémoire avant que l’analyse ne puisse se faire.

Moteur de données : connexion en direct et vice versa

Le moteur de données est conçu pour s’intégrer directement à la technologie de « connexion en direct » de Tableau, permettant de passer, en un seul clic, d’une connexion directe à la base de données de l’entreprise (émettant des requêtes SQL très précises spécifiques à la plateforme) à la demande d’un extrait des données chargées dans le moteur de données (et inversement) présentant une correspondance exacte de la sémantique de collecte et de calcul. Cette intégration permet aux entreprises d’analyser des échantillons de données (Go) puis de les rediriger vers un entrepôt parallèle tel que Teradata afin d’effectuer l’analyse finale (ou les rapports) sur des pétaoctets de données.

De véritables requêtes spécifiques

Le moteur de données intègre un langage et un optimiseur de requête conçus pour prendre en charge les requêtes typiques d’analyse d’entreprise instantanée. Lorsque l’on travaille sur les données à la vitesse de la pensée, il n’est pas rare d’avoir besoin d’exécuter des requêtes complexes telles que des filtres multidimensionnels étendus ou des requêtes de cooccurence complexes. Les bases de données existantes sont généralement peu performantes pour ces types de requêtes, alors que le moteur de données les traite de manière instantanée.

Modèle de données souple

Le moteur de données se distingue principalement des autres solutions en mémoire en cela qu’il permet de travailler directement sur les données telles qu’elles sont représentées dans la base de données sur le disque. Ainsi, il n’est pas nécessaire de modéliser les données ni de créer de script pour utiliser le moteur de données. Tout comme n’importe quelle autre base de données relationnelle, le moteur de données vous permet de définir de nouvelles colonnes calculées. En fait, vous pouvez envisager cela comme une sorte de modélisation des données spécifiques possible à tout moment.

Temps de connexion et de chargement d’instance

Le moteur de données est unique : une fois que vos données y sont chargées, le démarrage est très rapide. Seule la partie des données à laquelle les requêtes correspondent doit être lue. La base de données peut comporter de nombreuses données non pertinentes dans le cadre d’une analyse spécifique. Dans ce cas, vous n’aurez pas à attendre que le moteur de données ait lu ces données.