Tableau 9.0 en avant-première : gardez une longueur d'avance grâce à la préparation automatisée des données

Les analyses ne sont pas réservées aux données bien organisées. Tableau 9.0, actuellement en version bêta, permet d'automatiser le nettoyage des données désordonnées, en particulier pour les feuilles de calcul Excel. Cette version inclut un outil d'interprétation des données qui identifie automatiquement la structure d'un fichier Excel, de nouveaux outils permettant de faire pivoter et de scinder les données, ainsi qu'une nouvelle vue pour manipuler rapidement les métadonnées. Combinées à la modélisation automatique des données, disponible depuis la version 8.2, ces nouvelles fonctions vous permettent de préparer rapidement les données pour les analyser.

Dans Tableau, avant de pouvoir trouver des réponses à vos questions et exploiter toute la puissance analytique, ou encore partager le fruit de votre travail avec d'autres utilisateurs, sur appareil mobile ou sur Internet, vous devez d'abord vous connecter aux données.

Vous n'êtes pas sans savoir que les analyses ne sont pas réservées aux données bien organisées. Vous êtes nombreux à préparer vos données avec des outils et des scripts spécialisés afin de les utiliser dans Tableau, ou à passer du temps à élaborer des formules de calcul complexes pour résoudre les problèmes liés aux données.

Tableau 9.0 automatise en grande partie la corvée du nettoyage des données, en particulier pour les feuilles de calcul Excel. Cette version apporte plusieurs améliorations, notamment l'interpréteur de données qui détecte automatiquement la structure d'un fichier Excel, de nouveaux outils pour faire pivoter et scinder les données, ainsi qu'une nouvelle vue pour manipuler rapidement les métadonnées. Combinées à la modélisation automatique des données, disponible dans la version 8.2, ces nouvelles fonctions vous permettent de préparer rapidement les données pour les analyser.

En matière de préparation des données, l'objectif de Tableau est de permettre à chaque utilisateur de modifier fondamentalement la connexion de données quand il le souhaite. Par conséquent, ces fonctions se doivent d'appliquer les quatre principes suivants pour vous simplifier la tâche.

  • Intelligence : elles doivent se mettre en œuvre automatiquement et être en mesure d'interpréter parfaitement les données.
  • Rapidité : elles doivent opérer pratiquement en temps réel, même sur de très grandes quantités de données.
  • Reproductibilité : elles doivent laisser la possibilité de modifier les données sous-jacentes, par exemple pour ajouter des valeurs, des lignes ou des colonnes.
  • Flexibilité : elles doivent permettre les modifications importantes à tout moment, tout en préservant ce qui a été fait.

Vous bénéficierez de tous ces avantages dans Tableau 9.0 grâce à ses nouvelles fonctionnalités. Voyons cela de plus près :

Interpréteur de données Tableau
Vos fichiers Excel ressemblent-ils à ceci ?

Tableau détecte automatiquement l'emplacement des données (ici elles commencent à la cellule B8) et leur structure (par exemple, la feuille comporte plusieurs en-têtes composés) pour les préparer à être analysées.

Tableau croisé dynamique
Souvent, les fichiers texte et Excel comportent des noms de colonne qui constituent des valeurs de données exploitables. Ici en l'occurrence, les noms des champs combinent l'année et le mois.

Pour optimiser les analyses, il serait préférable d'avoir une seule colonne « Date » au lieu de plusieurs dizaines et une autre colonne contenant les valeurs. En d'autres termes, il faut faire pivoter une partie de l'ensemble de données. Il suffit de sélectionner la commande Pivoter pour obtenir le résultat suivant.

Scission
De nombreuses colonnes regroupent plusieurs informations comme des numéros de téléphone (avec indicatif local), des adresses de messagerie, des URL et bien d'autres combinaisons propres à vos données. Avec la fonction « Scission », Tableau échantillonne automatiquement vos données, détecte les délimiteurs multiples et crée de nouvelles colonnes si nécessaire. Nous disposons d'une colonne qui combine le code postal et l'emplacement. Une valeur ressemble à ceci : 90001 (33.973271508000494, -118.24896959899968). Imaginez les calculs complexes que requiert l'analyse des trois composants.

Les expressions régulières sont très utiles dans cette situation, et vous pouvez maintenant les utiliser dans Tableau. La création des expressions régulières peut toutefois en rebuter plus d'un. Sachez qu'il suffit de cliquer avec le bouton droit et de choisir Scinder pour obtenir ceci :

Des colonnes bien organisées, sans passer par de multiples fenêtres ou messages. Si la scission automatique ne détecte pas la structure de votre champ, un message vous invite à indiquer un délimiteur (généralement une virgule, un espace ou un autre caractère). Vous pouvez par ailleurs modifier les calculs créés, grâce à la fonction SPLIT(). Vous avez donc à votre disposition trois nouvelles méthodes pour décomposer facilement une colonne en éléments exploitables.

Grille des métadonnées
Lors de la préparation des données pour les analyser, une liste de champs est parfois plus utile qu'un aperçu des données. Nous avons donc ajouté une vue des métadonnées de votre connexion.

Cette vue permet d'en savoir plus sur les champs d'un seul coup d'œil, de les renommer rapidement et d'effectuer des opérations en bloc sur plusieurs d'entre eux. Vous souhaitez masquer plusieurs champs ? C'est très simple. Il suffit de les sélectionner, puis de cliquer sur Masquer.

Ces fonctionnalités sont pratiques et vous pouvez les appliquer dans l'ordre de votre choix. En fait, vous pouvez cliquer sur le nouvel onglet Données à tout moment au cours de l'analyse pour modifier votre connexion. Vous pouvez ajouter des tables, modifier les jointures, changer les noms des champs, utiliser l'une des nouvelles fonctions, etc. Votre analyse s'actualise au fur et à mesure. Avec cette nouvelle version de Tableau, vous aurez plus que jamais le contrôle sur vos analyses.

Il va sans dire que cette préparation des données est incontournable pour profiter pleinement de l'aspect réellement amusant, à savoir la création d'analyses visuelles utiles et attrayantes. En interagissant avec votre visualisation, les utilisateurs ne se douteront pas un seul instant de la manière dont vous avez nettoyé vos données pour obtenir un tel résultat.