Avec les outils Big Data Tableau, Alation Data Catalog et Hadoop, la gouvernance peut suivre


Amélioration de la gouvernance pour plus de 13 To de données stockées sur Hadoop
Réduction des erreurs de reporting avec des sources de données certifiées par l'IT
Optimisation du développement de produits pour améliorer l'expérience client

GoDaddy est une société internationale spécialisée dans la gestion des noms de domaine et l'hébergement de sites Web, qui compte 17 millions de clients. Chaque jour, elle collecte 13 téraoctets (To) de données, qui sont stockées et gérées sur Hadoop. Aujourd'hui, avec Tableau et Alation, l'équipe Enterprise Data bénéficie d'un contrôle accru sur la justesse des données, ce qui permet aux business units d'accéder à des sources de données préparées et certifiées par les responsables des données de GoDaddy. À présent, les analystes passent moins de temps à rechercher les données et peuvent davantage se consacrer à leur cœur de métier. L'équipe continue ainsi d'améliorer le développement de produits grâce à des décisions basées sur les données, ce qui optimise l'expérience client.

En mettant les données à la disposition des utilisateurs finaux, nous leur donnons la possibilité de créer rapidement les rapports de base dont ils ont besoin. Comme ils sont en première ligne, ce sont les plus à même d'identifier rapidement les améliorations éventuelles à apporter à un produit ou à une application.

Le libre-service pour plus de 1 400 utilisateurs Tableau

Avec des centaines de sources de données disséminées sur des dizaines de plates-formes et exploitées par plus de 1400 utilisateurs Tableau, l'équipe de GoDaddy cherchait un moyen d'améliorer la fiabilité et l'accessibilité des données dans l'entreprise.

« Nous avions plusieurs réplications de ces données. Nous avions même des champs calculés qui n'étaient pas documentés », explique Sharon Graves, Enterprise Data Evangelist et administratrice de Tableau Server chez GoDaddy. « En termes de BI, il nous était presque impossible de déterminer si nous utilisions les bonnes données pour le reporting. »

Pour mettre en œuvre l'analytique en libre-service à grande échelle, l'équipe de GoDaddy a adopté le catalogue de données Alation parallèlement à Tableau. Cette solution répertorie les sources de données et fournit le contexte en fonction de l'utilisation.

Alation complète l'approche de Tableau en matière de gouvernance en permettant aux utilisateurs finaux de découvrir facilement les données provenant de plusieurs sources et d'en comprendre toutes les nuances. Ce processus est automatique. Alation explore et classe dans des catalogues les données de l'entreprise, la sémantique métier liée aux données et la logique intégrée dans l'historique analytique via les journaux de requêtes SQL.

Tableau et Alation reposent tous les deux sur une infrastructure Hadoop hébergée chez GoDaddy. Celle-ci se compose d'Apache Pig (plate-forme de création de scripts permettant de traiter et d'analyser de gros volumes de données), d'Apache Spark (structure de calcul en cluster) et d'Apache Hive.

Alation et Tableau ont permis à l'équipe Enterprise Data de GoDaddy d'examiner la traçabilité d'une table, de rechercher un champ dans plusieurs sources de données et de renforcer la visibilité et le contrôle.

Avec cette nouvelle plate-forme de données, GoDaddy a automatisé de nombreux processus manuels, notamment en créant des alertes automatiques pour assurer le chargement des données. Des règles de gestion sont également appliquées uniformément lors du traitement.

Et ce n'est pas tout. « Une grande partie des métadonnées est collectée automatiquement via la fonctionnalité de machine learning d'Alation, grâce à l'examen des journaux de requêtes et au profilage des données sur les serveurs de GoDaddy », explique Sharon Graves.

Les responsables des données utilisent Tableau et Alation ensemble pour la curation des données qui sont automatiquement inventoriées dans le catalogue Alation. Les fonctionnalités de curation d'Alation leur permettent de valider automatiquement la sémantique métier recommandée afin de capturer le contexte des données. Les responsables des données peuvent propager des balises pour les ensembles de données qui impliquent des données personnelles ou qui sont soumises à d'autres exigences de conformité. Ils peuvent également promouvoir ou désactiver des sources de données afin de garantir la justesse des données utilisées par les employés et d'orienter les analystes et les utilisateurs confirmés pendant l'analyse.

« La constitution de l'équipe Enterprise Data parallèlement à la mise en œuvre de ces produits a permis de donner du sens à la stratégie de données de GoDaddy », affirme Sharon Graves. « Cela nous a aidés à consolider les règles et la gestion, ce qui nous a permis d'améliorer grandement l'expérience utilisateur. »

La constitution de l'équipe Enterprise Data parallèlement à la mise en œuvre de ces produits a permis de donner du sens à la stratégie de données de GoDaddy. Cela nous a aidés à consolider les règles et la gestion, ce qui nous a permis d'améliorer grandement l'expérience utilisateur.

Une expérience produit optimale pour plus de 17 millions de clients

L'équipe Data Enterprise chez GoDaddy gère chaque jour l'afflux de 13 téraoctets de données (indicateurs du trafic Web, historiques d'achat des clients, statistiques internes, etc.). Avant d'adopter cette nouvelle solution, l'accès aux données était lent. Il prêtait également à confusion et compliquait la tâche des analystes de GoDaddy.

« Nos utilisateurs confirmés, qui ne sont pas toujours des experts Data, ne savaient pas où trouver les données dont ils avaient besoin pour leurs analyses ou comment les mettre à profit », explique Sharon Graves.

Cette nouvelle plate-forme a marqué le début de l'analytique en libre-service chez GoDaddy. « En créant un environnement en libre-service », ajoute Sharon, « les chefs de produit et les utilisateurs métier peuvent tirer parti des données pour améliorer l'expérience client et concevoir le produit qui répond le mieux aux besoins des consommateurs en identifiant les tendances et en anticipant les problèmes. »

Maintenant que les utilisateurs disposent des outils analytiques dont ils ont besoin, ils passent moins de temps à chercher les données et peuvent davantage se consacrer à l'amélioration des processus. Résultat : les 17 millions de clients de GoDaddy sortent plus satisfaits que jamais de leur expérience produit.

Les chefs de produit et les équipes fonctionnelles utilisent les tableaux de bord Tableau pour identifier les tendances et détecter les problèmes potentiels avant qu'ils surviennent. La facilité d'accès aux données leur permet d'analyser précisément les tendances de leur site Web et les campagnes d'e-mail marketing afin d'optimiser le développement de leurs produits.

« En mettant les données à la disposition des utilisateurs finaux, nous leur donnons la possibilité de créer rapidement les rapports de base dont ils ont besoin », explique Sharon Graves. « Si nous constatons que des consommateurs abandonnent le processus d'achat à un moment précis, nous pouvons adapter notre approche en conséquence afin de déterminer si elle est plus efficace que la précédente. Comme ils sont en première ligne, ce sont les plus à même d'identifier rapidement les améliorations éventuelles à apporter à un produit ou à une application. »

Moins d'erreurs coûteuses grâce à une meilleure gouvernance des données

Auparavant, pour créer des rapports, les analystes devaient extraire les données de SQL, les mettre dans une feuille de calcul, puis envoyer les résultats par e-mail. L'équipe Enterprise Data avait très peu de visibilité sur l'utilisation des données. Il était difficile de déterminer l'origine d'une erreur et encore plus compliqué de la corriger.

Désormais, les responsables des données de GoDaddy utilisent Alation pour analyser les milliers de classeurs Tableau, en affichant les principaux utilisateurs de chaque source de données. Cette information permet aux équipes analytiques et métier de mieux comprendre comment les données sont utilisées dans toute l'entreprise, et de savoir qui contacter en cas de question. Cette approche permet de minimiser les erreurs coûteuses à grande échelle.

« Alation et Tableau ont permis à l'équipe Enterprise Data de GoDaddy d'examiner la traçabilité d'une table, de rechercher un champ dans plusieurs sources de données et de renforcer la visibilité et le contrôle », affirme Sharon Graves.

Quelques clics suffisent pour déterminer la popularité des différentes sources de données dans Tableau Server, savoir qui utilise les données et où, et chercher un champ spécifique dans des centaines de sources de données.

Pour découvrir comment Alation et Tableau assurent la gouvernance à grande échelle, regardez ce webinaire et lisez ce livre blanc.

Autres ressources susceptibles de vous intéresser…