Exécution d'analyses SQL avec Tableau et Amazon Aurora

Pour la plupart des entreprises, la base de données SQL est intouchable. Les administrateurs verrouillent en permanence les opérations en écriture et protègent l'espace de stockage de la base de données pour que toutes les données y soient enregistrées avec exactitude pour la postérité. Et qu'en est-il des analyses ? Elles attendront, la plupart du temps. La création d'extraits peut être exécutée pendant les heures creuses, comme en début de matinée. Les connexions en direct vers la base de données pendant les heures de bureau (pendant lesquelles les utilisateurs veulent interroger leurs données) sont considérées dangereuses et inutiles. Malheureusement, les données qui sont si soigneusement stockées dans la base de données perdent ainsi de leur utilité.

La fin du trimestre approche, et votre équipe a passé la semaine à conclure des contrats. Vous souhaitez vérifier si vous remplissez vos objectifs, mais il y a un hic :

l'extrait de données que vous utilisez est mis à jour chaque nuit et il n'inclut pas encore les contrats que votre équipe a conclus aujourd'hui. Vous pourriez vous connecter à votre base de données SQL, mais elle est verrouillée pour protéger les opérations en écriture. Vous naviguez à l'aveugle, car même si votre base de données est capable de stocker et collecter vos données, elle n'est pas en mesure de répondre à vos besoins analytiques.

Bon nombre d'entre vous ont certainement déjà connu cette situation. Pour la plupart des entreprises, la base de données SQL est intouchable. Les administrateurs verrouillent en permanence les opérations en écriture et protègent l'espace de stockage de la base de données pour que toutes les données y soient enregistrées avec exactitude pour la postérité.

Et qu'en est-il des analyses ? Elles attendront, la plupart du temps. La création d'extraits peut être exécutée pendant les heures creuses, comme en début de matinée. Les connexions en direct vers la base de données pendant les heures de bureau (pendant lesquelles les utilisateurs veulent interroger leurs données) sont considérées dangereuses et inutiles. Malheureusement, les données qui sont si soigneusement stockées dans la base de données perdent ainsi de leur utilité.

Cette situation est en passe de changer. Grâce à Amazon Aurora et ses réplicas en lecture, les utilisateurs Tableau peuvent se connecter directement à la base de données pour exécuter les analyses qu'ils souhaitent, à tout moment, sans affecter les opérations en écriture sur la base de données principale.

Fonctionnement commun de Tableau et d'Aurora

Les réplicas en lecture fonctionnent comme des instances autonomes dans un cluster de bases de données Aurora, dédiées aux opérations en lecture. Vous pouvez en distribuer jusqu'à 15 dans trois zones de disponibilité, au sein de la région AWS où est hébergée la base de données. Une seule et même instance en lecture permet d'accéder aux réplicas en lecture. La charge des requêtes en lecture est équilibrée sur l'ensemble des réplicas en lecture dans un cluster Aurora, pour garantir qu'aucun réplica ne soit saturé en répondant aux besoins analytiques de votre entreprise.

Les réplicas en lecture sont extrêmement utiles pour la connexion en direct avec Tableau, dans la mesure où ils permettent aux utilisateurs de faire glisser et déposer tout type de champ, ou de créer tout type de requête, sans se soucier des conséquences sur la base de données. Le connecteur perfectionné de Tableau permet de produire du code SQL efficace et direct, optimisé pour Aurora pour profiter automatiquement de performances accrues.

Par ailleurs, les utilisateurs Tableau peuvent créer des hiérarchies, des dossiers, des groupes ou des calculs, et modifier les alias de tous les champs pour optimiser la qualité et la fiabilité des données. Vous pouvez publier cette définition de métadonnées sur Tableau Server, avec une connexion directe vers le réplica en lecture Aurora. Cela vous permet d'enregistrer une version unique et fiable de l'information, à laquelle chaque utilisateur pourra se connecter en vue de l'utiliser, dans la limite des autorisations définies.

Architecture des réplicas en lecture dans Aurora

Tableau Server permet également de faire en sorte que les autorisations intégrées s'appuient sur les autorisations au niveau des lignes déjà définies dans votre instance Aurora. Vous pouvez également définir un niveau d'autorisation pour chaque vue, classeur, dossier ou groupe dans Tableau Server directement. Grâce à un tel niveau de précision dans la définition d'autorisations, vous pouvez avoir l'assurance que seuls les utilisateurs habilités pourront accéder aux données sensibles sans conséquences négatives.

En résumé, l'association de Tableau et d'Aurora permet de faciliter l'exécution d'analyses avec la plupart des bases de données SQL. Vos utilisateurs n'auront plus à patienter pour exécuter leurs analyses ou à attendre que les extraits de données se mettent à jour, et pourront se connecter directement et en toute sécurité à Aurora pour créer des visualisations en glisser-déposer et partager leurs résultats.

Pour découvrir Tableau et Aurora en action, rejoignez-nous le 2 novembre à l'occasion de notre webinaire, qui inclut une démonstration.