CEA : Des découvertes capitales cachées dans des millions de lignes de données
Antonio Cosma, chercheur en sciences au CEA, et son équipe peuvent désormais interroger leurs données et obtenir des réponses en quelques minutes grâce à Tableau.
Aujourd'hui, le CEA peut analyser de grands ensembles de données multidimensionnelles. Un échantillon contient généralement près de 1 million de cellules, et l'équipe de recherche analyse simultanément de nombreux échantillons. Grâce à Tableau, ils peuvent avoir une vue d'ensemble sur toutes les données ou en explorer certaines en détail.
Les tests d'hypothèses pouvaient parfois prendre jusqu'à 3 heures. À présent, comme le souligne Antonio Cosma, « il est possible de répondre instantanément aux questions. »
Tableau: Qu'est-ce qui vous a amené à chercher une solution d'analyse visuelle ?
Antonio Cosma, Chercheur en sciences: Le CEA avait besoin d'une base de données, nous avons donc commencé à accumuler les données, mais à un certain moment un problème s’est posé. Comment faire pour visualiser ces données ?
Les outils qui étaient disponibles n'étaient pas satisfaisants. J'ai alors commencé à chercher une solution pour visualiser et analyser mes données.
Tableau: Comment en êtes-vous venu à choisir Tableau ?
Antonio: Après seulement quelques heures d'utilisation de Tableau, je me suis immédiatement rendu compte que c'était l'outil dont j'avais besoin, disons l'outil que j'avais toujours cherché pour regarder des données multidimensionnelles que je pouvais aussi agréger rapidement.
Tableau: Pourriez-vous donner un exemple d'une façon dont Tableau vous aide à voir et à comprendre vos données ?
Antonio: Ces données de cytométrie en flux sont très particulières, parce qu'on analyse les cellules de l'organisme une par une. Quand on a un individu, un échantillon, on analyse, par exemple 1 million de cellules. Cela revient à dire qu'on analyse 1 million de lignes. Si on visualise ces données dans un fichier Excel par exemple, pour chaque ligne, on va avoir quelque chose comme trente ou quarante paramètres. C'est une quantité de données énorme et multidimensionnelle.
Après seulement quelques heures d'utilisation de Tableau, je me suis rendu compte que c'était l'outil dont j'avais besoin. C'est l'outil que j'attendais pour consulter des données multidimensionnelles et les regrouper rapidement.
Antonio: Tableau nous permet de faire des filtres, de visualiser ces données très simplement. De plus, ce que je vous ai décrit, c'est un échantillon.
C'est clair qu'on n'a pas un seul échantillon. On a plusieurs échantillons associés à plusieurs individus, à plusieurs groupes d'individus, qui par exemple sont atteints de maladies différentes.
Tableau: En quoi votre cadence de travail a-t-il changé depuis que vous utilisez Tableau ?
Antonio: Souvent, dans notre métier, on s'interroge et après on dit : « OK. Mais pour résoudre cette question, je dois récupérer toutes mes données, les filtrer, les traiter. »
Alors à un certain moment, on se dit : « Mais est-ce que cette question mérite deux ou trois heures de travail ? » Et quelquefois, on se dit : « OK, mais cette question, bon, je la laisse de côté. »
Avec Tableau, au contraire, je n'ai plus ce problème. Si j'ai une question, je peux m'y consacrer tout de suite. Même si c'est une question peu importante, qui a peu de chances d'aboutir, je peux la visualiser immédiatement.
Tableau: Comment vos collègues ont-ils accueilli vos analyses effectuées dans Tableau ?
Antonio: Et disons qu'en général, nos analyses de données sont plutôt impressionnantes pour nos partenaires [collègues]. Il y a beaucoup de personnes qui se rapprochent de nous, pour faire les analyses avec Tableau, avec notre système d'organisation de données multidimensionnelles.
Résultat, le CEA a démarré avec une licence qui était la mienne, et maintenant nous avons plus d'une vingtaine de licences. On est en train de déployer Tableau dans tous nos services, ce qui représente plus d'une centaine d'utilisateurs.
Et, il y a beaucoup de laboratoires qui travaillent à nos côtés, des collaborateurs avec lesquels on a l'intention d'utiliser Tableau. Le nombre de licences va donc sûrement croître.