7 compétitions pour les data scientists et les analystes

Participez à des compétitions de création de visualisations pour mettre vos compétences à l'épreuve.

Les compétitions de data science ont plusieurs intérêts. Elles vous permettent d'apprendre les meilleures pratiques, d'avoir des retours sur vos créations et d'améliorer vos compétences. Elles servent également à faire naître des idées et à apporter des réponses à une problématique à travers une approche participative.

Au-delà de ces nombreux avantages, ces compétitions permettent aux participants de repousser leurs limites et les encouragent à appliquer leur créativité à divers domaines.

Voici quelques exemples de compétitions auxquelles vous pouvez participer, pour mettre en pratique vos compétences en data science ou visualisation de données.

Iron Viz

Site Web : tableau.com/fr-fr/iron-viz
Organisation : Tableau

Chaque année, Tableau Public organise plusieurs compétitions de visualisations, permettant aux différents vainqueurs d'accéder à la compétition suprême : l'Iron Viz. Différents concours de qualification sont organisés au cours de l'année, chacun autour d'un thème particulier. Les vainqueurs de ces différents concours pourront participer à l'Iron Viz se déroulant en direct devant plus de 17 000 spectateurs, lors de la Conférence Tableau ou de la Conférence Tableau Europe, où ils devront s'affronter pour créer une visualisation à partir d'un même ensemble de données.

Les visualisations sont évaluées en fonction de plusieurs critères : la conception, la mise en récit, la profondeur d'analyse et les découvertes qui en résultent. Même si vous ne remportez pas la victoire, les concours de l'Iron Viz sont le moyen idéal de découvrir le monde de l'analytique et de faire évaluer vos créations par les autres participants et par des experts du secteur.

Les compétitions de Kaggle

Site Web : kaggle.com/competitions
Organisation : Kaggle

Nous ne pouvions pas parler de compétitions de data sans parler de Kaggle, l'une des plates-formes les plus connues dans ce domaine. Ce site a acquis sa notoriété en commençant par organiser des compétitions de machine learning. Les concours organisés par Kaggle attirent généralement des milliers de participants, en individuel ou par équipe, et proposent des récompenses très lucratives.

L'idée est simple : il s'agit de créer le meilleur algorithme possible pour résoudre la problématique proposée. Selon les concours, les vainqueurs peuvent repartir avec la satisfaction d'avoir acquis de nouvelles compétences, avec la reconnaissance des autres participants ou avec une somme d'argent. Si une somme d'argent est en jeu, elle est généralement de l'ordre de quelques dizaines de milliers de dollars, mais certains concours ont déjà proposé des récompenses de plus de 100 000 dollars. Le prix le plus élevé jusqu'ici était de 1 million de dollars pour l'équipe qui serait capable de surpasser le modèle « Zestimate » de Zillow qui prédit la valeur des biens immobiliers. En plus d'organiser des concours pour diverses organisations, Kaggle propose également le Data Science Bowl, qui a pour objectif d'apporter une contribution positive à la société grâce à la science.

Les prix Kantar Information is Beautiful Awards

Site Web : informationisbeautifulawards.com
Organisation : Information is Beautiful et Kantar

Si vous avez l'habitude de créer des visualisations de données, vous connaissez très probablement Information Is Beautiful, le site de David McCandless qui met en avant l'importance de la conception visuelle pour communiquer l'information. Ce site organise également les Information is Beautiful Awards, destinés à mettre en lumière les visualisations les plus créatives et pertinentes.

Chaque année, ce prix est décerné aux créateurs qui réussissent à faire parler les données de la manière la plus artistique, en évaluant la manière dont elles sont mises en valeur et dégagent des informations sur la problématique abordée. Une cérémonie vient clôturer la compétition. Les créations en pré-sélection sont consultables sur le site, tandis que les participants nommés sont invités à la cérémonie, qui se tient à la fin de l'année. À la cérémonie de 2018, les visualisations des participants sélectionnés ont été immortalisées sur des cookies.

Qu'il s'agisse de voir sa création figurer sur un cookie ou de remporter plusieurs milliers de dollars, les compétitions de data permettent de révéler les créateurs les plus talentueux. Même si vos réalisations sont encore modestes, les concours de data sont un bon moyen d'affûter vos compétences.

Les compétitions de Driven Data

Site Web : drivendata.org/competitions
Organisation : Driven Data

À l'instar de Kaggle, Driven Data organise des compétitions de data science s'appuyant sur une approche participative pour trouver des solutions à des problématiques de prédiction complexes. Ces compétitions visent à s'attaquer à des questions sociales majeures à l'aide de modèles statistiques prédictifs. Bien que ces concours n'aient pas la même envergure que ceux organisés par Kaggle, Driven Data se focalise sur la résolution de problématiques ayant un impact tangible sur notre quotidien et notre environnement. La fondation AARP Foundation a sponsorisé plusieurs compétitions, dont une nécessitait de créer des modèles pour prédire la sécurité physique des personnes âgées. Les organismes The Nature Conservancy et Gulf of Maine Research Institute ont eux aussi sponsorisé un concours pour aider les pêcheries à déterminer la taille et le nombre de poissons pêchés d'après des vidéos de surveillance enregistrées sur les bateaux.

Les participants sont évalués sur la manière dont ils peuvent efficacement prédire les tendances futures des données afin de résoudre la problématique proposée, en comparant leurs résultats aux valeurs réelles. Les modèles désignés vainqueurs sont ensuite mis en application par l'organisme sponsor, pour l'aider à atteindre ses objectifs. Certains de ces concours n'offrent que reconnaissance aux vainqueurs, tandis que d'autres proposent des sommes d'argent, mais toutes se donnent pour objectif d'avoir un impact positif sur le monde qui nous entoure.

La communauté CrowdANALYTIX

Site Web : crowdanalytix.com/community
Organisation : CrowdANALYTIX

CrowdANALYTIX organise également des compétitions de modélisation des données, en mettant l'accent sur le machine learning, l'intelligence artificielle, le deep learning et le traitement du langage naturel. Si ces concours sont plus informels, ils n'en sont pas moins enrichissants. Comme expliqué précédemment, certaines compétitions ont un but purement pédagogique, tandis que d'autres mettent en jeu diverses récompenses.

Cette plate-forme se compose de deux niveaux : celui des machines, et celui des humains, les data scientists qui mettent ces machines au point et créent des algorithmes. Dans ce cas précis, les compétitions prennent plus la forme de projets où les participants adoptent un processus itératif. Les algorithmes désignés vainqueurs sont ajoutés à la base de données de CrowdANALYTIX, puis optimisés et contrôlés. Si un algorithme commence à se dégrader, la communauté est invitée à le modifier ou à le recréer.

Les compétitions Coda Lab

Site Web : competitions.codalab.org
Organisation : Coda Lab

Coda Lab est une plate-forme open source de recherche en informatique scientifique. Les compétitions sont organisées pour favoriser la recherche et les tests de code collaboratifs. Bien qu'aucune récompense prestigieuse ne soit en jeu, ces concours permettent de créer un code plus efficace et reproductible. Coda Lab s'appuie très largement sur les aspects de programmation et d'écriture de code propres à la data science. C'est donc un bon moyen de se lancer dans des projets et des challenges collaboratifs.

Topcoder Open

Site Web : tco19.topcoder.com
Organisation : Topcoder

Topcoder est similaire à Coda Lab, dans la mesure où il s'agit d'une initiative collaborative pour la recherche et les tests de code. Son site principal propose un large éventail de challenges et de compétitions, aussi bien en data science qu'en code ou conception Web. Plusieurs mettent en jeu des sommes d'argent appréciables, alors que d'autres offrent avant tout le plaisir d'avoir participé.

Chaque année est organisé le Topcoder Open, le « tournoi ultime de programmation et de conception ». Il regroupe divers concours portant sur les algorithmes, le développement, l'interface utilisateur et l'assurance qualité. Les concours de sélection ont lieu en ligne. Les différents vainqueurs remportent des points leur permettant de gagner d'autres récompenses et un billet pour la finale du TCO qui se tient aux États-Unis. Le TCO organise également des évènements locaux pour toucher un public plus large. Ces évènements ont lieu sur une ou deux journées et offrent l'occasion de participer dans différents pays.

Lancez-vous en créant un compte gratuit sur Tableau Public, et utilisez l'un des ensembles de données proposés à la page Ressources pour vous exercer à créer vos propres visualisations.

Conseil : vous avez besoin d'entraînement ? Participez au Makeover Monday ! Chaque dimanche, un nouvel ensemble de données est proposé. Des participants du monde entier créent des visualisations qui seront ensuite évaluées lors d'un webinaire le mercredi suivant.