20 septembre, 2018

Trois idées reçues sur le machine learning

Face à la multiplication des applications du machine learning dans l'analytique moderne, il est nécessaire de tordre le cou à certaines idées reçues pour bien comprendre comment tirer parti du potentiel des machines.

Le machine learning est un domaine de l'informatique qui se base sur les données pour extraire des algorithmes et des modèles d'apprentissage, et appliquer des généralisations «déduites » à des situations nouvelles, ce qui permet notamment l'exécution de tâches sans programmation directe par un utilisateur humain. Face à la multiplication des applications du machine learning dans l'analytique moderne, il est nécessaire de tordre le cou à certaines idées reçues pour bien comprendre comment tirer parti du potentiel des machines.

Idée reçue : Le machine learning et l'IA vont remplacer les humains

Rassurez-vous, les machines ne vont pas vous voler votre travail. En réalité, le machine learning et l'IA sont susceptibles de vous aider à mieux faire votre travail et à vous concentrer sur les aspects intrinsèquement humains de celui-ci, comme la créativité et la définition de stratégie.

Même si le machine learning et l'IA sont utiles dans de multiples scénarios, il reste de nombreux domaines dans lesquels les apports de ces technologies sont limités et qui nécessitent encore l'intervention ou la supervision d'humains. Exemples :

Planification à long terme
Réflexion abstraite ou créative
Compréhension des relations de cause à effet
Prise de décisions nécessitant une connaissance du domaine ou du contexte

Le discernement et le bon sens sont également nécessaires pour éliminer toute partialité des algorithmes de machine learning. Même au rythme des progrès technologiques actuels, nous ne profiterons peut-être jamais de solutions 100 % algorithmiques. La transparence reste un facteur important pour permettre aux humains de faire confiance aux résultats et aux recommandations formulés par les machines. En effet, il est important pour nous de comprendre ce qui se passe dans ces modèles avant de nous y fier et d'intégrer des décisions influencées par les machines dans notre vie professionnelle et personnelle.

Idée reçue : L'apprentissage des machines se base sur l'expérience

Contrairement à ce que l'on pourrait croire, le machine learning s'appuie sur des données, pas sur des expériences. Il n'est pas possible de laisser un ordinateur résoudre un problème sans lui donner d'informations. Pour apprendre et pour créer des algorithmes à appliquer à des scénarios futurs, les machines ont besoin de données, notamment :

Une méthode pour classer ou représenter les composants d'un ensemble de données
Des indicateurs pour juger et évaluer la réussite d'une tâche
Un moyen d'optimiser les paramètres du modèle en fonction des données

Les machines extraient une explication généralisée de l'ensemble de données, comme un récit abstrait, qui peut inclure des tendances complexes ou des régularités cachées qu'un humain aura du mal à identifier. À titre d'exemple, les institutions financières utilisent aujourd'hui le machine learning pour détecter et signaler des irrégularités pouvant représenter des opérations frauduleuses, ou évaluer des risques et formuler des recommandations en matière de prêt.

Pour utiliser un exemple plus simple, il est possible de présenter à une machine plusieurs photos de donuts pour qu'elle détermine si chaque nouvelle photo contient un donut ou non. Pour cela, il faut d'abord fournir des photos avec des donuts, et des photos sans, et indiquer à l'outil de classification ce que contient chaque photo. La machine peut alors construire un modèle lui permettant de générer des prédictions déterministes pour distinguer les photos avec donut de celles sans donut. Enfin, il faut introduire une nouvelle image pour permettre à la machine d'appliquer son modèle algorithmique et de prendre une décision pour indiquer si cette photo contient un donut ou non.

Idée reçue : Le machine learning et l'IA désignent la même chose

L'IA et le machine learning sont des concepts intimement liés, mais très différents. Cette relation peur se résumer de la manière suivante : l'IA est une problématique, tandis que le machine learning est l'une des solutions cherchant à résoudre cette problématique. Si l'objectif ultime est d'obtenir un ordinateur capable de résoudre un problème en employant les capacités cognitives de l'intelligence humaine, l'application d'algorithmes basés sur les données à de nouvelles situations complexes n'est qu'un moyen parmi d'autres d'y parvenir.

Pour vous aider à mieux faire la distinction entre les deux, imaginez l'IA comme une méthode permettant de résoudre des problèmes faciles pour les humains mais difficiles pour les machines, comme la vision artificielle. Pour revenir à notre exemple des donuts, nous allons ajouter un degré de difficulté pour enseigner à un ordinateur à faire la distinction entre donuts et bagels. C'est une question très simple pour un humain, mais très compliquée pour un ordinateur. Ici, l'IA représente la capacité d'une machine à bien distinguer des bagels des donuts (problème), alors que le machine learning permet à l'ordinateur d'apprendre à trancher lorsqu'on lui présente une photo (solution).

À l'inverse, le machine learning est très efficace dans les situations que les machines gèrent plus facilement que les humains, comme l'exécution d'algorithmes mathématiques complexes ou l'utilisation de calcul de probabilités. La puissance de calcul des machines permet de réaliser rapidement des tâches complexes ou de repérer des tendances qu'un humain pourrait ne pas voir.

Les cas d'utilisation du machine learning en analytique moderne

De nombreuses entreprises intègrent le machine learning dans leurs pratiques analytiques pour identifier des informations cachées, et obtenir des recommandations plus intelligentes afin de prendre des décisions éclairées. Cette approche est particulièrement utile pour l'analyse du Big Data et pour la gestion d'ensembles de données volumineux et complexes. Le machine learning permet également d'identifier des tendances comportementales au sein d'une entreprise afin de proposer des suggestions aux utilisateurs dont les comportements sont similaires. Il peut par exemple suggérer des sources de données à utiliser pour la préparation des données ou l'analyse, ou le contenu analytique pertinent à utiliser pour répondre à une question particulière.

L'analytique avancée et prédictive est un autre exemple de domaine qui continue à se développer. Le machine learning permet d'automatiser des analyses statistiques avancées et d'appliquer automatiquement des modèles avec un degré de confiance élevé, pour que les utilisateurs moins chevronnés puissent aussi tirer parti de modèles complexes. Les utilisateurs plus aguerris, quant à eux, pourront explorer et modifier des calculs, ce qui non seulement répond à la nécessité de transparence, mais permet également de tester différents scénarios de simulation.

Le machine learning est également utilisé en analytique pour permettre aux utilisateurs d'interroger leurs données à l'aide de requêtes en langage naturel. En somme, le machine learning apprend à interpréter les intentions et la sémantique des questions formulées par des utilisateurs humains, et à traduire ces questions en requêtes structurées. Avec les progrès réalisés en matière de langage naturel et dans les autres fonctionnalités de l'analytique intelligente grâce à l'IA et au machine learning, des utilisateurs ne disposant pas d'aucune compétences analytiques traditionnelles pourront exploiter leurs données de manière totalement inédite pour faire des découvertes.

Trois idées reçues sur le machine learning

Idée reçue : Le machine learning et l'IA vont remplacer les humains

Idée reçue : L'apprentissage des machines se base sur l'expérience

Idée reçue : Le machine learning et l'IA désignent la même chose

Les cas d'utilisation du machine learning en analytique moderne

Autres sujets pertinents

VizQL Data Service: Extend Your Data Beyond Visualizations

VizQL Data Service from Tableau: Use Your Data, Your Way

When and How to Use Multi-fact Relationships in Tableau