Le machine learning, qu'est-ce que c'est ?

Au cours de la dernière décennie, un nombre croissant d'entreprises ont adopté dans leur stratégie de transformation numérique des méthodes d'intelligence artificielle dans la manière dont elles conçoivent leurs produits, gèrent leurs business et définissent leurs processus.

La collecte, l'analyse et l'exploitation des données sont à présent considérées comme des moteurs essentiels de la croissance d’une entreprise.

Les nombreuses avancées dans le domaine de l’intelligence artificielle, que ce soit la détection de cancer, les chatbots, les algorithmes de recommandation ou de détection de fraude, sont liées pour la vaste majorité aux progrès effectués dans le domaine du machine learning.

Pour en savoir plus sur ce sujet, je vous invite à découvrir dans cet article ce qu’est le machine learning, ses techniques, ses applications, comment ça marche et pourquoi on l’utilise.

Définition

Le machine learning, ou apprentissage automatique, est une application de l'intelligence artificielle (IA). Il s’agit d’un ensemble de méthodes qui offre aux systèmes la possibilité de faire et d’améliorer des prédictions ou des comportements basés sur des données (big data) sans être explicitement programmés.

Le machine learning est un changement de paradigme de la « programmation normale » où toutes les instructions doivent être explicitement données à l'ordinateur vers la « programmation indirecte » qui nécessite l’utilisation de données.

La performance des modèles de machine learning est intimement liée à la donnée, que ce soit en quantité mais aussi en qualité. Plus celle-ci sont nombreuses, plus l’algorithme peut apprendre et affiner son modèle pour ainsi délivrer des résultats précis.

C'est là que la data intelligence entre en jeu : elle permet d'extraire les bonnes données, de les croiser, de les structurer et de les qualifier pour maximiser l'efficacité des modèles.

Une fois entraîné, l’utilisation du modèle de machine learning permet par exemple de retrouver des patterns sur des nouvelles données ou de prédire une valeur future.

🔎 Un algorithme de machine learning est également capable d’apprendre sur des ensembles de données croissants et ainsi d’améliorer de manière continue sa performance.

Comment ça marche ?

L’estimation des prix de logements, la recommandation d'un produit, la détection de panneaux de signalisation, la prédiction de défaut de crédit et la détection de fraude des internautes sont des exemples d’application de machine learning qui ont tous en commun de pouvoir être résolus par l'expérience de l'apprentissage automatique.

Les tâches sont différentes, mais l'approche est la même.

Étape 1 : collecte et préparation des données.

Comme nous l’avons vu plus haut, plus il y en a, mieux c'est. Les données doivent contenir le résultat que vous souhaitez prédire et des informations supplémentaires à partir desquelles effectuer la prédiction.

Voici quelques exemples :

Pour un détecteur de feu tricolore ("Y a-t-il un feu tricolore dans l'image ?"), il nous faut une collection d’images d’intersections avec une indication si un feu tricolore est visible ou pas.
Pour un prédicteur de risque de défaut de paiement, vous avez besoin d'un réseau de données antérieures sur les prêts réels, d'informations sur le fait que les clients étaient en défaut ou non avec leurs prêts et de données qui vous aideront à faire des prédictions, telles que les revenus, les défauts de crédit antérieurs, etc.
Pour la prédiction du taux de décrochage qui consiste à détecter les clients susceptibles d'annuler un abonnement à un service, il nous faudra des données sur la manière dont ils utilisent le service (exemple : comportement d’achat, durée de session, réponse aux sollicitations marketing, etc).

Étape 2 : entraînement de l’algorithme et ajustement des paramètres

Lorsque les données ont été nettoyées et préparées (voir le concept de tidy data, ou données propres), nous pouvons passer à la sélection d’un algorithme de machine learning. A partir des données du problème choisi, celui-ci génère notre modèle de détection de feux tricolore, le modèle de notation de crédit ou le modèle d’attrition.

Pour généraliser, l’algorithme supervise et commence par faire une estimation aléatoire des modèles raisonnables pour identifier la variable à prédire. En cas d'erreur, une série d'ajustements est effectuée par l’algorithme lui-même pour que la prédiction s’approche le plus de la variable d’apprentissage cible.

L’algorithme de machine learning possède également toute une série de paramètres additionnels à disposition pour son utilisateur afin d’optimiser les résultats et la performance du modèle.

🔎 Le réglage du modèle de machine learning est comme l’ajustement des boutons et des interrupteurs d’une télévision jusqu'à ce que l’on obtienne un signal plus clair

Ces processus constituent la phase de formation d'un système d'apprentissage automatique. (deep learning)

Étape 3 : utilisation du modèle

L'objectif de la création d'un modèle d'apprentissage automatique est de résoudre un problème, et un modèle d'apprentissage automatique ne peut le faire que lorsqu'il est confronté à de nouvelles données.

L’intégration d’un modèle de machine learning dans un produit ou un processus, comme une voiture autonome, un processus de demande de crédit ou d’une plateforme CRM (Customer Relationship Management) permet alors d’utiliser la puissance des données passées pour une application en temps réel.

En tant que tel, le déploiement de modèles est aussi important que la création de modèles.

Pourquoi utiliser le machine learning ?

La reconnaissance de l'augmentation des volumes et des variétés de données disponibles (voir Big data et les 4 V de la donnée), le traitement informatique moins cher et plus puissant (cloud computing), et le stockage de données abordable (cloud storage) encouragent la production rapide et automatique de modèles capables d'analyser des données toujours plus volumineuses et plus complexes et ainsi de fournir des résultats plus rapides et plus précis, même à très grande échelle.

Par conséquent, en construisant des modèles de machine learning précis, une organisation a de meilleures chances d'identifier des opportunités rentables, ou d'éviter des risques inconnus.

💡 Dans le cas de notre CRM, la prédiction du taux de décrochage des clients peut entraîner la mise en place de mesures pour fidéliser le client avant qu'il ne soit trop tard. La capacité de prédire qu'un client court un risque élevé de décrochage alors qu'il est encore temps de faire quelque chose à ce sujet représente une énorme source de revenus potentiels supplémentaires pour l’entreprise.

Et voilà, vous savez tout sur le machine learning ! Pour en apprendre davantage sur la data, restez connecté !

Cela risque de vous intéresser :

Écrit par Pierre Baudin

Data Manager