Quel est le but du machine learning ?
Mis en exergue par le mathématicien britannique Alan Turing au 20ème siècle, le Machine Learning (ML) est un concept qui a le vent en poupe depuis quelques années. Il est considéré à juste titre comme une sous-catégorie de l’intelligence artificielle. Aujourd’hui, utilisé dans plusieurs domaines, même les plus insoupçonnés, il reste pourtant un concept que peu de personnes comprennent véritablement. Grâce à cet article, vous saurez tout sur le fonctionnement et le but du ML.
Qu’est-ce que le machine learning ?
Encore confus dans l’esprit de beaucoup de personnes, le machine learning fait partie des sciences modernes très prometteuses. Il permettrait de dénicher les redondances qui se trouvent dans les flux de données afin de faire des prédictions plus ou moins réelles. C’est aussi une technique de programmation informatique consistant à utiliser des probabilités statistiques pour permettre aux ordinateurs d’apprendre des notions sans aucune intervention humaine. Pour ce faire, le ML utilise des algorithmes. Ces programmes s’ajustent automatiquement quand ils sont soumis à divers types d’informations en entrée.
L’entrée d’un volume important de données dans un ordinateur-étudiant constitue la quintessence même du Machine Learning. On peut naturellement se poser la question suivante : comment la machine fait-elle pour apprendre des notions par elle-même ? Il suffit simplement qu’elle consomme et emmagasine des big data. Une fois entraîné, le programme pourra par elle-même trouver des patterns dans de nouvelles données.
Cas d’utilisation normal du machine learning
La voiture autonome peut être considérée comme un bon exemple de ML. Comment comprendre qu’un véhicule se déplace tout seul sans aucun pilote ? Les voitures autonomes sont ordinairement équipées de plusieurs radars, de caméras et d’un bon capteur lidar. Ces éléments assurent plusieurs fonctions dont :
- la détermination de l’emplacement de la voiture avec précision et en permanence,
- l’analyse de la portion de route située juste en avant du véhicule autonome,
- la détection d’objets fixes ou mobiles situés sur les côtés ou sur l’arrière de la voiture.
Toutes les informations recueillies grâce aux éléments qui équipent le véhicule, sont régulièrement traitées par un ordinateur central. Cet ordinateur se trouve également dans la voiture. Il collecte, analyse le flux de données emmagasinées et les classe de façon quasi-identique aux réseaux neuronaux d’un cerveau humain. C’est l’ordinateur qui, grâce au Machine Learning, guide la voiture dans son environnement. Après avoir classé les données nécessaires, il prend plusieurs décisions par seconde (des milliers) selon les statistiques et les observations. Ainsi, il détermine le sens dans lequel il doit tourner le volant, le moment où il doit changer de vitesse, etc.
Les différentes catégories de Machine Learning qui existent
Aujourd’hui, le concept de machine learning s’est vraiment démocratisé. Il est présent dans les domaines tels que les transactions boursières, l’imagerie médicale, la sécurité des données en ligne, le référencement naturel, le marketing digital… On distingue actuellement trois catégories de ML.
L’apprentissage automatique supervisé
Le ML supervisé est une technologie élémentaire et stricte. On peut l’utiliser pour prédire des événements futurs. Techniquement, on parle de « modélisation prédictive ». L’ordinateur apprend les règles générales et peut prédire des situations ou des résultats par ses propres aptitudes. En réalité, c’est un algorithme qui essaie de développer une fonction de façon autonome avec les variables d’entrée afin de prédire avec précision la sortie. Par exemple, grâce au ML supervisé, l’ordinateur peut imaginer avec précision la valeur d’un bien immobilier. Pour ce faire, il n’aura besoin que des entrées telles que l’année de construction du bien, le nombre de pièces, l’emplacement, l’aire du terrain, etc.
Par ailleurs, dans la catégorie « ML supervisé », on peut encore dénombrer deux sous-catégories (ou types) :
- Le type « Classification » : la variable de sortie est globale (il s’agit d’une catégorie)
- Le type « Régression » : la variable de sortie ici est une valeur particulière, spécifique.
L’arbre de décision, la régression linéaire, les forêts aléatoires représentent quelques exemples d’algorithmes du ML supervisé.
L’apprentissage automatique non supervisé
Par opposition au ML supervisé, le Machine Learning non supervisé intègre un algorithme qui détermine lui-même la structure de la variable d’entrée. Cet algorithme permet de découvrir les structures cachées dans les données. L’approche du ML non supervisé est atypique et appelée « featuring learning » ou « apprentissage des caractéristiques ».
L’algorithme de reconnaissance faciale que Facebook utilise pour identifier les personnes qui se trouvent sur les photos représente un exemple de ML non supervisé. Ici aussi, on peut distinguer deux sous-catégories : Clustering et Association.
L’apprentissage automatique par renforcement
Dans le ML par renforcement, un algorithme interagit avec un environnement très dynamique pour atteindre un certain but. Par exemple, l’algorithme peut interagir avec un ensemble de données qui lui permettront de définir la manière de conduire une voiture. Le même algorithme peut permettre à la machine d’affronter un adversaire dans un jeu. En outre, on distingue aussi deux types de ML par renforcement : Monte Carlo et celui par différence temporelle (TD).
Finalement, le Machine Learning sert précisément à réaliser des analyses prédictives sur la base de données provenant du Big Data. Son but ultime est donc de rendre faciles certaines tâches que les humains accomplissent de façon récurrente.