Chargement...

 

Le Machine Learning: quésaco?

De gros volumes de données semi-structurés ne peuvent souvent pas être analysés à l'aide d'un simple tableur Excel et de diagrammes de dispersion. De nouvelles approches sont alors nécessaires pour gérer la complexité et le volume de ces nouveaux ensembles de données. Même avec des ensembles de données plus traditionnels, utiliser une simple régression linéaire conduit généralement à un surapprentissage voir à des résultats incohérents. Les méthodes issues du Machine Learning peuvent ainsi être utilisé aussi bien pour analyser les Big Data que des ensembles de données plus traditionnels.

Il ne fait aucun doute que les techniques issues du Machine Learning ont donné récemment des résultats spectaculaires lorsqu'appliquées à des problèmes tels que la reconnaissance d'images et de formes, le traitement du langage naturel (NLP) et l'automatisation de tâches complexes telles que la conduite automobile.

Notons tout d'abord qu'automatiser des tâches complexes ne veut pas dire faire du Machine Learning. Il est tout à fait possible de programmer un ordinateur pour réaliser des opérations basées sur un ensemble fixe de règles plus ou moins complexes. Néanmoins, la première fois que le programme rencontrera une situation ne pouvant pas être résolu par l'applications d'une ou plusieurs de ces régles, le programme s'arrêtera.

Un programme de type Machine Learning reçoit généralement à la fois des données en entrée et des données en sortie. Ces données de sortie, fournies par le programmeur, représentent la conséquence attendue de l'application du programme sur les données fournies en entrée. Le programme cherche alors à découvrir de lui-même les liens existant entre les données d'entrée et de sortie. Le succès de cette tâche d'apprentissage est ensuite évalué en fournissant au programme en entrée un échantillon de données pour lequel le programmeur connait le résultat souhaité et rien en sortie. La qualité des données produite en sortie permet au programmeur d'évaluer la capacité du programme à aboutir à des conclusions à partir de situations encore inconnues.

Les algorithmes de Machine Learning sont généralement divisé en deux familles: les algorithmes dit supervisés et ceux dit non-supervisés. Pour les algorithmes de type supervisé, le programme essaye de trouver une règle, une "équation", pouvant être utilisée pour prédire une variable. Dans les algorithmes de type non-supervisé, le programme essaye de comprendre la structure sous-tendant un semble de données. Enfin, le Deep Learning est une méthode d'apprentissage automatique consistant à analyser des données par couches successives d'apprentissage. Par exemple, l'algorithme pourra commencer par apprendre des concepts simples puis cherchera à combiner ceux-ci pour développer des concepts plus complexes voir des notions abstraites.

Pour terminer, le but de l'automatisation de tâches est généralement d'être en mesure de faire effectuer par la machine des tâches faciles à définir mais fastidieuses à réaliser. L'objectif du Deep Learning est, lui, d'être en mesure de faire effectuer par la machine des tâches difficiles à décrire mais faciles à réaliser. Le Deep Learning est dans son essence plus semblable à la façon dont les Hommes apprennent, et est donc une véritable tentative de recréer artificiellement l'intelligence humaine.