Lemachine learningest un domaine en pleine expansion, en lien direct avec le développement des grosses bases de données. Ce terme fait référence à des méthodes d’apprentissage automatique, fondées sur des outils mathématiques, pour apprendre à partir des observations, sans modèle explicite. Il existe ainsi différents modèles pouvant permettre des approches moins contraignantes en termes d’hypothèses tout en étant efficace sur de grosses bases de données. L’apprentissage supervisé est un des grands types d’apprentissage sous-jacent aux modèles demachine learning. Les observations sont ici catégorisées, selon une variable qualitative ou continue que l’on souhaite généralement prédire. Lepreprocessingou traitement des données est également une étape incontournable dans l’utilisation de modèles de typemachine learning. Il peut permettre de choisir les paramètres de manière à minimiser l’erreur sans tomber dans le surapprentissage. L’objectif de cet article est ici d’expliciter certains termes récurrents dès qu’il est question demachine learninget de présenter quelques modèles courants de façon simplifiée afin de comparer leurs avantages vis-à-vis de méthodes statistiques plus classiques.