Le stage a
pour but d'introduire les principaux concepts de l'apprentissage
statistique, domaine clef de l'intelligence artificielle
d'aujourd'hui en s'appuyant sur la résolution de problèmes de
classification supervisée. En partant d'un problème réel
(classification de documents), nous présenterons l'apprentissage
sous l'angle d'une modélisation probabiliste et statistique. Nous
évoquerons les questions de représentation des données, choix des
modèles et choix de métriques d'évaluation. Puis nous nous
intéresserons au ressort commun à différents algorithmes
d'apprentissage, la descente de gradient. Nous évoquerons enfin
très rapidement les points difficiles et les défis qui se posent
lors de l'utilisation de ces outils. Deux séances pratiques en
Python ponctueront la journée : l'une portant sur un problème
"jouet" en deux dimensions pour maîtriser la compréhension du
modèle et de l'algorithme. La deuxième portera sur la résolution
effective du problème posé en début de journée. L'outil
Scikit-Learn sera employé.