Annuaire

LÉON Aurélia

Doctorante à Sorbonne Université
Équipe : MLIA

Direction de recherche : Ludovic DENOYER

Apprentissage séquentiel budgétisé pour la classification extrême et la découverte de hiérarchie en apprentissage par renforcement

Cette thèse s’intéresse à la notion de budget pour étudier des problèmes de complexité (complexité en calculs, tâche complexe pour un agent, ou complexité due à une faible quantité de données). En effet, l’objectif principal des techniques actuelles en apprentissage statistique est généralement d’obtenir les meilleures performances possibles, sans se soucier du coût de la tâche. La notion de budget permet de prendre en compte ce paramètre tout en conservant de bonnes performances.

Nous nous concentrons d’abord sur des problèmes de classification en grand nombre de classes : la complexité en calcul des algorithmes peut être réduite grâce à l’utilisation d’arbres de décision (ici appris grâce à des techniques d’apprentissage par renforcement budgétisées) ou à l’association de chaque classe à un code (binaire). Nous nous intéressons ensuite aux problèmes d’apprentissage par renforcement et à la découverte d’une hiérarchie qui décompose une tâche en plusieurs tâches plus simples, afin de faciliter l’apprentissage et la généralisation. Cette découverte se fait ici en réduisant l’effort cognitif de l’agent (considéré dans ce travail comme équivalent à la récupération et à l’utilisation d’une observation supplémentaire). Enfin, nous abordons des problèmes de compréhension et de génération d’instructions en langage naturel, où les données sont disponibles en faible quantité : nous testons dans ce but l’utilisation jointe d’un agent qui comprend et d’un agent qui génère les instructions.

Soutenance : 10/05/2019

Membres du jury :

M. Jeremie Mary, Criteo [rapporteur]
Mme. Cecile Capponi, Aix-Marseille Université - LIS [rapporteuse]
Mme. Aurélie Beynier, Sorbonne Université - LIP6
M. Stéphane Doncieux, Sorbonne Université - ISIR
M. Yves Grandvalet, Université de Technologie de Compiègne, Heudiasyc
M. Ludovic Denoyer, Facebook

Date de départ : 31/05/2019

Publications 2015-2019

Toutes Communications Soutenance de thèse

2019
- A. Léon : “Apprentissage séquentiel budgétisé pour la classification extrême et la découverte de hiérarchie en apprentissage par renforcement”, soutenance de thèse, soutenance 10/05/2019, direction de recherche Denoyer, Ludovic (2019)
2016
- A. Léon, L. Denoyer : “Policy-gradient methods for Decision Trees”, ESANN - European Symposium on Artificial Neural Networks, Computational Intelligence and Machine Learning, Unknown, Belgium (2016)
2015
- A. Léon, L. Denoyer : “Reinforced Decision Trees”, European Workshop on Reinforcement Learning - EWRL, Unknown, (2015)