KAMIENNY Pierre-Alexandre

PhD student
Team : MLIA
Arrival date : 10/01/2020
    Sorbonne Université - LIP6
    Boîte courrier 169
    Couloir 26-00, Étage 5, Bureau 534
    4 place Jussieu
    75252 PARIS CEDEX 05
    FRANCE

Tel: +33 1 44 27 39 44, Pierre-Alexandre.Kamienny (at) nulllip6.fr
https://lip6.fr/Pierre-Alexandre.Kamienny

Supervision : Patrick GALLINARI

Co-supervision : LAMPRIER Sylvain (LIP6)

Apprentissage par renforcement en ligne dans les environnements non-stationnaires

Les applications de l’apprentissage par renforcement interviennent dans un monde large- ment non-stationnaire (e.g capteurs imparfaits, conditions météoroligiques changeantes, présence d’autres agents aux multiples comportements, etc.). Il est donc nécessaire d’apprendre des poli- tiques capables de s’adapter aux changements de dynamique de l’environnement. Cependant, les algorithmes classiques font l’hypothèse de stationnarité, et ne sont donc pas adaptés pour traiter ce type de problème. Les principales méthodes ont été développées dans le cadre des bandits manchots et très peu de travaux ne permettent le traitement de problèmes à grande échelle (espace d’actions et d’états continus, en grande dimension). La thèse s’intéresse donc à l’étude de nouveaux modèles profonds capable de détecter les changements de dynamique de l’environnement et de s’y adapter rapidement.