HADOUX Emmanuel
Direction de recherche : Nicolas MAUDET
Co-encadrement : BEYNIER Aurélie, WENG Paul
Décision séquentielle markovienne en environnements non-stationnaires : application aux débats d?argumentation
Les problèmes de décision séquentielle dans l’incertain requièrent qu’un agent prenne des décisions, les unes après les autres, en fonction de l’état de l’environnement dans lequel il se trouve. Dans la plupart des travaux, l’environnement dans lequel évolue l’agent est supposé stationnaire, c’est-à-dire qu’il n’évolue pas avec le temps. Toutefois, l’hypothèse de stationnarité peut ne pas être vérifiée quand, par exemple, des évènements exogènes au problème interviennent. Dans cette thèse, nous nous intéressons à la prise de décision séquentielle dans des environnement non-stationnaires. Nous proposons un nouveau modèle appelé HS3MDP permettant de représenter les problèmes non-stationnaires dont les dynamiques évoluent parmi un ensemble fini de contextes. Afin de résoudre efficacement ces problèmes, nous adaptons l’algorithme POMCP aux HS3MDP. Dans le but d’apprendre les dynamiques des problèmes de cette classe, nous présentons RLCD avec SCD, une méthode utilisable sans connaître à priori le nombre de contextes. Nous explorons ensuite le domaine de l’argumentation où peu de travaux se sont intéressés à la décision séquentielle. Nous étudions deux types de problèmes : les débats stochastiques (APS ) et les problèmes de médiation face à des agents non-stationnaires (DMP). Nous présentons dans ce travail un modèle formalisant les APS et permettant de les transformer en MOMDP afin d’optimiser la séquence d’arguments d’un des agents du débat. Nous étendons cette modélisation aux DMP afin de permettre à un médiateur de répartir stratégiquement la parole dans un débat.
Soutenance : 26/11/2015
Membres du jury :
M. Yann Chevaleyre, LIPN, Univ Paris 13 [Rapporteur]
M. Pierre Marquis, CRIL, Univ Artois [Rapporteur]
Mme. Leila Amgoud (Examinatrice) IRIT
M. Olivier Buffet, LORIA/INRIA
M. Patrice Perny (Examinateur) LIP6, Univ Paris 6
M. Nicolas Maudet, LIP6, Univ Paris 6
Mme. Aurélie Beynier, LIP6, Univ Paris 6
M. Paul Weng, SYSU-CMU, Carnegie Mellon
M. Anthony Hunter (Invité) UCL
Publications 2013-2018
-
2018
- E. Hadoux, A. Beynier, N. Maudet, P. Weng : “Mediation of Debates with Dynamic Argumentative Behaviors”, Computational Models of Argument, vol. 305, Frontiers in Artificial Intelligence and Applications, Warsaw, Poland, pp. 249-256 (2018)
-
2015
- E. Hadoux : “Décision séquentielle markovienne en environnements non-stationnaires : application aux débats d?argumentation”, thèse, soutenance 26/11/2015, direction de recherche Maudet, Nicolas, co-encadrement : Beynier, Aurélie, Weng, Paul (2015)
- E. Hadoux, A. Beynier, N. Maudet, P. Weng, A. Hunter : “Optimization of Probabilistic Argumentation With Markov Decision Models”, International Joint Conference on Artificial Intelligence, Buenos Aires, Argentina (2015)
-
2014
- E. Hadoux, A. Beynier, P. Weng : “Sequential Decision-Making under Non-stationary Environments via Sequential Change-point Detection”, Learning over Multiple Contexts (LMCE), Nancy, France (2014)
- E. Hadoux, A. Beynier, P. Weng : “Solving Hidden-Semi-Markov-Mode Markov Decision Problems”, AAMAS Workshop Adaptative Learning Agents, ALA 2014, Paris, France (2014)
- E. Hadoux, A. Beynier, P. Weng : “Prise de décision séquentielle en environnements incertains et non stationnaires”, ROADEF - 15e congrès annuel de la Société française de recherche opérationnelle et d'aide à la décision, Bordeaux, France (2014)
- E. Hadoux, A. Beynier, P. Weng : “Solving Hidden-Semi-Markov-Mode Markov Decision Problems”, Scalable Uncertainty Management, vol. 8720, Lecture Notes in Computer Science, Oxford, United Kingdom, pp. 176-189, (Springer International Publishing) (2014)
-
2013
- E. Hadoux, A. Beynier, P. Weng : “Apprentissage de politique par minimisation de regret”, 14e Congrès de la Société Française de Recherche Opérationnelle et d'Aide à la Décision (ROADEF 2013), Troyes, France (2013)