LESOT Marie-Jeanne

ongoing PhD project at Sorbonne University
Team : MALIRE
https://lip6.fr/Marie-Jeanne.Lesot

Supervision : Bernadette BOUCHON-MEUNIER

Co-supervision : D'ALCHÉ-BUC Florence

Classification non supervisée pour la visualisation de données structurées et la construction de prototypes

La classification non supervisĂ©e, ou clustering, a pour objectif la dĂ©composition d'un ensemble de donnĂ©es en sous-groupes homogĂšnes et distincts, qui rĂ©sument la base initiale et conduisent par lĂ  Ă  une reprĂ©sentation simplifiĂ©e des donnĂ©es. Toutefois, il est nĂ©cessaire d'enrichir les informations brutes de cette dĂ©composition pour aider Ă  leur exploitation. Nous considĂ©rons dans ce but deux modes d'enrichissement, basĂ©s respectivement sur une caractĂ©risation visuelle, qui fournit simultanĂ©ment une reprĂ©sentation graphique des donnĂ©es, et une caractĂ©risation par prototypes flous, qui se place Ă  un niveau plus sĂ©mantique. D'une part, nous considĂ©rons la caractĂ©risation visuelle de donnĂ©es structurĂ©es correspondant par exemple Ă  des documents textuels pour lesquels une organisation hiĂ©rarchique est disponible, par le biais de titres et de sous-titres. Cette problĂ©matique est abordĂ©e dans le cadre du clustering topographique Ă  noyau, pour lequel nous dĂ©finissons un critĂšre d'Ă©valuation prenant en compte son double objectif. Nous proposons aussi un critĂšre de sĂ©lection de noyau applicable dans un contexte d'apprentissage non supervisĂ© ainsi qu'un noyau pour traiter les donnĂ©es textuelles prĂ©cĂ©dentes. D'autre part, le clustering avec caractĂ©risation par prototypes flous doit fournir une description interprĂ©table de l'ensemble de donnĂ©es : la reprĂ©sentation doit permettre une mise en correspondance des groupes identifiĂ©s avec des concepts naturels utilisĂ©s intuitivement pour dĂ©crire les donnĂ©es. Cette tĂąche d'extraction de concepts descriptifs, abordĂ©e dans le cadre de la thĂ©orie des sous-ensembles flous, peut ĂȘtre dĂ©composĂ©e en trois Ă©tapes principales : identification des concepts, reprĂ©sentation des concepts identifiĂ©s et enfin Ă©tiquetage linguistique, pour chacune desquelles nous proposons des outils, sous la forme d'un algorithme de clustering, une mĂ©thode de construction de prototypes et des coefficients d'exceptionnalitĂ©.

Defence : 01/31/2005

Jury members :

Florence d'Alché-Buc (professeur, Université Evry-Val d'Essonne), directrice de thèse
Bernadette Bouchon-Meunier (directrice de recherche, CNRS), directrice de thèse
Carl Frélicot (professeur, Université La Rochelle), rapporteur
Hélène Paugam-Moisy (professeur, Université Lyon II), rapportrice
Patrice Perny (professeur, Université Paris VI), examinateur
Michèle Sebag (directrice de recherche, CNRS), examinatrice

Full Professor

4 ongoing PhD projects at Sorbonne University (Supervision / Co-supervision)

  • BHAN Milan : Generation of counterfactual texts.
  • FAN Chunyang : Apprentissage de mesure de similaritĂ© pour le transfert analogique.
  • GERVOIS Guillaume : Qualification et quantification du Bien et du Mal dans un modĂšle de raisonnement Ă©thique.
  • MUNRO Yann : Abstract argumentation and actual causality for the generation of explanations in the context of human-agent interaction.

14 completed PhD projects (2011 - 2024) at Sorbonne University

  • 2024
    • JEYASOTHY Adulam : InterprĂ©tabilitĂ© des modĂšles en apprentissage automatique.
  • 2023
    • BOVE Clara : Conception et Ă©valuation d’interfaces utilisateur explicatives pour systĂšmes complexes en apprentissage automatique.
  • 2022
    • FACI Adam : ReprĂ©sentation, simulation et exploitation de connaissances dans le formalisme des graphes conceptuels.
  • 2020
    • LENART Marcin : QualitĂ© des donnĂ©es et de l'information pour systĂšmes d'aide Ă  la dĂ©cision.
    • LAUGEL Thibault : InterprĂ©tabilitĂ© Locale Post-hoc des modĂšles de classification «boĂźtes noires».
  • 2019
    • GUILLON Arthur : OpĂ©rateurs de rĂ©gularisation pour le subspace clustering flou.
  • 2017
    • CANU MaĂ«l : DĂ©tection de communautĂ©s orientĂ©e sommet pour rĂ©seaux mobiles opportunistes sociaux.
    • LEGASTELOIS BĂ©nĂ©dicte : Extension pondĂ©rĂ©e des logiques modales dans le cadre des croyances graduelles.
    • LEFORT SĂ©bastien : «How much is ‘about’?» ModĂ©lisation computationnelle de l’interprĂ©tation cognitive des expressions numĂ©riques approximatives.
  • 2016
    • MOYSE Gilles : RĂ©sumĂ©s linguistiques de donnĂ©es numĂ©riques : interprĂ©tabilitĂ© et pĂ©riodicitĂ© de sĂ©ries.
  • 2014
    • OUDNI Amal : Fouille de donnĂ©es par extraction de motifs graduels : contextualisation et enrichissement.
  • 2013
    • DZOGANG Fabon : ReprĂ©sentation et apprentissage Ă  partir de textes pour des informations Ă©motionnelles et pour des informations dynamiques.
  • 2011
    • FENG Haifeng : Etudes des liens entre couleurs et Ă©motions Ă  partir des annotations spontanĂ©es d'images.
    • NEL François : Suivi des mouvements informationnels : construction, modĂ©lisation et simulation de graphes de citations, application Ă  la dĂ©tection de buzz.

2001-2024 Publications