LIP6 CNRS Sorbonne Université Tremplin Carnot Interfaces
Direct Link LIP6 » News » Studenti di dottorato

LESOT Marie-Jeanne

Dottore di ricerca
Gruppo di ricerca : MALIRE
Ricercatore
Relatore : Bernadette BOUCHON-MEUNIER
Co-relazione : D'ALCHÉ-BUC Florence

Classification non supervisée pour la visualisation de données structurées et la construction de prototypes

La classification non supervisée, ou clustering, a pour objectif la décomposition d'un ensemble de données en sous-groupes homogènes et distincts, qui résument la base initiale et conduisent par là à une représentation simplifiée des données. Toutefois, il est nécessaire d'enrichir les informations brutes de cette décomposition pour aider à leur exploitation. Nous considérons dans ce but deux modes d'enrichissement, basés respectivement sur une caractérisation visuelle, qui fournit simultanément une représentation graphique des données, et une caractérisation par prototypes flous, qui se place à un niveau plus sémantique. D'une part, nous considérons la caractérisation visuelle de données structurées correspondant par exemple à des documents textuels pour lesquels une organisation hiérarchique est disponible, par le biais de titres et de sous-titres. Cette problématique est abordée dans le cadre du clustering topographique à noyau, pour lequel nous définissons un critère d'évaluation prenant en compte son double objectif. Nous proposons aussi un critère de sélection de noyau applicable dans un contexte d'apprentissage non supervisé ainsi qu'un noyau pour traiter les données textuelles précédentes. D'autre part, le clustering avec caractérisation par prototypes flous doit fournir une description interprétable de l'ensemble de données : la représentation doit permettre une mise en correspondance des groupes identifiés avec des concepts naturels utilisés intuitivement pour décrire les données. Cette tâche d'extraction de concepts descriptifs, abordée dans le cadre de la théorie des sous-ensembles flous, peut être décomposée en trois étapes principales : identification des concepts, représentation des concepts identifiés et enfin étiquetage linguistique, pour chacune desquelles nous proposons des outils, sous la forme d'un algorithme de clustering, une méthode de construction de prototypes et des coefficients d'exceptionnalité.
Difesa : 01/31/2005 - 14h00 - Site Scott - salle C.931
Membri della commissione :
Florence d'Alché-Buc (professeur, Université Evry-Val d'Essonne), directrice de thèse
Bernadette Bouchon-Meunier (directrice de recherche, CNRS), directrice de thèse
Carl Frélicot (professeur, Université La Rochelle), rapporteur
Hélène Paugam-Moisy (professeur, Université Lyon II), rapportrice
Patrice Perny (professeur, Université Paris VI), examinateur
Michèle Sebag (directrice de recherche, CNRS), examinatrice

4 Studenti di dottorato (Relatore / Co-relazione)

  • FACI Adam : Inductive learning from conceptual graphs
  • LAUGEL Thibault : Interpretability for human-friendly machine learning models
  • LENART Marcin : From data to information management framework for reliable decision aid systems
  • PANTIN Jérémie : Model optimization for natural language processing tasks

9 Dottore di ricerca 2011 - 2019

Pubblicazioni 2001-2019

 Mentions légales
Mappa del sito |