LIP6 CNRS Sorbonne Université Tremplin Carnot Interfaces
Direct Link LIP6 » 新闻 » 在读博士

LESOT Marie-Jeanne

毕业博士
科研组 : MALIRE
讲师
责任导师 : Bernadette BOUCHON-MEUNIER
助理责任导师 : D'ALCHÉ-BUC Florence

Classification non supervisée pour la visualisation de données structurées et la construction de prototypes

La classification non supervisée, ou clustering, a pour objectif la décomposition d'un ensemble de données en sous-groupes homogènes et distincts, qui résument la base initiale et conduisent par là à une représentation simplifiée des données. Toutefois, il est nécessaire d'enrichir les informations brutes de cette décomposition pour aider à leur exploitation. Nous considérons dans ce but deux modes d'enrichissement, basés respectivement sur une caractérisation visuelle, qui fournit simultanément une représentation graphique des données, et une caractérisation par prototypes flous, qui se place à un niveau plus sémantique. D'une part, nous considérons la caractérisation visuelle de données structurées correspondant par exemple à des documents textuels pour lesquels une organisation hiérarchique est disponible, par le biais de titres et de sous-titres. Cette problématique est abordée dans le cadre du clustering topographique à noyau, pour lequel nous définissons un critère d'évaluation prenant en compte son double objectif. Nous proposons aussi un critère de sélection de noyau applicable dans un contexte d'apprentissage non supervisé ainsi qu'un noyau pour traiter les données textuelles précédentes. D'autre part, le clustering avec caractérisation par prototypes flous doit fournir une description interprétable de l'ensemble de données : la représentation doit permettre une mise en correspondance des groupes identifiés avec des concepts naturels utilisés intuitivement pour décrire les données. Cette tâche d'extraction de concepts descriptifs, abordée dans le cadre de la théorie des sous-ensembles flous, peut être décomposée en trois étapes principales : identification des concepts, représentation des concepts identifiés et enfin étiquetage linguistique, pour chacune desquelles nous proposons des outils, sous la forme d'un algorithme de clustering, une méthode de construction de prototypes et des coefficients d'exceptionnalité.
答辩 : 2005-1-31 - 14h00 - Site Scott - salle C.931
评委会 :
Florence d'Alché-Buc (professeur, Université Evry-Val d'Essonne), directrice de thèse
Bernadette Bouchon-Meunier (directrice de recherche, CNRS), directrice de thèse
Carl Frélicot (professeur, Université La Rochelle), rapporteur
Hélène Paugam-Moisy (professeur, Université Lyon II), rapportrice
Patrice Perny (professeur, Université Paris VI), examinateur
Michèle Sebag (directrice de recherche, CNRS), examinatrice

4 在读博士 (责任导师 / 助理责任导师)

  • FACI Adam : Inductive learning from conceptual graphs
  • LAUGEL Thibault : Interpretability for human-friendly machine learning models
  • LENART Marcin : From data to information management framework for reliable decision aid systems
  • PANTIN Jérémie : Model optimization for natural language processing tasks

9 毕业博士 2011 - 2019

2001-2019 刊物

 Mentions légales
网站导航 |