JACOB Yann

Docteur
Équipe : MLIA
Date de départ : 30/09/2013
https://lip6.fr/Yann.Jacob

Direction de recherche : Patrick GALLINARI

Co-encadrement : DENOYER Ludovic

Classification dans les graphes hétérogènes et multi-relationnels: application aux réseaux sociaux

L'émergence du Web 2.0 a vu apparaître une grande quantité de données qui peuvent naturellement se représenter sous forme de graphes complexes. Plusieurs tâches d'analyse, de prédiction et de recherche d'informations ont pour objet ces données, alors que les modèles de l'état de l'art ne sont pas adaptés à ce type d'information. Dans cette thèse, nous nous intéressons à la problématique de classification/étiquetage automatique de noeuds dans des réseaux de contenu partiellement étiquetés et complexes. Cette tâche générique trouve de nombreuses applications par exemple pour l'annotation de photos/vidéos dans les réseaux sociaux, la détection du spam sur le Web ou bien l'étiquetage de grands réseaux d'utilisateurs. L'originalité de notre travail est de se focaliser sur deux types particuliers de réseaux peu abordés dans la littérature: les graphes multi-relationnels composés de plusieurs types de relation, et les graphes hétérogènes, composés de plusieurs types de noeud, et donc de plusieurs problématiques conjointes d'étiquetage.
Dans un premier temps nous avons proposé deux nouveaux algorithmes pour l'étiquetage dans les graphes multi-relationnels. Ces algorithmes apprennent à pondérer les différents types de relation dans le processus de propagation des étiquettes selon leur utilité pour la tâche visée. Ils permettent d'apprendre à combiner les différents types de relation de manière optimale pour la classification, tout en utilisant l'information de contenu des noeuds.
Dans un second temps, nous proposons un algorithme pour l'étiquetage dans les graphes hétérogènes. Ici, une difficulté particulière demeure dans le fait que chaque type de noeud possède son propre jeu d'étiquettes: par exemple des tags visuels pour une photo et des groupes pour un utilisateur, et qu'il faut donc résoudre ces différents problèmes de classification simultanément en s'aidant de la structure du graphe. Notre algorithme est basé sur l'utilisation d'une représentation latente commune à tous les types de noeud permettant de traiter les différents types de noeud de manière uniformisée. Les résultats expérimentaux montrent que ce modèle est capable de prendre en compte les corrélations entre les étiquettes de noeuds de type différent.

Soutenance : 20/09/2013

Membres du jury :

ROSSI Fabrice (Equipe SAMM - Université Paris 1) [Rapporteur]
CHIDLOVSKII Boris (Xerox Grenoble) [Rapporteur]
SAERENS Marco (ISLM - Université Catholique de Louvain) [Rapporteur]
GUILLAUME Jean-Loup (lip6)
DENOYER Ludovic
GALLINARI Patrick

Date de départ : 30/09/2013

Publications 2011-2014

Mentions légales
Carte du site