JACOB Yann
Direction de recherche : Patrick GALLINARI
Co-encadrement : DENOYER Ludovic
Classification dans les graphes hétérogènes et multi-relationnels: application aux réseaux sociaux
L'émergence du Web 2.0 a vu apparaître une grande quantité de données qui peuvent naturellement se représenter sous forme de graphes complexes. Plusieurs tâches d'analyse, de prédiction et de recherche d'informations ont pour objet ces données, alors que les modèles de l'état de l'art ne sont pas adaptés à ce type d'information. Dans cette thèse, nous nous intéressons à la problématique de classification/étiquetage automatique de noeuds dans des réseaux de contenu partiellement étiquetés et complexes. Cette tâche générique trouve de nombreuses applications par exemple pour l'annotation de photos/vidéos dans les réseaux sociaux, la détection du spam sur le Web ou bien l'étiquetage de grands réseaux d'utilisateurs. L'originalité de notre travail est de se focaliser sur deux types particuliers de réseaux peu abordés dans la littérature: les graphes multi-relationnels composés de plusieurs types de relation, et les graphes hétérogènes, composés de plusieurs types de noeud, et donc de plusieurs problématiques conjointes d'étiquetage.
Dans un premier temps nous avons proposé deux nouveaux algorithmes pour l'étiquetage dans les graphes multi-relationnels. Ces algorithmes apprennent à pondérer les différents types de relation dans le processus de propagation des étiquettes selon leur utilité pour la tâche visée. Ils permettent d'apprendre à combiner les différents types de relation de manière optimale pour la classification, tout en utilisant l'information de contenu des noeuds.
Dans un second temps, nous proposons un algorithme pour l'étiquetage dans les graphes hétérogènes. Ici, une difficulté particulière demeure dans le fait que chaque type de noeud possède son propre jeu d'étiquettes: par exemple des tags visuels pour une photo et des groupes pour un utilisateur, et qu'il faut donc résoudre ces différents problèmes de classification simultanément en s'aidant de la structure du graphe. Notre algorithme est basé sur l'utilisation d'une représentation latente commune à tous les types de noeud permettant de traiter les différents types de noeud de manière uniformisée. Les résultats expérimentaux montrent que ce modèle est capable de prendre en compte les corrélations entre les étiquettes de noeuds de type différent.
Soutenance : 20/09/2013
Membres du jury :
ROSSI Fabrice (Equipe SAMM - Université Paris 1) [Rapporteur]
CHIDLOVSKII Boris (Xerox Grenoble) [Rapporteur]
SAERENS Marco (ISLM - Université Catholique de Louvain) [Rapporteur]
GUILLAUME Jean-Loup (lip6)
DENOYER Ludovic
GALLINARI Patrick
Publications 2011-2014
-
2014
- Y. Jacob, L. Denoyer, P. Gallinari : “Learning latent representations of nodes for classifying in heterogeneous social networks”, The 7th ACM international conference on Web search and data mining, New York City, United States, pp. 373-382 (2014)
-
2013
- Y. Jacob : “Classification dans les graphes hétérogènes et multi-relationnels: application aux réseaux sociaux”, thèse, soutenance 20/09/2013, direction de recherche Gallinari, Patrick, co-encadrement : Denoyer, Ludovic (2013)
- Y. Jacob, L. Denoyer, P. Gallinari : “Classification dans les graphes hétérogénes basée sur une représentation latente des noeuds”, CORIA 2013, Neuchâtel, Switzerland, pp. 85-100 (2013)
-
2012
- S. Peters, Y. Jacob, L. Denoyer, P. Gallinari : “Iterative Multi-Label Multi-Relational Classification Algorithm for Complex Social Networks”, Social Network Analysis and Mining, vol. 2 (1), pp. 17-29, (Springer) (2012)
- Y. Jacob, L. Denoyer, P. Gallinari : “Apprentissage automatique de la propagation des étiquettes dans les réseaux sociaux multirelationnels”, Document numérique - Revue des sciences et technologies de l'information. Série Document numérique, vol. 15 (1), pp. 79-99, (Hermès) (2012)
-
2011
- Y. Jacob, L. Denoyer, P. Gallinari : “Classification and Annotation in Social Corpora using Multiple Relations”, the 20th ACM international conference on Information and knowledge management , CIKM'11, Glasgow, United Kingdom, pp. 1215-1220, (ACM) (2011)
- Y. Jacob, L. Denoyer, P. Gallinari : “Apprentissage des schemas de propagation dans les multi-graphes”, COnférence en Recherche d'Infomations et Applications - CORIA 2011, Avignon, France, pp. 159-174 (2011)