Séminaire Donnees et APprentissage ArtificielRSS

Apprentissage de représentations de documents liés

12/09/2019
Intervenant(s) : Adrien Guille (ERIC)
L'apprentissage de représentations de documents liés consiste à plonger un corpus structuré dans un espace vectoriel de faible dimension, en prenant en compte à la fois l'information textuelle et l'information structurelle. Au cours de cet exposé, je présenterai des travaux récents à ce sujet, menés au sein de l'équipe DMD du laboratoire ERIC. Premièrement, je présenterai une méthode pour apprendre conjointement des représentations orientées texte, et des représentations orientées structure (Brochier, Guille & Velcin, WWW 2019). J'illustrerai l'intérêt de telles représentations d'un point de vue qualitatif, à travers une tâche de suggestion de mots-clés. Deuxièmement, je présenterai une nouvelle méthode, sans hyperparamètre et basée sur un algorithme d'estimation efficace, qui rend son utilisation particulièrement pratique (Guille & Gourru, soumis). Je démontrerai empiriquement, d'un point de vue quantitatif, la pertinence de cette méthode, tant en classification de documents qu'en prédiction de liens.
**Bio**
Adrien Guille est Maître de Conférences en informatique à l'Université Lumière Lyon 2 depuis 2016, membre de l'équipe Data Mining & Decision du laboratoire ERIC. Ses travaux de recherche émannent de problématiques concrètes liées à la production textuelle sur le Web. Après s'être intéressé durant son doctorat aux médias sociaux et à la manière dont ceux-ci réagissent aux évènements (hors ligne) et propagent l'information en leur sein, il s'intéresse désormais à l'apprentissage de représentations de documents tirés du Web à des fins de classification, recommandation, etc. en lien avec des partenaires industriels (e.g. DM2 digital marketing, MeetSys, Peer.Us).
_Plus d'information sur Adrien Guille :_

Plus d'informations ici …
benjamin.piwowarski (at) nulllip6.fr
Mentions légales
Carte du site