Séminaire Donnees et APprentissage ArtificielRSS

Recherche d'information : Distribution de mots et modèles d'information


19/01/2012
Intervenant(s) : Eric Gaussier, Université Joseph Fourier (Grenoble I)
Les modèles probabilistes sont à l'heure actuelle les modèles de choix pour la recherche d'information /ad hoc/ non supervisée. Ces modèles se sont développés à partir de différents principes : ordonnancement probabiliste, modèle de langue, déviation à l'aléatoire. Nous introduisons ici une nouvelle famille de modèles qui s'inscrit dans le cadre de la déviation à l'aléatoire tout en corrigeant et simplifiant les modèles précédemment proposés dans ce cadre. Nous montrons qu'une des conditions pour que les modèles de cette famille se comportent bien est qu'ils soient fondés sur des distribution de probabilité "en rafale" (burstiness), un phénomène mis en avant de façon empirique dans diverses études sur les collections textuelles. Ces modèles établissent donc un pont naturel entre recherche d'information et distributions des mots en corpus. Nous discutons également des liens entre les distributions de probabilité en rafale et les différentes distributions à "longue" traîne (traîne grasse, longue ou lourde). Pr. Eric Gaussier did his PhD in Computer Science at both Université Paris 7 and the IBM France Scientifc Center, on probabilistic models for bilingual lexicon extraction. After having been Area Manager for Learning and Content Analysis at the Xerox Research Centre Europe, he joined the Université Joseph Fourier and the Grenoble Informatics laboratory as a Professor of Computer Science in September 2006. He is currently leading the AMA team, the research of which fits within the general framework of machine learning and information modeling. He is a member, since 2007, of the Information Sciences panel for starting grants of the European Research Council, a member, since 2005, of the Advisory Board of SIGDAT and was a member, from 2007 to 2010, of the Executive Board of the European Association for Computational Linguistics. Since 2010, he is deputy director of the Grenoble Informatics Laboratory (LIG).
Plus d'informations ici
Sahar.Changuel (at) nulllip6.fr
 Mentions légales
Carte du site |