Séminaire Donnees et APprentissage ArtificielRSS

Attribution d'auteur : Une approche basée sur le vocabulaire spécifique


http://project.lip6.fr:8180/CMS/Seminar?id=21260
05/04/2012
Intervenant(s) : Jacques Savoy, Institut d'informatique, Université de Neuchâtel – Suisse
Dans cette présentation, nous discuterons des familles de méthodes proposées pour résoudre le problème de l’attribution d’auteur (sur la base d’un ensemble de texte écrits par des auteurs connus, peut-on déterminer l’auteur d’un nouveau document). Après un survol des diverses questions reliées à l’attribution d’auteur, nous présenterons des solutions classiques à cette question. Notre modèle s’inscrit dans cette perspective et s’appuie sur le concept de vocabulaire spécifique d’un texte ou d’une partie d’un corpus. Nous avons ainsi la possibilité de définir la spécificité lexicale d’un texte (ou d’un auteur). Ensuite nous indiquerons comment cette spécificité peut être comparée à des profils d’auteurs afin de déterminer l’auteur possible d’un texte. Afin d’évaluer notre approche nous avons conduit deux expériences sur des corpus de presse (Glasgow Herald : 5 408 articles écrit par 20 journalistes ; La Stampa : 4 326 articles rédigés par 20 auteurs). Cette expérience démontre les qualités relatives des méthodes Delta, chi-carré ou celle basée sur la divergence de Kullback-Leibler.
Plus d'informations ici
Sahar.Changuel (at) nulllip6.fr
 Mentions légales
Carte du site |