LIP6 CNRS Sorbonne Université Tremplin Carnot Interfaces
Direct Link LIP6 » Jobs

 Thesis : Génération de résumés à partir de données structurées

SCAI PhD thesis
Les bases de données publiques ou privées se multiplient dans la société de l’information actuelle. Extraire des informations importantes pour donner rapidement une vision globale du contenu de ces tables et réussir à générer un résumé textuel correspondant à ces informations est une tâche complexe; il s’agit cependant d’un verrou critique dans de nombreuses applications allant du data-journalisme à l’analyse de données dans le monde de la finance. L’objectif de la thèse est d’automatiser à la fois l’extraction d’informations et la génération de résumés de façon à permettre une analyse large échelle et multi-sources d’informations structurées ou semi-structurées tout en modélisant finement le contexte. Le domaine scientifique du data-to-text est en plein essor, grâce aux avancées récentes permises par les architectures de deep-learning, à la fois en extraction d’informations et en génération de texte. L’enjeu est ensuite de modéliser les facteurs de contextes: en fonction des utilisateurs visés, les informations ciblées vont différer légèrement; le style du résumé peut également varier. La prise en compte des facteurs de contexte ouvre de nouvelle perspective dans le domaine de la recommandation et, plus généralement, dans le celui de l’accès personnalisé à l’information.

Mots clefs : génération du langage, données structurées, deep learning, data-to-text

Ce projet de recherche doctoral fait l’objet d’une demande de financement auprès de « Sorbonne Center for Artificial Intelligence (SCAI) », le candidat retenu par son porteur devra donc participer au concours correspondant (prévoir un dossier et une audition) en vue d’obtenir le financement effectif.

More details here

Contact :Vincent Guigue

 Mentions légales
Site map |