LIP6 CNRS Sorbonne Université Tremplin Carnot Interfaces
Direct Link LIP6 » أحـداث السـاعـة » مسجلون في الدكتوراه

DELORT Jean-Yves

دكـتور
وحـدة : MALIRE
تاريـخ المـغادرة : 30/09/2004
رئاسـة البـحث : Bernadette BOUCHON-MEUNIER
تأطـير مـشـترك : RIFQI Maria

Modèles de navigation sur le Web basés sur le contenu

Le Web est un espace d'information aux dimensions vertigineuses. Chaque jour, son contenu et sa structure évoluent et s'enrichissent sans aucun contrôle, sans obéir à aucune règle. C'est pourquoi retrouver des documents pertinents est une tâche de plus en plus difficile. L'objectif des systèmes adaptatifs de navigation (SNA) est d'assister l'utilisateur durant ses recherches d'information sur le Web. Pour y parvenir, les systèmes cherchent à déceler dans le comportement de l'utilisateur des informations sur son profil, c'est-à-dire : ses besoins, ses préférences et ses stratégies de recherche. Le principal frein à la mise en place des SNA provient du manque d'informations disponibles sur les profils. Les approches existantes s'appuient sur des caractéristiques pauvres extraites du flux d'interactions nuisant aux performances globales des SNA. L'objectif de cette thèse est d'identifier de nouvelles sources d'informations à partir desquelles des connaissances plus fiables et plus riches sur les profils puissent être inférées. Pour cela nous nous concentrons sur les signes d'intérêt implicites, les "indices". Le modèle de navigation proposé s'appuie sur la présence d'indices dans le contenu textuel des documents accédés. Les indices extraits possèdent une grande capacité descriptive des besoins courants. L'application considérée est la détection de changement dans les besoins courants d'information, les "shifts". Ces résultats montrent que les indices permettent à la fois de discriminer les besoins des utilisateurs et d'identifier un champ lexical incluant les besoins. La dernière partie introduit une nouvelle approche pour la génération automatique de documents Web. Plutôt que de réaliser des résumés à partir du contenu des documents eux-mêmes, c'est l'ensemble des contenus des documents pointant vers eux qui est utilisé. Les méthodes proposées permettent ainsi de réaliser des résumés sur des documents ne contenant aucune donnée textuelle. Les résultats obtenus par cette approche sont près de deux fois supérieurs à l'approche classique utilisant uniquement le contenu du document à résumer.
مناقـشـة مـذكـرة : 09/12/2003 - 14h - LIP6 - Site Scott - Salle C.931
أعـضاء لجنة المناقـشة :
Mme Jocelyne Nanard - Professeur, LIRMM, Université de Montpellier - Rapporteur
Mr Venturini Gilles - Professeur, Ecole Polytechnique de l'Université de Tours - Rapporteur
Mr Houssem Assadi - Chercheur, France Télécom R&D - Examinateur
Mr Gallinari Patrick - Professeur, Université Paris 6 - Examinateur
Mme Bernadette Bouchon-Meunier - Directeur de recherche, CNRS - Directeur de thèse
Mme Maria Rifqi - Maître de conférence, Université Paris 6 - Encadrante de thèse

إصدارات 2001-2003

 Mentions légales
| خـريـطـة المـوقـع