BUFFONI David
Direction de recherche : Patrick GALLINARI
Co-encadrement : USUNIER Nicolas
Fonctions de pertes auxiliaires consistantes pour l'ordonnancement dans des tâches de Recherche d'Information
Dans l'ère technologique actuelle, gérer, contrôler et rechercher l'information est devenue une composante importante de notre vie quotidienne tout en étant un challenge crucial pour les chercheurs. Dans cette thèse, nous abordons le problème de la recherche d'objets parmi une plus grande collection, domaine appelé Recherche d'Information. Nous l'étudierons dans le contexte d'Apprentissage Statistique de Fonctions d'Ordonnancement où le but est d'apprendre une fonction de score tout en cherchant à minimiser un risque reflétant la qualité de la liste d'ordonnancement. Ce risque non-optimisable en pratique est alors substitué par un risque auxiliaire suivant la propriété de la consistance. Basés sur cette théorie, nous montrons une façon de dériver deux fonctions de coût auxiliaires consistantes et qui seront validées expérimentalement.
Ces considérations théoriques ne peuvent cependant pas être directement appliquées puisque les algorithmes d'apprentissage sont très sensibles à la qualité des données. Pour y remédier, nous nous focalisons sur les pretraitements nécessaires pour rendre les algorithmes d'apprentissage d'ordonnancement efficaces sur deux cas d'études : les problèmes de Recherche d'Information XML et de Recherche d'Information Texte-Image. Dans les deux cas, les algorithmes d'apprentissage sont dépendants de la qualité de la supervision, de l'échantillonnage des exemples d'entrainement et des caractéristiques de description extraites. Pour clore ces études, nous décrivons les expériences où nous améliorons les performances par rapport aux autres méthodes de l'état-de-l'art.
Soutenance : 04/10/2012
Membres du jury :
Mohand Boughanem -- Université Paul Sabatier -- Rapporteur
Patrick Gallinari -- Université Pierre et Marie Curie -- Directeur
Patrice Perny -- Université Pierre et Marie Curie -- Examinateur
Liva Ralaivola -- Université Aix-Marseille -- Rapporteur
Nicolas Usunier -- Université Pierre et Marie Curie -- Co-directeur
Nicolas Vayatis -- Ecole Normale Supérieure de Cachan -- Examinateur
Publications 2008-2015
-
2015
- G. Silvestre, D. Buffoni, K. Pires, S. Monnet, P. Sens : “Boosting Streaming Video Delivery with WiseReplica”, Transactions on Large-Scale Data- and Knowledge-Centered Systems, vol. XX, pp. 34-58, (Springer Berlin / Heidelberg) (2015)
-
2013
- G. Silvestre, S. Monnet, D. Buffoni, P. Sens : “Predicting Popularity and Adapting Replication of Internet Videos for High-Quality Delivery”, Parallel and Distributed Systems (ICPADS), 2013 International Conference on, Seoul, Korea, Republic of, pp. 412-419, (IEEE) (2013)
-
2012
- D. Buffoni : “Learning-to-Rank consistent surrogates for Information Retrieval tasks”, soutenance de thèse, soutenance 04/10/2012, direction de recherche Gallinari, Patrick, co-encadrement : Usunier, Nicolas (2012)
- D. Buffoni, S. Tollari, P. Gallinari : “A Learning to Rank framework applied to text-image retrieval”, Multimedia Tools and Applications, vol. 60 (1), pp. 161-180, (Springer Verlag) (2012)
-
2011
- D. Buffoni, S. Tollari, P. Gallinari : “The importance of the depth for text-image selection strategy in Learning to Rank”, European Conference on Information Retrieval (ECIR 2011), vol. 6611, Lecture Notes in Computer Science, Dublin, Ireland, pp. 743-746, (Springer) (2011)
- D. Buffoni, C. Calauzènes, P. Gallinari, N. Usunier : “Learning Scoring Functions with Order-Preserving Losses and Standardized Supervision”, The 28th International Conference on Machine Learning (ICML 2011), Bellevue, WA, United States, pp. 825-832 (2011)
- T. Truong, D. Buffoni, N. Usunier, M.‑R. Amini, P. Gallinari : “Modèles d’Ordonnancement pour le Résumé Automatique et la Recherche d’Information”, chapitre de Modèles Statistiques pour l'Accès à l'Information Textuelle, pp. 19-42, (Hermès-Lavoisier), (ISBN: 2746224976) (2011)
-
2010
- D. Buffoni, N. Usunier, P. Gallinari : “Apprentissage de fonctions d’ordonnancement par classification de paires ordonnées et pondérées (OWPC)”, Conference en Recherche d'information et Applications, CORIA 2010, Sousse, Tunisia, pp. 67-82, (ARIA) (2010)
-
2009
- D. Buffoni, N. Usunier, P. Gallinari : “LIP6 at INEX’09: OWPC for Ad Hoc Track”, 8th International Workshop of the Initiative for the Evaluation of XML Retrieval, INEX 2009, vol. 6203, Lecture Notes in Computer Science, Brisbane, Australia, pp. 59-69, (Springer) (2009)
- N. Usunier, D. Buffoni, P. Gallinari : “Ranking with ordered weighted pairwise classification”, International Conference on Machine Learning, Montreal, Quebec, Canada, pp. 1057-1064, (ACM) (2009)
- A. Trinh, D. Buffoni, P. Gallinari : “Probabilistic Multi-classifier by SVM from voting rule to voting features”, Extraction et gestion des connaissances (EGC'2009), vol. RNTI-E-15, Revue des Nouvelles Technologies de l'Information, Strasbourg, France, pp. 433-434 (2009)
-
2008
- A. Trinh, D. Buffoni, P. Gallinari : “Classifieur probabiliste avec Support Vector Machine (SVMs) et Okapi”, Actes de conference TALN08, Avignon, France, pp. 75-84 (2008)