LAW Marc
Direction de recherche : Matthieu CORD
Co-encadrement : GANÇARSKI Stéphane
Apprentissage de distance pour la comparaison d'images et de pages Web
Cette thèse se focalise sur l'apprentissage de distance pour la comparaison d'images ou de pages Web. Les distances (ou métriques) sont exploitées dans divers contextes de l'apprentissage automatique et de la vision artificielle tels que la recherche des k plus proches voisins, le partitionnement, les machines à vecteurs de support, la recherche d'information/images, la visualisation etc. Nous nous intéressons dans cette thèse à l'apprentissage de fonction de distance paramétrée par une matrice symétrique semi-définie positive. Ce modèle, appelé (par abus) apprentissage de distance de Mahalanobis, consiste à apprendre une transformation linéaire des données telle que la distance euclidienne dans l'espace projeté appris satisfasse les contraintes d'apprentissage.
Premièrement, nous proposons une méthode basée sur la comparaison de distances relatives qui prend en compte des relations riches entre les données, et exploite des similarités entre quadruplets d'exemples. Nous appliquons cette méthode aux attributs relatifs et à la classification hiérarchique d'images.
Deuxièmement, nous proposons une nouvelle méthode de régularisation qui permet de contrôler le rang de la matrice apprise, limitant ainsi le nombre de paramètres indépendants appris et le sur-apprentissage. Nous montrons l'intérêt de notre méthode sur des bases synthétiques et réelles d'identification de visage.
Enfin, nous proposons une nouvelle méthode de détection automatique de changement dans les pages Web, dans un contexte d'archivage. Pour cela, nous utilisons les relations de distance temporelle entre différentes versions d'une même page Web. La métrique apprise de façon entièrement non supervisée détecte les régions d'intérêt de la page et ignore le contenu non informatif tel que les menus et publicités. Nous montrons l'intérêt de la méthode sur différents sites Web.
Soutenance : 20/01/2015
Membres du jury :
Patrick Pérez, Technicolor (Rennes), Rapporteur
Alain Rakotomamonjy, Université de Rouen (Rouen), Rapporteur
Francis Bach, Inria - Ecole Normale Supérieure (Paris), Examinateur
Patrick Gallinari, UPMC (Paris), Examinateur
Jean Ponce, Ecole Normale Supérieure (Paris), Examinateur
Frédéric Précioso, Polytech'Nice-Sophia, Examinateur
Matthieu Cord, UPMC (Paris), Directeur de thèse
Stéphane Gançarski, UPMC (Paris), Co-directeur de thèse
Nicolas Thome, UPMC (Paris), Invité
Publications 2012-2016
-
2016
- Marc T. Law, N. Thome, M. Cord : “Learning a Distance Metric from Relative Comparisons between Quadruplets of Images”, International Journal of Computer Vision, pp. 1-30, (Springer Verlag) (2016)
-
2015
- M. Law : “Apprentissage de distance pour la comparaison d’images et de pages Web”, thèse, soutenance 20/01/2015, direction de recherche Cord, Matthieu, co-encadrement : Gançarski, Stéphane (2015)
- M. Law, N. Thome, S. Gançarski, M. Cord : “Apprentissage de métrique appliqué à la détection de changement de page Web et aux attributs relatifs”, CORIA 2015 - Conférence en Recherche d'Infomations et Applications - 12th French Information Retrieval Conference, Paris, France (2015)
-
2014
- M. Law, N. Thome, M. Cord : “Fantope Regularization in Metric Learning”, IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Columbus, Ohio, United States, pp. 1051-1058 (2014)
- M. Law, N. Thome, M. Cord : “Bag-of-Words Image Representation: Key Ideas and Further Insight”, chapter in Fusion in Computer Vision - Understanding Complex Visual Content, Advances in Computer Vision and Pattern Recognition, pp. 29-52, (Springer) (2014)
-
2013
- M. Law, N. Thome, M. Cord : “Quadruplet-Wise Image Similarity Learning”, IEEE International Conference on Computer Vision (ICCV), Sydney, Australia, pp. 249-256 (2013)
-
2012
- M. Law, N. Thome, M. Cord : “Hybrid Pooling Fusion in the BoW Pipeline”, ECCV 2012 Workshop on Information fusion in Computer Vision for Concept Recognition (ECCV-IFCVCR 2012), vol. 7585, Lecture Notes in Computer Science, Florence, Italy, pp. 355-364, (Springer) (2012)
- M. Law, N. Thome, S. Gançarski, M. Cord : “Structural and Visual Comparisons for Web Page Archiving”, 12th edition of the ACM Symposium on Document Engineering, DocEng'12, Paris, France, pp. 117-120, (ACM) (2012)
- M. Law, C. Sureda Gutierrez, N. Thome, S. Gançarski, M. Cord : “Structural and Visual Similarity Learning for Web Page Archiving”, 10th workshop on Content-Based Multimedia Indexing (CBMI), Annecy, France, pp. 1-6, (IEEE) (2012)