Séminaire Donnees et APprentissage ArtificielRSS

Fouille textuelle et visuelle: innovations et transfert industriel


23/03/2017
Intervenant(s) : Hervé Le Borgne (CEA LIST), Benjamin Labbe (CEA LIST)
Un premier volet concerne les activités scientifiques à travers deux travaux publiés récemment. Le premier [1,2] concerne la représentation des textes et des images dans des espaces communs de représentation, qui peut être utile pour de nombreuses applications telles que la génération automatique de légendes, l'illustration automatique d'un texte ou encore la recherche d'images à partir d'une requête en langage naturel. Nous présenterons divers principes permettant leur fabrication puis présenterons certains biais de représentations qui y ont été identifiés. Le second travail [3] présenté concerne le transfert d'apprentissage de réseaux convolutifs (CNN). Nous abordons la question de l'universalité des la représentation dans un tel contexte. Nous proposons un schéma d'apprentissage des CNN qui permet d'améliorer significativement cette universalité, en intégrant simplement les niveaux d'apprentissage de la catégorisation humaine. Un second volet de le présentation abordera les activités "de transfert technologique" de l'équipe, au travers de deux applications vers des industriels. Au delà des technologies proprement dites, nous parlerons des difficultés rencontrées et du dimensionnement des problèmes et systèmes manipulés.
[1] T. Q. N. Tran, H. Le Borgne, M. Crucianu, Aggregating Image and Text Quantized Correlated Components, CVPR 2016.
[2] T. Q. N. Tran, H. Le Borgne, M. Crucianu, Cross-modal Classification by Completing Unimodal Representations, ACM Multimedia 2016 Workshop: Vision and Language Integration Meets Multimedia Fusion.
[3] Tamaazousti Y., Le Borgne H., et Hudelot C. MuCaLe-Net: MultiCategorical-Level Networks to Generate More Discriminating Features. CVPR 2017.
**Bio**
Hervé Le Borgne is a researcher at the CEA LIST since 2006, carrying out research on computer vision and multimedia retrieval. Previously, he received his PhD from the INP Grenoble in 2004 and worked as a post-doc at Dublin City university from 2004 to 2006. He published more than 50 articles in international conferences and journals. His research interests include multimedia retrieval, computer vision, machine learning and more generally multimedia mining in order to extract semantic. He has served as a reviewer for several international conferences and journals, including Computer Vision and Image Understanding and Multimedia Tools and Applications. He has been a project manager since 2006, both for public funded projects and industrial contracts. He supervised 15 master students and co-advised one PhD in collaboration with Ecole Centrale Paris. Currently, he co-advises two PhD students, in collaboration with CNAM and Ecole Centrale Paris.
_Plus d'information sur Hervé Le Borgne : _
**Bio**
Benjamin Labbé is a researcher at the CEA LIST since 2011, carrying out transfer of technology and research on computer vision and multimedia retrieval. He received his PhD in computer science from the INSA Rouen in 2011. His research interests include first of all machine learning since its PhD to design multiclass and novelty detecting support vector machines in the context of naval infrared defensive systems. Then his research interests spread out to computer vision and large scale multimedia retrieval. One of his last achievements is the transfer to industrial partners of the image retrieval software framework ELISE for copy detection, instance search and semantic image annotation.
Plus d'informations ici
benjamin.piwowarski (at) nulllip6.fr
 Mentions légales
Carte du site |