LIP6 CNRS Sorbonne Université Tremplin Carnot Interfaces
Direct Link LIP6 » News » PhD students

DUPONT Robin

PhD student
Team : MLIA
Arrival date : 10/01/2019
Localisation : Campus Pierre et Marie Curie
    Sorbonne Université - LIP6
    Boîte courrier 169
    Couloir 26-00, Étage 5, Bureau 504
    4 place Jussieu
    75252 PARIS CEDEX 05
    FRANCE
Tel: +33 1 44 27 88 87, Robin.Dupont (at) nulllip6.fr
Supervision : Hichem SAHBI

Deep learning models design for connected objects

Les machines sont actuellement capables de comprendre et interpréter des scènes visuelles avec des performances, en termes de précision, proches à celles des humains. Par exemple, de nouvelles approches sont même sur le point de décrire parfaitement ce qui se passe devant une caméra en traduisant une activité en langage naturel. Ce grand progrès est dû principalement à l’émergence du domaine de l’apprentissage profond (Deep Learning DL) qui a permis de révolutionner les méthodes classiques de l’apprentissage par ordinateur (Machine Learning ML). L’apprentissage profond a permis récemment de faire ses preuves dans pas mal d’applications : sécurité, vision par ordinateur, traitement du langage etc.
Par ailleurs, les travaux de modélisation s’appuient quasi tous sur des réseaux de neurones convolutifs avec des millions, voire des milliards de paramètres. Par exemple, Krizhevsky et al. ont obtenu des résultats intéressants dans le challenge ImageNet 2012 en utilisant un réseau contenant 60 millions de paramètres. Généralement, l’apprentissage de ces modèles nécessite des jours voire des semaines. L’utilisation des GPUs à très haute capacité de calcul joue un rôle crucial dans leur succès. Après la publication d’AlexNet, la tendance générale pour la conception des réseaux de neurones est de multiplier les couches intermédiaires afin d’avoir une meilleure performance. Cependant, cette technique a ses limites et est dans pas mal de cas inutile et non justifiée. En effet, les réseaux de neurones profonds sont très consommateurs en temps et en mémoire. Pour les produits type "embarqué", les méthodes de vision artificielle doivent s’exécuter le plus rapidement possible avec des ressources de calcul limitées; pour des applications sous contraintes dans des produits – qui embarquent des algorithmes de réseaux profonds comme les objets connectés où le critère d’exécution en temps-réel est primordial – nous souhaitons ainsi obtenir le meilleur compromis qualité/temps de calcul. Ce compromis représente une fonction où le facteur d’accélération est inversement proportionnel aux performances de prédiction.
 Mentions légales
Site map |