Feature Selection with Neural Networks

Ph. Leray, P. Gallinari

LIP6 1998/012: Rapport de Recherche LIP6 / LIP6 research reports
27 pages - Mars/March 1998 - Document en anglais.

PostScript : 53 Ko /Kb

Contact : par mail / e-mail

Thème/Team: Apprentissage et Acquisition de Connaissances

Titre français : Sélection de Variables et Réseaux de Neurones
Titre anglais : Feature Selection with Neural Networks


Résumé : Les données collectées lors de l'observation d'un phénomène ou mesurées sur un système physique ne sont pas toutes aussi informatives: certaines variables peuvent correspondre à du bruit, être peu significatives, corrélées ou non pertinentes pour la tâche à réaliser. La sélection de variables est donc un problème complexe et fait l'objet de recherches dans de nombreuses disciplines. Dans le domaine des réseaux de neurones, la sélection de variables est étudiée depuis une dizaine d'années et un certain nombre de méthodes, plus ou moins proches des méthodes classiques, ont émergé. Ce rapport est une revue des approches connexionnistes pour la sélection de variables. Nous présentons tout d'abord les différents éléments constituant une méthode de sélection de variables. Nous évoquons ensuite brièvement les méthodes statistiques utilisées en régression et en classification. Nous passons enfin en revue les principales méthodes développées spécialement pour les réseaux de neurones. Plusieurs méthodes représentatives de sélection de variables sont alors comparées sur différents problèmes.

Abstract : Features gathered from the observation of a phenomenon are not all equally informative: some of them may be noisy, correlated or irrelevant. Feature selection aims at selecting a feature set that is relevant for a given task. This problem is complex and remains an important issue in many domains. In the field of neural networks, feature selection has been studied for the last ten years and classical as well as original methods have been employed. This paper is a review of neural network approaches to feature selection. We first briefly introduce baseline statistical methods used in regression and classification. We then describe families of methods which have been developed specifically for neural networks. Representative methods are then compared on different test problems.


Mots-clés : Sélection de Variables, Sélection de Caractéristiques, Pertinence d'une Variable, Recherche Séquentielle

Key-words : Feature Selection, Subset selection, Variable Sensitivity, Sequential Search


Publications internes LIP6 1998 / LIP6 research reports 1998

Responsable Éditorial / Editor
webmaster@lip6.fr