MOYSE Gilles
Direction de recherche : Marie-Jeanne LESOT
Résumés linguistiques de données numériques : interprétabilité et périodicité de séries
Nos travaux s'inscrivent dans le domaine des résumés linguistiques flous (RLF) qui permettent la génération de phrases en langage naturel, descriptives de données numériques, et offrent ainsi une vision synthétique et compréhensible de grandes masses d'information.
Nous nous intéressons d'abord à l'interprétabilité des RLF, capitale pour fournir une vision simplement appréhendable de l'information à un utilisateur humain et complexe du fait de sa formulation linguistique. En plus des travaux existant à ce sujet sur les composants élémentaires des RLF, nous proposons une approche globale de l'interprétabilité des résumés vus comme un ensemble de phrases et nous intéressons plus spécifiquement à la question de leur cohérence. Afin de la garantir dans le cadre de la logique floue standard, nous introduisons une formalisation originale de l'opposition entre phrases de complexité croissante. Ce formalisme nous permet de démontrer que les propriétés de cohérence sont vérifiables par le choix d'un modèle de négation spécifique. D'autre part, nous proposons sur cette base un cube en 4 dimensions mettant en relation toutes les oppositions possibles entre les phrases d'un RLF et montrons que ce cube généralise plusieurs structures d'opposition logiques existantes.
Nous considérons ensuite le cas de données sous forme de séries numériques et nous intéressons à des résumés linguistiques portant sur leur périodicité : les phrases que nous proposons indiquent à quel point une série est périodique et proposent une formulation linguistique appropriée de sa période. La méthode d’extraction proposée, nommée DPE pour Detection of Periodic Events, permet de segmenter les données de manière adaptative et sans paramètre utilisateur, en utilisant des outils issus de la morphologie mathématique. Ces segments sont ensuite utilisés pour calculer la période de la série temporelle ainsi que sa périodicité, calculée comme un degré de qualité sur le résultat renvoyé mesurant à quel point la série est périodique. Enfin, DPE génère des phrases comme « Environ toutes les 2 heures, l'afflux de client est important ». Des expériences sur des données artificielles et réelles confirment la pertinence de l'approche.
D’un point de vue algorithmique, nous proposons une implémentation incrémentale et efficace de DPE, basée sur l’établissement de formules permettant le calcul de mises à jour des variables. Cette implémentation permet le passage à l'échelle de la méthode ainsi que l'analyse en temps réel de flux de données.
Nous proposons également une extension de DPE basée sur le concept de périodicité locale permettant d'identifier les sous-séquences périodiques d'une série temporelle par l’utilisation d’un test statistique original. La méthode, validée sur des données artificielles et réelles, génère des phrases en langage naturel permettant d’extraire des informations du type « Toutes les deux semaines sur le premier semestre de l'année, les ventes sont élevées ».
Soutenance : 19/07/2016
Membres du jury :
Janusz Kacprzyk, Polish Academy of Sciences [Rapporteur]
Trevor Martin, University of Bristol [Rapporteur]
Bernadette Bouchon-Meunier, Université Pierre et Marie Curie
Jean-Gabriel Ganascia, Université Pierre et Marie Curie
Anne Laurent, Université Montpellier 2
Adrien Revault d'Allonnes, Université Paris 8
Marie-Jeanne Lesot, Université Pierre et Marie Curie
Publications 2012-2016
-
2016
- G. Moyse : “Résumés linguistiques de données numériques : interprétabilité et périodicité de séries”, thèse, soutenance 19/07/2016, direction de recherche Lesot, Marie-Jeanne (2016)
- G. Moyse, M.‑J. Lesot : “Linguistic summaries of locally periodic time series”, Fuzzy Sets and Systems, vol. 285, pp. 94-117, (Elsevier) (2016)
- M.‑J. Lesot, G. Moyse, B. Bouchon‑Meunier : “Interpretability of fuzzy linguistic summaries”, Fuzzy Sets and Systems, vol. 292, pp. 307-317, (Elsevier) (2016)
-
2015
- G. Moyse, M.‑J. Lesot, B. Bouchon‑Meunier : “Oppositions in Fuzzy Linguistic Summaries”, FUZZ-IEEE'15 - IEEE International Conference on Fuzzy Systems, Istanbul, Turkey, pp. 1-8, (IEEE) (2015)
-
2014
- G. Moyse, M.‑J. Lesot, B. Bouchon‑Meunier : “Énoncés contradictoires dans les résumés linguistiques flous”, 23e rencontre sur la Logique Floue et ses Applications, Cargèse, France, pp. 1-8 (2014)
- G. Moyse, M.‑J. Lesot : “Fast and Incremental Erosion Score Computation”, IPMU 2014 - International Conference on Information Processing and Management of Uncertainty in Knowledge-Based Systems, vol. 442, Communications in Computer and Information Science, Montpellier, France, pp. 376-385, (Springer) (2014)
-
2013
- G. Moyse, M.‑J. Lesot, B. Bouchon‑Meunier : “Mathematical morphology tools to evaluate periodic linguistic summaries”, Flexible Query Answering Systems, vol. 8132, Lecture Notes in Computer Science, Granada, Spain, pp. 257-268, (Springer) (2013)
- R. Almeida, M.‑J. Lesot, B. Bouchon‑Meunier, U. Kaymak, G. Moyse : “Linguistic Summaries of Categorical Time Series for Septic Shock Patient Data”, Fuzz-IEEE 2013 - IEEE International Conference on Fuzzy Systems, Hyderabad, India, pp. 1-8, (IEEE) (2013)
- G. Moyse, M.‑J. Lesot, B. Bouchon‑Meunier : “Linguistic summaries for periodicity detection based on mathematical morphology”, IEEE Symposium Series on Computational Intelligence, Singapore, Singapore, pp. 106-113, (IEEE) (2013)
-
2012
- G. Tissier, Ch. Tijus, M.‑J. Lesot, B. Bouchon‑Meunier, G. Moyse, Y. Pupulin : “Commande oculaire de caméras 3D”, Workshop " Eye-tracking, Regard & Interaction " - DEFISENS, Paris, France (2012)
- B. Bouchon‑Meunier, G. Moyse : “Fuzzy Linguistic Summaries: Where Are We, Where Can We Go?”, 2012 IEEE Conference on Computational Intelligence for Financial Engineering & Economics (CIFEr), New-York, United States, pp. 317-324 (2012)