SISOUK Keanu

Doctorant à Sorbonne Université
Équipe : APR
    Sorbonne Université - LIP6
    Boîte courrier 169
    Couloir 25-26, Étage 3, Bureau 303
    4 place Jussieu
    75252 PARIS CEDEX 05

01 44 27 88 16
Keanu.Sisouk (at) nulllip6.fr
https://lip6.fr/Keanu.Sisouk

Direction de recherche : Julien TIERNY, Julie DELON

Barycentres de Wasserstein de Diagrammes de Persistance et Applications

L’analyse topologique des données est un ensemble de techniques développées pour mettre en évidence, de manière efficace et robuste, des structures implicites dans des ensembles de données complexes. Ces techniques consistent à calculer un descripteur topologique pour chaque élément d’un jeu de données, en encodant ses principales caractéristiques topologiques de manière concise. Un exemple couramment utilisé est le diagramme de persistance. Cependant, bien qu’il s’agisse de représentations concises, les diagrammes de persistance peuvent nécessiter un espace de stockage important et être parfois trop complexes pour être analysés simplement. Dans cette thèse, notre objectif est de développer une méthode d’encodage pour des ensembles de diagrammes de persistance tout en conservant leur pouvoir descriptif. Nous commençons par développer un encodage non linéaire par dictionnaire pour les diagrammes de persistance. Nous renforçons ensuite notre approche en la rendant plus robuste aux valeurs aberrantes au sein d’un ensemble de diagrammes de persistance, en utilisant des barycentres robustes. Cette approche par dictionnaire implique le calcul de distances de Wasserstein, connues pour être couteuses en temps de calcul en fonction de la taille des diagrammes en entrée. Une façon de contourner ce problème consiste à utiliser le transport optimal par tranches, plus précisément la distance de Wasserstein tranchée (Sliced Wasserstein). Nous présentons des applications de ce travail à la réduction de données pour compresser davantage un ensemble de diagrammes de persistance; à la réduction de dimension en créant une vue planaire donnant un aperçu de la disposition des données; et à la robustesse aux valeurs aberrantes dans le cadre d’un problème de regroupement non supervisé.


Soutenance : 14/11/2025 - 10h - Campus Pierre et Marie Curie, salle Jacques Pitrat (25-26/105)

Membres du jury :

Vijay NATHARAJAN, Université de Bangalore [Rapporteur]
Nicolas PAPADAKIS, Université de Bordeaux [Rapporteur]
Carola DOERR, Sorbonne Université
Bertrand MICHEL, Ecole Centrale Nantes
Julie DELON, Université Paris Cité & ENS Paris
Julien TIERNY, Sorbonne Université

Publications 2023-2025