La thèse couvre plusieurs contributions traitant des défis posés dans le contexte de la gestion moderne des données.
Le premier défi est lié au problème d'inférence de schémas pour des collections JSON massives.
Le deuxième défi est motivé par l'adoption de JSON Schema comme langage standard pour décrire les collections JSON et est lié au problème de la génération de témoins et d'instances à partir de schémas.
Le dernier défi, plus classique, concerne le problème de l'incomplétude des données dans le contexte des bases de données analytiques.