CONSTANTIN Camélia
Supervision : Bernd AMANN
Classement de Services et de Données par Leur Utilisation
L'émergence des systèmes pair-à-pair et la possibilité de réaliser des calculs et d'échanger des données par des services web conduit à des systèmes d'intégration de données à large échelle où l'évaluation de requêtes et d'autres traitements complexes sont réalisés par composition de services. Un problème important dans ce type de systèmes est l'absence de connaissances globales. Il est difficile par exemple de choisir le meilleur pair pour le routage des requêtes, le meilleur service lors de la composition de services ou de décider parmi les données locales à un pair celles à rafraîchir, à mettre en cache, etc. La notion de choix implique celle de classement. Bien qu'il soit possible de comparer et classer des entités d'après leur contenu ou d'autres métadonnées associées, ces techniques sont généralement basées sur des descriptions homogènes et sémantiquement riches. Une alternative intéressante dans le contexte d'un système à large échelle est le classement basé sur les liens qui exploite les relations entre les différentes entités et permet de faire des choix fondés sur des informations globales.
Cette thèse présente un nouveau modèle générique de classement de services fondé sur leurs liens de collaboration. Nous définissons une importance globale de service en exploitant des connaissances spécifiques sur sa contribution aux autres services à travers les appels reçus et les données échangées. L'importance peut être calculée efficacement par un algorithme asynchrone sans génération de messages supplémentaires. La notion de contribution est abstraite et nous avons étudié son instanciation dans le cadre de trois applications:
(i) le classement de services basé sur les appels où la contribution reflète la sémantique des services ainsi que leur utilisation avec le temps;
(ii) le classement de services par l'utilisation des données où la contribution des services est fondée sur l'utilisation de leurs données pendant l'évaluation des requêtes dans un entrepôt distribué;
(iii) la définition des stratégies de cache distribuées qui sont basées sur la contribution d'une mise en cache des données à réduire la charge du système.
Defence : 11/27/2007
Jury members :
Pr Christine Collet - INP Grenoble (Rapporteur)
Pr Michalis Vazirgiannis - Université d'Économie d'Athènes (Rapporteur)
DR Serge Abiteboul - INRIA Futurs (Examinateur)
MdC David Gross-Amblard - Université de Bourgogne (Examinateur)
Pr Michel Scholl - CNAM Paris (Examinateur)
Pr Bernd Amann - Université Paris VI (Directeur de thèse)
Two past PhD students (2015 - 2017) at Sorbonne University
- 2017
- LI Yifan : Partitionnement de grands graphes.
- 2015
- CARON Clément : Provenance et Qualité dans les Workflows Orientés Données : Application à la Plateforme WebLab.
2005-2024 Publications
-
2024
- H. Rahimi, J. Hoover, D. Mimno, H. Naacke, C. Constantin, B. Amann : “Contextualized Topic Coherence Metrics”, Findings of the Association for Computational Linguistics: EACL 2024, St. Julian's, Malta, pp. 1760-1773, (Association for Computational Linguistics) (2024)
- H. Rahimi, H. Naacke, C. Constantin, B. Amann : “ATEM: A Topic Evolution Model for the Detection of Emerging Topics in Scientific Archives”, Studies in Computational Intelligence, vol. 1143, Studies in Computational Intelligence, Menton, France, pp. 332-343, (Springer Nature Switzerland), (ISBN: 978-3-031-53472-0) (2024)
- Y. Bai, C. Constantin, H. Naacke : “Leiden-Fusion Partitioning Method for Effective Distributed Training of Graph Embeddings”, European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases (ECML PKDD), Vilnius (Lituanie), Lithuania (2024)
-
2023
- H. Rahimi, H. Naacke, C. Constantin, B. Amann : “ANTM: An Aligned Neural Topic Model for Exploring Evolving Topics”, (2023)
- H. Rahimi, H. Naacke, C. Constantin, B. Amann : “ATEM: A Topic Evolution Model for the Detection of Emerging Topics in Scientific Archives”, (2023)
- H. Rahimi, J. Hoover, D. Mimno, H. Naacke, C. Constantin, B. Amann : “Contextualized Topic Coherence Metrics”, (2023)
-
2021
- Q. Grossetti, C. Du Mouza, N. Travers, C. Constantin : “Reducing the filter bubble effect on Twitter by considering communities for recommendations”, International Journal of Web Information Systems, vol. 17 (6), pp. 728-752, (Emerald Publishing Limited) (2021)
-
2020
- J. Debure, S. Brunesseaux, C. Constantin, C. Du Mouza : “A Pattern-based Approach for an Early Detection of Popular Twitter Accounts”, Conférence sur la Gestion de Données – Principes, Technologies et Applications (BDA), Paris, France (2020)
-
2019
- C. Constantin, C. Du Mouza, Y. Li : “A Label-based Edge Partitioning for Multi-Layer Graphs”, 52nd Hawaii International Conference on System Sciences (HICSS 2019), Maui, Hawaii, United States, pp. 2216-2225, (HICSS) (2019)
-
2018
- Q. Grossetti, C. Constantin, C. Du Mouza, N. Travers : “An Homophily-based Approach for Fast Post Recommendation in Microblogging Systems”, Open Proceedings, Vienne, Austria, pp. 229-240 (2018)
-
2017
- C. Constantin, Y. Li, C. Du Mouza : “Un partitionnement d’arêtes à base de blocs pour les algorithmes de marches aléatoires dans les grands graphes sociaux”, Revue des Sciences et Technologies de l'Information - Série ISI : Ingénierie des Systèmes d'Information, vol. 22 (3), pp. 89-113, (Lavoisier) (2017)
- Y. Li, C. Constantin, C. Du Mouza : “SGVCut: A Vertex-Cut Partitioning Tool for RandomWalks-based Computations over Social Network graphs”, International Conference on Scientific and Statistical Database Management, SSDBM, Chicago, United States, pp. 39:1-39:4 (2017)
-
2016
- Y. Li, C. Constantin, C. Du Mouza : “A Block-Based Edge Partitioning for Random Walks Algorithms over Large Social Graphs”, 32e Conférence sur la Gestion de Données - BDA2016, Poitiers, France (2016)
- Y. Li, C. Constantin, C. Du Mouza : “A Block-Based Edge Partitioning for Random Walks Algorithms over Large Social Graphs”, Web Information Systems Engineering – WISE 2016, Shanghai, China, pp. 275-289 (2016)
- C. Constantin, R. Dahimene, Q. Grossetti, C. Du Mouza : “Finding Users of Interest in Micro-blogging Systems”, International Conference on Extending Database Technology, EDBT 2016, Bordeaux, France (2016)
- C. Constantin, R. Dahimene, C. Du Mouza, Q. Grossetti : “Recommandation contextuelle d’utilisateurs pour les plateformes de micro-blogging”, Revue des Sciences et Technologies de l'Information - Série ISI : Ingénierie des Systèmes d'Information, pp. 93-118, (Lavoisier) (2016)
- C. Constantin, C. Du Mouza, W. Litwin, Ph. Rigaux, Th. Schwarz : “AS-Index: A Structure For String Search Using n-grams and Algebraic Signatures”, Journal of Computer Science and Technology, vol. 31 (1), pp. 147-166, (Springer Verlag) (2016)
-
2015
- R. Dahimene, C. Constantin, Q. Grossetti, C. Du Mouza : “Recommandation d’utilisateurs pour les sites de microblogging”, 31e Conférence sur la Gestion de Données - BDA2015, Île de Porquerolles, France (2015)
-
2014
- R. Dahimene, C. Constantin, C. Du Mouza : “RecLand: A Recommender System for Social Networks”, CIKM '14 Proceedings of the 23rd ACM International Conference on Information and Knowledge Management, Shanghai, China, pp. 2063-2065, (ACM) (2014)
- C. Caron, B. Amann, C. Constantin, P. Giroux, A. Santanchè : “Provenance-Based Quality Assessment and Inference in Data-Centric Workflow Executions”, OTM 2014 Conferences - Confederated International Conferences: CoopIS, and ODBASE 2014, vol. 8841, Lecture Notes in Computer Science, Amantea, Italy, pp. 130-147 (2014)
- C. Caron, B. Amann, C. Constantin, P. Giroux : “WePIGE: The WebLab Provenance Information Generator and Explorer”, 17th International Conference on Extending Database Technology, EDBT 2014, Athens, Greece, pp. 664-667 (2014)
-
2013
- B. Amann, C. Constantin, C. Caron, P. Giroux : “WebLab PROV: Computing fine-grained provenance links for XML artifacts”, BIGProv'13 Workshop (in conjunction with EDBT/ICDT), Gênes, Italy, pp. 298-306, (ACM) (2013)
-
2012
- C. Constantin, C. Du Mouza, Ph. Rigaux, V. Thion, N. Travers : “Browse Your Content-Based Distributed Repository!”, BDA'12, Bases de Données Avancées, Clermont-Ferrand, France, pp. 1-5 (2012)
- C. Constantin, C. Du Mouza, Ph. Rigaux, V. Thion, N. Travers : “A Desktop Interface over Distributed Document Repositories”, International Conference on Extending Database Technology (EDBT'12), Berlin, Germany, pp. 104-107 (2012)
-
2011
- C. Constantin, C. Du Mouza, Z. Faget, Ph. Rigaux : “Indexing Symbolic Music Scores”, Bases de Données Avancées (BDA), Rabat, Morocco, pp. 60-77 (2011)
- C. Constantin, C. Du Mouza, Z. Faget, Ph. Rigaux : “The Melodic Signature Index for Fast Content-based Retrieval of Symbolic Scores”, ISMIR 2011 - 12th International Society for Music Information Retrieval Conference, Miami, United States, pp. 363-368 (2011)
-
2009
- C. Constantin, J. Creus, C. Du Mouza, R. Horincar, N. Travers : “D2.1 State-of-the art of XML data stream models, Livrable 2.1 ANR RoSeS”, (2009)
-
2008
- B. Amann, C. Constantin, S. Jeanne, L. Touraille : “Recommandation et calibrage de processus WebContent avec piTunes”, BDA 2008 - Bases de Données avancées, Guilherand-Granges, France, pp. 51-55 (2008)
- B. Amann, C. Constantin : “Usage-based ranking of distributed XML data”, ACM Symposium on Applied Computing, Fortaleza, Brazil, pp. 1008-1012, (ACM) (2008)
- J. Lafaye, D. Gross‑Amblard, C. Constantin, M. Guerrouani : “Watermill: An Optimized Fingerprinting System for Databases under Constraints”, IEEE Transactions on Knowledge and Data Engineering, vol. 20 (4), pp. 532-546, (Institute of Electrical and Electronics Engineers) (2008)
-
2007
- C. Constantin : “Classement de Services et de Données par Leur Utilisation”, thesis, phd defence 11/27/2007, supervision Amann, Bernd (2007)
- B. Amann, C. Constantin : “Collaborative Cache Based on Path Scores”, 8th International Conference on Web Information Systems Engineering (WISE 2007), vol. 4831, Lecture Notes in Computer Science, Nancy, France, pp. 87-98, (Springer) (2007)
- C. Constantin, B. Amann : “A collaborative caching policy based on path materialization scores”, Bases de Données Avancées, BDA, Marseille, France, pp. 22-41 (2007)
- C. Constantin, B. Amann, D. Gross‑Amblard : “Un modèle de classement de services pour contribution et utilité”, Revue des Sciences et Technologies de l'Information - Série ISI : Ingénierie des Systèmes d'Information, vol. 12 (1), pp. 33-60, (Lavoisier) (2007)
-
2006
- C. Constantin, B. Amann, D. Gross‑Amblard : “A Link-based Ranking Model for Services”, Int. Conf. On Cooperative Information Systems (CoopIS), vol. 4275, Lecture Notes in Computer Science, Montpellier, France, pp. 327-344, (Springer) (2006)
-
2005
- C. Constantin, D. Gross‑Amblard, M. Guerrouani : “Watermill: an optimized fingerprinting system for highly constrained data”, MM&Sec 2005 - 7th workshop on Multimedia and Security, New York, United States, pp. 143-155, (ACM) (2005)