RAHIMI Hamed

Doctorant
Équipe : BD
Date d'arrivée : 01/10/2021
    Sorbonne Université - LIP6
    Boîte courrier 169
    Couloir 25-26, Étage 5, Bureau 502
    4 place Jussieu
    75252 PARIS CEDEX 05

Tel: 01 44 27 87 56, Hamed.Rahimi (at) nulllip6.fr
https://lip6.fr/Hamed.Rahimi

Direction de recherche : Bernd AMANN

Co-encadrement : NAACKE Hubert

Sémantisation de corpus scientifiques à large échelle - Application à l’analyse interactive de l’évolution des sciences

Aujourd'hui, les graphes de connaissances (KG) sont en plein essor. DBPedia, Wikidata, et Yago fournissent des connaissances encyclopédiques sur de nombreux concepts et entités et ne sont que les exemples les plus représentatifs de nombreux autres graphes de connaissances, qui ont atteint un très haut niveau de fiabilité et constituent une immense richesse pour mieux comprendre les informations du passé et produites en masse chaque jour. Les KG décrivent les connaissances sur la base du standard RDF et peuvent être interrogés à l'aide du langage d'interrogation SPARQL. D'autre part, beaucoup de connaissances sont produites sous forme textuelle et publiées sous forme d'articles dans des archives scientifiques comme Web of Science, ISTEX, citeSeer et arXiv. Afin de faciliter l'exploration et l'analyse globale des connaissances représentées dans ces archives scientifiques, les approches existantes consistent à décrire (indexer) les documents par des ensembles de termes qui ne capturent pas toutes les nuances conceptuelles nécessaires pour construire des cartes décrivant les relations sémantiques et temporelles (évolution) entre les sujets de recherche et les domaines scientifiques. Structurer ces connaissances pour les intégrer dans un graphe de reconnaissance est difficile et nécessite encore un effort humain important. Par conséquent, l'analyse plus sémantique des connaissances dans les corpus scientifiques est entravée par un manque de représentation sémantique des concepts scientifiques. Dans cette étude, nous visons à construire des évaluations sémantiques de sujets afin de caractériser l'évolution temporelle de la science en construisant des graphes d'évolution de sujets. En outre, nous étudierons les requêtes de modèles d'évolution qui consistent à combiner divers modèles, outils et ressources issus de la fouille de textes, de l'apprentissage automatique, des bases de données et du web sémantique (RDF/SPARQL, Wikidata, DBPedia, Yago).