Abstract
OpenArchaeo est une plateforme web-sémantique dédiée à l’archéologie, développée par le consortium Huma-Num2 MASAplus, pour fédérer l’information archéologique disséminée dans une infinité de silos hétérogènes, et construire des liens entre les jeux de données.
Lors de la conceptualisation de la plateforme OpenArchaeo, une solution a été apportée par le biais d'un modèle sémantique basé sur le CIDOC CRM, représentant les entités clés de l’archéologie. Les informations liées aux lieux, à la chronologie, aux personnes ou à la typologie d’objet physique utilisent des vocabulaires contrôlés tels que PACTOLS, GeoNames, VIAF, IdRef ou ORCID, garantissant que chaque jeu de données contient des informations désambiguïsées et des termes scientifiques partagés et réutilisables par la communauté. Les données sont ainsi structurées en graphes de connaissances et gérées dans un triplestore interrogeable en ligne, qui est hébergé par l’IR Huma-Num.
Toutefois, l'interrogation d'un triplestore peut être complexe, car elle implique l'utilisation du langage SPARQL pour interroger le graphe de données. Modéliser les “questions de compétences” en SPARQL éloigne l’utilisateur final, l'obligeant également à comprendre la complexité du graphe et de l’ontologie. En effet pour des raisons d’interopérabilité sémantique dans le CIDOC-CRM, de simples attributs d'une entité peuvent être en fait représentés par le biais d'une chaîne de propriétés complexe.
Pour que l’utilisateur archéologue puisse raisonner dans son modèle scientifique lorsqu’il interroge les graphes de OpenArchaeo, une interface d'interrogation visuelle intuitive a été développée, puis rendue générique sous le nom de Sparnatural par la société Sparna. Sparnatural permet aux utilisateurs d'interagir avec le triplestore sans avoir de connaissances spécifiques sur l'ontologie, le modèle sous-jacent ou le langage SPARQL. L’utilisateur peut ainsi interroger le triplestore en utilisant les concepts archéologiques qu’il a l’habitude de manipuler et l’application transforme ces concepts en leurs équivalents CIDOC pour générer la requête SPARQL. Le système de OpenArchaeo considère chaque jeu de données comme un endpoint singulier, et une requête peut fédérer les résultats provenant de différentes sources.
OpenArchaeo est une application open-source novatrice qui permet aux données du Web sémantique d'être utilisées non seulement par les machines, mais aussi par les chercheurs grâce à Sparnatural. Il augmente la valeur des données de la recherche en les rendant facilement trouvables et accessibles, conformément aux premiers principes FAIR. En outre, les données présentées dans OpenArchaeo sont accessibles via un point d'accès unique, interopérables grâce à l'ontologie CIDOC CRM et aux vocabulaires contrôlés, et réutilisables grâce aux métadonnées associées.
Auteurs: Florian HIVERT, Olivier MARLET, Béatrice MARKHOFF