Abstract
Depuis la fin 2024, le Lab des Archives nationales de France (AnF) et la société Sparna travaillent à la conception et à la réalisation d’une solution web de diffusion des référentiels sémantisés des AnF. Il s’agit de données de référence sur des entités de contexte des archives conservés aux AnF (des agents, des lieux, des concepts ; voir le graphique ci-dessous).
Ces données ont été sémantisées conformément à SKOS et à l’ontologie RiC-O dans sa version 1.1 publiée en mai 2025 et sont disponibles sur GitHub (voir https://github.com/ArchivesNationalesFR/Referentiels). Elles forment ensemble un graphe de connaissances intéressant en soi pour les utilisateurs finaux tels que les chercheurs en sciences humaines et sociales : elles incluent notamment la description fine de nombreux services d’administration centrale de l’État de l’Ancien Régime à nos jours et celle des voies de Paris actuelles ou caduques. Elles sont aussi essentielles dans l'écosystème des métadonnées des AnF : les archivistes de l'institution les produisent et s'en servent pour contextualiser et indexer la description des archives.
L’objectif du projet, baptisé GARANCE (Graphe des Archives nationales de France pour la Recherche, l’Accès et la Navigation des Connaissances Enrichies) est de doter ces données liées, par ailleurs moins riches et très peu accessibles dans leur format source dans le SI actuel des AnF, d'une solution web de consultation et de recherche qui envalorise la nature et le contenu, et soit facile à utiliser pour les publics des AnF et les professionnels des archives. Il s'agit aussi de nourrir la réflexion sur le futur SI et ses fonctionnalités de diffusion. Nous présenterons le contexte et le déroulement du projet, l'architecture technique choisie, qui associe une base de graphes, un SPARQL end point, des dispositifs de recherche, un générateur de pages statiques et des composants de data visualisation, et le site web réalisé, qui sera officiellement mis en ligne fin 2025 ou début 2026.
Nous ferons un focus sur le composant développé lors de la première phase du projet qui est une chaine de publication de données RDF générique basée sur les composants suivants : - Générateur de sites statiques eleventy - Framing JSON-LD pour mettre en forme des données sous forme de documents JSON « propres » - SHACL pour contrôler certains paramètres d’affichage (ordre, couleurs) - Template d’affichage d’entités JSON
Auteurs : Thomas Francart (Sparna - https://www.sparna.fr/fr/) et Florence Clavaud (Lab des Archives nationales de France - https://www.archives-nationales.culture.gouv.fr/).