<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/">
  <channel>
    <title>Outils et mécanisme d’indexation pour la recherche et la découverte de données dans un écosystème Solid (SemWeb.Pro) RSS Feed</title>
    <description></description>
    <link>https://cms.semweb.pro/talk/18411358</link>
<item>
<guid isPermaLink="true">https://cms.semweb.pro/talk/18411358</guid>
  <title>Outils et mécanisme d’indexation pour la recherche et la découverte de données dans un écosystème Solid</title>
  <link>https://cms.semweb.pro/talk/18411358</link>
  <description>&lt;p&gt;Nous proposons de présenter des travaux sur l’indexation et son exploitation
dans le contexte du web sémantique et en particulier du projet Solid/Linked
Web Storage du W3C. Nous avons conçu un vocabulaire basé sur les shapes SHACL
qui permet d’indexer les données à différentes échelles. Nous avons aussi
développé un moteur de requêtage en TypeScript capable de parcourir ces index
et trouver des résultats qui valident une certaine shape fournie en entrée.&lt;/p&gt;
&lt;p&gt;L’indexation permet de grandement accélérer la recherche de données. La
spécification Solid actuelle n’inclue pas de capacité d’indexation côté
serveur. Sans modifier la spécification il est possible d’ajouter cette
capacité côté serveur à l’aide d’un agent ou directement côté client. Dans les
deux cas il est nécessaire de formaliser cette capacité d’indexation dans un
protocole dit « client-client ».&lt;/p&gt;
&lt;p&gt;Nos travaux ont débuté dans le cadre d’une coopération entre l’INRIA et
l’entreprise française Startin’Blox il y a plus de deux ans. Nous avons montré
comment ces index ont permis de solutionner un problème de recherche
décentralisée dans le contexte d’applications Solid. Dans l’une de nos
démonstrations les index étaient répartis sur 32 serveurs Solid. Un index
fédéré était également présent sur un serveur de fédération. Ces index étaient
interrogés selon les critères de recherche exprimés côté client.&lt;/p&gt;
&lt;p&gt;Aujourd’hui le moteur de requêtage a été réécrit et utilise désormais un
validateur SHACL (rdf-validate-shacl). Cette nouvelle implémentation présente
l&#39;avantage de ne pas être fortement couplée aux index. Le moteur se contente
de valider des shapes sur les entrées d&#39;index fournies par une stratégie de
requêtage. De plus cette implémentation doit permettre de profiter pleinement
de l&#39;expressivité de SHACL.&lt;/p&gt;
&lt;p&gt;Le moteur de requêtage est basé sur la bibliothèque TypeScript Semantizer.
Cette bibliothèque en cours de réécriture permet de manipuler des datasets RDF
à l’aide de mixins. Ces mixins fournissent des méthodes pour manipuler les
quads présents dans des datasets. Un certain nombre de mixin sont fournis et
les clients peuvent définir leur propre mixin. Un générateur de code permet de
générer le code source de mixins « basiques » à partir de shape SHACL.&lt;/p&gt;
&lt;p&gt;Auteur : Maxime Lecoq-Gaillard est ingénieur de recherche et développement
titulaire d&#39;un master de l&#39;ISTIC en architecture logicielle (Université de
Rennes 1). Coprésident de Data Food Consortium, directeur technique chez
AlmaFood, il porte le projet Mycelium : un ensemble d’applications Solid et
libres pour les paysan⋅ne⋅s.&lt;/p&gt;
&lt;p&gt;Liens utiles :&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a href=&quot;https://github.com/semantizer/semantizer-typescript/tree/dev&quot;&gt;https://github.com/semantizer/semantizer-typescript/tree/dev&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href=&quot;https://www.datafoodconsortium.org/&quot;&gt;https://www.datafoodconsortium.org/&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href=&quot;https://almafood.fr/&quot;&gt;https://almafood.fr/&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;</description>
  <dc:date>2025-12-05T16:52+00:00</dc:date>
  <dc:creator>admin</dc:creator>
</item>
  </channel>
</rss>