Abstract
Début 2010, pour répondre à une directive européenne, Renault mettait
en oper sa première application basée sur les techniques du semantic web :
un système de publication des documents et données de sa documentation
technique après-vente, en charge d’alimenter un site web à destination
des réparateurs indépendants. Aujourd'hui, on veut faire évoluer la solution,
pour prendre en compte de nouvelles sources de données, et élargir son audience.
La solution initiale peut-elle évoluer facilement ? est-elle scalable et
supportera-t-elle un important surcroit de charge ? Certains parlent d’un échec
du Semantic Web : les choix techniques faits se sont-ils révélés pertinents ?
Que ferait-on différemment aujourd'hui ? Cinq années ont passé : de nouvelles
techniques sont apparues (JSON-LD, par exemple), d'autres ont mûri (Solr), JSON
et javascript sont devenus incontournables. Ce qui faisait défaut est-il maintenant
disponible ? Par exemple, comment intégrer les formulaires (ou les templates d’URI)
dans une API basée sur les Linked Data ? (alors que le web repose à la fois sur les
liens hypertextes et les formulaires, les linked data ne connaissent que les liens)
Après avoir expliqué la particularité de la recherche documentaire dans le contexte
automobile (qui fait nécessairement sortir du cadre du modèle relationnel - et donc
de SPARQL - pour l’évaluation de la pertinence d’un document en fonction du véhicule
auquel on s’intéresse), nous reviendrons brièvement sur ce qui avait fait le succès
de la solution initiale - en particulier, les capacités d’agrégation de RDF, qui
avaient permis de réconcilier facilement des données de sources variées. Nous dirons
ce que nous avons abandonné - pour faire bref, disons que SPARQL n’est plus aussi
central dans la solution, ou du moins qu’il n’en est plus le seul cœur. Mais surtout,
nous verrons comment il a été possible de modifier assez profondément l'architecture
initiale en intégrant des techniques nouvelles et en s’inspirant d’idées récentes
(“Hypermedia driven web APIs”, Hydra, JSON-LD, web components, etc).
Nous verrons aussi quelques limites ou promesses pas complètement tenues par les
techniques en œuvre. Nous ferons la démonstration d’un prototype d’IHM en javascript
construite sur la solution, montrant une recherche documentaire complexe, entièrement
guidée par les données, avec un minimum de couplage entre serveur et client.