Abstract
Le programme NosRecettes (2013-2016) du projet Open Food
System1 (OFS) a pour ambition d’offrir, grâce à une
plate-forme numérique, une panoplie de services pour mieux
assister les cuisiniers amateurs. Les recettes désormais
digitales peuvent devenir un des vecteurs les plus efficaces
pour accélérer la démocratisation des usages numériques dans
le quotidien domestique.
Nos Recettes vise donc à développer des solutions complètes
innovantes, à base de Web Sémantique, qui seront la base des
expériences utilisateurs dans la cuisine de demain :
* la structuration de données de recettes numériques sur
un format de données universel riche ;
* la proposition de recettes et de menus grâce à
un moteur de recommandation basé sur des profils
utilisateurs individualisés ;
* la communication, avec des appareils électroménagers
automatisés qui sauront comprendre ces recettes, les
réussir et les reproduire simplement ;
* une communauté d’amateurs de cuisine de dimension
internationale.
Pour répondre à ces axes, nous avons développé une chaîne
sémantique pour l’enrichissement des recettes
numériques. Cette chaîne intègre trois outils : Luxid de
Temis pour l’extraction d’information, GraphDB de OntoText
pour le raisonnement et le stockage en RDF des recettes
enrichies et enfin le Content Augmentation Manager de
Mondeca pour orchestrer chacune des étapes, filtrer et
désambiguïser les informations extraites et optimiser les
raisonnements à réaliser en fonction des scénarios du
programme : calcul d’information nutritionnelle,
identification de recettes génériques vs recettes variantes,
identification de la saisonnalité d’une recette,
identification de la complétude d’une recette, structuration
fine des instructions de la recette pour identifier des
adaptations possibles entre matériels, amélioration des
résultats du moteur de recommandation de recettes.
Pour rendre possible chacun de ces scénarios, tous les
composants de la chaîne sémantique reposent essentiellement
sur une ressource termino-ontologique de la cuisine composée
de 6 modules interdépendants (aliments, nutrition,
matériels, unité, préparations et cuisine). En effet, elle
permet de générer les lexiques utilisés par l’outil
d’extraction linguistique pour l’enrichissement des recettes
numériques. Mais surtout la définition de nombreuses classes
construites permet de classer automatiquement les recettes
enrichies tout en permettant l’inférence de nouvelles
connaissances sur ces recettes. Un véritable challenge a été
relevé pour pouvoir concilier représentation de l’ontologie
en OWL2 DL, raisonnements dans le fragment OWL2 QL proposé
par GraphDB et performance de l’ensemble de la chaine
sémantique pour que les temps de traitement restent
acceptables. Ce programme illustre les limites actuelles
pour l’implémentation de raisonnements poussés, sur une
ontologie conséquente, dans un environnement à visée
hautement industrielle.
#### Autrices
**Florence Amardeilh** est responsable du département R&D de
Mondeca depuis 2007, travaillant dans les domaines de
l’acquisition des connaissances et du Web Sémantique
depuis 2002. Ingénieur de Recherche en Systèmes
d’information et Gestion des Connaissances en 2001, elle a
ensuite réalisé une thèse CIFRE chez Mondeca en
partenariat avec l’Université Paris 10. La thèse a eu pour
objectif de réunir et de combiner les méthodes et outils
du Traitement Automatique du Langage avec ceux du Web
Sémantique afin de créer des applications pour le
peuplement d’ontologies et l’annotation sémantique.
Florence participe, en collaboration avec des
partenaires industriels et universitaires, au montage, au
pilotage et à la réalisation de nombreux projets de
recherche européens (IST FP5 - MOSES, IST-FP6 – TAO,
IST-FP7 Virtuoso, IST-FP7 SeaBilla) et français (ANR
Eiffel, ANR Tecsan VigiTermes, ANR Tecsan InterSTIS, RNTL
TerraNumerica, FUI SAMAR, FUI LegiLocal, ANR CSOSG SAIMSI,
ANR TecSan TerSan, FUI FIORA, PSPC Open Food System),
permettant à Mondeca d'être à la pointe de l'innovation
des méthodes et outils existants en Web Sémantique.