Abstract
Vidal, bien connu pour son fameux dictionnaire des médicaments, s'est
aujourd'hui positionné comme leader concernant le développement de services
digitaux pour l'information à destination du monde médical. Dans cette optique,
la conception de services pour répondre, par exemple, à des besoins de
recherche d'information revêt un caractère d'importance stratégique. Parmi ces
services, un prototype de chatbot a été conçu par les équipes Vidal, dans le
but d'aider la mise à disposition des informations liées aux effets secondaires
des produits pharmaceutiques, informations importantes pour une prescription,
et une prise, en sécurité des médicaments. Pour répondre à cet objectif, le
bot s’appuie sur des données stockées dans des graphes RDF (base de données
Vidal orientée graphe). Cette modélisation en graphe a été mise en place pour
décrire les concepts d’intérêt, le vocabulaire associé et leurs liens
sémantiques. Les données d'intérêt sont ainsi récupérées en utilisant l’un des
standards du web sémantique : le langage de requête SPARQL et sont communiquées
de façon pertinente et naturelle à l'humain, en accord avec le déroulé de la
discussion. Concrètement, l'utilisateur peut poser des questions sur plusieurs
formes de produit (médicament, substance...) et peut, soit demander la liste
exhaustive des effets indésirables, soit poser la question spécifique sur un
effet en particulier. Le bot est aussi capable de solliciter de l'humain
l'ensemble des précisions nécessaires pour lever la moindre ambiguïté
concernant la demande formulée initialement (médicaments avec des noms
proches...). Nous nous proposons d'en détailler les aspects fonctionnels
et techniques, de même que la modélisation et l’exploitation des données.
La présentation se terminera par une démonstration.
**Auteurs/Autrices**
* Romain Benassi, Data Scientist, PUBLICIS SAPIENT. Diplômé de l'IMT Atlantique
et docteur Centrale-Supélec en mathématiques appliquées, j'ai évolué pendant
près de 5 ans dans le domaine de l'énergie, en particulier sur l'analyse
statistique des consommations des foyers et la désagrégation des courbes de
charges électriques (NILM). J'ai rejoint début 2020 Publicis Sapient où j'ai
été amené, en tant que consultant Data Scientist auprès de plusieurs clients
dont principalement Vidal, à travailler sur les sujets du Deep Learning et du
NLP. Depuis 2021, je suis également formateur/enseignant à temps partiel sur
ces deux sujets, en particulier à l'EPITA.
* Mehdi Embarek, Knowledge engineer, MK SOFT. Titulaire d’un doctorat en
informatique. Thèse effectuée au commissariat à l’énergie atomique (CEA).
Consultant en ingénierie de la connaissance, NLP et web sémantique depuis 2006.
* Suzanne Bento Pereira Responsable de la plateforme Data Science, VIDAL.
Responsable de la plateforme Data Science chez VIDAL, elle est titulaire d'un
doctorat en informatique de l'Université de Rouen. Experte en ingénierie de la
connaissance, NLP et IA dans le domaine de la santé.