Abstract
Il est généralement coûteux de créer une ontologie pour un domaine et
répondant à des besoins spécifique, car il faut à la fois être un
expert du domaine visé et en même temps maîtriser les méthodes
d'ingénierie des connaissances. De nombreuses ontologies existent déjà
pour une large variété de domaines, mais ces ontologies ne sont pas
forcément référencées dans des catalogues permettant leur
découvrabilité, ni adaptées au cas d'utilisation visé car, soit trop
spécifiques, soit trop génériques. Ainsi, il faut souvent un ingénieur
de la connaissance dédié pour sélectionner ou mettre à jour une
ontologie pour un cas d'utilisation donné. Une fois l'ontologie
construite, il n'est pas non plus aisé de l'utiliser pour venir
peupler un graphe de connaissances, cette tâche nécessitant souvent
des approches du traitement automatique du langage naturel (TALN)
telles que l'identification d'entités et l'extraction de relations.
Pour les entreprises, il est difficile d'allouer des ressources pour
créer une ontologie et de transformer leurs documents internes en
graphe de connaissances.
Les grands modèles de langage (LLMs) promettent de s'abstraire en
partie de ces contraintes. Ils sont capables de résoudre un certains
nombres de tâches de TAL et peuvent être guidé pour construire une
ontologie de domaine. Dans cet exposé, nous présenterons l'approche
développée par Lettria pour créer une ontologie et peupler un graphe
de connaissances à partir de textes, de manière automatisée et
adaptable. Pour cela, nous avons défini une orchestration de prompts
et de critères afin de donner la possibilité à tout le monde de
pouvoir effectuer ces tâches. Chacun des critères générés peut être
modifié par l'utilisateur afin d'adapter les résultats et se
rapprocher d'un objectif visé. Nous montrerons l'évaluation de cette
méthode sur le benchmark académique Text2KG et nous présenterons les
premiers retour clients où cette approche a déjà été mise en place
avec succès.