Abstract
City Moove est une plateforme sémantique permettant de collecter et d'agréger
différent type d’information culturelle et touristique. Elle est composée de
collecteurs qui traitent des formats de données hétérogènes tels que des flux
RSS, des exports XML ou CSV, des réponses à des APIs en JSON, etc. Le modèle de
données au coeur de la plate-forme repose sur et étend Schema.org. L’information
ainsi agrégée constitue un graphe de connaissances représenté en RDF. La
plateforme moissonne en continu des flux d’informations donnés, par exemple, à
une fréquence quotidienne permettant ainsi une mise à jour de la base de
connaissances. La plateforme dispose d’un module de dédoublonnage, indispensable
dès lors que différentes sources décrivant potentiellement les mêmes objets,
sont agrégées. Le moteur de dédoublonnage repose sur STEM
(https://github.com/enricopal/STEM), un algorithme supervisé permettant
d’améliorer à la fois la précision et le rappel concernant l’interconnexion de
données RDF calculée à partir de logiciels tels que DUKE ou SILK. La plateforme
dispose également d’un module permettant de prédire la catégorie des
événements. Au final, la plateforme a été utilisé pour différentes zones
géographiques : l’île de St Barthelemy, la région de la côte d’azur, et un
certain nombres de grandes villes telles que Milan, Amsterdam ou Londres.
Nous illustrerons le fonctionnement de la plateforme en utilisant la base de
connaissances créées couvrant la région de la Côte d’Azur, soit plus de 250
communes s’étalant entre Monaco et St Tropez. Les flux collectés proviennent
d’offices de tourisme (Nice, Cannes, Antibes, Mandelieu, Grasse), du comité
régional de tourisme, de salles semi-privées (le palais des festivals), de
l’open data (Open Agenda, Data Tourisme), de bases de données professionnelles
(APIDAE), ou du web (Facebook, Google, Foursquare, Yelp, Eventful, Evensi,
Meetup). La base de connaissances contient plus de 335k points d’intérêts, 100k
revues et plus de 30k événements collectés depuis 2 ans. Nous montrerons comment
ce graphe de connaissances touristiques peut être aussi complété ou corrigé
grâce à un outil de contrôle éditorial attaché au système de gestion de contenu
WordPress. Des applications clientes peuvent alors consommer les données, soit
en interrogeant directement un point d’entrée SPARQL, soit en utilisant l’API
City-Moove. Nous montrerons différentes interfaces graphiques Web de type moteur
de recherche exploratoire ou des applications mobiles restituant des parties du
graphe de connaissances.
Nous avons enfin développé Minotour, un assistant conversationnel intelligent
se nourrissant de la base de connaissances. Minotour combine plusieurs moteurs
de compréhension du langage naturel (NLU) et repose sur une architecture
modulaire construite au dessus de Botkit. Il permet de répondre à toute sorte de
question d’ordre touristiques concernant les événements et activités à faire,
les lieux à visiter, l’offre d’hébergement ou de restauration disponible, tout
en ajoutant des informations contextuelles telles que les prévisions
météorologiques ou l’offre de transport public. Minotour est disponible sur de
nombreuses applications de messagerie tels que Facebook Messenger, Skype,
Telegram ou Slack, ou sur des enceintes connectées (Google Home, Amazon Alexa).
#### Auteurs/Autrices
**Frédéric BOSSARD** est président et chargé des relations avec la clientèle Grand
Compte de l’Agence de communication digitale WACAN dont la majorité des références
sont liés au marché du Tourisme : Communauté Européenne, Communauté d’Agglomération
Sophia Antipolis, Ville de Nice, Ville de Saint-Laurent-du-Var, Conseil Régional P.A.C.A., C
onseil Général 06, Aéroport de Nice, etc.
C’est à l’issu de cette forte expérience que Monsieur Frédéric Bossard et Mr jean-Claude Guignard
ont créé la start-up Data-Moove en identifiant les problématiques rencontrées par les professionnels
du tourisme pour la promotion de leurs produits (événements, manifestations, lieux, …) à leurs clients
potentiels.
C’est lors de cette activité que Monsieur Bossard a pu définir une solution répondant à ce besoin
fortement qualifié de gestion et de diffusion d’une donnée touristique à haute volumétrie provenant
de plusieurs sources, utilisée par différents intervenants et supports médias.