Abstract
Depuis que le théâtre de la Comédie-Française existe, c'est-à-dire depuis 1680,
des registres sont produits par la troupe : ils recensent, entre autres, les
dépenses, les recettes et les feux (la distribution) des différentes
représentations. Parce qu'ils permettent de se rendre compte du quotidien de la
troupe, ces documents sont très précieux pour mieux comprendre l'organisation
de la vie théâtrale parisienne depuis le XVIIe siècle : ils constituent un
apport notable à l'histoire du spectacle vivant. Néanmoins, il n'était jusqu'à
présent pas possible de proposer une analyse quantitative de ces données, dans
la mesure où ces registres n'étaient disponibles que dans un format papier,
celui de l'archive telle qu'elle est conservée à la Bilbiothèque-Musée de la
Comédie-Française. C'est donc pour diffuser une source précieuse mais méconnue
et difficile d'accès que le projet RCF (Registres de la Comédie-Française) est
né : numériser ces registres, les transcrire dans des bases de données et
promouvoir ces données pour en faciliter l'exploitation sont les objectifs que
s'est fixée l'équipe de RCF. Dans ce cadre, nous souhaitons présenter le
travail qui a été fait spécifiquement sur la base de données des dépenses. Il
s'agira de rendre compte de la complexité du travail de transcription que nous
avons dû réaliser sur cette base, car les données à transcrire se sont révélées
particulièrement hétérogènes et, à certains égards, discontinues. Nous verrons
en quoi transcrire des données hétérogènes comporte une part de subjectivité
que les technologies du Web Sémantiques permettent, en partie, de pallier. Nous
verrons ensuite comment nous avons tiré parti de ces technologies pour
fusionner cette base de données de transcription des dépenses, nouvellement
créée, avec deux bases qui ont été générées il y a quelques années, celle des
recettes et celle des feux. Enfin, nous montrerons comment nous avons exploité
les technologies du Web Sémantique pour promouvoir la réutilisation de ces
données et contribuer, de ce fait, au Web de données liées dans le champ des
humanités numériques. Nous concluerons sur l'intérêt que présente, en
complément d'une approche quantitative, une approche qualitative des données
provenant de l'expertise de spécialistes.
Références :
* https://cfregisters.org/ = site du projet
* https://flipbooks.cfregisters.org/ = les registres transcrits
* https://rcf-sparql.demo.logilab.fr/ = entreprôt SPARQL contenant les donnée
* https://upnd.pages.logilab.fr/rcf-ui-expense/ = application de visualisation des données des dépenses
* https://forge.extranet.logilab.fr/UPND/rcf-expense = entrepôt contenant le code de l'application de
transcription des données des dépenses
* https://forge.extranet.logilab.fr/upnd/rcf-ui-expense = entrepôt contenant le code de l'application de
visualisation des données des dépenses
Auteurs/Autrices
* Charline Granger - Charline est docteure en études
théâtrales de l'Université Paris Nanterre et actuellement attachée temporaire
de recherche et d'enseignement à l'Ecole Normale Supérieure de Lyon. Ses
travaux portent sur l'histoire du théâtre et de sa réception, ainsi que sur le
rapport entre archives et humanités numériques.
* Fabien Amarger - Fabien est un docteur ingénieur en
informatique, spécialiste des technologies du Web Sémantique. Travaillant à
Logilab depuis maintenant 4 ans, il est particulièrement investi dans les
sujets qui concernent la recherche, notamment en Web Sémantique.