Le projet de sémantisation
"Quelle place occupaient les femmes face à la justice de l’ancien régime ?", "Les meurtres ont-ils été plus fréquents à certaines périodes ?", "Observe-t-on des différences selon les lieux ou les types d’affaires ?"
Autant de questions auxquelles il était jusqu’à présent difficile de répondre à partir d’un simple moteur de recherche.
Le projet SemPER (Sémantisation des Procédures en Réseau) permet un nouveau mode d’interrogation de la base des sacs à procès du parlement de Toulouse.
Là où le moteur de recherche classique renvoie une liste de documents, cette interface s’appuie sur les relations qui existent entre les informations contenues dans les dossiers.
Fondée sur la sémantisation des données, elle permet de croiser les procédures, les faits, les lieux et les acteurs afin de faire apparaître des logiques, des récurrences et des contextes.
D’un point de vue technique, le projet SemPER poursuivait deux objectifs complémentaires : Il s’agissait, d’une part, d’expérimenter la nouvelle norme de description archivistique Records in Contexts (RiC) et son modèle conceptuel RiC-CM et, d’autre part, de mobiliser les technologies du web sémantique à travers l’ontologie RiC-O.
Le but était à la fois d’évaluer dans quelle mesure ces modèles pouvaient être appliqués de manière concrète à un corpus existant, et de montrer l’intérêt de cette approche en termes d’exploration, de mise en relation des données et de renouvellement des usages.
Pour y parvenir, un travail approfondi sur les données existantes a été nécessaire. Un peu plus de 5.000 notices ont été restructurées et enrichies, ce qui permet aujourd’hui de croiser davantage d’informations et de mieux comprendre les logiques qui traversent les procédures.
Parallèlement, le projet a permis d’intégrer une dimension de fiabilité et de traçabilité des données, rendue possible par l’application de la norme RiC. Chaque étape du traitement archivistique a été documentée, offrant aux utilisateurs une lecture transparente du corpus.
La dimension expérimentale de ce projet n’est pas une fin en soi : elle vise avant tout à proposer de nouvelles manières d’accéder aux archives et d’en explorer la richesse.
Ce travail a également permis de produire un modèle de données réutilisable. Le modèle SemPER est désormais publié afin de pouvoir être repris, adapté ou étendu par d’autres projets souhaitant décrire des procédures judiciaires selon une approche similaire. Il ouvre ainsi la possibilité de comparer des corpus différents et de développer des analyses à plus grande échelle, au-delà du seul cas du parlement de Toulouse. Le modèle de données SemPER est formalisé en SHACL et mis à disposition via une page web dédiée, permettant son téléchargement au format RDF/Turtle.
Le projet SemPER, mené par les Archives départementales de la Haute-Garonne, a bénéficié de l'expertise de Florence Clavaud, responsable du Lab des Archives nationales, et membre exécutif du CIA/EGAD, en charge du développement de RiC, ainsi que de l'appui technique et méthodologique de la société Sparna.