Le projet de sémantisation
"Quelle place occupaient les femmes face à la justice de l’ancien régime ?", "Les meurtres ont-ils été plus fréquents à certaines périodes ?", "Observe-t-on des différences selon les lieux ou les types d’affaires ?"
Autant de questions auxquelles il était jusqu’à présent difficile de répondre à partir d’un simple moteur de recherche.
Le projet SemSac permet un nouveau mode d’interrogation de la base des sacs à procès du parlement de Toulouse.
Là où le moteur de recherche classique renvoie une liste de documents, cette interface s’appuie sur les relations qui existent entre les informations contenues dans les dossiers.
Fondée sur la sémantisation des données, elle permet de croiser les procédures, les faits, les lieux et les acteurs afin de faire apparaître des logiques, des récurrences et des contextes.
D’un point de vue technique, le projet SemSac poursuivait deux objectifs complémentaires : Il s’agissait, d’une part, d’expérimenter la nouvelle norme de description archivistique Records in Contexts (RiC) et son modèle conceptuel RiC-CM et, d’autre part, de mobiliser les technologies du web sémantique à travers l’ontologie RiC-O.
Le but était à la fois d’évaluer dans quelle mesure ces modèles pouvaient être appliqués de manière concrète à un corpus existant, et de montrer l’intérêt de cette approche en termes d’exploration, de mise en relation des données et de renouvellement des usages.
Pour y parvenir, un travail approfondi sur les données existantes a été nécessaire. Un peu plus de 5.000 notices ont été restructurées et enrichies, ce qui permet aujourd’hui de croiser davantage d’informations et de mieux comprendre les logiques qui traversent les procédures.
Parallèlement, le projet a permis d’intégrer une dimension de fiabilité et de traçabilité des données, rendue possible par l’application de la norme RiC. Chaque étape du traitement archivistique a été documentée, offrant aux utilisateurs une lecture transparente du corpus.
La dimension expérimentale de ce projet n’est pas une fin en soi : elle vise avant tout à proposer de nouvelles manières d’accéder aux archives et d’en explorer la richesse.
Le projet SemSacs, mené par les Archives départementales de la Haute-Garonne, a bénéficié de l'expertise de Florence Clavaud, responsable du Lab des Archives nationales, et membre exécutif du CIA/EGAD, en charge du développement de RiC, ainsi que de l'appui technique et méthodologique de la société Sparna.