INSA Lyon

Accéder à des sources documentaires hétérogènes anciennes constituées de textes manuscrits ou imprimés, d'images, de gravures, ou encore de photographies difficiles à indexer, constitue l'enjeu central des nouveaux systèmes dédiées à l’extraction d’information sémantique des corpus de documents. L'absence de méthodologie et d'outils performants pour assurer l'exploitation de fonds patrimoniaux conduit les institutions détentrices de ces fonds (archives nationales et internationales, librairies digitales) à ne pouvoir diffuser via leur portail d'accès qu’une documentation transcrite en texte intégrale ou partielle, ce qui réduit considérablement l'accès à tout le pan du patrimoine disponible en images ou de contenus mixtes qui ne dispose pas de transcriptions fiables. Dans le projet SYMTESENS, nous visons la construction d'un système automatisé de recherche d’information multimodal, dynamique et interactif qui devra rendre possible le traitement de grandes masses documentaires, essentiellement hétérogènes au sein desquelles nous ciblons les informations liées à la sensorialité, et en premier lieu au sonore, en connexion avec deux projets phares : Bretez[1] et SoundCityve[2]. La méthodologie proposée devra permettre de réduire les temps d’exploration de la documentation grâce à l’apport de nouvelles techniques d’apprentissage automatique et de fouille de texte par l’exploitation de nouveaux modèles de langues adaptés au sensible. Elle sera générique et reproductible pour s’appliquer à d’autres sujets d’études liés à la sensorialité (goût, odorat, toucher). Le projet permettra ainsi de mettre en lumière une documentation difficile voire impossible à identifier de façon manuelle, pour des publics divers (grand public ou experts). C’est auprès des Archives Municipales de Lyon qui disposent d’ensembles documentaires très riches et diversifiés du 18ème siècle que les cas d’études et d’application du projet sont proposés.

[1] Projet Bretez, BRETEZ - MSH Lyon St-Etienne (msh-lse.fr)

[2] Projet SoundCityve, SoundCITYve – L'archéologie du paysage sonore. (hypotheses.org)

http://SYMTESENS – L'archéologie du paysage sonore. (hypotheses.org) https://archeoson.hypotheses.org/symtesens

Visuel: 
Partenaires: 
Laboratoires: 
Dates projet: 
03/2021 - 09/2026
Financement: 
Contact: 
veronique.eglin@insa-lyon.fr
Coordinateur: 
INSA Lyon - LIRIS
Responsable INSA: 
Véronique EGLIN
Sous-Titre: 
DEPLOIEMENT INTELLIGENT DE SOLUTIONS D'IA DANS LE EDGE COMPUTING
Montant global du projet: 
194854' €'
Chapo: 
Ressentir, voir, entendre : interroger la sensorialité dans des documents d’archive