
Sciences & Société
Soutenance de thèse : Juliette LUISELLI
Comment les réarrangements chromosomiques façonnent les génomes : étude par modélisation et simulations
Doctorante : Juliette LUISELLI
Laboratoire INSA : LIRIS - Laboratoire d'lnfoRmatique en Image et Systèmes d'information
École doctorale : ED512 Infomaths (Informatique et Mathématiques de Lyon)
Les origines de la complexité des génomes, ainsi que les déterminants de la taille des génomes, restent largement débattus. Cette thèse montre que les réarrangements chromosomiques sont un facteur clé de l'évolution de l'architecture du génome en termes de taille et de complexité. Elle montre en particulier que la taille et la fraction codante des génomes sont étroitement liées à la sélection de la robustesse aux réarrangements chromosomiques, et que celle-ci est notamment modulée par la taille de la population et le taux de mutation. Dans un premier temps, nous avons étudié l'impact des réarrangements chromosomiques sur l'évolution de l'architecture des génomes bactériens. Pour cela, la thèse s'appuie sur des simulations informatiques et des modélisations mathématiques. En particulier, pour les simulations, elle s'appuie sur Aevol, un logiciel conçu pour étudier l'évolution de la structure des génomes procaryotes, qui permet aux réarrangements chromosomiques d'agir directement sur la séquence génomique des individus. En utilisant Aevol, nous avons pu montrer que les réarrangements chromosomiques sont essentiels pour soutenir l'adaptation à long terme, mais aussi pour stabiliser la taille du génome. Ce résultat nous a permis de montrer, par des campagnes de simulation à grande échelle, que la pression imposée par les réarrangements sur la taille du génome est modulée à la fois par le taux de mutation (qui modifie la robustesse des génomes) et par la taille de la population (qui modifie l'efficacité de la sélection pour la robustesse). Ce résultat a ensuite été confirmé par un modèle mathématique qui met en évidence comment ces deux paramètres déterminent une proportion d'équilibre du génome non codant. La deuxième partie de la thèse se concentre sur la généralisation des résultats précédents aux génomes eucaryotes. Tout d'abord, elle présente une nouvelle version d'Aevol développée spécifiquement pour le projet, qui modélise des organismes diploïdes avec des chromosomes linéaires se reproduisant sexuellement et subissant un événement de recombinaison méiotique obligatoire. Avec ce modèle, nous montrons que les génomes de type eucaryote réagissent aux changements du taux de mutation et de la taille de la population de la même manière que les génomes de type procaryote. Dans le dernier chapitre, nous montrons que le mode de reproduction est également un déterminant important de l'architecture du génome, car l'auto-fécondation conduit à des génomes réduits. En conclusion, cette thèse de doctorat présente un nouveau cadre permettant de comprendre les aspects fondamentaux de l'évolution de la taille des génomes, en se concentrant sur l'impact direct et indirect des mutations, et en particulier des réarrangements chromosomiques, et sur la manière dont elles affectent l'avenir de chaque lignée. Nous montrons également comment d'autres paramètres, tels que la taille de la population et le mode de reproduction (asexué, sexué, autofécondation), interagissent avec ces mutations et modulent leur impact sur l'évolution de la taille du génome. L'ensemble de ces résultats contribue à une vision unifiée de l'évolution de l'architecture et de la complexité des génomes le long de l'arbre de la vie.
Informations complémentaires
-
Amphithéâtre de la Bibliothèque Universitaire Science Doua, Domaine de la Doua - 20 avenue Gaston Berger - BP 72215 69622 Villeurbanne Cedex

Sciences & Société
Soutenance de thèse : Alexandre BENTO
Raisonnement embarqué pour le Web des Objets
Doctorant : Alexandre BENTO
Laboratoire INSA : LIRIS - Laboratoire d'lnfoRmatique en Image et Systèmes d'information
École doctorale : n°512 lnfoMaths - Informatique et Mathématiques de Lyon
Le Web des Objets étend l'Internet des Objets avec des standards du Web, tels que des graphes de connaissances et des capacités de raisonnement. Les raisonneurs traditionnels sont optimisés pour la performance et nécessitent trop de ressources matérielles, notamment de mémoire, pour être exécutés sur les objets contraints typiquement utilisés dans les applications loT. Dans cette thèse, nous proposons des optimisations d'un algorithme de raisonnement couramment utilisé pour rendre son implémentation possible sur des objets contraints, en nous concentrant sur la réduction de l'empreinte mémoire du raisonnement. Ces optimisations sont (i) algorithmiques, tirant profit des caractéristiques des jeux de règles utilisés pour le raisonnement, et (ii) axées sur la représentation des connaissances en mémoire au sein du raisonneur. Nous proposons également LiRoT, l'implémentation d'un raisonneur léger et incrémental pouvant être embarqué sur des objets contraints, résultat de ces optimisations. Nous évaluons expérimentalement l'impact des diverses optimisations, et nous montrons qu'elles permettent de réduire significativement l'empreinte mémoire du raisonnement, tout en ayant un impact minimal sur le temps de calcul. Nous comparons également LiRoT à plusieurs raisonneurs de référence, et nous montrons qu'il est plus adapté pour traiter des jeux de données d'une taille typique des applications loT. Enfin, nous évaluons l'usage de LiRoT sur des plateformes telles qu'ESP32 et Arduino Due et montrons qu'il est possible de faire du raisonnement sur des plateformes aussi contraintes. Cette thèse a été financée par le projet CoSWoT (ANR-19-CE23-0012).
Informations complémentaires
-
Amphithéâtre 501.337 Robert Arnal, Bâtiment Ada Lovelace 7 Avenue Jean Capelle 69100 Villeurbanne

Sciences & Société
Soutenance de thèse : Matthieu BETTINGER
Résilience à la collusion dans les mécanismes de places de marché décentralisées
Doctorant : Matthieu BETTINGER
Laboratoire INSA : LIRIS - Laboratoire d'lnfoRmatique en Image et Systèmes d'information
École doctorale : ED512 Infomaths (Informatique et Mathématiques de Lyon)
Les places de marché décentralisées dans le Web3 cherchent à protéger leurs utilisateurs contre la censure, les biais et les points de défaillance uniques qui peuvent exister dans leurs homologues centralisés. Pourtant, certains mécanismes ont tendance à rester centralisés, par exemple le moteur de recherche permettant de découvrir de nouvelles ressources sur le marché. De telles vulnérabilités ont été exploitées sur des places de marché décentralisées ces dernières années : il est d'autant plus essentiel de fournir des mécanismes de protection. Dans cette thèse, nous proposons des protocoles pour assurer la fiabilité et l'équité des mécanismes des places de marché, notamment par la résilience à la collusion d'acteurs malveillants. Tout d'abord, pour traiter la sélection décentralisée d'un sous-ensemble de participants parmi une population comprenant des acteurs malveillant, nous proposons un protocole basé sur la blockchain pour éviter que les acteurs malveillants n'influencent la sélection à leur avantage. Ensuite, en considérant des ensembles de participants sélectionnés qui travailleront ensemble sur des tâches dans une place de marché décentralisée de ressources cloud, dans un environnement sans accès à des informations fiables ou non confidentielles, nous présentons un mécanisme d'incitation qui punit ou récompense collectivement les participants aux tâches en fonction du résultat de leurs tâches. Nous décrivons et évaluons également la manière d'atteindre un taux de réussite cible des tâches de la place de marché : l'algorithme que nous proposons est capable d'atteindre les objectifs définis et de réduire par 5 à 10 fois le taux d'échec par rapport à un système sans protection. Par ailleurs, nous montrons comment les fournisseurs du moteur de recherche d'une place de marché décentralisée peuvent favoriser un sous-ensemble d'utilisateurs du moteur de recherche. Nous protégeons ces moteurs de recherche avec notre protocole COoL-TEE, qui permet aux utilisateurs honnêtes d'éviter les fournisseurs malveillants de ce moteur de recherche, qui retardent de manière sélective les réponses au profit des utilisateurs qui les soudoient. Les utilisateurs honnêtes collaborent avec des environnements d'exécution de confiance (Trusted Execution Environment, TEE) au sein des machines hôtes des fournisseurs du moteur de recherche, afin de sélectionner des fournisseurs proches, rapides et honnêtes. A partir de simulations d'utilisateurs envoyant des requêtes depuis le monde entier à des fournisseurs géo-distribués hébergés dans des centres de données, nous illustrons comment COoL-TEE réduit l'avantage des utilisateurs malveillants à un niveau proche d'un scénario sans attaques. Enfin, de nombreux protocoles traditionnels et basés sur les TEEs requièrent des mesures temporelles fiables pour leur logique d'exécution, y compris COoL TEE. Cependant, des attaquants qui contrôlent le système d'exploitation sont capables d'attaquer la perception du temps du TEE et, par conséquent, de manipuler les protocoles utilisant les mesures temporelles fournies. Nous contribuons une implémentation publique du protocole d'état-de-l'art Triad, dont le code source est fermé, et nous menons des attaques sur celui-ci de manière empirique. Sa calibration peut être manipulée pour affecter la vitesse d'horloge perçue par le TEE. En outre, les attaques sur une machine compromise peuvent se propager aux machines honnêtes participant au protocole de temps de confiance de Triad. Nous discutons comment atténuer ces vulnérabilités afin d'améliorer la résilience contre de telles attaques.
Informations complémentaires
-
Amphithéâtre BU Sciences Lyon 1, 20 avenue Gaston Berger BU Sciences La Doua 69622 Villeurbanne Cedex

Sciences & Société
Soutenance de thèse : Alice BRENON
Méthodes et outils pour l'étude diachronique des discours géographiques dans deux encyclopédies françaises.
Doctorante : Alice BRENON
Laboratoire INSA : LIRIS - Laboratoire d'lnfoRmatique en Image et Systèmes d'information
École doctorale : ED512 lnfoMaths - Informatique et Mathématiques de Lyon
Dans le cadre du projet GEODE du LabEx ASLAN, cette thèse étudie en diachronie les discours géographiques dans deux encyclopédies françaises. L'Encyclopédie, Dictionnaire Raisonné des sciences, des arts et des métiers (EDdA), emblématique du siècle des Lumières, constitue la borne la plus ancienne de l'intervalle. Celui-ci s'étend jusqu'à la fin du XIXᵉ siècle, représenté par La Grande Encyclopédie, Inventaire raisonné des Sciences, des Lettres et des Arts (LGE). Au travers de trois contributions principales, les travaux abordent des thématiques telles que la préparation des données et l'encodage en particulier, la classification automatique et les analyses textométriques. En confrontant des méthodes simples de la théorie des graphes à des remarques structurelles sur les éléments présents dans les encyclopédies, la première étude souligne les différences fondamentales qui existent entre dictionnaires et encyclopédies en termes de structures et aboutit à la proposition d'un encodage XML-TEi pour représenter une encyclopédie, qui est appliqué sur la première édition numérique de LGE. La comparaison de méthodes de classifications permet ensuite de choisir un modèle pour associer un domaine de connaissance à chaque article du corpus, ce qui rend possible la conduite d'analyses contrastives dans la dernière partie de la thèse. Un examen attentif des erreurs commises par un des classifieurs sur l'EDdA révèle des ressemblances existant entre les domaines et montre une Géographie très au contact des autres sciences au XVIIIe siècle. Pour finir, les deux œuvres sont comparées pour mettre en relief les changements survenus dans la manière d'écrire la Géographie. Un premier développement quantifie puis caractérise la variation dans les articles du domaine (à l'aide de statistiques sur le nombre de mots et leurs longueurs puis en étudiant les mouvements d'entrées entre domaines) Les apports de la textométrie sont enfin utilisés pour approfondir la compréhension des liens entre biographies et discours géographiques.
Informations complémentaires
-
Amphithéâtre Chappe, Bâtiment Hedy Lamarr, 6 avenue des Arts, Villeurbanne cedex 69621

Sciences & Société
Soutenance de thèse : Yacine BELAL
Apprentissage Collaboratif de Confiance : Personnalisation, Confidentialité et Robustesse en Environnements Décentralisés
Doctorant : Yacine BELAL
Laboratoire INSA : LIRIS - Laboratoire d'lnfoRmatique en Image et Systèmes d'information
École doctorale : n°512 lnfoMaths - Informatique et Mathématiques de Lyon
Il y a une vingtaine d'années, l'émergence du Web 2.0 a profondément transformé notre rapport au numérique en permettant aux utilisateurs de créer et partager du contenu sur une multitude de plateformes, générant ainsi un volume croissant de données. Combinée aux récents progrès en apprentissage automatique, cette abondance de données a permis l'apparition de nombreux services basés sur l'apprentissage (e.g., agents conversationnels, assistants vocaux, détection de fraude). Traditionnellement, l'entraînement des modèles sous-jacents à ces services reposait sur la collecte de données sensibles par des entités centralisées, souvent les fournisseurs de service eux-mêmes. Cette centralisation a soulevé de sérieuses préoccupations en matière de confidentialité, comme en témoignent les multiples scandales liés à la vie privée au cours de la dernière décennie. En réponse, plusieurs réglementations, telles que le Règlement Général sur la Protection des Données (RGPD), ont été mises en place. Dans ce contexte, repenser les paradigmes d'apprentissage classiques pour les rendre plus respectueux de la vie privée est devenu essentiel. L'apprentissage fédéré a vu le jour en 2017 avec la promesse de préserver la confidentialité des données en permettant à des utilisateurs d'entraîner collaborativement un modèle sans jamais partager leurs données brutes. Ce paradigme a donné naissance à une classe plus large d'approches appelée apprentissage collaboratif. Il est désormais bien établi que l'apprentissage fédéré souffre de plusieurs limitations, notamment sa dépendance à un serveur central (point de défaillance unique) et sa vulnérabilité à diverses attaques en confidentialité et robustesse. C'est dans cette optique que l'apprentissage par commérage a été proposé, avec la promesse d'une décentralisation totale, s'appuyant sur des protocoles de communication pair-à-pair, dits protocoles de bavardage. Dans ce paradigme, chaque nœud agit comme un mini-serveur fédéré, coordonnant l'apprentissage avec ses voisins via un graphe de communication dynamique. Toutefois, il reste à démontrer si cette approche permet réellement de dépasser les limites de l'apprentissage fédéré, notamment en matière de personnalisation, de protection de la vie privée et de robustesse face aux comportements malveillants. Cette thèse s'attache à explorer ces questions. Dans un premier temps, nous comparons les performances individuelles des modèles produits par ces deux paradigmes, avant de proposer PEPPER, une structure logicielle permettant d'exploiter pleinement le potentiel de l'apprentissage par commérage à des fins de personnalisation, et de surpasser l'approche fédérée sur cet aspect. Dans un second temps, nous introduisons CIA, une attaque d'inférence de communautés utilisée pour auditer les vulnérabilités de confidentialité des deux paradigmes. Cette étude révèle une certaine résilience intrinsèque de l'apprentissage par commérage face à ce type d'attaques d'inférence comparative. Enfin, nous nous penchons sur la robustesse de ce paradigme face aux attaques par empoisonnement de modèles. Bien que sa nature dynamique puisse l'exposer davantage à ce type de menaces, nous proposons GRANITE, un cadre logiciel robuste pour l'apprentissage par commérage sur des graphes dynamiques. Dans l'ensemble, ce travail met en évidence le potentiel de l'apprentissage par commérage à s'imposer comme une alternative crédible à long terme pour des systèmes d'apprentissage décentralisés, transparents et centrés sur l'utilisateur.
Informations complémentaires
-
Amphithéâtre de la BU Sciences DOUA, 20 avenue Gaston Berger 69622 Villeurbanne Cedex

Sciences & Société
Soutenance de thèse : Aghile AIT MESSAOUD
Systèmes de traitement et de stockage distribué confidentiels basés sur les TEEs
Doctorant : Aghile AIT MESSAOUD
Laboratoire INSA : LIRIS - Laboratoire d'lnfoRmatique en Image et Systèmes d'information
École doctorale : n°512 lnfoMaths - Informatique et Mathématiques de Lyon
Les données sont devenues un moteur essentiel du monde numérique, alimentant l'innovation et les stratégies commerciales. Toutefois, leur manipulation s'accompagne d'importants enjeux de sécurité et d'éthique, car elles peuvent contenir des informations sensibles nécessitant une protection stricte. Toute violation peut entraîner des atteintes à la vie privée, des pertes financières et une perte de confiance. Pour garantir leur sécurité, il est crucial de les protéger dans leurs trois états : en transit, au repos et en cours d'utilisation. Les données en transit doivent être chiffrées pour éviter toute interception, celles au repos sécurisées par des contrôles d'accès stricts et un chiffrement robuste, tandis que celles en cours de traitement nécessitent un environnement protégé pour empêcher tout accès non autorisé. Les environnements d'exécution fiables jouent un rôle clé en isolant les données sensibles, même vis-à-vis des processus système ou du système d'exploitation. Cette recherche se divise en deux parties principales. La première porte sur la sécurisation des données en cours d'utilisation, en étudiant l'apprentissage fédéré comme cas d'usage spécifique. Ce paradigme d'apprentissage automatique préservant la confidentialité reste vulnérable aux attaques visant la mémoire principale des dispositifs clients, pouvant révéler des informations sensibles sur les données utilisées pour l'entraînement du modèle. Face à ces menaces, GradSec a été développé pour sécuriser l'apprentissage fédéré contre ces attaques. Cette solution exploite ARM TrustZone, un environnement d'exécution fiable conçu pour les appareils mobiles, afin de protéger les couches critiques du modèle en fonction des attaques identifiées. La seconde partie traite de la sécurisation des données au repos en s'appuyant sur les bases de données dé-valeur en mémoire, choisies pour leur flexibilité et leur capacité à stocker divers types de données via sérialisation. Une analyse approfondie des bases de données dé-valeur basées sur des environnements d'exécution fiables a mis en évidence leurs architectures et composants fondamentaux, tout en révélant leur vulnérabilité aux attaques par canaux auxiliaires. Pour atténuer ce risque, TruShare a été conçu comme un système de stockage distribué confidentiel combinant environnements d'exécution fiables et partage de secret. En fragmentant les données sensibles entre plusieurs nœuds, cette approche rend les fuites de données beaucoup plus complexes pour un attaquant. Ces travaux de recherche visent à répondre aux défis de la sécurité des données dans des environnements non fiables, en garantissant une confidentialité renforcée aussi bien lors du traitement que du stockage des informations.
Informations complémentaires
-
Salle de Conférence de la BU Sciences La Doua, 20 avenue Gaston Berger, 69100 Villeurbanne

Recherche
Venez encourager les doctorantes et doctorants lors de la finale locale Ma thèse en 180 secondes.
La finale locale Université de Lyon du concours international francophone Ma thèse en 180 secondes se déroulera jeudi 20 mars 2025, à 18h au Grand Amphithéâtre de l'Université de Lyon. Finale retransmise également sur les comptes Facebook et YouTube de l'Université de Lyon.
Un jury composé de chercheurs, journalistes et représentants du monde socio-économique décernera trois prix. Vous aurez également la possibilité de décerner le prix du public en assistant à la finale.
Le 1ᵉʳ prix du jury et le prix du public seront les deux lauréats Université de Lyon qui accéderont à l'étape nationale du concours.
Parmi les 12 candidats sélectionnés, Syrine Salouhou représentera les couleurs de l'INSA Lyon pour sa thèse "Analyse conjointe de trajectoires spatiales et oculaires pour le dépistage de la maladie d'Alzheimer" réalisée au sein de l'école doctorale Infomaths (ED 512) et du laboratoire LIRIS
Grand Amphithéâtre de l'Université de Lyon - 90 rue Pasteur 69007 Lyon
Finale nationale prévue pour le 17 juin 2025.
---------------
Ma Thèse en 180 secondes propose aux doctorants de présenter, devant un jury et un auditoire profane et diversifié, leur sujet de recherche en termes simples. Douze doctorantes et doctorants du site Lyon Saint-Étienne exposeront, en 3 minutes, de manière claire, concise et néanmoins convaincante, leur projet de recherche.

Sciences & Société
Ma thèse en 180 secondes : finale locale "Université de Lyon"
Venez encourager les doctorantes et doctorants lors de la finale locale Ma thèse en 180 secondes.
La finale locale Université de Lyon du concours international francophone Ma thèse en 180 secondes se déroulera jeudi 20 mars 2025, à 18h.
À suivre en présentiel ou en direct sur YouTube et sur la page Facebook Université de Lyon.
Un jury composé de chercheurs, journalistes et représentants du monde socio-économique décernera trois prix. Vous aurez également la possibilité de décerner le prix du public en assistant à la finale.
Le 1ᵉʳ prix du jury et le prix du public seront les deux lauréats Université de Lyon qui accéderont à l'étape nationale du concours.
Parmi les 12 candidats sélectionnés, Syrine Salouhou représentera les couleurs de l'INSA Lyon pour sa thèse "Analyse conjointe de trajectoires spatiales et oculaires pour le dépistage de la maladie d'Alzheimer" réalisée au sein de l'école doctorale Infomaths (ED 512) et du laboratoire LIRIS
Finale nationale prévue pour le 17 juin 2025.
---------------
Ma Thèse en 180 secondes propose aux doctorants de présenter, devant un jury et un auditoire profane et diversifié, leur sujet de recherche en termes simples. Douze doctorantes et doctorants du site Lyon Saint-Étienne exposeront, en 3 minutes, de manière claire, concise et néanmoins convaincante, leur projet de recherche.
Informations complémentaires
-
Grand Amphithéâtre de l'Université de Lyon - 90 rue Pasteur 69007 Lyon

Sciences & Société
Soutenance de l'Habilitation à Diriger des Recherches en sciences : Audrey SERNA
Supporting meaningful and adapted experience to foster motivation and sustained engagement.
Maître de conférences : Audrey SERNA
Laboratoire INSA : LIRIS
Rapporteurs : Wendy Mackay, Jean-Claude Martin, Vero Vanden Abeele
Jury :
Civilité |
Nom et Prénom |
Grade/Qualité |
Etablissement |
Mme |
Dupuy Chessa Sophie |
Professeur des Universités |
Université Grenoble Alpes |
M |
Garcia Christophe |
Professeur des Universités |
INSA Lyon |
M |
Hacid Mohand-Saïd |
Professeur des Universités |
Université Claude Bernard Lyon 1 |
Mme |
Lavoué Elise |
Professeur des Universités |
Université Jean Moulin Lyon 3 |
Mme |
Mackay Wendy |
Directrice de Recherche |
INRIA Saclay |
M |
Martin Jean-Claude |
Professeur des Universités |
Université Paris Saclay |
Mme |
Vanden Abeele Vero |
Associate Professor |
KU Leuven |
Informations complémentaires
-
INSA Lyon - Amphi Laura Bassi - Villeurbanne

Sciences & Société
Soutenance de thèse : Pierre-Yves GENEST
Unsupervised Open-World Information Extraction From Unstructured and Domain-Specific Document Collections
Doctorant : Pierre-Yves GENEST
Laboratoire INSA : LIRIS
École doctorale : ED512 : InfoMaths de Lyon
The exponential growth in data generation has rendered the effective analysis of unstructured textual document collections a critical challenge. This PhD thesis aims to address this challenge by focusing on Information Extraction (IE), which encompasses four essential tasks: Named Entity Recognition (NER), Coreference Resolution (CR), Entity Linking (EL), and Relation Extraction (RE). These tasks collectively enable extracting and structuring knowledge from unformatted documents, facilitating its integration into structured databases for further analytical processes.
Our contributions start with creating Linked-DocRED, the first large-scale, diverse, and manually annotated dataset for document-level IE. This dataset enriches the existing DocRED dataset with high-quality entity linking labels. Additionally, we propose a novel set of metrics for evaluating end-to-end IE models. The evaluation of baseline models on Linked-DocRED highlights the complexities and challenges inherent to document-level IE: cascading errors, long context handling, and information scarcity.
We then introduce PromptORE, an unsupervised and open-world RE model. Adapting the prompt-tuning paradigm, PromptORE achieves relation embedding and clustering without requiring fine-tuning or hyperparameter tuning (a major weakness of previous baselines) and significantly outperforms state-of-the-art models. This method demonstrates the feasibility of extracting semantically coherent relation types in an open-world context.
Further extending our prompt-based approach, we develop CITRUN for unsupervised and open-world NER. By employing contrastive learning with off-domain labeled data, CITRUN improves entity type embeddings, surpassing LLM-based unsupervised NERs, and achieving competitive performance against zero-shot models that are more supervised.
These advancements facilitate meaningful knowledge extraction from unstructured documents, addressing practical, real-world constraints and enhancing the applicability of IE models in industrial contexts.
Informations complémentaires
-
Salle 501.337, Bâtiment Ada Lovelace, INSA-Lyon (Villeurbanne)