Sujet de Thèse
Titre :
Développement de méthodes d'apprentissage automatique pour la prédiction de la viabilité et mortalité cellulaires en bioréacteurs.
Dates :
2025/10/01 - 2028/09/30
Encadrant(s) : 
Autre(s) encadrant(s) :
Pr. Bensoussan Danièle (d.bensoussan@chru-nancy.fr) , Pr Olmos Eric (eric.olmos@univ-lorraine.fr)
Description :
Bien que de nombreux essais cliniques soient en cours sur l'utilisation de Médicaments de Thérapies Innovantes (MTI), le principal défi auquel sont confrontés la majorité des investigateurs est la capacité de produire un grand nombre de cellules fonctionnelles dans un délai court et à un coût maîtrisé en raison essentiellement d'une variabilité non contrôlée des conditions initiales de culture. L'ambition de standardisation des lots de bioproduction repose sur la résolution de problèmes d'optimisation des conditions de culture et sur l'ajustement en temps réel des paramètres critiques des bioprocédés de fabrication. Mais ces deux enjeux requièrent de disposer de modèles fiables du comportement dynamique de la quantité et de la mortalité cellulaires. Lors de cultures en bioréacteurs, l'apparition des phénomènes de mort cellulaire reste très peu maîtrisée. En effet, lorsque l'un des substrats nécessaires à la croissance devient limitant, des mécanismes intracellulaires complexes de mort cellulaire sont enclenchés, notamment de mort programmée par apoptose. De manière générale, ces mécanismes sont irréversibles, ce qui implique qu'une action de régulation de la quantité de substrat a posteriori devient alors sans action sur la survie des cellules, ce qui impacte négativement les performances du bioprocédé. Pour améliorer les stratégies de contrôle du bioréacteur des modèles cinétiques de croissance et de mort cellulaire ont été largement documentés dans la littérature mais ceux-ci restent paramétrés lors de cultures définies et sont donc moyennement généralisables à d'autres conditions de culture et, a fortiori, à d'autres lignées cellulaires. L'utilisation de modèles métaboliques est également peu adaptée du fait de la complexité des mécanismes intracellulaires impliquées. Ainsi, il est attendu un gain significatif de performances en cas d'utilisation de modèles prédictifs de contrôle intégrant des modèles de mort cellulaire étendus (Dewasme et al., 2023).

Le sujet de thèse concernera le développement de méthodes et d'outils pour l'identification de modèles dynamiques associés à deux variables de sortie : quantité et mortalité cellulaires. Il se décompose en deux axes complémentaires et partageant les mêmes jeux de données. Les deux axes d'application utiliseront le même type de modèle hiérarchique composé d'un modèle de premier principe biologique (modèle externe) et d'un modèle d'apprentissage de type réseau de neurones bayésien (modèle interne). Ce sujet s'inscrit dans les perspectives d'un projet Bioproduction France 2030 sur le développement d'une nouvelle technologie de mesure et dans le cadre d'une demande de projet CNRS MITI Avancées thérapeutiques (en cous de soumission) sur le financement de technologies de mesure complémentaires pour enrichir les bases de données à l'origine de la construction de nos modèles d'apprentissage. Les travaux de cette thèse seront notamment appliqués à la production de cellules eMDSC CD34+ dans le cadre du développement d'une nouvelle thérapie cellulaire.

Axe 1 : plans d'expériences intensifiés. L'optimisation de la densité cellulaire produite est actuellement réalisée via l'application de méthodes de planification statistique d'expériences. Leur principe est de sélectionner un nombre parcimonieux d'essais à réaliser pour identifier au mieux des modèles algébriques qui permettront notamment de prédire des points de fonctionnement pertinents. Un plan d'expériences comprend en moyenne entre 10 et 20 essais différents à réaliser. Dans le cas d'un bioréacteur, une session de culture peut durer entre 2 et 4 semaines selon le mode de production. Une campagne d'expérimentation fondée sur un tel plan peut donc durer au minimum 20 semaines. Cette durée constitue le principal obstacle qui freine leur mise en oeuvre dans le secteur de la bioproduction. Notre objectif est de développer une alternative s'inspirant des travaux de Bayer et al. (Bayer et al., 2020; Nold et al., 2022) proposant un couplage hybride entre un réseau de neurones artificiel et un modèle de premiers principes biologiques qui leur permet de réaliser plusieurs conditions expérimentales différentes pendant une même session de production et ainsi de diviser au moins par trois la durée d'une campagne d'essais. Dans le prolongement de ce travail, nous souhaitons explorer l'usage d'autres techniques d'apprentissage comme celui de réseaux de neurones bayésiens sur lesquels nous travaillons déjà pour des applications médicales en radiothérapie.

Axe 2 : capteur logiciel de mortalité cellulaire. Ce second objectif est complémentaire à celui de l'axe 1 par la nature de la variable à modéliser et la réutilisation des données obtenues durant cette première phase. Il n'existe actuellement pas de technologie fiable pour mesurer et caractériser en temps réel la mortalité cellulaire pendant un cycle de bioproduction. Or cette connaissance impacte grandement la qualité des lots produits et permettrait d'ajuster au mieux les paramètres critiques du procédé pour maîtriser aussi bien la quantité (axe 1) que la viabilité (axe 2) des cellules. Le développement de capteurs logiciels dédiés aux bioréacteurs a fait l'objet d'un regain d'intérêt ces dernières avec l'intégration des nouvelles technologies analytiques (Gustavsson, 2018), (Pérez et al., 2020), (Reyes et al., 2022) comme les spectrométries Raman et proche infra-rouge. Dans ce sujet, nous souhaitons utiliser des capteurs plus répandus et moins coûteux comme les sondes diélectriques et de turbidité pour augmenter la portée des résultats. Nous compléterons ces données d'apprentissage par des mesures et caractérisations de la mortalité cellulaire issues de prélèvements quotidiens. Nous considèrerons les travaux de Kroll et al. (Kroll et al., 2017) comme base de départ et nous chercherons à améliorer la précision et la robustesse des résultats en identifiant un modèle dynamique hybride de la mortalité cellulaire dont la structure hiérarchique sera inspirée de celle (réseaux de neurones bayésiens couplés à un modèle de premiers principes) déjà investiguée dans l'axe 1.
Mots clés :
Hierarchical Modeling, Machine Learning, Soft Sensors, Design of Experiments, Cell Production
Conditions :
Durée : 3ans
Employeur: Université de Lorraine,
Lieux: CRAN, LRGP, Cybernano
Rémunération : bourse de thèse
Profil attendu : Double compétence Numérique et Santé
Département(s) : 
Biologie, Signaux et Systèmes en Cancérologie et Neurosciences
Financement :
ENACT IA (50%) / Cybernano (50%)