CRAN - Campus Sciences
BP 70239 - 54506 VANDOEUVRE Cedex
Tél : +33 (0)3 72 74 52 90 Fax : +33 (0)3 72 74 53 08
cran-secretariat@univ-lorraine.fr
 
 
Sujet de Thèse : Identification de modèles dynamiques linéaires à effets mixtes. Applications aux dynamiques de populations cellulaires en biologie.
Dates : 2014/11/14 - 2017/10/31
Etudiant : Levy BATISTA
Directeur(s) CRAN : Thierry BASTOGNE , El-Hadi DJERMOUNE
Description : Une des caractéristiques communes aux systèmes biologiques est une large variabilité des leurs réponses entre des individus semblables subissant le même traitement dans un même contexte. Cette manque de reproductibilité augmente lorsqu'on passe des études in vitro aux études in vivo puis aux études cliniques. Il est indispensable d'estimer cette variabilité intra-groupe dans les analyses de pharmacocinétique ou de pharmacodynamie car elle influence directement la pertinence des analyses statistiques réalisées sur les paramètres estimés et celles des études de prédiction sur les réponses. En outre, il est également courant de chercher à évaluer quantitativement les effets de facteurs qualitatifs (e.g. le type de molécule, le type de lignée cellulaire ou la voie d'administration) sur les réponses mesurées. Dans ce but, on utilise généralement des plans d'expériences permettant de faire varier judicieusement les conditions d'expérimentation et de procéder à des répétitions de traitement pour évaluer la reproductibilité des réponses.

Une fois les expériences réalisées, on se contente trop souvent de répéter l'application d'algorithmes d'identification de modèle à chacune des réponses mesurées. Cette approche a deux inconvénients majeurs:
- elles est rapidement chronophage car dans les études visées le nombre de répétitions des analyses est au minimum un multiple de cent;
- elle engendre d'estimer et de ré-estimer à chaque fois un nombre inutilement trop grand de paramètres. En effet, d'un individu à un autre, aussi bien que d'un traitement à un autre, le contexte ne change pas et certains paramètres du modèle, en particulier ceux de la partie stochastique, n'ont pas de raison de changer de valeur.

Plutôt que de déterminer un modèle pour chaque réponse, il serait plus judicieux de chercher à identifier un modèle global à partir de l'ensemble des réponses individuelles mesurées à l'issue du plan d'expériences. C'est l'idée sous-jacente au problème d'identification posé dans cette thèse.

Pour représenter la diversité des réponses au sein du modèle, on se propose de décrire chaque paramètre par un modèle ANOVA (analyse de variance) composé d'une part d'effets fixes (déterministes) dus aux facteurs qualitatifs et d'autre part d'effets aléatoires pour décrire la variabilité inexpliquée entre les individus d'un même groupe de traitement. L'introduction d'une représentation ANOVA des paramètres du modèle implique l'introduction d'hyperparamètres et le problème d'identification à résoudre consiste alors à savoir comment estimer ces hyper-paramètres du modèle à partir des données expérimentales disponibles. En ce sens le problème proposé peut être vu comme une extension des problèmes d'identification de modèles LPV (Linéaires à Paramètres Variants).

Des solutions ont été proposées par la communauté statisticienne pour traiter ce type de problème, notamment le développement de méthodes d'estimations dédiés aux modèles non-linéaires à effets mixtes (2005-Kuhn,2006-Lavielle,2007-Samson). Plusieurs de ces approches ont donné de bons résultats dans des études de modélisation PK/PD (pharmacocinétique et pharmocodynamie) à partir de données expérimentales (2006-Samson,2010-Bastogne). Toutefois, elles nécessitent au préalable de déterminer la structure théorique des réponses à étudier. Les méthodes existantes utilisent des modélisations phénoménologiques des réponses pharmacocinétiques ou de pharmocodynamie mais n'ont jamais à notre connaissance été étendues aux modèles de type fonctions de transfert ou représentations d'état en automatique

Notre principal objectif est donc d'étendre ces approches au problème de l'identification de systèmes dynamiques linéaires (1987-Ljung), d'évaluer leur efficacité en pratique et d'élaborer un outil de traitement automatisé de ces informations biologiques. Pour débuter, des structures de modèles simples (de type ARX) sont envisagées.
Mots clés : identification de systèmes, erreur de prédiction, modèles à effets mixtes, systèmes biologiques
Conditions : Durée: 3ans
Financement CIFRE: CYBERnano (start-up CRAN)
Lieu: Nancy (Campus Médecine)
Rémunération : montant d'un thèse ministérielle classique
Profil: étudiant de master en automatique et traitement du signal avec des compétences en identification de systèmes.
Département(s) :
Santé - Biologie - Signal
Financement : Financement CIFRE: CYBERnano (start-up CRAN)