Sujet de Thèse
Modélisation basée données pour la construction et la mise à jour de jumeaux numériques de systèmes cyber-
physiques : application au projet ANR JUNEAU
Dates :
2024/04/08 - 2027/04/07
Etudiant :
Encadrant(s) :
Autre(s) encadrant(s) :
Pr. Virginie GOEPP (virginie.goepp@insa-strasbourg.fr)
Description :
La reconception/reconfiguration des systèmes industriels s'appuie, entre autres, sur des modèles de
comportement, notamment des simulations à évènements discrets (SED) [1, 2].
La construction de ces modèles est un enjeu important car c'est d'eux que dépendent les performances de la
reconception/reconfiguration. Plusieurs aspects entrent en jeu dans la construction de ces modèles tels que :
le temps et l'expertise nécessaires pour les construire mais aussi leur validité, crédibilité et degrés de précision
et granularité en fonction de l'objectif de modélisation et des indicateurs de performance ciblés [3].
Ces dernières années de nombreux travaux [4-7] considèrent la modélisation/simulation basées données
(data-driven modeling/simulation) comme un moyen d'automatiser la construction et par conséquent
d'accélérer la construction et la mise à jour de modèles plus précis et complets de systèmes complexes. Le
principe sous-jacent à la modélisation/simulation basée données est de construire les modèles à partir de
données réelles issues du système (mesure de capteurs, log de systèmes informatiques, etc.).
L'obtention des données nécessaires à la modélisation/simulation basée données est un goulet (important) du
processus [8]. Il a pour origines principales la méconnaissance et/ou l'absence des données nécessaires à la
construction du modèle en regard du problème de reconception/reconfiguration traité. La suppression de ce
goulet passe par la mise à disposition rapide de modèles génériques (réutilisables) et de systèmes de mesures
adéquats.
Dans ce contexte, contrairement aux travaux existants qui proposent des modèles de simulation basée
données ad hoc, un premier objectif est de proposer des modèles génériques qui peuvent être adaptés
rapidement aux besoins spécifiques. Cela nécessite tout d'abord de caractériser les données nécessaires aux
modèles de simulation en fonction du problème de reconception/reconfiguration considéré, et parallèlement
d'identifier les modèles que les données existantes permettent d'obtenir, en regard des indicateurs de
performance envisagés.
Les données produites par le système réel vont donc permettre d'instancier les modèles génériques proposés,
et seront aussi utilisées afin de connecter le modèle de simulation obtenu avec le système réel, pour aller
jusqu'à en faire une ombre numérique. Ce modèle devra nécessairement être mis à jour en fonction de
changements mineurs/majeurs intervenant sur le système réel. Un deuxième objectif, contigu au premier, sera
donc d'étudier les possibilités de modifier, dynamiquement dans le temps, la structure du modèle initial avec
le système réel, en respectant la topologie du modèle. Outre la question du « comment », se pose aussi la
question du « quand » réaliser cette mise à jour. Cela nécessitera d'étudier des approches de détection de
dérive entre systèmes réel/virtuel telles que [9,10] ou d'assimilation de données.
Une attention particulière devra être portée sur la complétude des données nécessaires à la conception/mise à
jour des modèles de simulation. Si des données supplémentaires doivent être obtenues, il sera alors nécessaire
de spécifier les exigences du système de mesure capables de répondre aux besoins d'informations, dans
l'optique d'assister l'expert humain dans la mise en oeuvre de la collecte de données par le biais d'une
instrumentation éphémère ou non, couche parallèle aux systèmes d'information déjà en place sur le système
d'intérêt, mise en oeuvre rapidement pour acquérir les données manquantes à moindre coût.
Ce projet doctoral sera mené en recherche/action. La recherche/action est une méthodologie de recherche où
activités de recherche et d'expérimentation/observation en usine s'enrichissent mutuellement. Cette méthode
de recherche s'appuie sur des boucles comprenant 3 phases : Planification de l'action prenant en compte les
connaissances scientifiques existantes, Action/Observation pour mettre en oeuvre les propositions et Réflexion
pour analyser les résultats obtenus sur le terrain. La fin d'une boucle peut donner naissance à une nouvelle,
autant que cela est nécessaire. Dans le cadre de ces travaux, deux terrains d'application sont envisagés : d'une
part, le monde hospitalier avec une application au Service d'Accueil des Urgences pédiatriques de Saint-
Etienne, qui constituera la cible principale du projet de thèse. D'autre part, et de manière plus classique, afin
de démontrer la généricité de l'approche, il sera envisagé d'appliquer ces travaux sur les usines école de l'IUT
de Haguenau (Université de Strasbourg).
Les techniques mises en oeuvre sont celles de simulation à évènements discrets (logiciels Witness, Arena,
FlexSim, ...) ainsi que l'ingénierie d'entreprise pour la caractérisation des modèles.
comportement, notamment des simulations à évènements discrets (SED) [1, 2].
La construction de ces modèles est un enjeu important car c'est d'eux que dépendent les performances de la
reconception/reconfiguration. Plusieurs aspects entrent en jeu dans la construction de ces modèles tels que :
le temps et l'expertise nécessaires pour les construire mais aussi leur validité, crédibilité et degrés de précision
et granularité en fonction de l'objectif de modélisation et des indicateurs de performance ciblés [3].
Ces dernières années de nombreux travaux [4-7] considèrent la modélisation/simulation basées données
(data-driven modeling/simulation) comme un moyen d'automatiser la construction et par conséquent
d'accélérer la construction et la mise à jour de modèles plus précis et complets de systèmes complexes. Le
principe sous-jacent à la modélisation/simulation basée données est de construire les modèles à partir de
données réelles issues du système (mesure de capteurs, log de systèmes informatiques, etc.).
L'obtention des données nécessaires à la modélisation/simulation basée données est un goulet (important) du
processus [8]. Il a pour origines principales la méconnaissance et/ou l'absence des données nécessaires à la
construction du modèle en regard du problème de reconception/reconfiguration traité. La suppression de ce
goulet passe par la mise à disposition rapide de modèles génériques (réutilisables) et de systèmes de mesures
adéquats.
Dans ce contexte, contrairement aux travaux existants qui proposent des modèles de simulation basée
données ad hoc, un premier objectif est de proposer des modèles génériques qui peuvent être adaptés
rapidement aux besoins spécifiques. Cela nécessite tout d'abord de caractériser les données nécessaires aux
modèles de simulation en fonction du problème de reconception/reconfiguration considéré, et parallèlement
d'identifier les modèles que les données existantes permettent d'obtenir, en regard des indicateurs de
performance envisagés.
Les données produites par le système réel vont donc permettre d'instancier les modèles génériques proposés,
et seront aussi utilisées afin de connecter le modèle de simulation obtenu avec le système réel, pour aller
jusqu'à en faire une ombre numérique. Ce modèle devra nécessairement être mis à jour en fonction de
changements mineurs/majeurs intervenant sur le système réel. Un deuxième objectif, contigu au premier, sera
donc d'étudier les possibilités de modifier, dynamiquement dans le temps, la structure du modèle initial avec
le système réel, en respectant la topologie du modèle. Outre la question du « comment », se pose aussi la
question du « quand » réaliser cette mise à jour. Cela nécessitera d'étudier des approches de détection de
dérive entre systèmes réel/virtuel telles que [9,10] ou d'assimilation de données.
Une attention particulière devra être portée sur la complétude des données nécessaires à la conception/mise à
jour des modèles de simulation. Si des données supplémentaires doivent être obtenues, il sera alors nécessaire
de spécifier les exigences du système de mesure capables de répondre aux besoins d'informations, dans
l'optique d'assister l'expert humain dans la mise en oeuvre de la collecte de données par le biais d'une
instrumentation éphémère ou non, couche parallèle aux systèmes d'information déjà en place sur le système
d'intérêt, mise en oeuvre rapidement pour acquérir les données manquantes à moindre coût.
Ce projet doctoral sera mené en recherche/action. La recherche/action est une méthodologie de recherche où
activités de recherche et d'expérimentation/observation en usine s'enrichissent mutuellement. Cette méthode
de recherche s'appuie sur des boucles comprenant 3 phases : Planification de l'action prenant en compte les
connaissances scientifiques existantes, Action/Observation pour mettre en oeuvre les propositions et Réflexion
pour analyser les résultats obtenus sur le terrain. La fin d'une boucle peut donner naissance à une nouvelle,
autant que cela est nécessaire. Dans le cadre de ces travaux, deux terrains d'application sont envisagés : d'une
part, le monde hospitalier avec une application au Service d'Accueil des Urgences pédiatriques de Saint-
Etienne, qui constituera la cible principale du projet de thèse. D'autre part, et de manière plus classique, afin
de démontrer la généricité de l'approche, il sera envisagé d'appliquer ces travaux sur les usines école de l'IUT
de Haguenau (Université de Strasbourg).
Les techniques mises en oeuvre sont celles de simulation à évènements discrets (logiciels Witness, Arena,
FlexSim, ...) ainsi que l'ingénierie d'entreprise pour la caractérisation des modèles.
Mots clés :
modélisation basée données, simulation, jumeau numérique
Département(s) :
Modélisation Pilotage des Systèmes Industriels |