Sujet de Thèse
Dates :
2023/10/10 - 2026/10/09
Etudiant :
Encadrant(s) :
Description :
Cette thèse se place dans le cadre général du développement de systèmes autonomes intelligents en réseau.
De nombreux champs d'applications donnent aujourd'hui lieu à des réseaux de systèmes dynamiques, à
l'instar des flottes de drones ou de véhicules et des réseaux d'énergie. Pour permettre le plein essor de ces
technologies, il est essentiel d'avoir à disposition des méthodes de contrôle adaptées qui apportent des
garanties de stabilité et de robustesse ainsi que de performance (optimalité).
Dans ce contexte, l'objectif de cette thèse internationale est de contribuer au développement d'outils
méthodologiques pour la synthèse de lois de commande performantes, stabilisantes et robustes pour des
systèmes non-linéaires généraux interconnectés. Nous nous concentrerons à cette fin sur les techniques de
programmation dynamique. La programmation dynamique est l'approche privilégiée pour construire des
contrôleurs performants (« presque » optimaux) pour des systèmes et des fonctions de coût généraux, ce qui
est essentiel pour les systèmes complexes en réseau, lorsqu'un modèle des dynamiques est disponible. En
revanche, les contrôleurs obtenus par programmation dynamique ne sont a priori pas dotés de garanties de
stabilité et de robustesse, or celles-ci sont essentielles dans la plupart des applications de l'automatique.
Le but de cette thèse est donc d'identifier des conditions, voire de revisiter les algorithmes de la
programmation dynamique, afin d'apporter à la fois des garanties de performance mais aussi de stabilité
robuste.
Les principales étapes de la thèse seront les suivantes : (i) établir des propriétés de stabilité entrée-sortie,
intimement liées aux questions de robustesse et essentielles pour la mise en place de lois de commande
distribuées par la suite, pour un système isolé ; (ii) exploiter ces résultats pour des réseaux de systèmes dans
un premier temps lorsque chaque agent du réseau doit minimiser un coût local ; (iii) développer des versions
de ces stratégies de contrôle basées sur les données (et non plus sur un modèle des dynamiques), on parle
alors ici d'apprentissage par renforcement, pour améliorer l'autonomie des systèmes en synthétisant
directement les entrées de contrôle à partir des données d'entrée-sortie disponibles.
Cette thèse se fera en étroite collaboration avec Dragan Nesic de l'université de Melbourne (Australie). Une
voire des séjours en Australie seront prévus.
De nombreux champs d'applications donnent aujourd'hui lieu à des réseaux de systèmes dynamiques, à
l'instar des flottes de drones ou de véhicules et des réseaux d'énergie. Pour permettre le plein essor de ces
technologies, il est essentiel d'avoir à disposition des méthodes de contrôle adaptées qui apportent des
garanties de stabilité et de robustesse ainsi que de performance (optimalité).
Dans ce contexte, l'objectif de cette thèse internationale est de contribuer au développement d'outils
méthodologiques pour la synthèse de lois de commande performantes, stabilisantes et robustes pour des
systèmes non-linéaires généraux interconnectés. Nous nous concentrerons à cette fin sur les techniques de
programmation dynamique. La programmation dynamique est l'approche privilégiée pour construire des
contrôleurs performants (« presque » optimaux) pour des systèmes et des fonctions de coût généraux, ce qui
est essentiel pour les systèmes complexes en réseau, lorsqu'un modèle des dynamiques est disponible. En
revanche, les contrôleurs obtenus par programmation dynamique ne sont a priori pas dotés de garanties de
stabilité et de robustesse, or celles-ci sont essentielles dans la plupart des applications de l'automatique.
Le but de cette thèse est donc d'identifier des conditions, voire de revisiter les algorithmes de la
programmation dynamique, afin d'apporter à la fois des garanties de performance mais aussi de stabilité
robuste.
Les principales étapes de la thèse seront les suivantes : (i) établir des propriétés de stabilité entrée-sortie,
intimement liées aux questions de robustesse et essentielles pour la mise en place de lois de commande
distribuées par la suite, pour un système isolé ; (ii) exploiter ces résultats pour des réseaux de systèmes dans
un premier temps lorsque chaque agent du réseau doit minimiser un coût local ; (iii) développer des versions
de ces stratégies de contrôle basées sur les données (et non plus sur un modèle des dynamiques), on parle
alors ici d'apprentissage par renforcement, pour améliorer l'autonomie des systèmes en synthétisant
directement les entrées de contrôle à partir des données d'entrée-sortie disponibles.
Cette thèse se fera en étroite collaboration avec Dragan Nesic de l'université de Melbourne (Australie). Une
voire des séjours en Australie seront prévus.
Mots clés :
Programmation dynamique, stabilité, systèmes interconnectés
Département(s) :
Contrôle Identification Diagnostic |