Sujet de stage
Titre :
Conception et apprentissage de commandes centrées sur SLAM pour l'autonomie des drones (ROS/Gazebo, AirSim)
Dates :
2026/03/06 - 2026/09/06
Encadrant(s) : 
Description :
Le projet envisage une pile d'autonomie axée sur le SLAM (SLAM-first autonomy stack), dans laquelle la perception, l'ingénierie de la simulation, la planification et la commande sont articulées avec la sécurité comme exigence primordiale. Les travaux se concentrent sur le développement d'un module SLAM visuel/visuel-inertiel fournissant la pose, la cartographie et des estimations d'incertitude de base, servant de socle (backbone) aux processus décisionnels et de commande en aval.

La simulation constitue une activité centrale : un pipeline ROS/Gazebo sera conçu pour une itération rapide et systématiquement interfacé avec AirSim afin de permettre une détection et une physique de haute fidélité, une randomisation de domaine et des tests de résistance par scénarios (obstacles dynamiques, vent, artefacts de capteurs).

Sur la base du SLAM, la planification de mouvement sera mise en oeuvre à l'aide de méthodes basées sur des graphes (A*/D* Lite) et sur l'échantillonnage (RRT/RRT*), générant des trajectoires paramétrées temporellement et réalisables sur le plan cinodynamique (kinodynamically feasible), tenant compte des marges de sécurité et, le cas échéant, de l'incertitude du SLAM.

Les stratégies de commande seront étudiées, allant du PID à la commande optimale (LQR/MPC) pour le mouvement point à point et le suivi de trajectoire sous contraintes. L'apprentissage d'une commande sûre (safe control learning) est un objectif principal : des filtres de sécurité (ex. : programmation quadratique basée sur des fonctions barrières de commande ⬔ CBF-QP), une assurance à l'exécution et une gestion robuste des contraintes seront intégrés tant aux contrôleurs classiques qu'à la couche d'apprentissage.

En tant que composante novatrice, des approches d'apprentissage par renforcement (PPO/SAC résiduels ou sécurisés par bouclier/ safety-shielded) seront développées pour améliorer le suivi et l'évitement local, avec des fonctions de récompense sensibles au risque et des études d'ablation comparatives face aux références classiques.

Les livrables comprennent une base de code reproductible (ROS/Gazebo ? AirSim), des benchmarks quantitatifs (classique vs classique+RL), un rapport de recherche concis, une vidéo de démonstration et la préparation d'un manuscrit pour soumission à des conférences ou revues réputées.

Objectifs :

Ingénierie du socle SLAM : Implémenter et benchmarker un pipeline SLAM visuel/VIO (pose, cartographie, incertitude de base), en l'établissant comme module principal d'estimation d'état.

Construction de la pile de simulation : Configurer un environnement ROS/Gazebo reproductible (mondes, capteurs, plugins) avec des scénarios scriptés pour une itération rapide.

Interfaçage de simulation haute fidélité : Intégrer AirSim ? ROS/Gazebo (synchronisation temporelle, topics, capteurs) pour permettre des tests de résistance réalistes (physique et capteurs) et la randomisation de domaine.

Planification de trajectoire : Implémenter A*/D* Lite et RRT/RRT* ; générer des trajectoires paramétrées temporellement et cinodynamiquement réalisables (ex. : splines limitées en jerk).

Commande de référence (Baseline control) : Développer une commande PID de base et l'étendre de préférence à la commande optimale (LQR) pour le mouvement point à point et le suivi de trajectoire sous contraintes.

Couche de sécurité pour la commande : Concevoir des filtres de sécurité CBF-QP et/ou une assurance à l'exécution (Simplex) pour garantir la satisfaction des contraintes et minimiser les violations de sécurité.

Innovation en RL : Développer un RL résiduel ou sécurisé par bouclier (safety-shielded RL, ex. : PPO/SAC) qui augmente le contrôleur nominal ou l'évitement local tout en respectant les filtres de sécurité.
Mots clés :
commande autonome, conception de commande, apprentissage de commande, drones, apprentissage de comma
Département(s) : 
Contrôle Identification Diagnostic