Sujet de Thèse
Titre :
Contribution à la généralisation et la transférabilité de l'apprentissage profond pour la maintenance prédictive
Dates :
2025/10/01 - 2028/09/30
Encadrant(s) : 
Description :
Contexte scientifique
Un élément clé de l'Industrie 4.0 est la maintenance prédictive (PdM-Predictive Maintenance) visant à optimiser les stratégies de maintenance grâce à des méthodologies basées sur les données. La PdM s'appuie sur la numérisation et l'analyse des données pour prédire la dégradation des équipements, optimiser la planification de la maintenance, allouer efficacement les ressources, réduire les coûts, améliorer la disponibilité et prolonger la durée de vie des actifs.
Depuis le début des années 2010, les méthodes d'apprentissage automatique (ML) ont été largement adoptées pour la PdM. Cependant, les tendances récentes indiquent une évolution vers l'apprentissage profond (DL-Deep Learning. Le passage des méthodes conventionnelles de PdM aux approches basées sur le DL est attribué à plusieurs avantages clés.
L'un des atouts fondamentaux du DL en PdM réside dans sa capacité à extraire et à apprendre des informations discriminantes à partir de sources de données brutes, complexes et multimodales. Les modèles de DL découvrent de manière autonome des caractéristiques pertinentes, ce qui améliore la détection des pannes, le diagnostic et le pronostic. De plus, le DL peut traiter des ensembles de données hétérogènes à grande échelle avec une connaissance minimale du domaine. Cependant, malgré ces avantages, plusieurs défis et limitations entravent l'adoption et l'efficacité complètes du DL dans les applications de maintenance prédictive.
Premièrement, les modèles de DL souffrent fréquemment de surapprentissage, en particulier lorsqu'ils sont entraînés sur des jeux de données étiquetés limités. Ce problème est crucial dans les environnements industriels, où l'acquisition de données étiquetées de haute qualité est à la fois coûteuse et chronophage. De plus, les modèles de DL nécessitent des ressources de calcul importantes, ce qui complique leur déploiement dans des applications industrielles temps réel. Une autre limitation majeure est l'interprétabilité : les modèles de DL fonctionnent comme des boîtes noires, ce qui rend difficile pour les ingénieurs de maintenance de faire confiance à leurs prédictions ou de les valider. Ce manque de transparence peut ralentir l'adoption des solutions de maintenance prédictive basées sur le DL, en particulier dans les secteurs où la prise de décision exige des justifications solides et une conformité réglementaire. Un défi majeur de la recherche en maintenance prédictive repose sur la prise en compte, dans le modèle de maintenance prédictive, des environnements d'exploitation dynamiques, influencés à la fois par des facteurs internes et externes. Les systèmes de surveillance traditionnels se concentrent principalement sur les données internes, négligeant souvent l'impact des variables externes. Cette négligence peut conduire à des interprétations erronées de l'état de santé d'une machine, entraînant des erreurs de détection des défauts et de prédiction des pannes, ou des pertes d'opportunités de maintenance. De plus, les modèles de maintenance prédictive ne parviennent souvent pas à généraliser aux conditions dynamiques, telles que les changements de processus de production ou les variations environnementales, ce qui peut dégrader les performances du modèle. Les modèles de DL existants peinent à s'adapter aux nouveaux scénarios opérationnels, ce qui limite leur utilisation à long terme.
Un autre défi majeur est la rareté des données (data scarcity). De nombreux environnements industriels manquent de données étiquetées suffisantes pour former des modèles robustes, ce qui nécessite des techniques alternatives telles que l'apprentissage par transfert, la génération de données synthétiques et l'apprentissage auto-supervisé. De plus, la PdM implique l'intégration de données provenant de multiples sources hétérogènes (par exemple, vibrations, son, température). De nombreux modèles DL existants ne parviennent pas à exploiter pleinement les données de capteurs multimodaux. Cette incapacité à exploiter efficacement diverses sources de données limite la précision prédictive et la prise de décision globale.

Objectives de la thèse et contributions attendues
Face à ces défis, nous avons pour objet dans cette thèse de développer un cadre d'apprentissage profond combinant à la fois des modèles et des méthodologies d'entrainement efficaces pour la maintenance prédictive de systèmes industriels.
Plusieurs approches seront explorées pour relever les défis identifiés :
⬢ Developement de modèles d'apprentissage non supervisé et auto-supervisé pour entraîner des modèles d'apprentissage profond sur des ensembles de données industrielles à grande échelle afin d'apprendre des représentations de caractéristiques significatives avant de les affiner pour des tâches pronostiques spécifiques. Les modèles dévelopés permettront d'améliorer la robustesse des modèles lorsque les données étiquetées sont rares.
⬢ Developemende modèles d'apprentissage par transfert et adaptation au domaine : Étude de techniques améliorant la généralisation à différentes machines et industries, pour relever le défi des conditions d'apprentissage profond.
⬢ Pré-entraînement des réseaux d'apprentissage profond : Utilisation de l'apprentissage non supervisé et auto-supervisé pour extraire des représentations génériques et transférables à partir de données étiquetées et non étiquetées. Ces représentations seront affinées pour des applications PdM spécifiques, réduisant ainsi la dépendance aux grands ensembles de données annotées.
⬢ Fusion de données multimodales : intégration de diverses modalités de capteurs (par exemple, vibrations, son, température) pour améliorer la précision prédictive et fournir une vision globale de l'état des machines
⬢ Mécanismes de contextualization: développement de modèles intégrant les facteurs internes et externes affectant l'état des machines, améliorant ainsi la détection des anomalies et la précision des pronostics.
De plus, le travail s'appuiera sur des données industrielles fournies par des clients d'Idemoov pour tester et valider la solution proposée sur des données opérationnelles réelles avec des défis industriels pratiques.
Mots clés :
Maintenance prédictive, apprentissage profond, apprentissage par transfert
Département(s) : 
Modélisation Pilotage des Systèmes Industriels
Financement :
Demande de financement d'ENACT