Sujet de Thèse
Titre :
Le futur des jumeaux numériques vers l'acquisition d'habilités cognitives à travers l'Analyse Polyadique de Concepts.
Dates :
2023/10/01 - 2026/09/30
Encadrant(s) : 
Description :
Le terme "jumeau numérique" (JN) a été utilisé pour la première fois par John Vickers de la National Aeronautics and Space
Administration (NASA) en 2002. Il a également donné la première définition formelle du jumeau numérique en 2010 comme
"une simulation intégrée multi-physique, multi-échelle et probabiliste d'un système tel que construit qui utilise les meilleurs
modèles physiques disponibles, les mises à jour des capteurs, etc. pour refléter la vie de son jumeau correspondant" [1]. Les cas
d'utilisation du JN couvrent l'ensemble du cycle de vie d'un produit.
Faisons référence au concept de cognition. La définition classique de la cognition donnée par Neisser [2] comprend "...tous les
processus par lesquels l'entrée sensorielle est transformée, réduite, élaborée, stockée, récupérée et utilisée...". Les aspects
fondamentaux de la cognition comprennent l'attention (concentration sélective), la perception (formation de préceptes utiles à
partir de données sensorielles brutes), la mémoire (encodage et récupération des connaissances), le raisonnement (tirer des
déductions à partir d'observations, de croyances et de modèles), l'apprentissage (à partir d'expériences, d'observations et
d'enseignants), la résolution de problèmes (atteindre des objectifs), la représentation des connaissances, etc.
Le JN standard est celui qui possède une partie numérique, une partie physique correspondante et une connexion entre elles.
Cette version du JN a la capacité d'apprendre et de stocker automatiquement les connaissances dans une structure formelle
comme les ontologies et les graphes de connaissances. L'une des caractéristiques du JN est le fait que ses activités sont liées à
une quantité massive de données à récupérer, à relier et à traiter. Ces données proviennent de sources hétérogènes.
Le JN ayant des capacités cognitives, en plus d'avoir la capacité d'apprendre, est doté des autres éléments de la cognition tels
que la perception, l'attention, la mémoire, le raisonnement, la résolution de problèmes, etc.

L'exploration de données multi-relationnelles (MRDM) [3] est le processus de découverte de connaissances ou de modèles à
partir de quantités massives de données (exploration de données), lorsque les données proviennent de sources hétérogènes liées
(multi-relationnelles). De plus, l'apprentissage non supervisé est le nom donné au processus d'extraction de modèles à partir de
données non étiquetées. Plusieurs cadres mathématiques ont été proposés pour traiter cette tâche, chacun ayant ses forces et ses
faiblesses, notamment l'analyse formelle des concepts.
L'analyse formelle des concepts (FCA [4]) est un formalisme qui établit une connexion entre les données binaires classiques
(croisables) et la structure des concepts et des règles qui peuvent être trouvés dans ces données. Il est très puissant car il offre
des structures mathématiques bien étudiées qui peuvent être exploitées par des algorithmes.
Comme les tables croisées sont une façon plutôt limitée de représenter les données, diverses extensions du formalisme ont été
proposées pour traiter des données plus complexes, telles que les structures de motifs (Pattern Structures) [5], l'analyse des
concepts relationnels (Relational Concept Analysis) [6], l'ACF floue (Fuzzy FCA) [7] ou l'ACF graphique (Graph FCA) [8].
Tout comme la FCA, elles sont basées sur la théorie des treillis [9].
L'analyse conceptuelle triadique [10] et l'analyse conceptuelle polyadique (ACP) [11] visent à étendre l'ACF aux données sous
forme de relations n-aires (c'est-à-dire des tableaux croisés multidimensionnels) et ont la particularité de faire intervenir des n-
treillis au lieu de treillis. Ces structures sont considérablement moins connues et étudiées, et des résultats qui seraient
considérés comme fondamentaux dans la théorie des treillis font défaut. Les possibilités sont pourtant nombreuses, car les
données multidimensionnelles sont désormais omniprésentes : les ensembles de données RDF, les sources de données des JN,
les connaissances folksonomiques sont toutes intrinsèquement au moins triadiques et leur transformation pour les adapter à des
tableaux croisés dyadiques n'entraîne qu'une perte d'informations. Certains travaux ont déjà été réalisés dans ce sens dans le
domaine de l'exploration de règles d'association multidimensionnelles [12,13].

Le défi scientifique est d'étudier la meilleure façon pour les JNs d'acquérir des compétences cognitives telles que le
raisonnement. Les outils méthodologiques qui seront analysés pour atteindre cet objectif sont les extensions de l'ACF avec un
intérêt particulier pour l'ACP et sa capacité à étudier les relations n-air.
L'objectif final est de pouvoir structurer les connaissances contenues dans les différents JNs sous forme de règles d'association
multidimensionnelles.

Ce sujet de thèse, impliquant une recherche à la fois théorique et appliquée, est complémentaire aux thèmes de recherche de
l'équipe-projet S&O-2I (prochain COPIL) du département ISET (prochain MPS2I) du CRAN. Au niveau international, ce sujet
est partiellement couvert par la communauté de chercheurs de l'IFAC TC 5.3 "Enterprise Integration and Networking", qui
s'intéresse également à cette problématique de formalisation de sémantique et de modèles pour l'interopérabilité des systèmes.
Mots clés :
Jumeau numérique, Analyse formelle de concepts, Formalisation de la Connaissance, Fonction cognitive
Conditions :
La durée est de trois ans : de septembre 2023 à septembre 2026.
Le lieu de travail sera l'Université de la Lorraine, laboratoire CRAN dans le département ISET à Vandoeuvre les Nancy.
La rémunération est liée au contrat doctoral relative à la bourse du gouvernement Français.
On attend un étudiant avec des fortes compétences en mathématique, informatique et qui connait le monde industriel.

Au cours de cette thèse il sera nécessaire d'acquérir une connaissance de la théorie des treillis, en particulier de treillis des
concepts, pour pouvoir maitriser l'analyse des concepts formels. Cette connaissance est préalable au développement d'une
méthode qui permette l'évaluation des processus d'interopérabilité des systèmes de pilotage et de gestion d'entreprise (ERP,
MES, SCM, CRM, ..).
Département(s) : 
Modélisation Pilotage des Systèmes Industriels
Financement :
Contrat doctoral AM2I (IAEM)