Sujet de Thèse
Titre :
Méthodes formelles d'extraction et de réutilisation des connaissances provenant de sources hétérogènes pour l'interopérabilité sémantique des architectures distribuées
Dates :
2021/12/15 - 2024/12/14
Encadrant(s) : 
Description :
Le tourisme est un enjeu stratégique pour la France. Première destination touristique mondiale depuis plusieurs années avec 89
millions de visiteurs par an, le secteur pèse plus de 7% du PIB de l'Hexagone. Dans la région du Grand Est il y a eu l'émergence
d'une nouvelle politique régionale en matière touristique. Elle apparaît comme un enjeu majeur tant en termes d'attractivité
touristique et économique, que de participation à la définition d'une véritable image du Grand Est. Définie à l'issue d'un travail de
convergence, la stratégie régionale s'accompagne de l'élaboration d'un Schéma régional de développement touristique (SRT). Voté en
mars 2018, il répond aux exigences d'attractivité, d'excellence et de proximité afin de promouvoir une filière qui représente à elle
seule 4% de l'emploi régional. La transformation du marché du tourisme a commencé dès le début des années 2000 avec la
démocratisation d'internet ; Booking et Expedia apparaissaient en 1996 et Trip Advisor en 2000 par exemple. L'apparition des OTA
(Online Travel Agencies) et des comparateurs en ligne a eu un impact direct sur la chaîne de valeur existante qui comptait un grand
nombre d'intermédiaires. De nombreuses plateformes se sont ainsi développées dans le but de centraliser le trafic internet, capter et
monétiser la donnée client afin de se positionner comme un point de passage obligatoire pour les acteurs du tourisme. Au travers d'un
commissionnement sur les ventes allant parfois jusque + 30%, ces acteurs sont devenus une force et une faiblesse du modèle actuel
entrainant une majoration des prix de ventes pour pouvoir prendre en compte les commissions. Le voyageur souhaitant pouvoir gérer
simplement et de bout en bout la réservation de ses prochaines vacances via un unique point de contact. En tant qu'acteur fortement
impliqué dans le développement économique des massifs, et dans notre région visant le développement du Massif des Vosges, le
Syndicat National des Moniteurs du Ski de France (SNMSF) qui regroupe 17 000 moniteurs au sein des Écoles du Ski Français (ESF)
sur l'ensemble du territoire national, participe au développement du Tourisme depuis 1945.
En 2016, le SNMSF a lancé une place de marché « Mon Séjour en Montagne » qui repose sur des valeurs fortes d'équités pour les
acteurs touristiques et de transparence et fluidité pour le client. Cette plateforme collaborative porte la vision du SNMSF d'un
tourisme durable, équitable et solidaire.
Le projet ambitionne de rendre la plateforme un moyen plus équitable pour poser les jalons d'un système global, intelligent et
connecté (Smart Montagne) permettant la collecte et le traitement des données en temps réel afin d'extraire de la nouvelle
connaissance à des fins touristiques. Ces données et informations seront ensuite agrégées et transformées par des systèmes d'inférence
automatique pour formaliser les connaissances implicites existantes.
Pour apporter à ce projet, déjà en marche, des contributions scientifiques précises et concrètes on utilisera une approche de
l'ingénierie des systèmes interopérables qui consiste à s'appuyer sur différents types et niveaux d'abstraction ou de modèles. Ces
modèles doivent exprimer et formaliser non seulement l'aspect "structurel" des composants du système, mais aussi leur comportement
(Maier, 1998), qui peut être limité par les exigences spécifiques du domaine du système (règles commerciales). Un autre type de
contrainte peut être induit par le ou les protocoles d'interopérabilité qui peuvent imposer des règles strictes pour doter les systèmes
interopérables de propriétés telles que l'autonomie, la confidentialité et la transparence.
L'objectif de ce projet de recherche est double : d'une part, modéliser des données provenant de sources hétérogènes et, d'autre part,
étudier les problèmes posés par l'ingénierie dirigée par les modèles dans les systèmes coopératifs. Impliquant une coopération
concernant les "systèmes d'acteurs" désireux d'interopérer. Les systèmes collaboratifs sont désormais organisés en réseaux, soit sous
forme de systèmes complexes (Camarinha-Matos, 2014). Les systèmes complexes envisagés seront composés de réseaux de Systèmes
Cyber Physique, des capteurs intelligents, qui récupéreront des données en insérant le contexte et formeront ainsi des réseaux
d'information.
1. Le manque de formalisation (en autres mathématique) de l'agglomération des informations dans les modèles de systèmes et des
systèmes d'informations qui en émergent, ainsi que la définition de la sémantique des concepts et des relations qu'ils mettent en
oeuvre, pour assurer leur compréhension commune, et faciliter leur interopération en minimisant les pertes sémantiques ;
2. L'adaptation (voire l'extension) des outils de nature algébrique et/ou géométrique (théorie des treillis, théorie des catégories,
algèbre homologique) dans le contexte de l'analyse des concepts formels, pour le traitement de donnés hétérogènes en constante
évolution. Ce qui constitue une approche récente qui n'a pas encore été pleinement développé (même du point de vue mathématique)
pour ce type de données.
Le sujet de thèse proposé se positionne clairement dans la continuité de la thèse effectuée par Mickael Wajnberg de 2017 à 2020 au
CRAN ayant posé les fondements d'une méthodologie d'extraction de connaissance polyvalente et portant plus spécifiquement sur la
gestion des règles d'association dans des contextes relationnels. La thèse proposée entre dans le cadre du Domaine d'Expertise
Stratégique « Industrie 4.0 ». Les précédents travaux ont démontré l'intérêt d'une approche holistique de l'ensemble des ressources
informationnelles et ont permis le développement d'une méthodologie focalisée sur l'optimisation de la gestion de connaissance. La
présente proposition vise donc à poursuivre les travaux engagés par l'élaboration d'une méthode formelle d'extraction et de
réutilisation des connaissances provenant de sources hétérogènes pour l'interopérabilité sémantique des architectures distribuées.
Cette méthode sera intégrée comme brique méthodologique au processus de gestion des ressources d'information aptes à l'aide à la
décision. Le cas d'application sera constitué par les systèmes d'informations et de remontés des données de au moins une des stations
de ski des Vosges.
Mots clés :
Formalisation de la connaissance, Fouille de données multi relationnelles, ACF, SCP
Conditions :
La thèse démarrera le 01/10/2021 et durera trois ans.
La rémunération est 31300 euro brut à l'année.
Le profil attendu est celui d'un ingénieur informaticien capable à gérer les problématiques relatives aux grandes masses des données
et à la formalisation de la connaissance. Un plus est la connaissance de méthodologies de modélisation appliquées à l'Industrie 4.0
Département(s) : 
Ingénierie des Systèmes Eco-Techniques
Financement :
Le financement provient d'une subvention versée par la région Grand Est et d'un autre sujet privé.