Sujet de Thèse
Titre :
Unicité des modèles tensoriels couplés avec des facteurs partagés et spécifiques
Dates :
2024/10/01 - 2027/09/30
Autre(s) encadrant(s) :
Prof. Adali Tülay (adali@umbc.edu)
Description :
La fusion de données a gagné en importance dans des nombreuses applications [1]. Un problème fondamental consiste à fusionner des jeux de données hétérogènes contenant des informations communes et spécifiques à l'ensemble de ces données [4]. Dans de nombreuses applications, les données ont trois dimensions ou plus, ce qui est un défi pour les méthodes classiques. Le formalisme tensoriel s'impose comme un cadre naturel pour la modélisation et l'analyse de ce type de données.

Défis : L'étude des factorisations tensorielles/matricielles flexibles n'en est qu'à ses débuts. L'unicité des décompositions tensorielles couplées a récemment fait l'objet d'un certain nombre d'études [3]. Des décompositions plus flexibles ont été proposées [5], mais les résultats d'unicité pour ce type de décompositions restent limités [2]. Les méthodes actuelles sont limitées par leur capacité à intégrer simultanément les informations communes et spécifiques à différents sous-groupes de matrices/tenseurs. Surmonter ces défis est d'une importance cruciale pour de nombreuses applications dans le domaine de l'ingénierie.

Programme de recherche : Le candidat au doctorat développera des méthodes flexibles de décomposition de matrices/tenseurs pour révéler les informations communes et spécifiques aux différents ensembles de données multidimensionnelles, permettant ainsi de regrouper des sous-ensembles partageant des facteurs communs. Un aspect essentiel des méthodes développées sera leurs garanties théoriques, pour lesquelles l'utilisation des modèles tensoriels fournit un cadre mathématique adéquat [3]. Cela impliquera l'utilisation de mesures de similarité entre les ensembles de données tensorielles (les distances sur les variétés riemanniennes, par exemple) et la résolution de problèmes d'optimisation à grande échelle.


Références :
[1] D. Lahat et al., "Multimodal data fusion: an overview of methods, challenges, and prospects,'' Proceedings of the IEEE, vol. 103, no. 9, pp. 1449-1477, 2015.
[2] R. A. Borsoi et al., "Coupled tensor decomposition for hyperspectral and multispectral image fusion with inter-image variability,'' IEEE Journal of Selected Topics in Signal Processing, vol. 15, no. 3, pp. 702-717, 2021.
[3] M. Sørensen and L. D. De Lathauwer, "Coupled canonical polyadic decompositions and (coupled) decompositions in multilinear rank-(L_{r,n},L_{r,n},1) terms-part I: Uniqueness,'' SIAM Journal on Matrix Analysis and Applications, vol. 36, no. 2, pp. 496-522, 2015.
[4] A. K. Smilde et al., "Common and distinct components in data fusion,'' Journal of Chemometrics, vol. 31, no. 7, p. e2900, 2017.
[5] E. Acar et al., "Structure-revealing data fusion,'' BMC Bioinformatics, vol. 15, no. 1, pp. 1-17, 2014.
Mots clés :
Unicité, modèles statistiques, décompositions tensorielles, données multidimensionelles
Conditions :
Le/la candidat.e sera encadré.e par Sebastian Miron, Ricardo Borsoi et David Brie, membres du projet Signaux Multidimensionnels (SiMul) (https://cran-simul.github.io/) au laboratoire CRAN (Université de Lorraine, France), ainsi que par Mme. Tülay Adali, directrice du laboratoire Machine Learning for Signal Processing (MLSP) à l'Université du Maryland (UMBC), USA.
Le/la candidat.e sera basé.e au Laboratoire CRAN, Université de Lorraine, avec la possibilité de visites de recherche au laboratoire MLSP à Baltimore, USA.

Profil attendu : Master ou équivalent, avec une expérience dans l'un ou plusieurs des domaines suivants : traitement du signal, apprentissage automatique, mathématiques appliquées. Bon niveau en anglais (écrit et oral).

Les candidats doivent envoyer leur candidature à sebastian.miron@univ-lorraine.fr, ricardo.borsoi@univ-lorraine.fr, david.brie@univ-lorraine.fr, adali@umbc.edu, en joignant un CV académique et une lettre de motivation (1 page maximum) expliquant leur motivation pour ce poste.
Département(s) : 
Biologie, Signaux et Systèmes en Cancérologie et Neurosciences
Financement :
Environ 2100 euros brut /mois (thèse LUE). La thèse a une durée de 36 mois, à partir de 2024.