Sujet de Thèse
Titre :
Méthodes rapides pour les décompositions tensorielles sous contraintes, appliquées à des données de grande dimension
Dates :
2018/06/07 - 2020/08/30
Etudiant :
Encadrant(s) : 
Autre(s) encadrant(s) :
Prof. Stefan-Gheorghe Pentiuc (pentiuc@eed.usv.ro)
Description :
Durant les deux dernières décades, les tenseurs (tableaux multidimensionnels de données) ont gagné beaucoup d'intérêt dans la
communauté traitement du signal et des données, grâce à leur capacité à expliquer des systèmes et phénomènes complexes (see e.g.,
[1]). En même temps, le volume de données à traiter a augmenté de façon drastique, ce qui appelle au développement des méthodes
rapides de décomposition tensorielle, adaptées au traitement des données de grande dimension.

Ce sujet de cette thèse s'appuie sur les compétences complémentaires des équipes française et roumaine, et s'organise autour de deux
axes.

Un premier axe consiste en le développement des algorithmes rapides pour les décompositions tensorielles des données de grande
dimension, sous contraintes. La grande diversité actuelle des applications engendre des données avec une spécificité liée au type
d'acquisition, e.g., données non-négatives pour les systèmes optiques (imageurs hyperspectraux, microscopes, etc.), données binaires
ou à valeurs entières, dans le cas des systèmes à évènements discrets ou des réseaux informatiques ou sociaux, données
parcimonieuses pour les systèmes à évènements rares, etc. La prise en compte explicite de ces contraintes dans les algorithmes de
traitement se traduit par des résultats mieux interprétables et des algorithmes plus efficaces du point de vu calculatoire [2].
Des méthodes pour les décompositions tensorielles sous contrainte ont été déjà proposées dans la littérature et ont démontré leur
intérêt dans la pratique. Néanmoins, il existe peu d'études quant à évolutivité de ce type d'algorithmes aux données de (très) grande
dimension et aux contraintes de type temps-réel, spécifiques des applications récentes. Le doctorant sera donc amené à développer
des méthodes de décomposition tensorielle répondant à ces contraintes, accompagné par l'équipe française (CRAN) qui possède déjà
une expérience importante sur ce type de problème [3,4].

Un deuxième axe de ce travail de thèse est représenté par le développement des stratégies de calcul parallèle et/ou distribué pour
les algorithmes de décompositions et du traitement de très grandes masses de données. La partie roumaine a une certaine expérience
dans le domaine du développement des algorithmes et techniques d'analyse des grands volumes de données, ainsi que dans
algorithmes parallèle [5, 6]. L'Université « Stefan cel Mare de Suceava » possède également l'infrastructure matérielle nécessaire
(ordinateur IBM Roadrunner à 6.5 TFlops) pour l'implantation pratique et l'expérimentation de ces méthodes [7].

[1] E. Acar and B. Yener, Unsupervised multiway data analysis: A literature survey, IEEE Trans. Knowledge Data Engrg., vol. 21, pp. 6-20,
2009.
[2] J.E. Cohen, R.C. Farias, P. Comon, Fast Decomposition of Large Nonnegative Tensors
IEEE Signal Processing Letters 22 (7), 862-866.

[3] X. Guo, S. Miron, D. Brie, A. Stegeman, Uni-Mode and Partial Uniqueness Conditions for CANDECOMP/PARAFAC of Three-Way Arrays
with Linearly Dependent Loadings, SIAM Journal on Matrix Analysis and Applications, Vol.33, Issue 1, pp. 111-129, 2012

[4] X. Guo, S. Miron, D. Brie, S. Zhu, X. Liao, A CANDECOMP/PARAFAC perspective on uniqueness of DOA estimation using a vector
sensor array, IEEE Transactions on Signal Processing, Vol. 59, Issue 7, pp. 3475 - 3481, 2011

[5] S.G. Pentiuc, Ş.I. Şoiman, A Proposed Method for Pattern Classification with HMM in the Context of Supervised Learning, Journal of
Applied Computer Science & Mathematics, , Issue 19, p50-56, 2015

[6] S.G. Pentiuc, I. Ungurean, Multilevel Parallelization of Unsupervised Learning Algorithms in Pattern Recognition on a Roadrunner
Architecture, Intelligent Distributed Computing V Book Series: Studies in Computational Intelligence, Vol. 382, pp. 71-80: 2011

[7] I. Ungurean, S.G. Pentiuc, V.G. Gaitan, et al., Using Resources Provided by Cell Broadband Engine in order to Develop an Application
of Hierarchical Data Clustering, Proc. 9th Roedunet IEEE International Conference, pp. 224-227, 2010
Mots clés :
decompositions tensorielles, grande dimension, calcul parallèle.
Département(s) : 
Biologie, Signaux et Systèmes en Cancérologie et Neurosciences