CRAN - Campus Sciences
BP 70239 - 54506 VANDOEUVRE Cedex
Tél : +33 (0)3 72 74 52 90 Fax : +33 (0)3 72 74 53 08
cran-secretariat@univ-lorraine.fr
 
 
Sujet de Thèse : Etude des décompositions de type Candecomp/Parafac avec dépendances linéaires dans les modes. Application à l’analyse de données biomédicales.
Dates : 2014/10/03 - 2017/09/30
Etudiant : Marc-Abel BISCH
Directeur(s) CRAN : David BRIE , Sebastian MIRON
Description : Au cours des deux dernières décennies, la décomposition Candecomp/Parafac (CP) a connu un succès important dans des domaines
variés tels que la chimiométrie, les télécommunications, le traitement d'antenne ou l'imagerie médicale [1]. Cela est essentiellement dû à
ses intéressantes propriétés d'unicité. A la différence des décompositions bilinéaires, la CP est unique sous de faibles contraintes liées
aux rangs des matrices représentant les différents modes. Néanmoins, en présence de dépendances linéaires fortes - notamment de
colinéarités - entre les colonnes des matrices des modes, l’unicité de la décomposition n’est plus garantie. Des conditions permettant
d’assurer l’unicité d’une partie des paramètres ont été établies dans [2].

Des versions modifiées du modèle CP, appelées PARALIND [3] ou CONFAC [4], ont été proposées afin de prendre en compte
explicitement les dépendances linéaires entre les colonnes des différents modes par introduction d’une matrice dite de dépendance. La
donnée de ces matrices permet d’énoncer des conditions d’unicité totale ou partielle pour ce type de décompositions [5, 6].

Il existe toutefois des applications où la connaissance des matrices de dépendances n’est pas acquise. Il est alors nécessaire
d’estimer ces matrices car elles caractérisent les interactions entre les mécanismes sous-jacents à la production des données. C’est le
cas, par exemple, des bio-capteurs bactériens où les dépendances des courbes de réponses sont causées par les interactions entre les
différents gènes rapporteurs. Dans le cadre de cette thèse nous nous focalisons sur les applications de ces techniques à l’analyse des
données biomédicales. Le premier problème considéré est celui de l’analyse de cinétiques de réaction par techniques de spectro-
imagerie qui a des applications en cancérologie (réponse spatio-temporelle à une thérapie). Dans le cas de réactions chimiques
complexes, la matrice de dépendances permet de caractériser les couplages entre les différents réactifs. Le deuxième problème est celui
de l’analyse de séquences de données de cytométrie en flux. Dans ce cas, la matrice de dépendances caractérise les interactions entre
les différentes populations.

Le problème d’estimation des matrices de dépendances est généralement mal-posé. Nous avons proposé [7] d’imposer des
contraintes de parcimonie sur ces matrices afin de régulariser la décomposition. D’un point de vue physique cette hypothèse de
parcimonie est justifiée car cela revient à expliquer les déficiences de rang par un nombre minimal d’interactions. Néanmoins, un grand
nombre d’aspects restent à étudier. En premier lieu, l’identifiabilité de ce type de modèle mérite d’être analysée car nous avons observé
expérimentalement des situations où l’algorithme proposé dans [7] ne fournit pas des résultats satisfaisants. Egalement, nous
envisageons d’étudier les intérêts d’une décomposition parcimonieuse des matrices présentant des dépendances linéaires. D’une part
nous pensons que ce type de décomposition doit permettre d’améliorer les conditions d’unicité et d’autre part de développer des
algorithmes d’estimation efficaces. Dans ce travail, une attention particulière sera donnée au cas des colinéarités qui présente de
nombreuses applications pratiques.



[1] E. Acar and B. Yener, Unsupervised multiway data analysis: A literature survey, IEEE Trans. Knowledge Data Engrg., vol. 21, pp. 6–20,
2009.

[2] X. Guo, S. Miron, D. Brie, A. Stegeman, Uni-Mode and Partial Uniqueness Conditions for CANDECOMP/PARAFAC of Three-Way
Arrays with Linearly Dependent Loadings, SIAM Journal on Matrix Analysis and Applications, Vol.33, Issue 1, pp. 111-129, 2012.

[3]R. Bro, R.A. Harshman, N. D. Sidiropoulos et M.E. Lundy, Modeling multi-way data with linearly dependent loadings, Journal of
Chemometrics, vol 23, no. 7-8, pp. 324-340, 2009.

[4]A. L. F. de Almeida, G. Favier, and J. C. M. Mota, A constrained factor decomposition with application to MIMO antenna systems, IEEE
Trans. Signal Process., vol.56, pp. 2429–
2442, 2008.

[5]A. Stegeman & A.L.F. de Almeida, Uniqueness conditions for constrained three-way factor decompositions with linearly dependent
loadings, SIAM Journal on Matrix Analysis and Applications, vol. 31, pp. 1469-1490, 2009.

[6]A. Stegeman & T.T.T. Lam, Improved uniqueness conditions for canonical tensor decompositions with linearly dependent loadings,
SIAM Journal on Matrix Analysis and Applications, vol. 33, pp. 1250-1271, 2012.

[7]F. Caland, S. Miron, D. Brie, C. Mustin, A blind sparse approach for estimating constraint matrices in Paralind data models, EUSIPCO
2012, Bucharest, Romania, Aug. 27-31, 2012
Mots clés : Candecomp/ Parafac, Paralind, Confac, dépendances linéaires, parcimonie
Conditions : Profil recherché : Titulaire d’un Master Recherche ou diplôme d’Ingénieur Grandes Ecoles avec des compétences en traitement du signal
et/ou mathématiques appliquées.

Envoyer dossier complet (CV + lettre de motivation + relevé de notes + nom des encadrants de stage + lettres de recommandations) par
email à david.brie@univ-lorraine.fr et sebastian.miron@univ-lorraine.fr.
Département(s) :
Santé - Biologie - Signal
Financement : Bourse ministérielle (contrat doctoral), environ 1450 euros/mois