Vous êtes ici : Réunions » Réunion

Identification

Identifiant: 
Mot de passe : 

Mot de passe oublié ?
Détails d'identification oubliés ?

Décompositions tensorielles et applications

Nous vous rappelons que, afin de garantir l'accès de tous les inscrits aux salles de réunion, l'inscription aux réunions est gratuite mais obligatoire.

Inscriptions closes à cette réunion.

Inscriptions

24 personnes membres du GdR ISIS, et 26 personnes non membres du GdR, sont inscrits à cette réunion.
Capacité de la salle : 100 personnes.

Annonce

ATTENTION : Changement de Salle

Il existe au moins deux manières d’étendre la SVD au cas de tenseurs (ie tableaux à plus de deux entrées) : la décomposition de Tucker3 et la décomposition Canonique Polyadique (CP). Tandis que cette dernière permet de définir la notion de rang tensoriel et possède de bonne propriété en termes d’unicité, la decomposition de Tucker offer l’intérêt de permettre une meilleure adaptation aux données. Les décompositions tensorielles ont aujourd’hui des applications dans des domaines aussi variés que la psychométrie, la chimiométrie, la fouille de données, le génie biomédical, le traitement de signaux audio et les télécommunications. Ces décompositions permettent de prendre en compte explicitement l'aspect multidimensionnel des données offrant ainsi une alternative efficace aux approches matricielles d’analyse de données multidimensionnelles.

L'objectif de cette réunion est de faire le point sur les avancés méthodologiques récentes, les apports sur le plan applicatif et les problèmes ouverts.

Date : 16 janvier 2013 de 9h30 à 17h30

Salle : Amphi Grenat

Organisateurs :

Programme

9h30 – 9h40 Introduction de la journée, L. Albera, D. Brie

9h40 – 10h40 Exposé tutoriel: Pierre Comon, Décompositions tensorielles et applications

10h40 - 11h00 Mohamed Hanafi, Multiway Regression by  Partial Least Squares (PLS) :  Optimality Properties and connexion with PARAFAC

11h00 - 11h10 pause café

11h10 - 12h10 Exposé tutoriel:  Sabine van Huffel, The power of tensor algebra in medical diagnostic

12h10 - 12h30 Gérard Favier, Modèles tensoriels avec contraintes. Applications aux systèmes de communication MIMO

12h30 - 14h00 Pause déjeuner

14h00 – 14h20 Rémy Boyer, Décomposition multidimensionnelle en valeurs singulières pour tenseurs structurés

14h20 - 14h40 Sebastian Miron, Conditions d’unicité uni-modale et partielle pour les décompositions CANDECOMP/PARAFAC des tableaux tridimensionnels de données

14h40 - 15h00 Pascal Chevalier, Décomposition de tableaux de cumulants d'ordre 2q en traitement d'antenne - Théorie des réseaux virtuels aux ordres supérieurs

15h00 - 15h20 Cédric Févotte, Décompositions tensorielles non-négatives du spectrogramme multicanal pour la séparation de sources musicales

15h20 - 15h40 Xavier Luciani, Décomposition CP par diagonalisation conjointe : Algorithmes et applications à la spectroscopie de fluorescence

15h40 - 15h50 pause café

15h50 - 16h10 Mohammad Niknazar, Fetal electrocardiogram (ECG) extraction from multichannel recordings

16h10 - 16h30 Marie-France Devaux, Coupling multimodal and multiresolution hyperspectral images by an extended version of Multiple Co-inertia Analysis

16h30 - 16h50 Tristan Porges, Méthode tensorielle MPCA pour la classification de cible en imagerie radar

16h50 - 17h10 Andreas Kodewitz, Non-negative sub-tensor set Factorization

17h10 - 17h30 Maxime Boizard, Une nouvelle décomposition orthogonale : la cross HOSVD, application au STAP multidimensionnel

Résumés des contributions

Décompositions tensorielles et applications

Pierre Comon – Gipsa Lab, Grenoble

Dans cet exposé, les tenseurs sont vus comme des représentations en dimension finie de fonctions de plusieurs variables. En d'autres termes, ce sont des tableaux à plusieurs indices, et typiquement strictement plus de deux; l'ordre du tenseur désigne le nombre d'indices. On soulignera d'abord quelques différences frappantes entre les matrices et les tenseurs d'ordre supérieur à deux. Une propriété essentielle est l'unicité de la décomposition parfois appelée "canonique polyadique" (CP), qui consiste en une somme de fonctions à variables séparées. Cette décomposition peut être vue comme une des généralisations possibles de la Décomposition en Valeurs Singulières (SVD) à des ordres supérieurs à deux. A ce titre, elle permet de définir le rang d'un tenseur. A travers plusieurs applications, on verra le rôle que la décomposition CP peut jouer, et quelles variables entrent en jeu pour la construction des tenseurs (temps, espace, fréquence, code, réalisation, concentration, polarisation, indépendance statistique, etc...) à partir de données mesurées. On dira que le modèle devra présenter une diversité suffisante (au moins trois variables non redondantes) pour que les propriétés tensorielles puissent être exploitées. On soulignera ensuite que le problème d'approximation de rang faible, incontournable dans les applications, est mal posé quand l'approximation est de rang supérieur à 1, et on proposera une solution via l'introduction de contraintes sur les cohérences des matrices facteurs. Pour terminer, on expliquera quelle interprétation physique on peut donner à ces contraintes dans les diverses applications présentées.

Multiway Regression by  Partial Least Squares (PLS): Optimality Properties and connexion with PARAFAC

Mohamed HANAFI, ONIRIS, Nantes

Keywords: Multiway data, NPLS, PARAFAC, LCMS data

The pupose of multiway regression is to build a model between a three array X and another array Y. In this lecture we limit ourselves to the case where Y is a vector or a matrix. Like PLS such model might be useful for predicting future Y value from future X values or to study correlation or relationship between X and Y. A well know method which deals with the multiway regression problem is Nway PLS. Nway PLS has been introduced by Bro [1] and more studied by Smilde and al. [4].  Nway PLS is an extension of the ordinary regression model PLS to the case when X is three or multiway data set. It has been used in different situations especially in metabolomics [2,3].

The main contribution of the present lecture consists to exhibit equivalent optimization problems whose solutions leads to the scores or loadings given by the Trilinear PLS2 algorithm [1] in multiway regression setting. We show that this iterative algorithm generates a sequence of vector scores and loadings for which three specific criteria are monotonically increasing or decreasing, demonstrating that this procedure is convergent.

[1] Bro, R. (1996). Multiway calibration. Multilinear PLS. Journal of Chemometrics, 10, 47–61.  
[2]  Dyrby, M., Petersen, M., Whittaker, AK., Lambert, L., Norgaard, L., Bro, R., Engelsen, SB. (2005). Analysis of lipoproteins using 2D diffusion-edited NMR spectroscopy and multi-way chemometrics. Anal. Chim. Acta, 531, 209–216.
[3] Rubingh, CM., Bijlsma, S., Jellema, RH., Overkamp, KM., van der Werf, MJ., Smilde, AK. (2009). Analyzing longitudinal microbial metabolomics data. J. Proteome Res., 8, 4319–4327.
[4]  Smilde, A.K. (1997). Comments on multilnear PLS. Journal of Chemometrics, 11, 367–377.

The power of tensor algebra in medical diagnostics

Sabine Van Huffel, Department of Electrical Engineering (ESAT-SCD(SISTA)) and IBBT Future Health Department, KU Leuven, Leuven, Belgium

In biomedical signal processing, the aim is to extract clinically,biochemically or pharmaceutically relevant information (e.gmetabolite concentrations in the brain) in terms of parameters outof low-quality measurements in order to enable an improved medicaldiagnosis.Typically, biomedical data are affected by largemeasurement errors, largely due to the non-invasive nature of themeasurement process or the severe constraints to keep the inputsignal as low as possible for safety and bio-ethical reasons.The underlying computational signal processing problems can be solved by makinguse of matrix and tensor decompositions, thereby transforming the available priorknowledge in medically relevant constraints. In particular, it is shown howcomputational tensor kernels, such as Parallel Factor Analysis up to Block Component Analysis,...can be used as building blocks of higher-level signal processing algorithms. A majorchallenge here is how to make the mathematical tensor components ``interpretable''such that they reveal the underlying medically relevant information.The power of these algorithms will be illustrated in a variety of case studies,including epileptic seizure onset detection using Electro-EncephaloGraphy (EEG). In addition,it is shown how to generalize these tensor based algorithms when combiningdifferent modalities. Applications include the integration of simultaneously acquiredEEG and functional MR Imaging in the study of cognitive processes and disturbances.

Modèles tensoriels avec contraintes. Applications aux systèmes de communication MIMO

Gérard Favier,  I3S, Nice

Au cours de la dernière décennie, les modèles tensoriels du type CP, appelés aussi décompositions PARAFAC, ont fait l’objet de très nombreuses applications en traitement du signal et de l’image. Depuis les travaux de pionnier de Sidiropoulos, Giannakis et Bro, en 2000 [1], les communications numériques constituent un domaine d’application privilégié des outils tensoriels. Cet exposé a pour objectif de montrer comment la conception de différents systèmes de communication MIMO a abouti au développement de nouveaux modèles tensoriels avec contraintes. Dans une première partie, différents modèles tensoriels seront présentés de façon unifiée, i.e. les modèles de types Tucker, PARALIND/CONFAC et PARATUCK [2]. Puis, dans une deuxième partie, nous décrirons quatre exemples de systèmes MIMO conduisant à de nouveaux modèles tensoriels contraints pour les tenseurs de signaux reçus:

Nous montrerons comment ces modèles tensoriels permettent d’estimer de façon conjointe et semi-aveugle les symboles transmis et les canaux de communication. Des résultats de simulations seront présentés pour illustrer les performances de ces systèmes de communication.

[1] SIDIROPOULOS N., GIANNAKIS G., BRO R. (2000), "Blind PARAFAC receivers for DS-CDMA systems" IEEE Transactions on Signal Processing, 48 (3): 810-822, March 2000.
[2] FAVIER G., de ALMEIDA A., "Constrained tensor models with applications to MIMO communication systems", to be published.
[3] FAVIER G., da COSTA M., de ALMEIDA A., ROMANO J.M., "Tensor space−time (TST) coding for MIMO wireless communication systems" Signal Processing, Elsevier, 92:1079−1092, April 2012.
[4] de ALMEIDA, FAVIER G., XIMENES L. (2013), "Space-time-frequency (STF) MIMO communication systems with blind receiver based on a generalized PARATUCK2 model" IEEE Transactions on Signal Processing, Accepted for publication.
[5] FAVIER G., BOUILLOC T., de ALMEIDA A. (2012) "Blind constrained block−Tucker2 receiver for multiuser SIMO NL−CDMA communication systems", Signal Processing, Elsevier, 92 (7):1624−1636, July 2012.
[6] XIMENES L., FAVIER G., de ALMEIDA A., SILVA Y. "PARAFAC-PARATUCK based blind receivers for dual-hop cooperative MIMO relay systems", to be published.

Décomposition multidimensionnelle en valeurs singulières pour tenseurs structurés

Rémy Boyer (Université Paris XI Sud, L2S/Supelec), Roland Badeau (Laboratoire TSI/COD, ENST Paris), Gérard Favier (CNRS, I3S)

Dans les applications de traitement du signal, souvent, la nature multidimensionnelle des modèles sous-jacents est ignorée pour des raisons de complexité calculatoire. Il est proposé dans ce travail une décomposition multidimensionnelle en valeurs singulières (HOSVD) rapide, c’est-à-dire de coût réduit, exploitant la structuration (Toeplitz, Hankel, symétrique) tensorielle. Pour ce faire, il est aisé de voir que déplier de manière standard un tenseur structuré conduit à des modes faiblement ou pas structurés. Partant de ce constat, il est introduit deux nouvelles manières de déplier de manière oblique un tenseur afin d’exploiter au mieux sa structuration. Ensuite, il est montré que pour certains tenseurs structurés, les modes associés présentent une redondance en terme de colonnes. On montre alors qu’il est possible de conserver l’espace gauche dominant de ces modes en considérant des modes réduit (c’est-à-dire sans redondance de colonne) mais pondéré selon l’occurrence de celles-ci. Pour chacune des structurations envisagées, on donne alors la complexité en FLOPS en comparant systématiquement à la complexité de la HOSVD standard. Les applications de ce travail sont nombreuses et certaines seront présentées telles que l’analyse harmonique, l’analyse en composantes principales de tenseurs basés sur les statistiques d’ordres supérieures ou encore la décomposition des noyaux de Volterra. La présentation envisagée s’appuie sur publications suivantes :

Conditions d’unicité uni-modale et partielle pour les décompositions CANDECOMP/PARAFAC des tableaux tridimensionnels de données

Xijing GUO*,**, Sebastian MIRON**, David BRIE**, Alwin STEGEMAN***
*Department of Information and Communication Engineering, Xi'an Jiaotong University, 710049 Xi'an, China
**Centre de Recherche en Automatique de Nancy (CRAN),  UMR 7039, Université de Lorraine, Vandoeuvre–lès-Nancy, France
***Heijmans Institute for Psychological Research, University of Groningen, Groningen, The Netherlands

Une propriété intéressante des décompositions trilinéaires de type CANDECOMP/PARAFAC (CP) est leur unicité essentielle, sous de faibles contraintes. Le résultat d’unicité le plus connu est attribué à Kruskal. Ce résultat, fondé sur la notion de «rang de Kruskal »  ou « k-rang », donne une condition suffisante d’unicité de la décomposition CP. Cependant, l’existence de dépendances linéaires, et plus particulièrement de colinéarités, entre les colonnes des matrices des trois modes, peut conduire à la non unicité de la décomposition CP.  Néanmoins, il existe des cas où il est possible d’identifier seulement une partie des paramètres du modèle CP. Dans ce travail on propose des conditions suffisantes d’unicité « uni-modale » permettant d’estimer de façon unique une seule des matrices des trois modes du modèle CP.  Nous montrons que, dans ce cas, il est possible de décomposer de manière unique le tenseur de départ en une somme de tenseurs de rang inférieur. Pour chacun de ces tenseurs, l’analyse de l’unicité de la décomposition peut être faite de façon indépendante.  La présentation est basée sur la publication suivante:

X. Guo, S. Miron, D. Brie, A. Stegeman,  Uni-Mode and Partial Uniqueness Conditions for CANDECOMP/PARAFAC of Three-Way Arrays with Linearly Dependent Loadings, SIAM Journal on Matrix Analysis and Applications, Vol.33, Issue 1, pp. 111-129, 2012

Décomposition de tableaux de cumulants d'ordre 2q en traitement d'antenne - Théorie des réseaux virtuels aux ordres supérieurs.

Pascal Chevalier (Thales Communications & CNAM).

L'exploitation des statistiques (ou cumulants) d'ordre supérieur en traitement d'antenne, à des fins de goniométrie (estimation des angles d'arrivée des sources) ou d'identification autodidacte de mélanges de sources, permet un accroissement virtuel de l'ouverture et du nombre d'antennes du réseau utilisé, engendrant une augmentation de la résolution et de la robustesse aux erreurs de modèles des méthodes ainsi que celle du nombre de sources statistiquement indépendantes traitées. Toutefois, les performances des méthodes dites aux ordres supérieurs sont directement fonction du réseau d'antennes initial et de la manière dont les cumulants d'ordre supérieurs sont rangés dans le tableau des cumulants. Le but de l'exposé est de présenter ce concept de réseau virtuel aux ordres supérieurs en insistant tout particulièrement sur le nombre maximal possible de composantes de rang 1 du tableau des cumulants d'ordre 2q en fonction du rangement des cumulants et de la géométrie du réseau d'antenne. Des tableaux aussi bien carrés que rectangulaires seront considérés, permettant d'optimiser le compromis performances - nombre de sources traitées.

Décompositions tensorielles non-négatives du spectrogramme multicanal pour la séparation de sources musicales

Cédric Févotte (Laboratoire Lagrange; CNRS, OCA & Université de Nice)

La factorisation en matrices non-négatives ou "NMF" (pour "nonnegative matrix factorization") connaît actuellement un vif intérêt dans le domaine du traitement du signal audio. Appliquée au spectrogramme d'un enregistrement sonore monocanal, elle permet d'extraire les motifs se répétant dans le signal (e.g, une note, un accord, un coup de cymbale) et a permis d'obtenir des résultats spectaculaires en transcription musicale et en séparation de sources.

Dans exposé nous présentons des généralisations de cette approche pour le traitement d'enregistrements multicanaux. Les spectrogrammes des différents canaux forment un tenseur canal-temps-fréquence dont nous décrivons diverses formes de décompositions. Nous montrerons en particulier que la décomposition PARAFAC classique peut s'interpréter dans notre contexte comme une méthode de séparation de sources dans un modèle de mélange linéaire instantané, mais qui n'exploite pas - dans ce modèle de mélange particulier - l'information mutuelle entre les canaux de manière optimale. Nous présenterons un nouveau modèle de décomposition tensorielle, appelé "multichannel NMF", accompagné d'une méthode d'estimation au sens du maximum de vraisemblance, qui permet de dépasser les limites de la décomposition PARAFAC pour notre problème, et de traiter en outre le cas de mélanges convolutifs (sur- ou sous-déterminés).Des résultats de séparation d'enregistrements musicaux réels, issus de CD, seront présentés. Travail en collaboration avec Alexey Ozerov (Technicolor, Rennes).

A. Ozerov, C. Févotte, R. Blouet, and J.-L. Durrieu. Multichannel nonnegative tensor factorization with structured constraints for user-guided audio source separation. In Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP), Prague, Czech Republic, May 2011.
http://perso.telecom-paristech.fr/~fevotte/Proceedings/icassp11d.pdf
C. Févotte and A. Ozerov. Notes on nonnegative tensor factorization of the spectrogram for audio source separation : statistical insights and towards self-clustering of the spatial cues. In Proc. 7th International Symposium on Computer Music Modeling and Retrieval (CMMR), volume 5493 of Lecture Notes in Computer Science, pages 102–115, Malaga, Spain, June 2010. Springer.
http://perso.telecom-paristech.fr/~fevotte/Proceedings/cmmr10.pdf
A. Ozerov and C. Févotte. Multichannel nonnegative matrix factorization in convolutive mixtures for audio source separation. IEEE Transactions on Audio, Speech and Language Processing, 18(3) :550–563, Mar. 2010.
http://www.tsi.enst.fr/~fevotte/Journals/ieee_asl_multinmf.pdf

Décomposition CP par diagonalisation conjointe : Algorithmes et applications à la spectroscopie de fluorescence.

X. Luciani, Laurent Albera (LTSI, Rennes)

La décomposition Canonique Polyadique (CP) fut introduite par Hitchcock en 1927 [1]. Celle-ci est aujourd'hui également connue sous les noms de CANonical DECOMPosition (CANDECOMP ou CanD) ou PARAllel FACtor analysis (PARAFAC) [2]. Dans ce dernier article, Harshman recourt à un algorithme itératif baptisé Alternating Least Squares (ALS) afin d'estimer les facteurs de la décomposition. De par sa simplicité et son antériorité cet algorithme est encore largement utilisé aujourd'hui malgré une convergence assez lente et parfois problématique. De nombreux autres algorithmes itératifs basés sur des méthodes d'optimisation classiques ont depuis été proposés. Par ailleurs, une procédure de recherche du pas de descente optimal (Enhanced Line Search, ELS), permet d'améliorer notablement les performances de la plupart de ces algorithmes [3,4]. Néanmoins ceux-ci restent coûteux numériquement et soumis au problème des minima locaux, notamment lorsque certains facteurs de la décomposition sont fortement corrélés. Enfin, dans la plupart des applications pratiques le tenseur de données est modélisé par une CP tronquée dont le rang est inconnu et généralement très inférieur à celui du tenseur (du fait du bruit), on parle alors de rang du modèle. Ce paramètre est souvent difficile à estimer alors que les algorithmes itératifs sont très sensibles à sa valeur, rendant ainsi problématique l'interprétation même des résultats (problème d'over-factoring). Dans ce contexte, les algorithmes dits « semi-algébriques » constituent une alternative pertinente en réécrivant algébriquement la CP comme un problème de diagonalisation conjointe [5,6,7] pouvant être résolu par des algorithmes de balayage par paires. Plus rapides et plus stables en pratique, ceux-ci sont également de part leur conception même insensibles au phénomène d'over-factoring. En contrepartie ces algorithmes imposent des conditions de fonctionnement plus strictes sur le rang de la décomposition. Nous présentons donc ici un algorithme de décomposition canonique semi-algébrique récent baptisé SALT (Semi-ALgebraic Tensor decomposition), permettant de limiter ces restrictions intrinsèques [8]. Par ailleurs celui-ci est rapide et permet de traiter le cas de facteurs très corrélés dans tous les modes (swamp). A l’instar d'autres approches semi-agébriques, SALT est basé sur la diagonalisation conjointe par similarité d'un ensemble de matrices carrées non orthogonales de type M(k)=AD(k)A−1 , problème pour lequel peu d'algorithmes existent. C'est pourquoi nous décrirons dans une seconde partie deux algorithmes de diagonalisation conjointe par similarité respectivement basés sur les décompositions polaires et LU de la matrice de vecteurs propres. Le premier de ces algorithmes (Joint Diagonalization algorithm based on Targeting hyperbolic Matrices, JDTM) est très efficace en termes de précision et pour les cas les plus difficiles (faible SNR, matrices de grandes dimensions, faible nombre de matrices à diagonaliser) [9]. Le second (Joint Eigenvalue decomposition algorithm based on Triangular matrices, JET) plus original, présente quant à lui une complexité numérique par itération bien plus faible que les autres algorithmes [8]. Enfin, un exemple d'application en spectroscopie de fluorescence, illustrant sur un cas concret le problème d'over-factoring et son traitement par SALT conclura cette présentation.

[1] F.L. Hitchcock, The expression of a tensor or a polyadic as a sum of products, J. Math. Phys, 6 (1), 164- 189, 1927.
[2] R.A. Harshman, Foundations of the Parafac procedure: Models and conditions for an explanatory multimodal factor analysis, UCLA Working Papers in Phonetics, 16, pp. 1-84, 1970.
[3] M. Rajih, P. Comon, and R. Harshman, Enhanced Line Search : A Novel Method to Accelerate PARAFAC, SIAM Journal on Matrix Analysis Appl., 30(3):1148-1171, September 2008.
[4] P. Comon, X. Luciani and A.L.F de Almeida, Tensor Decompositions, Alternating Least Squares and other Tales, Journal of Chemometrics, Volume 23, Aug. 2009, 393-405.
[5] L. Albera, A. Ferrol, P. Comon and P. Chevalier, Blind Identification of Overcomplete MixturEs of sources (BIOME), Linear Algebra and its Applications, 391, pp. 3-11, 2004.
[6] L. De Lathauwer, A Link between Canonical Decomposition in Multilinear Algebra and Simultaneous Matrix Diagonalization, SIAM Journal on Matrix Analysis, 28, 3 642-666, 2006.
[7] Roemer and F., Haardt, M.: A closed-form solution for multilinear PARAFAC decompositions, In IEEE SAM 2008, pp. 487-491, 2008.
[8] X. Luciani and L. Albera, Semi-algebraic canonical decomposition of multi-way arrays and joint eigenvalues decomposition, IEEE ICASSP'11, pp. 4104-4107.
[9] X. Luciani and L. Albera, Joint Eigenvalue Decomposition using Polar Matrix Factorization. In LVA/ICA 10, Lecture Notes in Computer Science, 2010, Volume 6365/2010, 555-562.

Fetal electrocardiogram (ECG) extraction from multichannel recordings

Mohammad Niknazar, Hanna Becker, Bertrand Rivet, Christian Jutten et Pierre Comon (Gipsa-Lab – Grenoble)

Our study addresses the problem of fetal electrocardiogram (ECG) extraction from multichannel recordings. The proposed two-step method, which is applicable to as few as two channels, relies on (i) a deterministic tensor decomposition approach, (ii) a Kalman filtering. Robust criteria to perform the tensor decomposition are proposed and used to better track weak traces of the fetal ECG. Then, the state parameters used within an extended realistic nonlinear dynamic model for extraction of N ECGs from M mixtures of several ECGs and noise are estimated from the loading matrices provided by the first step. Application of the proposed method on actual data shows its significantly  superior performance in comparison to the classic methods.

Coupling multimodal and multiresolution hyperspectral images by an extended version of Multiple Co-inertia Analysis

F. Allouche 1, M. Hanafi 2, F. Jamme 3, F. Guillon 1, M.-F. Devaux 1
1 UR1268 Biopolymères Interactions Assemblages, INRA, F-44300 Nantes.marie-francoise.devaux@nantes.inra.fr
2 ONIRIS. Unité de Sensométrie et de Chimiométrie, F-44322 Nantes. mohamed.hanafi@oniris-nantes.fr
3 Synchrotron SOLEIL, BP 48 F- 91192 Gif-sur-Yvette.frederic.jamme@synchrotron-soleil.fr

Keywords: microspectrophotometries, synchrotron, fluorescence, mid-infrared, Raman, multiblock and multiway data, Multiple Co-Inertia Analysis, chemometry, plant cell wall, chemical mapping

Performing chemical mapping by the joint analysis of hyperspectral images requires overcoming several difficulties. First joint hyperspectral images must be acquired for the same sample using different techniques and second, spatial resolution differs from one technique to the other. For example, infrared spatial resolution ranges between 5 and 50 µm while fluorescence resolution can be lower than 1 µm. In usual chemometric analysis, hyperspectral images are unfolded leading to a standard two-way data table of spectra: fig. 1a and 1b. The joint analysis of hyperspectral images lead to pair low resolution pixels to small images in high resolution images. By unfolding the small images [1], a three-way data table is obtained with one way corresponding to the paired low resolution pixels, the second way to the unfolded pixels of the small image and the third way to the spectral dimension.

Paired two and three-way data tables cannot be directly analysed by usual multiblock data analysis. In [1], the Inter-battery Tucker Analysis has been extended in the case of one two-way data table paired with one three-way data table. An extension of Multiple Co-Inertia Analysis [2, 3], called Trilinear Multiple Co-Inertia Analysis is proposed here to analyze any number of two and three-way data tables.

The method has been applied to the chemical mapping of cell wall in maize stems using three hyperspectral images - Mid Infrared, Raman and deep-UV fluorescence – acquired at the synchrotron SOLEIL [3]. Two components are discussed that described 54 and 24 %, 85 and 12 %, 98 and 2 % of the total variance for infrared, Raman and fluorescence, respectively. Components 1 described the global spectral intensity variations while components 2 was assigned to an opposition between pixels with high lignin content to pixels with high polysaccharide or phenolic acid contents. Three regions corresponding to the three cell types studied, (phloem, xylem and sclerenchyma) could be segmented.

Trilinear Multiple Co-Inertia Analysis shows a great potential to jointly analyse hyperspectral images while preserving the full resolution of each image. The method can also be applied to any context where data vector can be paired to sets of data vectors leading to two-way data tables paired to three-way data tables.

[1] Allouche F, Hanafi M, Jamme F, Robert P, Guillon F and Devaux MF. Coupling hyperspectral image data having different spatial resolutions by extending multivariate inter-battery Tucker analysis. Chemometrics and Intelligent Laboratory Systems. 113 : 43–51. 2012.
[2] Chessel D, Hanafi M. Analyses de la co-inertie de K nuages de points. Revue de Statistique Appliquée. XLVI (2) : 35–60. 1996.
[3] Allouche F, Hanafi M, Jamme F, Robert P, Barron C, Guillon F and Devaux MF. Coupling hyperspectral image data having different spatial resolutions using Multiple Co-inertia Analysis. Chemometrics and Intelligent Laboratory Systems. 117 : 200-212. 2012.

Méthode tensorielle MPCA pour la classification de cible en imagerie radar

Tristan Porges (Thalès)

En traitement du signal et en traitement d'images, les données sont multi-indicées et présentent la plupart du temps plus de deux axes de variations. Par exemple en traitement d'images, en plus des deux axes de pixels, un troisième axe peut être associé à la couleur (RVB pour des images jpeg), au temps (vidéo) ou à la polarisation (HH, VV ou HV pour de l'imagerie radar). Les décompositions tensorielles comme le PARAFAC ou la HOSVD deviennent ainsi des outils de plus en plus utilisés en traitement du signal pour la séparation de sources [1], [2] ou pour les télécommunications [3], [4], le filtrage [5] ou en traitement d'images pour la classification automatique de cibles (ATR - Automatic Target Recognition) en imagerie SAR [6]. Le radar à ouverture synthétique, généralement appelé SAR (Synthetic Aperture Radar), constitue un outil puissant pour l'observation terrestre. A l'instar des systèmes satellitaires optiques, l'image obtenue est la résultante de l'interaction entre l'onde électromagnétique incidente et le milieu imagé. Contrairement aux systèmes optiques, le SAR est un système actif opérationnel de jour comme de nuit. De plus, les ondes émises par les systèmes SAR traversent les couches nuageuses et permettent l'observation du sol malgré des conditions climatiquesdéfavorables. Les systèmes SAR peuvent être embarqués sur des satellites (imagerie SARsatellitaire) ou sur des avions, on parle alors de systèmes aéroportés. Les ondes SAR sont sensiblesaux propriétés physiques intrinsèques des milieux ainsi qu'à leurs structures géométriques. Dans lecadre d'une application militaire, des structures métalliques comme des véhicules engendrent uneimportante rétrodiffusion du signal émis et apparaissent sous la forme de pixels de forte intensitédans l'image finale. L'amélioration de la résolution des systèmes imageurs (résolution submétrique)et l'essor de systèmes polarimétriques élargissent considérablement le champ desapplications du SAR en télédétection. Ainsi la reconnaissance automatique de cibles estmaintenant envisageable dans le cadre d'application temps réel.Les méthodes de classification supervisées les plus répandues, comme le PCA, les réseauxde neurones ou les machines à vecteurs supports (SVM – Support Vector Machine) nécessite devectoriser les images d’apprentissage et ne permettent pas d’exploiter la totalité de l’informationqu’elles contiennent. L'intérêt d'une approche tensorielle en classification apparaît lorsque lesdonnées sont constituées de plusieurs images d'une même cible sous différents facteurs de prisesde vue (structure multi-indice). Dans la base de données MSTAR (images SAR de cibles militaires)ces facteurs sont : le type de cible, son orientation et l'angle de site de l'acquisition radar. Unereprésentation tensorielle de cette base de données permet d'assigner à chacun des modes dutenseur un axe de variation associé à un facteur. L'utilisation de décompositions tensoriellescomme la HOSVD permet de révéler des structures et des dépendances entre les données selon lesaxes de variation des différents facteurs. L'utilisation de ces dépendances au travers des valeurssingulières associées à chaque mode du tenseur permet d'extraire des quantités caractéristiquesrelatives à chaque facteur et ainsi de mettre en oeuvre un critère de discrimination qui permetl'identification des paramètres d'une image. L'algorithme MPCA (multilinear Principal ComponentAnalysis) utilise pleinement la représentation tensorielle des données pour procéder à laclassification. Une image de classe inconnue est alors projetée dans les sous-espaces de modesassociés aux différents facteurs de variation des images. Le problème de classification d'une imagede test revient alors à résoudre un problème inverse dans lequel il faut identifier les facteurs de ladécomposition.Le contexte spécifique de la reconnaissance de cibles en imagerie SAR nécessited'introduire les notions de confusion et de rejet. Les échantillons de test sont supposésgénéralement appartenir à une des classes d'apprentissage mais en pratique et plusparticulièrement dans le cas d'applications militaires, il se peut que les cibles testéesn'appartiennent à aucune des classes apprises. Le classifieur MPCA est ainsi capable d'avertirl'utilisateur de la présence d'une cible inconnue et de discriminer les véhicules civils et militaires.De plus, pour une application en temps réel, le calculateur du radar doit être capable d'effectuerlui même la classification. Ce dernier ayant une capacité mémoire limitée, une phase decompression des données est nécessaire. L'utilisation de la HOSVD durant la phase d'apprentissagepermet d'obtenir un taux de compression très important des données utiles pour la phase de testtout en maintenant les performances de classification.

[1] J.F.Cardoso, P. Comon : Tensor-based independent component, EUSIPCO 1990, 673-676,Barcelona, septembre 1990.
[2] P.Comon, C.Jutten : Handbook of blind source separation, independent component analysis andapplications, Academic press 2010.
[3] A.L.F.de Almeida, G.Favier, J.C.M.Mota : PARAFAC models for wireless communication systems,PSIP 2005, Toulouse, février 2005.
[4] A.L.F.de Almeida, G.Favier, J.C.M.Mota : PARAFAC-based unified tensor modeling for wirelesscommunication systems with application to blind multiuser equalization, Signal Processing,Elsevier, vol 87, 337-351, 2007.
[5] D.Mutti, S.Bourennane : Survey on tensor algebraic filtering, Signal processing, vol 87, 237-249,2007.
[6] T.Porgès, G.Favier : Automatic target classification in SAR images using MPCA. ICASSP 2011,Pragues, mai 2011.

Non-negative sub-tensor set Factorization

Andreas Kodewitz, Université d’Evry-Val d’Essonne, Laboratoire IBISC-TADIB

We want to present a novel approach to large scale non-negative tensor decomposition developed in course of my PhD thesis. This approach handles the data of large tensors not as a whole but piece wise. In contrary to block wise decomposition our approach does not need to access the same data block repeatedly, which considerably reduces memory overhead and calculation time. More precisely, our approach splits up the input tensor along one mode to obtain a set of sub-tensors of order N-1. Those sub-tensors are then presented one after the other to the decomposition algorithm and decomposed in two alternating steps. First the presented sub-tensor is encoded in terms of the factor matrices 1 to N-1. This corresponds to an update of a column of factor matrice N.Then the already included information is stored and the factor matrices 1 to N-1 areupdated. An approximation in the second step reduces considerably the memory consumptionand calculation time of the whole algorithm. We will show performance of ouralgorithm in the decomposition of 3rd and 4th order tensors formed by face images. Theperformance is compared to state of the art algorithms. We also show results obtainedin the decomposition of tomographic data forming a tensor of dimensions 91x109x91x335.

Une nouvelle décomposition orthogonale : la cross HOSVD, application au STAP multidimensionnel

Maxime Boizard(1,2), Guillaume Ginolhac(1,3), Frédéric Pascal (2), Philippe Forster (1)
1 Laboratoire SATIE - ENS Cachan - CNRS - UniverSud, France
2 Laboratoire SONDRA - Supelec, France
3 LISTIC - Université de Savoie, France

La Higher Order Singular Value Decomposition (HOSVD) [1] est l'une des deux solutions pour étendre la Singular Value Decomposition (SVD) au cas multilinéaire. Elle possède des proprieties d'orthogonalité similaires à la SVD, mais elle implique une définition du rang différente. Elle est utilisée pour de nombreux traitements : ESPRIT [2], Independent component analysis (cite thèse de lathauwer), MUSIC [3]. Le filtre STAP (Space Time Adaptative Processing) [4] est utilisé dans le cadre des RADAR aéroportés afin de détecter des cibles en mouvement, noyées dans un clutter (fouillis) de sol, en combinant les informations temporelles et spatiales. Il est possible de construire une version rang faible [5, 6] en utilisant le projecteur sur le sous espace orthogonal au clutter. En effet la loi de Brennan assure que la matrice de covariance du clutter est de rang faible. Cette version rang faible est connue pour être plus performante que la version classique. Dans le cadre de données multidimensionnelles (STAP MIMO et/ou STAP polarimétrique), les traitements usuels arrangent les données sous forme vectorielle sans utiliser complétement leur structure multidimensionnelle, ce qui parait préjudiciable dans certaines configurations de cibles et de clutter. Avec ses proprietes d'orthogonalite, la HOSVD semble un choix pertinent afin d'estimer le sous espace orthogonal au clutter et ainsi étendre le filtrage STAP rang faible au cas tensoriel. Dans [7] nous avons développé un filtre STAP multilinéaire rang faible basé sur la HOSVD que nous avons appliqué au STAP polarimétrique. Toutefois nous avons montré dans [8] que la HOSVD ne permettait pas de retrouver les résultats du STAP classique vectoriel. En effet la HOSVD repose sur le dépliement classique d'un tenseur. Ce dépliement ne permet de prendre en compte que l'information contenue dans chaque dimension prise séparément. Etant donné que le filtrage STAP repose sur le caractère spatio-temporel des données, il est donc logique que la HOSVD ne permette pas de retrouver les résultats du STAP vectoriel. Ce constat nous a amené à développer dans [10] une nouvelle décomposition : la cross HOSVD. Cette décomposition repose sur des dépliements plus généraux [9] qui permettent de mettre en valeur une combinaison de dimensions et donc de prendre en compte l'information contenue dans cette combinaison de dimensions (par exemple : la dimension spatio-temporelle). Dans cet exposé nous présenterons ce nouvel outil, ses propriétés. Nous présenterons aussi les résultats obtenus pour le STAP polarimétrique en terme de SNR loss.

[1] L. De Lathauwer, B. De Moor, and J. Vandewalle, A multilinear singular value decomposition," SIAM J. Matrix Anal. Apl., vol. 24, no. 4, pp. 1253-1278, 2000.
[2] M. Haardt, F. Roemer, and G. Del Galdo, Higher-order svd-based subspace estimation to improve the parameter estimation accuracy in multidimensionnal harmonic retrieval problems," IEEE Trans. on Proc. Sig. Proc., vol. 56, no. 7, pp. 3198-3213, July 2008.
[3] M. Boizard, G. Ginolhac, F. Pascal, S. Miron, and P. Forster, Numerical performance of a tensor music algorithm based on hosvd," in Proceedings of ICASSP, Vancouver, Canada, submitted.
[4] J. Ward,  Space-time adaptive processing for airborne radar," Tech. Rep., Lincoln Lab., MIT, Lexington, Mass., USA, December 1994.
[5] I. Kirsteins and D. Tufts, Adaptive detection using a low rank approximation to a data matrix," IEEE Trans. on Aero.and Elec. Syst., vol. 30, pp. 55 { 67, 1994.
[6] A. Haimovich,  Asymptotic distribution of the conditional signal-to-noise ratio in an eigenanalysis-based adaptive array," IEEE Trans. on Aero. and Elec. Syst., vol. 33, pp. 988 - 997, 1997.
[7] M. Boizard, G. Ginolhac, F. Pascal, and P. Forster, Développement de filtres stap tensoriels appliqués a des données multidimensionnelles," in Proc. of the GRETSI Conf., 2011.
[8] M. Boizard, G. Ginolhac, F. Pascal, and P. Forster, Low rank tensor stap filter based on multilinear svd," in Proceedings of SAM, Hoboken, New Jersey, USA, 2012.
[9] T. Kolda and B. Bader, Tensor decompositions and applications," SIAM Review, vol. 51, pp. 455-500, 2009.
[10] M. Boizard, G. Ginolhac, F. Pascal, and P. Forster, A new tool for multidimensional low-rank stap filter : Cross hosvds," in Proceedings of EUSIPCO, Bucharest, Romania, 2012.

Date : 2013-01-16

Lieu : Télécom Paristech (rue Barrault)


Thèmes scientifiques :
A - Méthodes et modèles en traitement de signal

Inscriptions closes à cette réunion.

Accéder au compte-rendu de cette réunion.

(c) GdR IASIS - CNRS - 2024.