Avancées récentes en analyse temps-fréquence

Nous vous rappelons que, afin de garantir l'accès de tous les inscrits aux salles de réunion, l'inscription aux réunions est gratuite mais obligatoire.

Inscriptions closes à cette réunion.

Inscriptions

37 personnes membres du GdR ISIS, et 16 personnes non membres du GdR, sont inscrits à cette réunion.
Capacité de la salle : 100 personnes.

Annonce

L'analyse temps-fréquence est dotée d'une riche histoire depuis ses premiers développements au milieu du XXe siècle, à l'interface du traitement du signal et de l'analyse harmonique. Les représentations temps-fréquences comme le spectrogramme sont utilisées en routine dans d'innombrables applications, allant de l'astronomie gravitationnelle au traitement de signaux audios, en passant par l'EEG ou la surveillance de machines tournantes. Le but de cette journée est de faire un tour d'horizon des récentes avancées méthodologiques du domaine, ainsi que des nouveaux champs applicatifs.

Sur le plan méthodologique, on peut citer, parmi les avancées récentes, le développement de nouvelles approches de segmentation du spectrogramme par l'exploitation de la structure de ses zéros (par triangulation ou par l'étude de processus ponctuels associés), mais aussi les approches dites de synchrosqueezing et nouvelles formes de réallocation permettant l'extraction de modes AM-FM, ou encore les extensions des représentations temps-fréquence classiques telles que le spectrogramme pour les signaux bi- ou multivariés.

Sur le plan des applications, on a vu ces dernières années émerger de nombreux travaux qui exploitent l'extraction des lignes de fréquence instantanées (ridges), ou bien les décompositions adaptatives données par des segmentations temps-fréquence. Ces décompositions s'avèrent adaptées pour de très nombreuses séries temporelles non-stationnaires. Les domaines d'applications incluent l'acoustique, la géophysique, l'audio et la parole, ou encore le radar.

Orateurs invités

Rémi Bardenet (CNRS, CRIStAL)
Julien Bonnel (Woods Hole Oceanographic Institute, USA)
Valentin Emiya (Aix Marseille Université, LIS )

Appel à contributions

Le programme inclura des communications pour lesquelles un appel à contributions est lancé. Les personnes intéressées peuvent envoyer un résumé (1 page maximum, format pdf) aux organisateurs. Date limite : 28 février.

Organisateurs

Julien Flamant (CNRS, CRAN) julien.flamant@cnrs.fr
Thomas Oberlin (ISAE-Supaero, IRIT) thomas.oberlin@isae-supaero.fr

Programme

Organisation

La journée aura lieu en présentiel à l'ISC, 113 rue Nationale, Paris 13ème. Pour ceux qui souhaiteraient assister à la journée en visio, voici un lien zoom : https://zoom.us/j/99178839734?pwd=ZmNUU1JPaEZWcldNdkdXV2xsbENsUT09

Pour des raisons d'organisation, merci de vous inscrire uniquement si vous comptez venir sur place.

Programme

9h30 : Accueil, introduction
9h45 : exposé invité Rémi Bardenet
10h30 : Juan Manuel Miramont
11h00 : pause café
11h20 : Ali Moukadem
11h50 : Cyril Cano
12h20 : Lunch
13h30 : exposé invité Valentin Emiya
14h10 : Pierre-Hugo Vial
14h40 : Vincent Lostanlen
15h10 : pause café
15h30 : exposé invité Julien Bonnel
16h15 : Nils Laurent
16h45 : Quentin Legros
17h15 : Conclusion et fin de la journée

Résumés des contributions

Orateurs invités

Rémi Bardenet (CNRS & Univ. Lille)

Zeros of random spectrograms: "old" and new

While we traditionally focus on regions of the time-frequency plane on which the spectrogram takes large values, the spatial distribution of the zeros of a spectrogram does carry a lot of information on the analyzed signal. I will give an overview of what has been learned since Flandrin's 2015 seminal paper on the zeros of the spectrogram of white noise, with a focus on our recent work on establishing a dictionary between time-frequency transforms and zeros of certain Gaussian processes.

Joint work with Julien Flamant, Pierre Chainais, Adrien Hardy, Barbara Pascal

Valentin Emiya (LIS, Aix-Marseille Université)

Atténuer des régions temps-fréquence

Nous nous intéressons à la problématique de l'atténuation de régions temps-fréquence, par exemple lorsqu'un signal de perturbation est bien localisé dans le plan temps fréquence. Nous abordons cette problématique sous l'angle du filtrage temps-fréquence, en formulant le problème d'optimisation dans le domaine du signal pour éviter les difficultés liées à la phase, et en proposant des solutions algorithmiquement efficaces.

La formulation du problème permet de contrôler précisément le niveau d'atténuation, en ajustant un compromis entre l'énergie dans les zones à atténuer et l'erreur d'approximation en dehors de ces zones. Le problème admet une solution analytique qui fait intervenir la notion de multiplicateurs de Gabor. Les vecteurs propres dominants de ces opérateurs présentent de remarquables propriétés de localisation temps-fréquence et la décroissance de leurs valeurs propres permet d'utiliser des approximations de rang réduit. Nous proposons des algorithmes dont l'efficacité s'appuie sur ces approximations, ainsi que sur des algorithmes de décompositions randomisés et sur des propriétés de non-recouvrement des zones temps-fréquence à atténuer.

Ce travail a été réalisé dans le cadre du doctorat de Marina Krémé sous la direction de Bruno Torrésani, Caroline Chaux et Valentin Emiya.

Référence: Ama Marina Kreme, Valentin Emiya, Caroline Chaux, Bruno Torrésani, Time-Frequency Fading Algorithms Based on Gabor Multipliers, IEEE Journal of Selected Topics in Signal Processing, IEEE, 2021, 15 (1), pp.65-77. https://hal.archives-ouvertes.fr/hal-02861427

Julien Bonnel (Woods Hole Oceanographic Institution, USA)

Acoustical oceanography with a single hydrophone: propagation, physics-based processing and applications

Lobsters, whales and submarines have little in common. Except that they produce low-frequency sounds, like many other marine occupants that use sound for communication, foraging, navigation and other purposes. However, unraveling and using the underwater cacophony is not at all simple. This is particularly true for low-frequency (f<500 Hz) propagation in coastal water (water depth D<200 m), because the environment acts as a dispersive waveguide: the acoustic field is described by a set of modes that propagate with frequency-dependent speeds; the propagated signals thus contains multiple components with non-linear group delays. In this context, to extract relevant information from acoustic recording, one needs to understand the propagation and to use physics-based processing. In this presentation, we will show how to analyze low-frequency data recorded on a single hydrophone. We will notably review modal propagation and time-frequency analysis. We will then show how those can be combined into a non-linear signal processing method dedicated to extract modal information from single receiver, and how such information can be used to localize sound sources and/or characterize the oceanic environment. The whole method will be illustrated on several experimental examples, including geoacoustic inversion on the New England Mud Patch and baleen whale localization in the Arctic.

Liste des contributions

Estimation de phase avec divergences de Bregman et applications à la reconstruction de signaux audio
Pierre-Hugo Vial (IRIT, Université de Toulouse, CNRS), Paul Magron (Université de Lorraine, CNRS, Inria, LORIA), Thomas Oberlin (ISAE-SUPAERO), Cédric Févotte (IRIT, Université de Toulouse, CNRS) L'estimation de phase (PR, de l'Anglais phase retrieval) a pour objectif d'identifier un signal à partir des amplitudes d'un ensemble d'observations linéaires. Ce problème apparaît dans de nombreuses applications en traitement du signal audio, lorsque l'on manipule des spectrogrammes d'amplitude ou de puissance construits avec la transformée de Fourier à court-terme et omettant la phase. Il est en effet nécessaire de retrouver la phase manquante à partir des spectrogrammes considérés afin de pouvoir synthétiser un signal temporel. Le phase retrieval est en général traité comme un problème de minimisation d'une fonction de coût quadratique. Celle-ci a été remplacée à de nombreuses reprises par des fonctions alternatives telles que les beta-divergences, qui ont montré leur efficacité en audio. Ainsi, nous choisissons de formuler le PR comme un nouveau problème de minimisation de divergences de Bregman. Comme ces dernières ne sont en général pas symétriques vis-à-vis de leurs arguments, deux formulations peuvent être exprimées. Nous procédons à l'optimisation des fonctions de coût introduites via deux méthodes, qui reposent sur la descente de gradient et l'algorithme des directions alternées. Nous conduisons également un travail expérimental visant à la reconstruction de signaux audio à partir de spectrogrammes, exacts ou estimés à partir d'observations bruitées. Les résultats obtenus mettent en avant le potentiel des méthodes proposées pour la restauration de signaux audio. En particulier, l'utilisation de certaines de ces divergences pour le PR à partir de spectrogrammes très bruités permet une reconstruction de meilleure qualité que le coût quadratique.

Détecteur de Ridges pour des Signaux Multicomposantes Non-Stationnaires

Nils Laurent, Sylvain Meignen (LJK, Université Grenoble Alpes, CNRS)
L'analyse temps-fréquence des signaux multicomposantes permet de traiter un grand nombre de signaux réels non stationnaires. Ce modèle présente un signal comme une composition de modes qui varient en fonction d'une amplitude instantanée et d'une fréquence instantanée. Dans notre cas précis, on s'intéresse à estimer la fréquence de chacun des modes en fonction du temps dans des situations avec un niveau de bruit élevé. Les méthodes de détection de ridges sont alors naturellement considérées sous l'hypothèse que chaque ridge forme une ligne continue sur le plan temps-fréquence. Lorsque le bruit est trop fort, cela n'est plus le cas et la ligne est fragmentée en de multiples portions de ridges. Il est donc nécessaire de trouver une nouvelle approche qui permet d'associer les portions de ridges pour chacun des modes. L'approche que nous avons considérée se déroule avec une identification de l'ensemble des ridges, l'élimination des ridges liés au bruit et l'association des ridges les plus significatifs en fonction du nombre de modes recherchés.

Renormaliser le spectrogramme : pourquoi, comment?

Vincent Lostanlen (CNRS, LS2N)
Le déploiement de réseaux de capteurs acoustiques, en traitement de la parole ou en bioacoustique notamment, requiert des systèmes d'écoute artificielle robustes aux variations du bruit de fond. Dans ce contexte, une méthode récente appelée normalisation d'énergie par canal (PCEN) offre un contrôle adaptatif des bandes de fréquences d'un spectrogramme. Or, malgré son succès empirique dans les modèles d'apprentissage profond, la PCEN manque aujourd'hui d'une fondation théorique. Afin d'y pourvoir, cet article propose des éléments de compréhension de la PCEN issus de l'analyse temps--fréquence et de l'inférence statistique. D'abord, nous comparons la PCEN à une estimation de périodogramme par méthode de Welch. Ensuite, nous démontrons que la PCEN d'un processus stationnaire au second ordre produit des coefficients d'amplitude indépendants et identiquement distribués, suivant asymptotiquement une loi de Rayleigh. Enfin, nous établissons un parallèle entre PCEN et transformation de Box-Cox. Ainsi, nous formalisons une propriété déjà observée expérimentalement : avec des hyperparamètres bien choisis, le « PCEN-gramme » d'un signal naturel présente une distribution d'amplitude quasi gaussienne. Nous concluons sur un aperçu des questions théoriques ouvertes que soulève la PCEN.

A noise-assisted denoising method based on the spectrogram's zeros
J. M. Miramont (Nantes Université, Laboratoire IREENA), R. Bardenet (CRIStAL, Université de Lille, CNRS), P. Chainais (CRIStAL, Université de Lille, CNRS) , F. Auger (Nantes Université, Laboratoire IREENA)
The short-time Fourier transform (STFT) is a fundamental tool for time-frequency (TF) signal analysis. Its square modulus, also termed spectrogram, can be seen as a TF distribution of the energy of a signal. Based on such an interpretation, a number of methods were built around the notion of maximum values of the spectrogram, assuming that more energy is concentrated where there is more information of the signal [1]. However, zeros of the spectrogram, i.e. minimum values, have also been described as relevant points that can be used to characterize this TF distribution. This is based on three facts [3]: 1) the STFT can be written in terms of the Bargmann transform, 2) the zeros of the Bargmann transform, the STFT and the spectrogram coincide and 3) being a complex entire function, the Bargmann transform can be characterized by a product formula based on its zeros by the celebrated Hadamard-Weierstrass factorization [3]. Moreover, the distribution of the zeros of the spectrogram has been shown to correspond to that of the zeros of planar random Gaussian analytic functions [2], building valuable bridges between spatial statistics and TF analysis. As shown in [3, 2], the position of the zeros can be leveraged to devise denoising methods that are based on the identification of the signal's support in the TF plane, in a non-parametric, geometry-independent fashion, contrasting with more traditional methods based on the maximum values of the spectrogram. The aim of our ongoing work is to identify the signal TF domain by means of a noise-assisted approach, particularly in low signal-to-noise ratio scenarios where other zeros-based methods might face difficulties.

Joint work with Rémi Bardenet, Pierre Chainais and François Auger.

References :
[1] F. Auger and P. Flandrin. Improving the readability of time-frequency and time-scale representations by the reassignment method. IEEE Trans. Signal Process., 43(5), 1995.

[2] R. Bardenet, J. Flamant, and P. Chainais. On the zeros of the spectrogram of white noise. Appl Comput Harmon Anal, 48(2), 2018.

[3] P. Flandrin. Time-frequency filtering based on spectrogram zeros. IEEE Signal Processing Letters, 22(11), 2015

Les zéros des transformées temps-fréquence pour le filtrage et la classification des signaux non-stationnaires P. Rougé (Université de Lyon, INSA, CREATIS, Inserm) , A. Moukadem (Université de Haute-Alsace, IRIMAS, Mulhouse France), A. Boutet (Université de Lyon, INSA, Inria, CITI, Lyon France), J-B. Courbot (Université de Haute-Alsace, IRIMAS, Mulhouse France, B. Colicchio (Université de Haute-Alsace, IRIMAS, Mulhouse France), A. Dieterlen (Université de Haute-Alsace, IRIMAS, Mulhouse France) et C. Frindel (Université de Lyon, INSA, CREATIS, Inserm)
Récemment, un lien entre les fonctions analytiques gaussiennes (Gaussian Analytic Functions ou GAFs) et la transformée de Fourier à court terme (STFT) a été établi [Bardenet 2020]. Ce lien s'articule sur le fait que les zéros de la STFT d'un bruit blanc correspondent aux zéros des GAFs qui sont formellement caractérisés en probabilité [Hough 2009]. Ce travail a été initié par des résultats antérieurs [Flandrin 2015] qui ont mis en évidence l'utilité de la distribution des zéros de la STFT dans le filtrage des signaux et notamment en présence de bruit gaussien. Dans cette présentation, nous abordons une application basée sur la distribution des zéros de la STFT pour extraire des descripteurs à partir du plan temps-fréquence afin de classifier des signaux non-stationnaires. Plus précisément, nous abordons les travaux publiés récemment [Rougé 2021] sur l'exploitation de la distribution des zéros de la STFT pour la classification des activités physiques à partir des signaux d'accélérations sans identifier l'identité de l'utilisateur.
Un deuxième volet de la présentation sera dédié à l'étude de l'extension des propriétés des zéros sur d'autres transformées temps-fréquence, notamment la transformée de Stockwell (ST) qui est considérée comme une version hybride entre la STFT et la transformée en ondelette de type Morlet. La ST dans sa version optimisée [Moukadem 2015] génère des représentations temps-fréquence avec une meilleure concentration d'énergie que la STFT, ce qui peut être bénéfique pour les applications de filtrage et de classification basées sur la distribution des zéros de la ST optimisée.

Fast and accurate gravitational-wave modelling with principal component regressionC. Cano (Univ. Grenoble Alpes, CNRS, Grenoble INP, GIPSA-Lab), E. Chassande-Mottin (Université de Paris, CNRS, Astroparticule et Cosmologie), N. Le Bihan (Univ. Grenoble Alpes, CNRS, Grenoble INP, GIPSA-Lab)The first observation of gravitational waves (GW) by the LIGO/Virgo collaboration in 2015 marked the advent of gravitational wave astronomy. Since this date about 50 events have been detected associated to the merger of compact star binaries, primarily binary black holes, the focus of this work. Theoretical waveform models (or templates) are used to detect the gravitational-wave signals using matched filtering, or to infer the astrophysical parameters of their source using Bayesian samplers. For both those tasks, a large number of template waveforms (about 10^5 to 10^6) are required to be computed to cover the relevant parameter space. Waveform models are deduced from the resolution of the source dynamics which is a difficult relativistic problem. The evaluation of recent and accurate waveform models is computationally expensive and actually dominates the computational budget for parameter inference. In the next decade, LIGO and Virgo detectors are expected to conduct at least two major observing runs with improved sensitivity, leading to a large increase in the number of detected signals. The analysis of those future observations calls for numerically efficient, yet accurate waveform generators.

In this work we consider the rapid generation of surrogate time-domain waveforms consistent with the gravitational-wave signature of the merger of spin-aligned binary black holes. Building on previous works, a machine-learning model is proposed that allows for highly-accurate waveform regression from a set of examples. An improvement of about an order of magnitude in accuracy with respect to the state of the art is demonstrated, along with a significant speed up in computing time with respect to the reference generation software tools. The waveform morphology being reasonably smooth and slowly varying with respect to its parameters (i.e., the binary component masses and their spins), it is possible to fit a signal model based on a generic amplitude and phase evolution from a set of example waveforms. We aim at reproducing noise-free waveform models with high fidelity thanks to a fast learning algorithm. This has been successfully realized using reduced-order modelling (based on tensor spline fitting) and more standard machine learning approach such as mixture-of-experts regression and artificial neural networks. In this work, we propose a model with reduced complexity based on principal component regression, that is able to improve the overall regression accuracy by about an order of magnitude. It can be implemented using off-the-shelf algorithms from Scikit-learn software library. These performances are notably achieved thanks to a different choice of features. While the method presented here is evaluated in the context of gravitational-wave astronomy, it applies in principle to any area that involves chirp signals. One of the lessons learned from this study is that pragmatic regression approaches based on off-the-shelf tools may provide better results than more sophisticated approaches. A judicious choice of features appears critical to optimize the approximation accuracy. Discussion about an important extension of this work could be presented in the case of precessing binaries (with arbitrary, misaligned spins) leading to arbitrarily polarized waveforms (not necessarily circularly polarized). In this more complex case with more input parameters and a larger waveform variability, fast and highly accurate modelling is still an open problem.

Probabilistic methods for robust ridge estimation and mode retrieval in presence of noise

Q. Legros (Télécom Paris, LTCI), D. Fourer (Université D'Evry/Université Paris-Saclay, IBISC)
Thanks to recent advances of the synchrosqueezing method, recent years has shown a grow of interest for time-frequency methods in a large number of applications involving multicomponent signals (MCS). Unfortunately, most of the existing approaches are deterministic and may fail to obtain relevant results in the presence of strong noise or of overlapping components. In this presentation, we introduce and evaluate two new probabilistic approaches allowing to estimate the ridges and to reconstruct the corresponding components of a MCS. The first method uses a pseudo-Bayesian framework combined with a robust alpha- and beta-divergence and the second one is based on a new expectation-maximization (EM) algorithm to estimate the instantaneous frequency and amplitude of the targeted mode. Both approaches are presented, discussed and comparatively assessed with other state-of-the-art methods.

Identification

Avancées récentes en analyse temps-fréquence

Inscriptions

Annonce

Orateurs invités

Appel à contributions

Organisateurs

Programme

Résumés des contributions