Apprentissage et reconnaissance des formes en signal et images

Nous vous rappelons que, afin de garantir l'accès de tous les inscrits aux salles de réunion, l'inscription aux réunions est gratuite mais obligatoire.

Inscriptions closes à cette réunion.

Inscriptions

20 personnes membres du GdR ISIS, et 0 personnes non membres du GdR, sont inscrits à cette réunion.
Capacité de la salle : 70 personnes.

Annonce

L'apprentissage statistique est un domaine de recherche à la croisée des statistiques, de l'informatique et de l'optimisation. Son objectif est de modéliser des systèmes complexes à partir d'exemples.

Cette problématique est particulièrement centrale en traitement du signal et des images où des capteurs, potentiellement hétérogènes et en grand nombre, délivrent d’importantes masses de données généralement bruitées. Le succès des méthodes d'apprentissage est principalement dû à leur flexibilité, et aux solutions efficaces et souvent élégantes auxquelles elles conduisent, même pour d'importantes masses de données.

L'objectif de la journée était de faire le point sur différentes avancées du domaine, en lien avec des applications en traitement du signal et des images.

Organisateurs :

Grégoire Mercier, ENST Bretagne, gregoire.mercier@enst-bretagne.fr
Cédric Richard, Laboratoire Fizeau, cedric.richard@unice.fr
Alain Rakotomamonjy, LITIS, Université de Rouen, alain.rakoto@insa-rouen.fr

Programme

09h45 - 10h00 : Accueil
10h00 - 10h40 : Florence d'Alché-Buc (IBIS - Université d'Evry), Régression à noyaux d'entrée et de sortie pour la prédiction de liens
10h40 - 11h20 : Gilles Gasso (LITIS - INSA de Rouen), Apprentissage de classifieurs sous contraintes probabilité.
11h20 - 12h00 : Paul Honeine (ICD - UTT), Problème de pré-image en apprentissage et reconnaissance des formes. Applications en traitement du signal et des images.

13h45 - 14h25 : Zaid Harchaoui (INRIA ), Instance-Selecting Regularization for Supervised Image Classification
14h25 - 15h05 : Frédéric Precioso (ETIS/LIP6), Catégorisation par le Contenu Sémantique d'Objets Vidéos :
Recherche et Reconnaissance d'Acteurs dans les Films et extensions
15h05 - 15h45 : Hachem Kadri (LAGIS), Operator-valued Kernels for Nonparametric Operator Estimation
15h45 - 16h25 : Nicolas Usunier (LIP6), Apprentissage de fonctions de ranking par classification de paires
pondérées : quelques algorithmes et applications

Résumés des contributions

Régression à noyaux d'entrée et de sortie pour la prédiction de liens

Florence d'Alché-Buc (IBIS - Université d'EVRY)

Nous abordons le problème de la prédiction de liens comme une tâche d'apprentissage d'un noyau de sortie en introduisant une méthode de régression à noyau de sortie, supervisée puis semi-supervisée. En faisant l'hypothèse supplémentaire d'un noyau d'entrée, la régression à noyau de sortie et à noyau d'entrée peut se formuler dans le cadre de l'approximation de fonctions à valeurs dans un espace de Hilbert, à l'aide d'un espace de Hilbert à noyau auto-reproduisant à valeurs "opérateur". Dans ce cadre, nous rappelons brièvement le théorème de représentation introduit par Micchelli et Pontil en 2005 pour un critère des moindres carrés pénalisé puis nous établissons un nouveau théorème de représentation dédié à la régression semi-supervisée . Nous donnons ensuite
un exemple simple de noyau à valeur opérateur défini à partir d'un noyau d'entrée à valeurs scalaires et nous construisons un espace de Hilbert avec celui-ci comme noyau autoreproduisant. La minimisation des moindres carrés
pénalisés dans ce cadre conduit à une solution analytique comme dans le cas de la régression ridge, qui est donc ici étendue. La pertinence de cette nouvelle approche est étudiée dans le cadre de la prédiction de lien supervisée et transductive sur des données d'interactions protéiques.

Apprentissage de classifieurs sous contraintes probabilité

Gilles Gasso (LITIS - INSA de Rouen)

Cette présentation aborde des problèmes de classification où on souhaite optimiser par exemple la précision pour un rappel fixé. Le problème d'optimisation non-convexe qui en résulte est résolu en se basant sur une approche de type programmation DC (différence de fonctions convexes).

Problème de pré-image en apprentissage et reconnaissance des formes. Applications en traitement du signal et des images.

Paul Honeine (ICD - UTT)

En apprentissage et reconnaissance des formes, le passage à un espace transformé permet d'élaborer des techniques non-linéaires à partir de techniques linéaires classiques. Quoique cette transformation se fasse implicitement par un choix approprié du noyau, la connaissance de la fonction réciproque, de l'espace transformé au domaine d'observation, est souvent d'intérêt primordial. C'est le problème de la pré-image. On se propose de présenter les avancés récentes dans la résolution de ce problème. Ouvrant la voie à une nouvelle classe de méthodes à noyau, ce problème est illustré au travers de plusieurs applications en traitement du signal et des images.

P. Honeine and C. Richard, Preimage problem in kernel-based machine learning. IEEE Signal Processing Magazine, 28 (2) : 77-88, march 2011.

Instance-Selecting Regularization for Supervised Image Classification

Zaid Harchaoui (INRIA)

We propose a new approach to perform classification in the presence of large amounts of irrelevant or noisy instances.
This is achieved by designing a convex objective function whose optimization finds the most relevant samples
for classification, and uses them to discriminate between classes. In particular, we combine the logistic loss with a
combination of L2 and L2,1-type regularization penalties that enforce within-group sparsity. We study the properties
of the L2,1 regularization, compare it to standard regularization penalties, and propose the final algorithm with
its optimization. Experimental results in real world applications show improvement over unstructured regularization
penalties.

Catégorisation par le Contenu Sémantique d'Objets Vidéos : Recherche et Reconnaissance d'Acteurs dans les Films et extensions

Fréderic Précioso (LETIS/LIP6) :

A partir de donneées vidéos, les séquences sont segmentées en plans-séquences contenant une série d'images dont le contenu sémantique est continu. En utilisant des algorithmes de l'état de l'art de détection d'objet vidéo (pour les visages ou les voitures, par exemple) nous extrayons des objets vidéos (e.g. visages, voitures) de ces plans-séquences et nous définissons les régions des images contenant le même objet (visage d'une personne, un modèle de voiture, etc) au cours du plan-séquence. De ces régions 2D+t, appelées tracks dans la littérature, nous calculons des caractéristiques visuelles spatio-temporellement cohérentes par un algorithme optimisé de suivi de points d'intérêt SIFT. Chaque ensemble de descripteurs SIFT suivis le long du track constitue une "chaîne de SIFTs''. L'ensemble des chaînes de descripteurs SIFT avec leur positions spatiales, extraits du vidéo track d'un même objet, définit ce que nous appelons un Tube Spatio-Temporel qui représente l'objet. Cette représentation de données n'est pas dédiée à une catégorie spécifique (visage ou voiture) mais au contraire fournit une description générique qui peut être adaptée aux différentes catégories d'objects vidéos. Pour comparer ces objets complexes, nous construisons des fonctions noyaux pour évaluer la similarité entre Tubes Spatio-Temporelles (STTK). à partir de ces similarités noyaux, nous proposons des stratégies d'apprentissage supervisé et interactif, intégrés dans un cadre SVM (Séparateur à Vaste Marge).
Notre approche est évaluée sur trois bases de données de films réels, le film français "L'esquive", des épisodes de la série télévisée "Buffy contre les Vampires'' et sur une base de données de voiture (à partir de films réels). Nous évoquerons enfin des extensions de ces travaux à la reconnaissance d'actions.

Operator-valued Kernels for Nonparametric Operator Estimation

Hachem Kadri (LAGIS)
Joint work with Philippe Preux, Emmanuel Duflos and Stéphane Canu.

In this talk we will consider the supervised learning problem when both & covariates and responses are real functions rather than scalars or finite dimensional vectors. In this setting, we will present a set of rigorously defined operator-valued kernels that can be valuably applied to learn infinite-dimensional operators in reproducing kernel Hilbert spaces of function-valued functions. We will describe some applications where the proposed& nonparametric operator estimation procedure can be of practical interest.

Apprentissage de fonctions de ranking par classification de paires
pondérées : quelques algorithmes et applicationsNicolas Usunier (LIP6)

Nicolas Usunier (LIP6)

Le problème de la prédiction d'un (pré)ordre total sur un ensemble de données observées, aussi appelé "ranking", a reçu un fort intérêt de la part de la communauté d'apprentissage ces dernières années. Cette tâche de prédiction
apparaît lorsque l'on souhaite ordonner des données selon la probabilité d'appartenance à une classe, mais aussi en classification multiclasses et, dans le contexte des moteurs de recherche, lorsque l'on produit la liste
ordonnée de résultats en réponse à une requête utilisateur. Les applications des méthodes de ranking étant extrêmement diverses, les algorithmes d'apprentissage doivent pouvoir s'adapter aux spécificités du
problème, comme le niveau de bruit dans l'étiquetage, la nécessité de passer à l'échelle ou encore la mesure d'évaluation utilisée. Nous présenterons tout d'abord des algorithmes pour l'apprentissage de fonctions de ranking
issus de l'approche par classification de paires d'exemples (c'est-à-dire que les observations à ordonner sont comparées deux à deux), où les paires d'exemples sont pondérées dans les fonctions de coût optimisées par les algorithmes. Les poids associés à chaque paire peuvent être statiques (i.e. dépendants
uniquement des exemples appartenant à la paire) ou dynamiques (i.e. dépendants de l'ordre induit par la fonction de prédiction) et permettent d'adapter la procédure d'apprentissage au problème considéré. Nous présenterons ensuite
des applications de ces algorithmes à des problèmes de recherche d'information dans des corpus de textes et d'images.

Identification