Nous vous rappelons que, afin de garantir l'accès de tous les inscrits aux salles de réunion, l'inscription aux réunions est gratuite mais obligatoire.
Inscriptions closes à cette réunion.
19 personnes membres du GdR ISIS, et 0 personnes non membres du GdR, sont inscrits à cette réunion.
Capacité de la salle : 70 personnes.
L'apprentissage statistique est un domaine de recherche à la croisée des statistiques, de l'informatique et de l'optimisation. Son objectif est de modéliser des systèmes complexes à partir d'exemples.
Cette problématique est particulièrement centrale en traitement du signal et des images où des capteurs, potentiellement hétérogènes et en grand nombre, délivrent d’importantes masses de données généralement bruitées. Le succès des méthodes d'apprentissage est principalement dû à leur flexibilité, et aux solutions efficaces et souvent élégantes auxquelles elles conduisent, même pour d'importantes masses de données.
L'objectif de la journée était de faire le point sur différentes avancées du domaine, en lien avec des applications en traitement du signal et des images.
Organisateurs :
Florence d'Alché-Buc (IBIS - Université d'EVRY)
Nous abordons le problème de la prédiction de liens comme une tâche d'apprentissage d'un noyau de sortie en introduisant une méthode de régression à noyau de sortie, supervisée puis semi-supervisée. En faisant l'hypothèse supplémentaire d'un noyau d'entrée, la régression à noyau de sortie et à noyau d'entrée peut se formuler dans le cadre de l'approximation de fonctions à valeurs dans un espace de Hilbert, à l'aide d'un espace de Hilbert à noyau auto-reproduisant à valeurs "opérateur". Dans ce cadre, nous rappelons brièvement le théorème de représentation introduit par Micchelli et Pontil en 2005 pour un critère des moindres carrés pénalisé puis nous établissons un nouveau théorème de représentation dédié à la régression semi-supervisée . Nous donnons ensuite
un exemple simple de noyau à valeur opérateur défini à partir d'un noyau d'entrée à valeurs scalaires et nous construisons un espace de Hilbert avec celui-ci comme noyau autoreproduisant. La minimisation des moindres carrés
pénalisés dans ce cadre conduit à une solution analytique comme dans le cas de la régression ridge, qui est donc ici étendue. La pertinence de cette nouvelle approche est étudiée dans le cadre de la prédiction de lien supervisée et transductive sur des données d'interactions protéiques.
Gilles Gasso (LITIS - INSA de Rouen)
Cette présentation aborde des problèmes de classification où on souhaite optimiser par exemple la précision pour un rappel fixé. Le problème d'optimisation non-convexe qui en résulte est résolu en se basant sur une approche de type programmation DC (différence de fonctions convexes).
Paul Honeine (ICD - UTT)
En apprentissage et reconnaissance des formes, le passage à un espace transformé permet d'élaborer des techniques non-linéaires à partir de techniques linéaires classiques. Quoique cette transformation se fasse implicitement par un choix approprié du noyau, la connaissance de la fonction réciproque, de l'espace transformé au domaine d'observation, est souvent d'intérêt primordial. C'est le problème de la pré-image. On se propose de présenter les avancés récentes dans la résolution de ce problème. Ouvrant la voie à une nouvelle classe de méthodes à noyau, ce problème est illustré au travers de plusieurs applications en traitement du signal et des images.
P. Honeine and C. Richard, Preimage problem in kernel-based machine learning. IEEE Signal Processing Magazine, 28 (2) : 77-88, march 2011.
Zaid Harchaoui (INRIA)
We propose a new approach to perform classification in the presence of large amounts of irrelevant or noisy instances.
This is achieved by designing a convex objective function whose optimization finds the most relevant samples
for classification, and uses them to discriminate between classes. In particular, we combine the logistic loss with a
combination of L2 and L2,1-type regularization penalties that enforce within-group sparsity. We study the properties
of the L2,1 regularization, compare it to standard regularization penalties, and propose the final algorithm with
its optimization. Experimental results in real world applications show improvement over unstructured regularization
penalties.
Hachem Kadri (LAGIS)
Joint work with Philippe Preux, Emmanuel Duflos and Stéphane Canu.
In this talk we will consider the supervised learning problem when both & covariates and responses are real functions rather than scalars or finite dimensional vectors. In this setting, we will present a set of rigorously defined operator-valued kernels that can be valuably applied to learn infinite-dimensional operators in reproducing kernel Hilbert spaces of function-valued functions. We will describe some applications where the proposed& nonparametric operator estimation procedure can be of practical interest.
Nicolas Usunier (LIP6)
Le problème de la prédiction d'un (pré)ordre total sur un ensemble de données observées, aussi appelé "ranking", a reçu un fort intérêt de la part de la communauté d'apprentissage ces dernières années. Cette tâche de prédiction
apparaît lorsque l'on souhaite ordonner des données selon la probabilité d'appartenance à une classe, mais aussi en classification multiclasses et, dans le contexte des moteurs de recherche, lorsque l'on produit la liste
ordonnée de résultats en réponse à une requête utilisateur. Les applications des méthodes de ranking étant extrêmement diverses, les algorithmes d'apprentissage doivent pouvoir s'adapter aux spécificités du
problème, comme le niveau de bruit dans l'étiquetage, la nécessité de passer à l'échelle ou encore la mesure d'évaluation utilisée. Nous présenterons tout d'abord des algorithmes pour l'apprentissage de fonctions de ranking
issus de l'approche par classification de paires d'exemples (c'est-à-dire que les observations à ordonner sont comparées deux à deux), où les paires d'exemples sont pondérées dans les fonctions de coût optimisées par les algorithmes. Les poids associés à chaque paire peuvent être statiques (i.e. dépendants
uniquement des exemples appartenant à la paire) ou dynamiques (i.e. dépendants de l'ordre induit par la fonction de prédiction) et permettent d'adapter la procédure d'apprentissage au problème considéré. Nous présenterons ensuite
des applications de ces algorithmes à des problèmes de recherche d'information dans des corpus de textes et d'images.
Date : 2011-04-07
Lieu : Telecom ParisTech - SalleB310 - Rue Barrault
Thèmes scientifiques :
A - Méthodes et modèles en traitement de signal
Inscriptions closes à cette réunion.
(c) GdR IASIS - CNRS - 2024.