Vous êtes ici : Réunions » Réunion

Identification

Identifiant: 
Mot de passe : 

Mot de passe oublié ?
Détails d'identification oubliés ?

Vers un apprentissage pragmatique dans un contexte de données visuelles labellisées limitées

Nous vous rappelons que, afin de garantir l'accès de tous les inscrits aux salles de réunion, l'inscription aux réunions est gratuite mais obligatoire.

S'inscrire à la réunion.

Inscriptions

37 personnes membres du GdR ISIS, et 13 personnes non membres du GdR, sont inscrits à cette réunion.
Capacité de la salle : 50 personnes.

Annonce

Résumé

Les réseaux de neurones convolutifs profonds ont offert de nombreux résultats impressionnants par exemple sur des tâches de classification d'images telles que la reconnaissance d'objets ou la classification de scènes. Cependant, pour qu'un réseau de neurones convolutifs profonds puisse avec succès apprendre à reconnaître des catégories visuelles, il est nécessaire de collecter et d'étiqueter manuellement des milliers d'exemples d'entraînement par catégorie cible et d'appliquer sur ceux-ci des algorithmes d'optimisation (en général itératifs) extrêmement coûteux en termes de ressources de calcul (centaines voire des milliers d'heures de GPU). De plus, dans le cas où une extension du modèle à d'autres catégories serait envisagée, il est nécessaire de collecter suffisamment de nouvelles données d'entraînement pour les nouvelles catégories et de recommencer la procédure d'apprentissage. Ces lourdes exigences ont poussé certains chercheurs à investiguer des pistes de recherche moins gourmandes en termes de données d'entrainement. L'idée étant de s'inspirer de la puissance du système visuel humain qui apprend de nouveaux concepts sans effort à partir de seulement quelques exemples et de les reconnaitre de manière fiable. Reproduire le même mode de fonctionnement dans les systèmes de vision artificielle par apprentissage est un des objectifs des recherches actuelles pour de nombreuses applications notamment celle de la vision du monde réel.

Cette journée a pour objectif de donner un état des lieux des avancées en vision artificielle par apprentissage automatique avec très peu de données labellisées sur les thèmes suivants : Détection, Reconnaissance, Classification, Segmentation.

Appel à contribution

Un appel à contribution est lancé sur les thèmes listés ci-dessus. Les chercheurs souhaitant présenter leurs contributions sont invités à soumettre aux organisateurs un résumé (1 page) avant le 30 octobre.

Orateurs invités

Organisateurs

Programme

En construction

...

Résumés des contributions

IFSS-Net: Interactive Few-Shot Siamese Network for Faster Muscle Segmentation and Propagation in Volumetric Ultrasound

Dawood AL CHANTI, GIPSA-lab / Grenoble

Quantification of muscle volume is a useful biomarker for degenerative neuromuscular disease progression or sports performance. Measuring muscle volume often requires the segmentation of 3D images. While Magnetic Resonance (MR) is the modality of preference for imaging muscles, 3D Ultrasound (US) offers a real-time, inexpensive, and portable alternative. The motivation of our work is to assist the segmentation and volume computation of the low limb muscles from 3D freehand ultrasound volumes. We propose a novel deep learning segmentation and propagation method for 3D US data, which requires few-shot expert annotated slices per 3D volume, on average 48 annotations out of 1400 slices, and leverages unannotated sub-volumes using sequential pseudo-labelling. To produce a fast and accurate muscle segmentation, suitable for reliable volume computation, we design a minimal interactive setting. In practice, we design a Siamese network to capture a common feature representation between ultrasound and mask sub-volumes. The reference can either come from an annotated part of the volume or from prior predictions. To guarantee the model convergence with limited annotated data, we propose a decremental learning strategy. We validate our approach for the segmentation, label propagation, and volume computation of the low-limb muscles, namely: the Gastrocnemius Medialis (GM), the Gastrocnemius Lateralis (GL), and the Soleus (SOL). We consider a dataset of 44 subjects. We demonstrate our method?s capability to learn from a few annotations under a simulated weaklysupervised regime, keeping only 3,5% of the annotations.

Multiscale Attention-Based Prototypical Network for Few-Shot Semantic Segmentation
Désiré SIDIBE, IBISC Université Evry Val d'Essonne

Few-shot semantic segmentation refers to the pixel-level prediction of new categories on a test set, given only a few label examples.

In this talk, we will highlight the challenges and specificities of this task as compared to other few-shot learning tasks such as image classification, and present the main approaches from the literature.

We will also present a method that takes advantage of complementary depth information to extend RGB-centric approaches.

Zero-shot Learning with Deep Neural Networks for Object Recognition
Hervé LE BORGNE, CEA LIST, Saclay

Zero-shot learning (ZSL) deals with the ability to recognize objects without any visual training sample. To counterbalance this lack of visual data, each class to recognize is associated with a semantic prototype that reflects the essential features of the object. The general approach is to learn a mapping from visual data to semantic prototypes, then use it at inference to classify visual samples from the class prototypes only. Different settings of this general configuration can be considered depending on the use case of interest, in particular whether one only wants to classify objects that have not been employed to learn the mapping or whether one can use unlabelled visual examples to learn the mapping.

We present an overview of the ZSL domain, its principle, how it has evolved over the past 10 years towards a less biased and a more realistic evaluation, as well as the main approaches proposed in the field. Then, we present quite recent work addressing various aspect of the ZSL, namely the realism of the "generalized zero shot learning", different methods to build the class prototypes at large scale, and a method to benefit from unlabelled samples from the unseen classes.

One shot Learning Landmarks Detection

Zihao WANG, INRIA, Nice

Landmarks detection in a medical image is a mainstay for many clinical algorithms applications. Learning-based landmarks detection is now a major successful methodology for many types of objects detection. However, learning-based approaches usually need a number of the annotated dataset for training the learning models. In this presentation, I will introduce an automatic one-shot learning-based landmarks detection approach is proposed for identifying the landmarks in 3D volume images. A convolutional neural network-based iterative objects localization method in combine with a registration framework is applied for automatically target organ localization and landmarks matching. The evaluation result shows that the proposed method is robust in convergence, effective in accuracy, and reliable for clinical usage.

Zero-Shot Semantic Segmentation
Tuan-Hung VU, VALEO
TBA

Date : 2021-11-26

Lieu : MSH Paris Nord


Thèmes scientifiques :
B - Image et Vision

(c) GdR 720 ISIS - CNRS - 2011-2020.