Imagerie stéréo et 3D : Problématiques de compression, perception et mesure de qualité
Nous vous rappelons que, afin de garantir l'accès de tous
les inscrits aux salles de réunion, l'inscription aux réunions est
gratuite mais obligatoire.
Inscriptions closes à cette réunion.
Inscriptions
8 personnes membres du GdR ISIS, et 2 personnes non membres du GdR, sont inscrits à cette réunion.
Capacité de la salle : 40 personnes.
Annonce
Description de la journée
Les efforts de recherche et de développement sur les technologies 3D ont augmenté de manière significative au cours des dernières années, couvrant toute la chaîne de traitement de la capture à l'affichage. Aujourd'hui, beaucoup d'experts prédisent que la 3D représente le futur des média comme la télévision, Internet, ... et qu'elle permettra d'améliorer la qualité de l'expérience des utilisateurs finaux. À ce jour il n'existe pas de processus d'acquisition unique pour les données 3D. Ainsi, les différents systèmes de traitement s'appuient sur différentes représentations de la scène 3D qui intègrent différents types de données.
Plusieurs travaux ont été consacrés à la compression de données image et vidéo 3D incluant la stéréo et le multi-vues (avec profondeur ou la disparité associée) ou encore de données géométriques dans les maillages 3D statiques ou animés. Bien sûr, ces travaux étendent les principes de codage vidéo classique.
Il est important de noter que les écrans (ordinateurs, téléviseurs, ...) jouent un rôle central dans l'adoption de la technologie 3D et de sa démocratisation. Cela signifie que la technologie doit faire preuve de maturité pour éviter un rejet de la part des utilisateurs finaux en raison d'une mauvaise qualité, de fatigue visuelle... Dans ce contexte, plusieurs études ont été consacrées à la définition de paradigmes subjectifs et des mesures objectives pour évaluer la qualité et pour prédire la qualité de l'expérience.
Cette journée de l'Action "Compression et qualité" s'inscrit dans le cadre de ces problématiques. Elle sera composée à la fois de présentations senior permettant de faire un review des principales avancées dans le domaine et de présentations plus ciblées sur des travaux récents.
Organisateurs
- Marc Antonini, I3S, Nice (am@i3s.unice.fr)
- Chaker Larabi, XLim, Poitiers (chaker.larabi@univ-poitiers.fr)
Programme
Programme
Le compte rendu de la journée est accessible à partir du lien suivant: CR-QC1.pdf
Résumés des contributions
Perception visuelle tri-dimensionnelle chez l'homme
- Orateur : Pascal Mamassian
- Affiliation: Laboratoire Psychologie de la Perception, CNRS & Université Paris Descartes)
- Résumé : La perception visuelle de la profondeur chez l'homme repose sur plusieurs indices tri-dimensionnels. Parmi ces indices, les disparités binoculaires qui sont responsables de notre vision stéréoscopique sont traditionnellement considérés comme les plus critiques pour une perception fine de la profondeur. Cet exposé présentera quelques résultats fondamentaux en perception stéréoscopique chez l'homme, ainsi que d'autres indices tri-dimensionnels dits monoculaires comme la texture, la perspective, ou l'ombre, qui viennent raffiner notre perception de la profondeur.
Retour au programme
Codage multirésolution de maillages surfaciques denses
- Orateur : Marc Antonini
- Affiliation: I3S, CNRS & Université de Nice-Sophia Antipolis
- Résumé : La demande d’affichage et de manipulation de maillages surfaciques complexes avec des résolutions de plus en plus fines (plusieurs millions de polygones) augmente régulièrement, alors que les capacités des bus et des réseaux évoluent plus lentement dû en particulier aux besoins de standardisation. Dans ce contexte, le goulot d’étranglement de la performance est donc aussi un problème de transmission des données : La compression devient donc un élément clé dans cette augmentation de performance recherchée. Dans cet exposé nous montrerons une solution de visualisation de maillages surfaciques denses qui s'appuie sur la quantification vectorielle par réseaux réguliers de points et sur l'analyse multirésolution de données géométriques. L'algorithme proposé est hautement parallèle et s'appuie sur un décodage GPU des données comprimées au niveau de la carte graphique, juste avant le rendu. Cette solution permet l'affichage et la manipulation d'objets 3D contenant plusieurs millions de triangles dans des temps extrêmement courts.
Codage multirésolution de maillages surfaciques denses
- Orateur : Elie Gabriel MORA, Joel JUNG
- Affiliation: ORANGE Labs
- Résumé : Avec les progrès réalisés dans le domaine de la production et de la visualisation de vidéos 3D, l’intérêt de cette dernière continue d’augmenter. De nouvelles applications 3D voient le jour : la 3DTV et la FTV en sont 2 exemples majeurs. Au milieu de cette révolution stéréoscopique, de nouveaux formats vidéo et différentes méthodes de codages doivent être explorés pour permettre un bon rendement qualité / compression. Et la tâche n’est pas facile, puisqu’une bonne visualisation en 3D requiert un nombre important de vues disponibles au décodeur, et le coût de codage et de transmission résultant peut augmenter rapidement. Cet exposé présentera un état de l’art général sur la compression vidéo 3D. On parlera plus précisément des différents formats et méthodes de codage 3D évalués à ce jour, en soulignant les activités normatives et les discussions récentes associées à ces sujets.
Retour au programme
L'impact de deux stratégies de compression dans le problème stéréo
- Auteurs : G. Blanchet, A. Buades, B. Col J.M Morel and B. Rougé
- Affiliation: CNES
- Résumé: Recent Earth observation satellite projects, in particular the Pleiades project (to be launched in 2010) contemplate the acquisition of quasi-simultaneous stereo pairs. This presentation evaluates the impact of the (necessary) compression of the stereo pairs. It compares two compression strategies. The first compression strategy uses classic JPEG 1992 or JPEG 2000, which retain the best perceptual performance. The second compression strategy maintains a shift invariance by simply sub-sampling both views after applying an anti-aliasing Gaussian filter. The quantitative comparison of these two basic strategies shows that JPEG algorithms must compress twice less than sub-sampling to reach the same disparity precision. This dramatic result is explained by the lack of translation invariance of classic compression algorithms. Nonetheless, the sweeping conclusion is that shift invariant algorithms are better compression tools for future stereo Earth observation satellites.
Retour au programme
TV3D un nouveau défi pour l’évaluation de la qualité perceptuelle
- Orateur : Patrick Le Callet
- Affiliation: IRCCyN/IVC
- Considérée comme une opportunité pour sublimer l’expérience visuelle, la TV3D focalise un grand intérêt pour l’industrie du “broadcasting”. Un des points importants pour assurer le succès d’une telle technologie réside dans sa capacité à offrir une qualité d’expérience suffisante. La mesure de qualité, qu’elle soit subjective ou objective, dans un contexte 3DTV soulève plusieurs questions et de nouveaux défis comparés à l’évaluation de qualité vidéo et ce sur toute la chaine de diffusion, de la production de contenu jusqu’à son rendu sur écrans 3D. Ces différentes questions seront présentées ainsi qu’un état des réponses actuelles.
Retour au programme
Métrique de qualité stéréo basée sur l’énergie binoculaire
- Auteurs : Rafik Bensalma et Chaker Larabi
- Affiliation: XLIM-SIC, Université de Poitiers
- We propose a quality metric for color stereo images. The concept of our metric is inspired by the behavior of simple and complex cells located in the primary visual cortex. These cells are responsible for merging left and right retinal images. To replicate the task performed by these cells, we adopted an approach based on spatial-frequency transform with the processing of selective orientations. From that, a model that calculates the binocular energy contained in the left and right retinal images has been proposed. The amplitude variation of the binocular energy defines the quality criterion of the reconstructed depth within the Human Visual System (HVS). Finally, from the experimental results, the used criterion seems to be correlated to human judgment obtained by psychophysical tests.
Retour au programme
Etude de l'attention visuelle sur des contenus stéréoscopiques 3D
- Auteurs : Quan Huynh-Thu et Christel Chamaret
- Affiliation: Technicolor
- Résumé: Visual attention is an important aspect of perception and its understanding is therefore important for the creation of 3D stereoscopic content. In this study, we conducted a subjective experiment using an eye-tracking equipment to record observers' gaze patterns. Video clips with a wide variety of spatio-temporal characteristics and range of disparity were shown to a panel of viewers in both their 2D and 3D stereoscopic version. We found that the differences in spread and location of fixations were highly dependent on the content characteristics and narrative flow of the video, and not only on the depth effect provided by the binocular disparity. Our results also indicated that average fixation frequency and average fixation duration were overall lower when viewing 3D stereoscopic content.
Retour au programme
Une comparaison des métriques perceptuelles existantes pour l'évaluation de la qualité des objets 3D
- Orateur : Guillaume Lavoué
- Affiliation: LIRIS
- Résumé: Avec les progrès technologiques dans les domaines de l’acquisition et de la visualisation, les objets 3D occupent un rôle grandissant dans de nombreux domaines industriels et scientifiques ; ainsi de nombreux traitements sont maintenant appliqués sur ces objets 3D, tels que la simplification, le tatouage et bien sûr la compression. Ces traitements conduisent généralement à une modification de l’apparence visuelle des objets 3D, des métriques ont donc été introduites afin de pouvoir correctement évaluer ou piloter ces traitements. Ces métriques vont de la simple distance géométrique (Hausdorff par exemple), jusqu’à des mesures perceptuelles plus complexes qui ont pour objectif de refléter au mieux la différence visuelle perçue par un être humain. Cet exposé a pour objectif de présenter les différentes métriques existantes et d’en proposer une comparaison quantitative dans le cadre de différentes expérimentations subjectives. Une application à la compression sera également présentée.
Retour au programme