Le laboratoire LIFAT (Tours) vient de publier une base de données STVD-FC dédiée au problème de vérification de faits politiques et journalisme de données. Cette base est plus particulièrement en lien avec les élections présidentielles françaises 2022. Elle recouvre des métadonnées XML associées à 6 730 émissions de télévision à contenu politique (pour un total de 6 540 heures de données audio / vidéo). La base de données est publiquement accessible sous CGU depuis le lien: https://dataset-stvd.univ-tours.fr/fc/
Le laboratoire LIFAT (Tours) https://lifat.univ-tours.fr/ vient de mettre à disposition pour la communauté recherche une base de données STVD-FC "large-Scale TV Dataset - Fact Checking". Cette base est dédiée au problème de vérification de faits politiques et journalisme de données plus particulièrement en lien avec les élections présidentielles françaises 2022. Elle est publiquement accessible depuis un portail de l'Université de Tours (lien ci-dessous) sous conditions générales d'utilisation.
https://dataset-stvd.univ-tours.fr/fc/
C'est une des bases les plus importantes de la littérature sur la tâche avec 6 540 heures de données audio / vidéo capturées sur la période Février à Mai 2022 à partir de 6 730 émissions de télévision. Cette base est fournie avec différentes métadonnées XML (1 330 "fact-checked claims" extraits du portail https://rattrapages-actu.epjt.fr/factoscope et données d'EPGs XMLTV). Les données vidéo / audio ont fait l'objet d'un protocole de capture standardisé avec compromis entre le niveau de dégradation et coût de stockage. La base est fournie en différentes parties pour une meilleure accessibilité au 2 To de données avec fichiers d'index.
La base de données STVD-FC a fait l'objet d'une publication en conférence à l'international [1].
[1] F. Rayar, M. Delalandre and V.H. Le. A large-scale TV video and metadata database for French political content analysis and fact-checking. Conference on Content-Based Multimedia Indexing (CBMI), pp. 181–185, 2022. https://hal-cnam.archives-ouvertes.fr/LIRFAI/hal-03747122v1
(c) GdR 720 ISIS - CNRS - 2011-2022.