Vous êtes ici : Kiosque » Annonce

Identification

Identifiant: 
Mot de passe : 

Mot de passe oublié ?
Détails d'identification oubliés ?

Annonce

28 février 2024

Thèse - Prédiction et reconnaissance des intentions de traversée des piétons pour améliorer la sécurité routière basée sur l’apprentissage profond


Catégorie : Doctorant


Équipe de recherche : STI / ERC TIM

Lieu de travail du (de la) doctorant(e) : Toulouse
Établissement de formation diplômant : Université Paris-Est Sup
Mots clefs : traitement d'images, deep learning, sécurité routière, piéton
Contacts : José Rivera <josue.rivera@cerema.fr>, Pascal Salmane <pascal.salmane@cerema.fr>
L’objet principal de la recherche proposée consiste à prédire l'intention de traversée des piétons. Pour y parvenir, des méthodes avancées de vision par ordinateur et d'apprentissage profond seront employées.
Les trois axes de recherche principaux qui guident les travaux de cette thèse sont :
1. Données d’entrée : on envisage de mettre en valeur cette information 3D pour améliorer la performance du modèle de prédiction de l’intention des piétons.
2. Modèle de prédiction : On envisage de développer un modèle de prédiction capable de prédire l'intention des piétons à partir de ces deux sources d'information : les caméras de bord de voie et les caméras embarquées sur leur attitude lorsqu’ils sont sur le point de traverser. Ce modèle peut également être adapté pour fonctionner avec une seule source d'informations.
3. Structure de réseau de neurones : On souhaite dans cette thèse trouver une structure commune qui permet de fusionner le maximum des caractéristiques dans un seul modèle afin de tenir en compte la complexité du comportement des piétons traités.
Cette thèse permettra les accomplissements suivants :
- Une meilleure compréhension des besoins en matière de sécurité routière en lien avec les usagers vulnérables sera développée.
- Une méthode expérimentale de création d'une nouvelle base de données sur le comportement des piétons sur la route.
- Une nouvelle méthode de prédiction des intentions de traversée des piétons en se basant sur les interactions avec leur environnement.
 

Reconnaître les intentions des piétons, en particulier leur intention de traverser la route, est crucial pour améliorer la circulation routière et garantir la sécurité des usagers vulnérables. Cette tâche est difficile car le comportement des piétons est influencé par divers facteurs, notamment leurs caractéristiques individuelles et les interactions avec leur environnement.

Selon les statistiques du Conseil national de la sécurité routière (CNSR) et de L'Observatoire national interministériel de la sécurité routière (ONISR), 15% des accidents de la route impliquent des piétons. En 2022, 488 piétons sont décédés dans un accident de la route, et plus de 1990 ont été blessés suite à des chocs avec d'autres usagers de la route. 90 % des heurts de piétons se produisent sur la chaussée, mais la proportion de tués est plus élevée en dehors des passages piétons. A l’échelle mondiale et selon le rapport de l'Organisation mondiale de la santé (OMS) sur la sécurité routière, environ 1,35 million de personnes sont tuées chaque année dans des accidents de la route. Ainsi, les piétons représentent 23% de tous les décès liés à la circulation routière dans le monde.
La reconnaissance des intentions des piétons est un domaine en pleine croissance dans le domaine de la sécurité routière. Les méthodes d'apprentissage profond sont utilisées pour extraire des informations de haut niveau à partir des données et pour représenter les schémas de comportement des piétons. Plusieurs travaux [1] ont examiné les travaux existants sur la prédiction du comportement des piétons, en particulier la prédiction de l’intention des piétons et les trajectoires des piétons.
Les données d’entrées pour ces modèles de prédiction peuvent être classifiées en trois types : les données 2D représentant les pixels de l’image, les données 3D représentant les nuages des points 3D du LiDAR, et les données 3D reconstruites à partir des images stéréoscopiques. La littérature étudiée permet de constater que la plupart des travaux sur l’intention de traverser de piétons sont réalisés avec des données images en 2D (76% des articles étudiés). Les données LiDAR ont récemment émergées (16% des articles étudiés), tandis que la reconstruction de l’environnement des piétons à partir des caméras stéréo est l’approche la moins employée (8%). Pourtant, l’emploi de cette source d’information permet une amélioration significative des performances (% de correctement classés de l’ordre de 89% pour les modèles utilisant des données en 2D, augmente à 91% si l’on ajouter des données 3D LiDAR).
En résumé, trois axes de recherche principaux guident les travaux de cette thèse :
1. Données d’entrée : on envisage de mettre en valeur cette information 3D pour améliorer la performance du modèle de prédiction de l’intention des piétons.
2. Modèle de prédiction : On envisage de développer un modèle de prédiction capable de prédire l'intention des piétons à partir de ces deux sources d'information : les caméras de bord de voie fourniraient en particulier des informations sur les trajectoires des piétons, et les caméras embarquées sur leur attitude lorsqu’ils sont sur le point de traverser. Ce modèle peut également être adapté pour fonctionner avec une seule source d'informations. À ce stade, on envisage aussi d'enrichir la base de données publique sur l'intention de traverser avec des données provenant de caméras de surveillance sur la route et des caméras embarquées sur un véhicule. Ensuite, Nous allons collecter l'ensemble des données via la plateforme "Autocampus de Toulouse". La plateforme "Autocampus de Toulouse" est un centre de recherche et d'expérimentation dont l'objectif est de créer un lieu unique bien équipé en ressources matérielles et techniques pour faciliter les expérimentations sur la mobilité. À notre connaissance, aucun travail expérimental n'a été réalisé à cette échelle pour enrichir la base de données sur la traversée des piétons.
3. Structure de réseau de neurones : Les architectures de deep learning peuvent être séquentielles ou non séquentielles. Les méthodes séquentielles, telles que Conv-LSTM [1] et GRU [2], sont très utilisées pour la prédiction des trajectoires des piétons. Elles nécessitent des informations temporelles sur la présence des piétons. En revanche, les méthodes non séquentielles, telles que le CNN [3] et le GNN [4] sont utilisées pour la prédiction des intentions des piétons. Elles nécessitent d’extraire les informations visuelles et spatiales de l’image. On souhaite dans cette thèse trouver une structure commune qui permet de fusionner le maximum des caractéristiques dans un seul modèle afin de tenir en compte la complexité du comportement des piétons traités.
 
Références :

[1] Zhang, C., & Berger, C. (2023). Pedestrian Behavior Prediction Using Deep Learning Methods for Urban Scenarios: A Review. IEEE Transactions on Intelligent Transportation Systems.
[2] Chen, K., Song, X., & Ren, X. (2021). Modeling social interaction and intention for pedestrian trajectory prediction. Physica A: Statistical Mechanics and its Applications, 570, 125790.
[3] Gesnouin, J., Pechberti, S., Stanciulcscu, B., & Moutarde, F. (2021, December). TrouSPI-Net: Spatio-temporal attention on parallel atrous convolutions and U-GRUs for skeletal pedestrian crossing prediction. In 2021 16th IEEE International Conference on Automatic Face and Gesture Recognition (FG 2021) (pp. 01-07). IEEE.
[4] Wang, R., Cui, Y., Song, X., Chen, K., & Fang, H. (2021). Multi-information-based convolutional neural network with attention mechanism for pedestrian trajectory prediction. Image and Vision Computing, 107, 104110.
[5] Zhou, H., Ren, D., Xia, H., Fan, M., Yang, X., & Huang, H. (2021). Ast-gnn: An attention-based spatio-temporal graph neural network for interaction-aware pedestrian trajectory prediction. Neurocomputing, 445, 298-308.
 

Dans cette rubrique

(c) GdR IASIS - CNRS - 2024.