Prudence au volant, même pour les véhicules autonomes

Publié par Adrien le 06/05/2021 à 09:00
Source: CNRS INS2I
Comment un véhicule autonome peut-il interagir avec des conducteurs humains, dont les comportements sont incertains ? Edouard Leurent a étudié des algorithmes d'apprentissage averses au risque, qui prennent des décisions prudentes en présence d'incertitude: ses travaux ont été distingués par le prix de thèse (Une thèse (du nom grec thesis, se traduisant par « action de poser ») est...) du Groupement de Recherche (La recherche scientifique désigne en premier lieu l’ensemble des actions entreprises en vue...) (GdR) MACS et du Club EEA en 2021.

Pour conduire, un véhicule (Un véhicule est un engin mobile, qui permet de déplacer des personnes ou des charges d'un...) autonome doit en permanence prendre une série de décisions: quand faut-il changer de voie, dépasser un véhicule trop lent, quand peut-on s'insérer dans le trafic ou doit-on au contraire céder le passage ? Ces décisions sont particulièrement difficiles à trancher lorsqu'elles font intervenir des conducteurs humains, dont les comportements ne peuvent être prédits avec certitude. Dans ce contexte (Le contexte d'un évènement inclut les circonstances et conditions qui l'entourent; le...), un algorithme peut-il apprendre de ses expériences et s'améliorer, tout (Le tout compris comme ensemble de ce qui existe est souvent interprété comme le monde ou...) en garantissant la sûreté ?

C'est le problème étudié par Edouard Leurent dans sa thèse "Apprentissage (L’apprentissage est l'acquisition de savoir-faire, c'est-à-dire le processus...) par renforcement sûr et efficace pour la prise de décision comportementale en conduite autonome", effectuée dans les équipes communes Inria SequeL et Valse au sein du Centre de Recherche en Informatique (L´informatique - contraction d´information et automatique - est le domaine...), Signal ( Termes généraux Un signal est un message simplifié et généralement codé. Il existe...) et Automatique (L'automatique fait partie des sciences de l'ingénieur. Cette discipline traite de la...) de Lille (CRIStAL - CNRS/Université de Lille/Centrale Lille), et en partenariat industriel (CIFRE) avec le groupe Renault. Ses travaux viennent d'être récompensés par le prix de thèse du GdR MACS et de la section Automatique du Club EEA.

Pour assurer la sûreté, même sous incertitude, il s'est intéressé à la théorie (Le mot théorie vient du mot grec theorein, qui signifie « contempler, observer,...) de la prise de décision robuste, qui préconise de ne pas considérer uniquement le futur le plus probable, mais plutôt la pire issue possible parmi un ensemble (En théorie des ensembles, un ensemble désigne intuitivement une collection...) de scénarios jugés crédibles d'après les observations (L’observation est l’action de suivi attentif des phénomènes, sans volonté de les...) dont on dispose.


Pour assurer la sûreté, on considère un ensemble de comportements possibles pour chaque véhicule observé. © Edouard Leurent

Cette démarche théorique est cependant difficile à mettre en pratique, à cause de l'explosion (Une explosion est la transformation rapide d'une matière en une autre matière ayant un...) du nombre (La notion de nombre en linguistique est traitée à l’article « Nombre...) de scénarios à considérer et de l'accumulation rapide de l'incertitude. Pour en proposer une implémentation (Le mot implantation peut avoir plusieurs significations :) efficace, et qui soit accompagnée de garanties théoriques, les travaux d'Edouard Leurent combinent des techniques issues des théories l'automatique et de l'apprentissage automatique (L'apprentissage automatique (machine-learning en anglais) est une discipline scientifique, qui est...).


La décision robuste peut toutefois conduire à un excès de prudence. © Edouard Leurent

Mais la prise de décision robuste a également ses faiblesses: très pessimiste, elle tend à adopter un comportement excessivement précautionneux. Par exemple, elle interdirait de dépasser un véhicule lent sur l'autoroute (Une autoroute est une route réservée à la circulation des véhicules motorisés rapides...), arguant que ce dernier pourrait très bien décider de changer de voie au dernier moment, provoquant un accident.

Plus généralement, on observe un conflit entre deux objectifs contradictoires: sûreté et efficacité. Une seconde ( Seconde est le féminin de l'adjectif second, qui vient immédiatement après le premier ou qui...) partie de ses travaux consiste donc à estimer ce compromis, afin de pouvoir contrôler en temps (Le temps est un concept développé par l'être humain pour appréhender le...) réel le niveau de risque assumé par un véhicule autonome.

"L'apprentissage par renforcement est une technique prometteuse car très générale, mais dont les applications réelles restent aujourd'hui très limitées, explique Edouard Leurent à la suite de l'annonce de l'obtention du prix de thèse. À l'inverse, l'automatique est largement utilisée dans de nombreuses industries, mais repose sur des modèles parfois simplistes. À l'avenir, j'aimerais contribuer à combiner ces deux disciplines, afin de les rendre plus fiables, plus efficaces, et davantage applicables aux problématiques industrielles. Je suis très fier de cette distinction, qui me permettra de m'engager avec confiance dans mes prochains projets."
Cet article vous a plu ? Vous souhaitez nous soutenir ? Partagez-le sur les réseaux sociaux avec vos amis et/ou commentez-le, ceci nous encouragera à publier davantage de sujets similaires !
Page générée en 0.054 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique