OrbiMob’ c’est le nom choisi pour un programme de rencontres et conférences autour de points de force du territoire en lien avec la mobilité durable. Il était organisé par la Métropole, l’Université Clermont Auvergne et leurs partenaires.
Le Connecteur les a suivis pour vous et partage une synthèse des interventions qui nous ont intéressées. Même si parfois, on doit le reconnaître, on arrive un peu en limite de compétences. Cette fois-ci il est question de couches cachées de réseaux neuronaux … on essaie de traduire … parce qu’au fond, c’est bigrement intéressant tout ça !
Thierry Chateau est enseignant chercheur à Polytech et chercheur à l’institut Pascal, particulièrement sur les questions de machine learning Il intervient dans le cadre du tout nouveau module « Polycompétence mobilité durable » proposé par Polytech (voir notre article).
Il est également engagé dans la création d’un spin off issu des labos de recherche du territoire et de Clermont Auvergne Innovation [dont la finalité est de valoriser la propriété intellectuelle des labos universitaire]: Logiroad & AI
Placer Clermont sur la carte de l’innovation en IA pour la mobilité
Avec Logiroad.AI, le but est d’inscrire la recherche Clermontoise, sur la carte des lieux d’innovation en matière d’IA pour la mobilité durable. Le spin-off permettra d’exploiter les méthodes et modèles d’intelligence artificielle, développés à Clermont (ou ailleurs). Puis de leur permettre de gagner en maturité et d’accéder au marché notamment via Logiroad, leader en France. Une équipe est constituée, elle grossit un peu chaque mois. L’enjeu principal est bien là.
Pour atteindre un rayonnement international sur un sujet aussi populaire que l’intelligence artificielle, il faut attirer les talents. Et pour cela, il faut un portefeuille de projets suffisamment important pour que ces talents puissent vraiment exprimer leurs compétences. L’ambition est de se positionner en pointe sur l’état de l’art en matière d’intelligence artificielle dans des domaines ciblés. Pour cela, il faut atteindre une masse critique, pour le projet bien sûr mais aussi pour Clermont. La politique de site universitaire, exprimée au travers du projet Cap 2025, se met en place autour d’une sélection de points différenciants. En l’occurrence, la mobilité durable et l’IA.
IA principes de base et applications
L’intelligence artificielle, vous vivez avec
Les assistants vocaux par exemple. Ils vont enregistrer une voix et la transférer dans une suite de mots pour lui donner un sens sémantique. Si vous demandez à votre assistant vocal “Note mon rendez vous chez le médecin demain à 18h30” cette requête va être complètement reconnue et votre rdv sera effectivement ajouté à votre agenda.
Normal quoi.
A chaque phase, il y a de l’intelligence artificielle. C’est devenu hyper familier.
Thierry Chateau parle donc Intelligence artificielle et machine learning. Et franchement pour le commun des mortels, on peut comprendre l’idée générale mais pour la compréhension ‘technologique’, c’est une autre paire de manches, malgré ses notables efforts. Pour nous aider à entrer dans le sujet de l’IA au service de la mobilité, il nous amène dans un rapide historique du “machine learning” et soulève (un peu) le capot. Je vous invite à regarder l’enregistrement avec la présentation qui illustre bien le propos sur la chaine Youtube d’Orbimob’.
« Machine learning »
L’IA démarre en 1956, premier usage du terme, connaît des vagues de popularité dans les années 80 puis l’histoire s’accélère illustrée notamment par le défi d’une équipe Google qui entraîne une intelligence artificielle à jouer au jeu de Go. Puis l’oppose à un humain, puis le fait s’entraîner contre un autre robot pour qu’ils développent eux-mêmes leurs stratégies. Et le champion du monde a été battu par une machine qui a développé des stratégies que les humains n’avaient pas du tout imaginées… Ce qu’on appelle désormais le machine learning.
L’un des projets les plus connus de machine learning, c’est celui de la classification des images: pour nommer l’objet contenu dans une image, il faut apprendre et donc entraîner la machine avec toute une collection d’images.
« Modèle d’apprentissage supervisé »
Cette phase d’apprentissage va permettre de générer un modèle, puis ce modèle va être déployé et quand la machine sera en face d’une image qui n’est pas dans la base d’apprentissage mais qui appartient à l’un des objets de cette base, elle sera capable de prédire de quelle classe il s’agit. Ce sont les méthodes les plus classiques d’apprentissage supervisé, appelées méthodes des réseaux de neurones parce que leur fonctionnement y ressemble beaucoup: un réseau complètement connecté, un entraînement qui va permettre de le spécialiser dans une tâche bien particulière grâce à des petites fonctions mathématiques.
Pour faire simple, lors de la phase d’apprentissage, on lui « montre » une image, qui est ni plus ni moins un tableau de pixels de couleurs différentes. L’idée c’est qu’en sortie quand on montre une image de chat la machine vienne bien activer une sortie “c’est un chat”. Si l’image active une sortie ‘chien’, on va venir rétro-propager l’erreur qu’on est en train de faire, c’est à dire modifier les points du réseau qui vont s’ajuster de manière automatique pour que la prochaine fois cette image soit bien classée en chat etc
En procédant ainsi un grand nombre de fois la machine va être capable d’apprendre l’apparence d’un chat et de capter des formes géométriques, celles représentatives des objets à apprendre. Ici par exemple la moustache du chat.
On arrive ainsi à augmenter le niveau sémantique des images et avoir des abstractions qu’on ne pouvait pas avoir à voir avec d’autres modèles. Un chat qui n’a jamais été vu lors de l’entraînement pourra quand même être catégorisé correctement… C’est le principe de base des réseaux de neurones. Et pas qu’un seul, non, il en faut beaucoup, alignés les uns à côté des autres pour former des couches de neurones avec une couche d’entrée, une couche de sortie et au milieu des couches cachées qui sont toutes reliées entre elles.
3 raisons à l’accélération de la popularité des réseaux de neurones
- L’introduction d’une catégorie d’algorithmes bien plus sophistiqués : on est désormais capable de programmer de très très gros réseaux de neurones.
- L’arrivée sur le marché de processeurs graphiques à bas coûts. Conçues pour faire du rendu d’images sur écran notamment pour les jeux vidéos, elles sont capables d’effectuer d’importantes quantités de calculs simples en parallèle. On va donc pouvoir déployer sur ces cartes graphiques de très gros réseaux de neurones et être capables d’entraîner des modèles qui sont très complexes.
- La disponibilité de très grandes bases de données correctement annotées. On l’a vu, ces réseaux sont basés sur un entraînement. Il faut donc une bonne base d’entraînement et notamment d’images. C’est l’objet de la base Image Net
De l’esprit de fructueuse compétition
Pour stimuler l’innovation, Google lance des compétitions dans le but de reconnaître et classifier les objets avec un grand niveau de précision, à partir d’un très très grand nombre d’images (plusieurs millions). Le but: réduire le taux d’échec.
La communauté scientifique s’y intéresse pour améliorer le taux de classification … qui progresse chaque année de 1% à 2% maximum. Une progression certes, mais assez poussive … En 2011, une image sur quatre était mal prédite. Mais c’est aussi le moment de la bascule avec la conjonction de la démocratisation des cartes graphiques, des bases de données massives et de nouveaux algorithmes. La mise en place de réseaux de neurones huit couches (une sorte de schéma relié des couches alignées les unes à côtés des autres, connectées entre elles, avec une couche d’entrée, une couche de sortie et au milieu des couches cachées) permet de faire un bond de 25 à 16% d’erreurs. Depuis cette date les projets, scientifiques comme privés, sont en croissance exponentielle.
Encore quelques limites
SI une expérience canadienne a montré que, sur ce type de tâche requérant un niveau élevé de détails de classification, l’intelligence artificielle est supérieure à celles des humains, il demeure des choses mal comprises encore. Par exemple: ces deux images, deux chiens identiques, pour un œil humain, en réalité légèrement transformé volontairement, deviennent un chien et une autruche pour le réseau de neurones !
L’IA pour la mobilité : quand est-ce qu’on lâche le volant ?
Spoiler : pas tout de suite !
Une fois ces quelques bases posées, c’est bien de l’utilisation de l’intelligence artificielle dans la mobilité dont il est question pour Thierry Chateau. Deux thématiques traitées ici, à Clermont: celle des véhicules autonomes -une des applications qui met vraiment en exergue l’intelligence artificielle- et celle de l’usage de l’infrastructure routière.
Le véhicule (presque bientôt) autonome
Cette illustration montre comment un véhicule autonome perçoit et analyse son environnement.
Les petits cercles concentriques sont issus d’un capteur qui balaye avec une très bonne résolution la scène qu’il voit. Il génère des données 3D qui seront exploitées dans des réseaux de neurones. Les véhicules sont également équipés de caméras et de GPS (ceux là sont précis au cm) L’intelligence artificielle va consister à détecter la route, les éléments de l’infrastructure, les lignes blanches, les passages piétons, les vulnérables c’est à dire les piétons, les autres véhicules … et à positionner le véhicule dans un référentiel 3D.
Lorsque le véhicule est en mouvement, des images sont générées toutes les 30 à 40 millisecondes. En cas d’accélération (ce qui correspond quand même à un usage habituel), il faut non seulement que l’intelligence artificielle produise un résultat très rapidement mais également qu’en fonction, elle propose une stratégie de pilotage, calcule les distances de freinage, les manoeuvres d’évitement, de déplacement etc Guider et décider de la trajectoire pour aller d’un point A à un point B de manière plus sécuritaire possible, en évitant des conducteurs ou des piétons qui ne vont pas forcément avoir des comportements attendus.
C’est une tâche très complexe. Une tâche qu’on ne peut pas atteindre aujourd’hui .
Les experts ne donnent d’ailleurs plus de date précise. Les programmes de recherche travaillent à lever verrou après verrou. Il faut atteindre un niveau d’intelligence artificielle qu’on appelle une « super intelligence » et ce ne sera pas avant 2050.
En attendant, il y a quand même des bénéfices directs. Les aides à la conduite sur les véhicules fonctionnent très bien parce qu’elles demeurent pilotées par un cerveau humain seul capable aujourd’hui de gérer la complexité des cas de figure à résoudre au niveau de la mobilité.
Anticiper & réguler bouchons ou nids de poule
Le réseau de neurones est entraîné à détecter les objets présents dans la scène : les véhicules, la signalisation, les personnes, … Il permet ainsi l’analyse de la provenance des véhicules, de comprendre comment se comporte le trafic en cas d’embouteillage et d’envisager de modifier l’infrastructure pour limiter ses problèmes de congestion.
Ces études qui se faisaient de manière manuelle jusque là peuvent désormais facilement être automatisées.
On peut également utiliser ces réseaux de neurones pour analyser l’infrastructure et l’état de la chaussée.
Ici, un réseau de neurones a été entraîné pour détecter différents types de défauts dans la chaussée. Ces données vont permettre d’établir un diagnostic, de planifier -et optimiser-la maintenance et d’augmenter sa durée de vie. Des travaux sont en cours pour mesurer l’impact en termes de co2 , sur la trace carbone des travaux de maintenance et sur l’impact économique.
Avec ces réseaux de neurones, capables de rassembler des données 3D, de très haute définition, géolocalisées, … dans des systèmes d’information, il devient possible de faire des analyses assez précises pour relever des pistes ou cartographier un quartier ou une ville en superposant les couches (la topographie, le mobilier urbain et les réseaux enterrés par exemple)
A lire aussi
Cet article est une synthèse personnelle de l’intervention de Thierry Chateau , le 3 novembre 2020 dans le cadre de la conférence Polycompétence en mobilité durable dans laquelle il intervient, en visio-conférence. Retrouvez au fur et à mesure l’intégralité des conférences sur la chaine Youtube d’Orbimob‘.