Intelligence artificielle ou humaine ? La géomatique mise sur les deux

| 1 décembre 2020 | 0 commentaire

Catégorie: Cartographie, Données, Entreprises, Imagerie, Logiciels, Recherche, Reportages, Réseaux/Transports, Satellite/Spatial, WebMapping

par Françoise de Blomac pour l’Afigéo

Sujet inévitable, l’intelligence artificielle est de plus en plus utilisée dans le domaine de l’information géographique. Inclure une touche d’IA est même devenu un must pour faire valoir ses solutions. Mais de quoi parle-t-on exactement ? Les GéoDataDays ont soulevé le capot de l’IA et montré, à travers exemples et débat, comment intelligences humaine et artificielle travaillent désormais « main dans la main ».

intelligence artificielle géomatique

Sous le capot de l’IA ou comment mettre de l’IA dans son SIG ? (document Esri)

Au fait, l’IA, c’est quoi ?

Si les origines de l’intelligence artificielle remontent à l’aube de l’informatique et à la machine de Turing, « son développement a été lent et peu médiatisé jusqu’aux années 2000 », comme l’a rappelé Didier Josselin, animateur de la session, directeur de l’UMR Espace à l’Université d’Avignon et ayant lui-même fait une thèse en intelligence artificielle dans les années 90. Pourtant, dès la fin des années 50, le Perceptron de Rosenblatt a été développé, premier algorithme à copier le mode d’apprentissage d’un réseau de neurones humains (voir encadré). D’autres techniques d’apprentissage se développent à partir de 1970. Mais c’est avec le développement des capacités des ordinateurs que l’intelligence artificielle gagne une nouvelle visibilité. Visibilité du grand public en s’attaquant aux joueurs d’échecs puis de Go, mais également chez les professionnels, qui accèdent plus facilement à des algorithmes matures, à des capacités de calcul inégalées et qui doivent trouver les moyens de traiter de plus en plus de données.

L’imagerie en tête de gondole

Dans le domaine de l’imagerie, les algorithmes d’apprentissage supervisé existent depuis de nombreuses années, c’est même la base de nombreux outils de classification. Mais les algorithmes génétiques et d’apprentissage profond (deep learning) permettent d’aller plus vite et plus loin dans la reconnaissance de motifs et de formes en prenant en compte de nombreux éléments : les couleurs, leur répartition dans une surface à analyser, les formes à différentes échelles, les rapports de proximité, etc. Les modèles supervisés introduisent une connaissance a priori dans les algorithmes, via des bases d’échantillonnages (des images de chats pour entraîner les modèles à reconnaître un chat). Ainsi l’apprentissage est plus rapide et les prédictions (cette image inconnue représente bien un chat) s’améliorent rapidement. Les modèles non supervisés, eux, travaillent sans connaissance a priori, ils associent des paquets de données qui se ressemblent, puis sont ensuite capables de prévoir que tel ou tel ensemble de données va se classer dans tel ou tel paquet. Pourquoi les réseaux de neurones et autres algorithmes d’apprentissage profond sont-ils plus efficaces que les logiciels traditionnels ? Justement, par leur capacité d’apprentissage itératif, qui leur permet de traiter d’immenses quantités de données. Une fois bien entraînés, ils produisent rapidement des prédictions.

Classification de données, segmentation d’images, représentation d’objets aux limites floues, exploration de relations non évidentes, détection d’objets… Autant de problèmes géographiques auxquels l’IA permet de répondre. Des prédictions en accidentologie à la réalisation de bases d’occupation du sol en passant par l’enrichissement de scènes 3D ou la vectorisation de plans de réseaux, de nombreux thèmes sont aujourd’hui concernés.

Des outils au cœur des SIG

Un éditeur comme Esri exploite déjà l’intelligence artificielle pour enrichir les fonctions de ses logiciels (smart mapping dans ArcGIS par exemple, qui propose des styles de représentation adaptés aux jeux de données exploités) et dispose de modules dédiés à la préparation des données d’échantillonnage, à la classification, à l’apprentissage profond, à la cartographie prédictive et à la détection de motifs, comme l’a rappelé David Jonglez, en charge du business développement chez Esri France. Oslandia a créé un plug-in QGIS basé sur son projet de R & D interne Deeposlandia qui facilite la classification sémantique des scènes 2D. Depuis 2019, FME inclut quelques Transformers dédié à la préparation de données pour l’apprentissage profond ainsi qu’un lien vers Picterra, plateforme Web pour faire rapidement de la classification d’image basée sur l’apprentissage profond.

intelligence artificielle géomatique

Un module d’apprentissage profond a été développé sous QGIS par Oslandia (Deeposlandia)

Scodify : gagner du temps grâce à l’IA

Quand ils ont créé Scodify (aujourd’hui intégré dans Sogelink), Jean-Loup Delaveau et Paul Périé n’envisageaient pas d’utiliser du machine learning pour faciliter la mise en base de données SIG des plans CAO/DAO de récolement des réseaux. Mais c’est un algorithme basé sur un réseau de neurones qui a permis d’atteindre un niveau d’automatisation suffisant pour que leur offre soit compétitive. En effet, chaque producteur de plans a sa manière de coder l’information (« Diam 10, Fonte » chez l’un et « Fte Ø10 » chez l’autre) et chaque opérateur, sa manière de la transcrire en base SIG. Au début, chaque client devait intégralement paramétrer son contexte d’utilisation de l’application. Mais grâce à l’introduction d’un réseau de neurones, ce paramétrage sert à entraîner l’algorithme et associe textes, géométrie, relations de voisinage… L’étape finale de classification manuelle alimente également le modèle, augmentant ainsi sa précision à chaque traitement. Mieux encore, les différents clients peuplent une base commune de données d’apprentissage. Un fonctionnement qui permet à tous de gagner du temps même s’il a ses limites (rien n’empêche deux utilisateurs d’apprendre des codifications contradictoires au modèle). « Nous avons utilisé l’IA pour répondre à un besoin et pas l’inverse, insiste Jean-Loup Delaveau, avec un vrai gain de productivité, de stabilité et une vision collaborative. Cela a été possible car un premier grand compte nous a fait confiance. »

intelligence artificielle géomatique

Face à l’hétérogénéité des plans, l’IA a permis à Scodify d’être plus efficace dans leur transformation en bases de données géographiques.

Bâti sur toute la France : passer à l’échelle grâce à l’IA

Chaque année, 250 scènes SPOT 6/7 sur la France sont reçues, traitées, stockées et diffusées via GEOSUD/DINAMIS. Grâce à un algorithme d’apprentissage profond mis en œuvre via TensorFlow sous Orfeo ToolBox, l’UMR TETIS est aujourd’hui capable d’utiliser ces mêmes images pour en extraire tout le bâti. « Le réseau de neurones attaque l’image à différents niveaux de résolution [panchromatique à 1.5 m et multispectral à 6 m], explique Rémi Cresson, ingénieur de recherche à l’INRAE. Ensuite, on concatène les deux flux d’information pour les transformer en occupation du sol. »

intelligence artificielle géomatique

Le fonctionnement du réseau de neurones qui traite l’ensemble des images SPOT 6/7 sur la France métropolitaine (UMR Tetis)

C’est le bâti de la BD Topo qui fait office de « vérité terrain  ». 10 millions de petits échantillons ont été constitués (sous forme raster) qui ont permis à l’algorithme d’apprendre à reconnaître le bâti dans les images SPOT. « De façon itérative, on fait lentement converger le réseau de neurones vers le résultat escompté », complète Rémi Cresson. Un tel processus nécessite des ressources informatiques importantes. Grâce au supercalculateur Jean Zay, 30 heures ont été suffisantes pour analyser l’ensemble du territoire métropolitain. Cinq années d’archives ont ainsi été traitées et les cartes qui en résultent sont visibles en ligne sur Lizmap. C’est donc la disponibilité d’un grand nombre d’images (l’archive SPOT 6/7), d’outils de modélisation (TensorFlow), de nombreux échantillons (BD Topo) et d’une grande puissance de calcul qui permet de passer à l’échelle et de traiter la France entière. Les résultats sont satisfaisants même si quelques problèmes subsistent en zone de montagne.

intelligence artificielle géomatique

Les traitements par réseau neuronal permettent d’isoler le bâti, les vergers et la vigne de l’ensemble des images SPOT 6/7 couvrant la France.

Adèle : l’IA au service des photo-interprètes

Pour faire la lumière sur les images ariennes ou satellitaires, il faut parfois en passer par les ombres, comme l’a très bien montré Aurélia Decherf, aujourd’hui chez IGN FI mais rendant compte d’un travail mené chez GeoFit avec Philippe Albert. Afin d’aider les photo-interprètes de l’entreprise, une boîte à outils exploitant des réseaux de neurones a été développée, baptisée Adèle Solutions, facilitant la classification, la segmentation et la détection d’objets dans les images. Elle permet de traiter les ombres, qui peuvent être à la fois les ennemies et les amies des photo-interprètes. Si elles réduisent la luminosité et limitent la capacité d’interprétation, elles peuvent également la faciliter en projetant sur l’image des formes invisibles verticalement (antennes, formes de bateaux, limites de parcelles, etc.). Adèle exploite un réseau de neurones pour produire un masque des ombres sur les images, en exploitant des bases d’apprentissages spécifiques à chaque cas et validées par un expert. Elles peuvent ensuite être éclaircies avec DeshadowNet, facilitant ainsi le travail d’interprétation et de rendu des orthophotographies. Désormais Adèle fait partie intégrante de l’offre de services de GeoFit et a été mobilisée dans différents POC (preuves de concept), montrant par exemple une capacité à déceler beaucoup plus de changements d’occupation du sol que manuellement.

intelligence artificielle géomatique

Sur cette image, les ombres du nord du bâtiment ont été traitées par DeshadowNet ce qui permet de reconstituer la bande enherbée et le parking. (Document GeoFit).

Perspectives encourageantes

Grâce à leur capacité à traiter de grands volumes de données, les algorithmes d’intelligence artificielle sont promis à un bel avenir dans le domaine de l’information géographique, à l’heure où la course à la numérisation 3D du monde entier est largement lancée. Car, « dans une scène urbaine, la voiture doit voir tout ce à quoi elle est confrontée » rappelle Raphaël Delorme d’Oslandia. Elle doit distinguer rapidement la personne qui traverse du vélo et de la borne incendie, etc. Être capable d’extraire le contexte urbain en combinant l’analyse verticale (images aériennes) et horizontale (images immersives de type StreetView ou Mapillary) sera certainement l’un des enjeux des années à venir et un terrain de jeu de prédilection pour l’intelligence artificielle.

Pour autant, l’IA ne produit pas de miracle. « Au stade de la construction, vous ne gagnez pas de temps par rapport à une méthode plus classique, insiste Aurélia Decherf. Mais une fois que vous avez construit vos bases d’apprentissage, elles sont réutilisables et là, vous gagnez du temps. »

Elle présente également certains biais qui en limitent la portée. Données d’entraînement insuffisantes ou de mauvaise qualité réduisent drastiquement la qualité des modèles. Les difficultés d’interprétation des résultats, surtout quand les couches de neurones s’accumulent produisent un effet « boîte noire » dérangeant. Les algorithmes restent très sensibles aux échelles d’analyse, comme le remarque Didier Josselin, qui y voit un sujet de recherche à explorer. Les algorithmes peuvent même se tromper complètement et confondre quelques lignées colorées avec un pingouin !

intelligence artificielle géomatique

Comme l’algorithme n’a aucune idée de ce qu’il cherche à identifier, il peut « rater » des éléments clés qu’un œil humain distinguera sans problème. Ainsi, des chercheurs ont montré que des motifs très abstraits pouvaient être confondus avec des photos de pingouins ou d’étoiles de mer. À l’inverse, il est facile d’insérer dans une image un petit élément perturbateur (quelques pixels incohérents avec l’algorithme), même invisible à l’œil nu, qui mettra en échec la reconnaissance d’objet ou de forme.

Importance de l’expertise humaine

Malgré ces limites, les intervenants reconnaissent tous que l’IA est devenue indispensable et promise à un tel avenir. Pour autant, elle ne remplace pas le travail de l’expert. « Il faut un sachant pour entraîner le réseau de neurones, insiste Paul Périé de Sogelink, un utilisateur qui sait de quoi il parle. L’intérêt du réseau de neurones est d’automatiser les opérations fastidieuses et de les faire passer à l’échelle, pas de remplacer les hommes. »

Il est également fondamental d’avoir une idée claire des attendus, car ils auront un impact pour la mise en place des algorithmes et des chaînes de production. Quand un algorithme d’intelligence artificielle est utilisé pour détecter des signes de cancers sur des radios, qu’est ce qui compte le plus ? Éviter les faux positifs ou les faux négatifs ? Quelles procédures sont mises en place pour remédier aux incertitudes ? « Il faut savoir raison garder, conclut Aurélia Decherf. Et décider ce que l’on utilise en fonction des objectifs à atteindre et des données d’entrée. » Et pour tout cela, il faudra encore longtemps des géomaticiennes et des géomaticiens !


Réseaux de neurones : quand la machine imite le cerveau

intelligence artificielle géomatique

Les réseaux de neurones permettent un apprentissage profond

« Si je vous lance une balle sans vous avoir prévenu, il y a de fortes chances pour que vous ne la rattrapiez pas. Mais la deuxième fois, vous allez la rattraper. » Didier Josselin a donc commencé la session sur l’intelligence artificielle par cette petite expérience. Que montre-t-elle ? « Quand les neurones sont connectés et activés en même temps, l’information circule mieux. Plus ils sont connectés, plus l’information circule efficacement. » C’est fort de ce constat que l’informatique s’est intéressée aux réseaux de neurones et les utilisent comme une analogie afin de construire des algorithmes imitant les capacités d’apprentissage de nos neurones reliés entre eux par des synapses. D’abord simples, les algorithmes se sont complexifiés et intègrent désormais plusieurs couches cachées de neurones, capables de prendre en compte plus d’information. Les résultats de l’apprentissage permettent de calculer des coefficients qui vont « peser » sur le réseau de neurones et guider le flux d’informations (via les synapses). Une fois qu’il a appris, le réseau de neurones peut analyser l’information d’entrée (une image satellite par exemple) et en déduire une information de sortie (une occupation du sol).

Print Friendly, PDF & Email

Tags:

Signaler un contenu

Laisser un commentaire

No Banner to display