No Banner to display

Intelligence artificielle et imagerie : une plateforme Open Source pour se lancer

Françoise De Blomac | 14 décembre 2018

Catégorie: Cartographie, Données, Imagerie, Logiciels, Open Data, Reportages, Satellite/Spatial

820 mots, environ 3 mn de lecture

Le potentiel des algorithmes d’intelligence artificielle dans le domaine de l’information géographique est désormais reconnu. Mais comment se lancer ? DataPink propose une plateforme dédiée à l’imagerie spatiale en Open Source. Les premiers résultats sont encourageants et ne demandent qu’à être améliorés par la communauté.

« Veuillez sélectionner les images montrant une voiture / une montagne / une devanture de magasin / un panneau de signalisation… » : Qui n’est pas tombé sur ce genre de captcha visuel au moment de s’inscrire sur un site ou de télécharger un document ? Derrière ce petit exercice de sélection qui garantira à Google votre humaine nature, se cache un problème crucial pour l’intelligence artificielle : disposer d’un jeu d’apprentissage conséquent. En effet, pour que les réseaux neuronaux (qui sont à la base de l’intelligence artificielle) reconnaissent un objet ou détectent un changement, ils doivent d’abord ingérer des couples d’images et de labels, où l’objet en question est clairement identifié. L’algorithme apprend alors progressivement à reconnaître les objets ou motifs souhaités en s’améliorant à chaque tentative.

Il a ainsi fallu analyser des millions d’images de sourires labellisés pour que votre appareil dernier cri sache prendre la photo au bon moment. Devant leurs ordinateurs, des centaines de milliers de petites mains s’attellent à cette tâche immense, plus ou moins consciemment. C’est ainsi que Google vous met au travail grâce à ses captchas, tandis que Facebook entraîne son algorithme à l’aide des photos postées sur Instagram. Encore largement manuel, ce travail se fait parfois au sein de communautés de chercheurs (comme ImageNet) ou contre rémunération (modeste) grâce par exemple au Mechanical Turk d’Amazon.

Comment s’entraîner dans le domaine géographique ?

Faire défiler des milliers d’images satellitaires ou aériennes et pointer sur les maisons, les routes, les piscines… ne tente personne. Pourtant, un jeu d’entraînement trop réduit, ou pire imprécis, limitera l’efficacité des algorithmes.

Pourquoi ne pas s’appuyer sur des bases de données déjà constituées pour fournir les échantillons d’entraînement ? Ainsi le bâti déjà vectorisé semble idéal pour entraîner un algorithme de détection de bâti… tant que la base vectorielle est parfaitement à jour, en totale cohérence avec l’imagerie, ce qui est rarement le cas. BD Topo, OpenStreetMap, cadastre… de nombreuses sources sont aujourd’hui mobilisables, notamment en Open Data, mais elles ont toutes leurs imperfections.

Avec RoboSat.pink, Olivier Courtin propose une plateforme pour faciliter l’émergence d’algorithmes d’intelligence artificielle ouverts et locaux.

DataPink, créé par Olivier Courtin il y a 18 mois, propose justement une plateforme logicielle Open Source destinée à constituer des données d’apprentissage et à entraîner les algorithmes d’apprentissage profond : RoboSat.pink. Elle facilite d’une part la récupération de flux de données (orthophotographies, images satellitaires, bases vectorielles) en s’appuyant notamment sur les standards de l’OGC). Elle permet également d’accéder à des briques d’algorithmes « à la pointe de l’état de l’art, utilisés aussi bien en imagerie médicale et spatiale, qu’en conduite autonome… » précise Olivier Courtin.

Beaucoup d’automatisme et un bon coup d’œil

L’exemple présenté sur Github s’appuie sur les données du Grand Lyon, qui publie en Open Data une couche vectorielle des empreintes de toits. L’image aérienne à analyser est découpée en tuiles sur lesquelles la couche vectorielle est superposée. L’algorithme d’intelligence artificielle s’entraîne ensuite avec les données brutes. Puis convergences et divergences sont analysées visuellement. L’utilisateur élimine manuellement les tuiles trop divergentes en raison d’une labellisation imparfaite (mauvaise classification, problème de mise à jour…) et relance l’algorithme avec un jeu de données d’apprentissage épuré, en vue d’obtenir un meilleur score de reconnaissance.

« Cette approche en deux temps permet de parfaire et de qualifier le jeu d’apprentissage, mais également de pouvoir ‘se lancer’ avec des données d’ores et déjà disponibles en Open Data » insiste Olivier Courtin.

En rose : zones prédites par l’algorithme (mais non présente dans la base d’entraînement)
En vert : zones présentes dans la base d’entraînement mais non reconnues par l’algorithme
En gris : zones prédites par l’algorithme et présentes dans la base d’entraînement

L’ouverture du code et sa modularité vont également aider des laboratoires de recherche à faire évoluer certaines briques algorithmiques et d’agir prioritairement sur deux éléments essentiels : la topologie du modèle et les fonctions de coûts. Deux domaines décisifs pour atteindre des bons niveaux de performance, actuellement au cœur de la recherche en vision par ordinateur, publique ou privée.

Les utilisations possibles de RoboSat.pink peuvent concerner de nombreux domaines applicatifs. Repérer rapidement des zones d’incohérence ou détecter des changements peut par exemple alimenter ensuite un processus de contrôle qualité.

La suite logicielle proposée n’assure pas encore l’extraction des données (reconstitution de fichiers vectoriels), mais c’est prévu sous peu, et Olivier Courtin est également ouvert à tout partenariat permettant de faire progresser plus rapidement RoboSat.pink, le premier des projets de recherche et développement de DataPink à arriver au stade industriel. « Sur ces sujets, conclut le développeur, la compétition n’est plus entre les structures de l’écosystème SIG, mais avec, ou plutôt contre, les GAFAM. »

Tags: intelligence artificielle

Signaler un contenu

Les commentaires sont fermés

Communiqués
de presse

Patrick Sillard nommé Directeur de l’ENSG-Géomatique

Inspecteur général de l’Insee, Patrick Sillard est ingénieur diplômé de l’ENSG-Géomatique (1994) et statisticien- économiste diplômé de l’Ensae-Paris (2004). Il est docteur de l’Observatoire de Paris en astronomie fondamentale, mécanique céleste et géodésie (1999). Il débute sa carrière en tant que doctorant et chargé de recherche au sein du laboratoire de recherche en géodésie de […]

communique-de-presse | 29 janvier 2024 | 0 commentaire

GEOFIT, GEOFIT Expert et GEOFIT Group fusionnent

Au 1er janvier 2024, les entreprises GEOFIT, GEOFIT Expert et GEOFIT Group ont fusionné sous le nom de GEOFIT. Société d’Exercice Libéral par Actions Simplifiées au capital de 10 000 000€, GEOFIT est inscrite à l’Ordre des Géomètres-Experts et rassemble désormais 1400 collaborateurs avec ses filiales (IGN FI, NEOGEO, IGO, SINTEGRA). Une fusion pour consolider […]

communique-de-presse | 8 janvier 2024 | 0 commentaire

OpenStreetMap, c’est aussi des professionnels : cette nouvelle fédération les rassemble

La Fédération des pros d’OpenStreetMap (FPOSM) vient d’être créée par 11 entreprises. Ce regroupement d’experts permet de répondre à un large panel de besoins cartographiques professionnels. Des expertises françaises, OpenStreetMap en commun OpenStreetMap, le Wikipédia de la cartographie, est une base de données géographique collaborative, libre et mondiale. Commun numérique par excellence, OpenStreetMap (OSM) est […]

communique-de-presse | 28 novembre 2023 | 0 commentaire

CARTOMANIA CONTINENTS : l’atlas insolite de culture générale

Connaissez-vous sur le bout des doigts les inventions créées en Asie ? Les différents instruments de musique d’Amérique du Sud ? Ou les noms des sublimes tissus d’Afrique ? Pouvez-vous placer sur une carte les grands clubs de sport d’Amérique du Nord ? Ou les stations scientifiques en Antarctique ? Et, plus proche de nous, […]

communique-de-presse | 24 novembre 2023 | 0 commentaire

Cartes marines : Poésie du littoral français en 130 cartes

Cartes marines : Poésie du littoral français en 130 cartes Avec une préface de Miossec, Dessins de Marine Le Breton, textes sous la direction de Denis Roland Les cartes ne font pas que guider nos trajectoires. Elles ne font pas que nous livrer le monde comme un ensemble de paramètres qui conditionnent le passage d’un […]

communique-de-presse | 24 novembre 2023 | 0 commentaire

Agenda

Mai

jeu

No Banner to display

Intelligence artificielle et imagerie : une plateforme Open Source pour se lancer

Comment s’entraîner dans le domaine géographique ?

Beaucoup d’automatisme et un bon coup d’œil

Communiqués
de presse

Rencontres DécryptaGéo

L’annuaire des Géo-Entreprises

Offres d’emploi

Agenda

Fil Twitter DécryptaGéo

Intelligence artificielle et imagerie : une plateforme Open Source pour se lancer

Comment s’entraîner dans le domaine géographique ?

Beaucoup d’automatisme et un bon coup d’œil

Subscribe

Communiqués de presse

Rencontres DécryptaGéo

L’annuaire des Géo-Entreprises

Offres d’emploi

Agenda

Fil Twitter DécryptaGéo

Communiqués
de presse