OSM ne manque pas d’adresses

Catégorie: A l'actu, Cartographie, Données, Grand public, Open Data, Utilisateurs

En quelques semaines, l’équipe d’OpenStreetMap France a pris le problème de l’adresse à bras-le-corps. Et les fondations de ce qui pourrait devenir une base d’adresses nationale ouverte sont sans doute en train d’émerger rapidement.

L’adresse, c’est un peu l’Arlésienne des bases de données à l’échelle nationale. Tout le monde en a besoin, tout le monde produit des données, mais impossible d’aboutir à une base unifiée, accessible à tous, alimentée et mise à jour en permanence tant le jeu d’acteurs est complexe. Malgré moult groupes de travail, rapports et commissions, la seule avancée récente a été le développement à l’IGN de la BD Adresse comme composante du RGE, réalisée à partir de différentes sources internes complétées par les données de la Poste, de la DGFIP et issues de partenariats divers (SDIS notamment).

Open Data, cadastre et OSM

Une fois de plus, OpenStreetMap a décidé de jeter un pavé dans la mare et a pris le taureau par les cornes, avec adresse, pourrait-on ironiser. « Nous partons de trois sources : les adresses d’OSM, soit environ 2 millions de points, les adresses publiées par les collectivités en open data, soit environ 1 million, et les adresses collectées à l’aide du cadastre vectoriel » explique Christian Quest. Pour récupérer ces dernières, des automates OSM font du scraping du site cadastre.gouv.fr. « On commence par récupérer les voies, puis on projette les points sur les façades de bâti si ce dernier est proche de la voirie » précise le président d’OSM France. Toute une batterie de scripts est mise en œuvre pour traiter les géométries et les attributs et aboutir à une dénomination non abrégée. « Nous suivons en cela les recommandations du CNIG » tient à rappeler Christian Quest. Un identifiant unique est également généré, contenant les codes FANTOIR et INSEE de la commune. Bien sûr, certains points d’adresses sont présents dans deux ou trois sources. Dans ce cas, OSM est utilisé en priorité car c’est généralement le plus à jour. Les outils OSM serviront également à l’amélioration. Mais toutes les ambiguïtés ne peuvent pas être levées automatiquement et les outils OSM servent également à pointer vers les zones où des vérifications de terrain seront nécessaires.

État des intégrations au 20 mai 2014 : en jaune, les données issues de l’open data, en vert, celles venant d’OSM, en bleu, celles récupérées du cadastre vectoriel, en rouge, les zones où les rapprochements n’ont pas encore été effectués.

État des intégrations au 20 mai 2014 : en jaune, les données issues de l’open data, en vert, celles venant d’OSM, en bleu, celles récupérées du cadastre vectoriel, en rouge, les zones où les rapprochements n’ont pas encore été effectués.

25 millions d’adresses en un mois

La collecte a démarré le 8 mai et 14,5 millions d’adresses avaient été intégrées au 20 mai. Mi-juin cette première collecte devrait être terminée et permettre la mise à disposition en licence ouverte (ODBL) de quelque 25 millions d’adresses. Les outils OSM permettront ensuite de les compléter, en attendant des outils dédiés à l’adresse. Bien sûr, le résultat sera loin d’être parfait mais il permettra d’avancer sur une base déjà bien constituée, selon des conditions claires d’ouverture et de réutilisation. Aux différents acteurs de l’adresse de se positionner ensuite pour alimenter la base, la faire vivre et utiliser cette infrastructure pour qu’un véritable processus national soit mis en place. Encore du boulot en perspective.

 

Imprimer cet article Imprimer cet article
Signaler un contenu

Laisser un commentaire

No Banner to display

Les cookies assurent le bon fonctionnement de nos services. En utilisant ces derniers, vous acceptez l'utilisation des cookies.
Accept Cookies
x