Une bonne donnée est une donnée vivante
Catégorie: Cartographie, Données, Entreprises, IDG/IDS, INSPIRE, Institutions, Open Data, Reportages, Secteur public, Utilisateurs
Comment aborder la notion de qualité des données géographiques quand les productions sont de plus en plus partenariales et les usages incontrôlés ? Telle était la question abordée par les participants au Géoséminaire organisé par les étudiants du mastère Silat le 25 février dernier à Montpellier sur le thème « Données géographiques : qualité et conditions d’usages ».
De plus en plus de données, produites par des acteurs plus ou moins qualifiés, mal documentées, largement diffusées et rediffusées… La qualité des données géographiques est-elle en danger ? On pourrait le croire et s’étonner de la faible prise en compte de la notion de qualité dans la directive INSPIRE qui se contente de recommander quelques champs de métadonnées. On pourrait également s’inquiéter de la très variable qualité des nombreux jeux de données mis à disposition en open data. Ne parlons même pas des nombreux calculateurs d’itinéraires qui mesurent notre futur parcours entre Montpellier et Shanghai au mètre près sans vérification possible !
De la qualité à la qualification
Face à ces évolutions, comment penser efficacement la qualité ? Gilles Troispoux du CEREMA et Armelle Verdier-Maillot qui vient de soutenir une thèse de droit sur les données géographiques ont proposé de nouvelles pistes de réflexion. « Derrière la qualité des données, il y a le mythe de la donnée parfaite. La notion de qualification, plus fine et complexe, consiste à se donner les moyens de connaître la qualité des données » explique ainsi Gilles Troispoux. Si les documents d’intention que sont les spécifications, si les normes et standards peuvent servir de base à l’évaluation de la qualité interne d’un jeu de données, c’est désormais son utilisabilité qui est essentielle, sa capacité à répondre aux besoins de celui ou de celle qui l’utilise. Derrière ce concept, se retrouvent les notions de responsabilité du producteur, d’intelligibilité des données, de facilité d’accès… auxquelles sont désormais confrontés les producteurs au quotidien.
De la théorie à la pratique
La diffusion de métadonnées reste bien sûr une des clés essentielles de cette communication sincère entre les producteurs et les utilisateurs. Les infrastructures de données géographiques ont sur ce point une action bénéfique, en accompagnant les producteurs locaux. Mais ce n’est pas la seule réponse. Le Syndicat informatique de Charente-Maritime (SI17) a développé un « certificateur », basé sur FME pour valider les fichiers PCI vecteurs et les plans locaux d’urbanisme saisis par différents prestataires pour le compte des collectivités. Au CRIGE PACA, un outil d’autoévaluation de la qualité des jeux de données est en cours de mise en place. À travers six critères (exhaustivité, cohérence logique, précision géométrique, précision thématique, actualité, facilité d’utilisation) et une notation de 1 à 5, les producteurs peuvent qualifier eux-mêmes leurs productions. Les équipes du CRIGE confrontent cette autoévaluation à leur propre vision. Le dialogue qui s’engage alors permet de construire un diagramme polaire visible sur le catalogue.
Le partage n’a pas que du mauvais
Le développement de la diffusion, du partage et de la mutualisation a de nombreux effets bénéfiques en la matière. Se mettre à plusieurs organismes pour produire une orthophotographie oblige certes à des compromis, mais également à mettre noir sur blanc ses attentes et à rédiger des spécifications plus fines, comme l’ont expliqué l’association SIG-LR et le ministère des ressources naturelles du Québec. Cela permet souvent de garder une petite enveloppe pour le contrôle qualité. Diffuser ses données sous forme de flux oblige à respecter strictement certains standards d’interopérabilité, qui stabilisent les formats. Les retours utilisateurs permettent de corriger les erreurs, mais également d’enrichir les bases. Ainsi, à Orange, des photos géolocalisées prises par les habitants ont permis aux services techniques de prendre conscience qu’il fallait supprimer les potelets au milieu de certains trottoirs surbaissés. Même le crowdsourcing peut avoir du bon !
Après avoir étudié différents modes de représentation de l’évaluation de la qualité des données présentes sur son portail, le CRIGE PACA a opté pour le diagramme polaire où peuvent se superposer la vision du producteur et celle de l’IDG régionale.
- Pour accéder directement aux présentations du Géoséminaire 2014, suivez ce lien