Au sujet de la « Vérité Terrain », par Benoît Ségala
Catégorie: Cartographie, Décalagéo, Données, Environnement, Formation, Logiciels, Ressources diverses
Consultant indépendant depuis 1996, Benoît Ségala se considère comme un « artisan » dans les domaines de la télédétection et de la géomatique. Il s’intéresse à toutes sortes de problématiques comme l’eau, les risques, l’occupation du sol. Notre billet sur la Vérité Terrain l’a inspiré… voici ses réflexions.
Un ouvrage de La Documentation Française* nous fournit une définition… de la « réalité de terrain » : « connaissance des caractéristiques de la scène étudiée à partir d’observations et de mesures (enregistrées ou non) réalisées in situ », tout en ajoutant que l’emploi de la formulation “vérité de terrain“ ou “vérité-terrain“ est à éviter « en raison de jugements de valeur contenus dans ces expressions »…
Rappelons toutefois que les anglophones parlent aussi de “ground truth“…
Et pour ne pas entrer dans le débat philosophique sur la notion de vérité, comme dit Françoise, nous dirons que quand nous parlons de “vérité-terrain“, on sous-entend qu’il s’agit de la “réalité de terrain“, et qu’elle correspond effectivement à « la mise en correspondance entre une proposition et la réalité ». Mais, comme évoqué, cette réalité est-elle, et doit-elle être, interprétée par l’enquêteur sur le terrain ?
Historiquement, c’est très tôt, dans le cadre du développement des premières applications de la photographie aérienne qu’est apparue la nécessité de vérifier sur le terrain les hypothèses découlant du travail de photo-interprétation d’une vue aérienne et, a posteriori, de contrôler in situ la qualité de la cartographie issue de ce travail.
Également, il s’est très vite révélé évident qu’un travail de photo-interprétation devait se nourrir à la fois de la réalité de terrain (ou vérité-terrain), mais aussi des multiples autres sources de documentation (dénommées aujourd’hui données exogènes) qui peuvent être disponibles pour appréhender le “monde réel“ : en ce sens, une base de données peut constituer une donnée exogène. Par contre, elle ne peut a priori pas être considérée comme étant une vérité-terrain, sauf bien sûr si elle a été spécialement constituée pour remplir ce rôle de base de connaissance de la réalité de terrain (en particulier, pour deux phases essentielles de la production d’une carte : l’initialisation du processus d’interprétation et la validation des résultats).
La question posée dans l’article concerne plus particulièrement la validation de la qualité des résultats issus de la production d’une base de données géographiques, et interroge sur la nature de la donnée qui fait office de vérité-terrain dans ces processus de validation (sous-entendue thématique).
Vérité-terrain et validation d’une interprétation
Dans l’absolu, c’est effectivement la réalité de terrain (ou vérité-terrain) qui devrait permettre la validation d’une cartographie ou d’une base de données géographiques.
Mais il faut considérer que ces dernières ont vocation, par définition, à constituer des représentations de la réalité et qu’elles ont été produites au moyen de processus d’interprétation (caractérisation des objets à représenter, identification, généralisation, …) pouvant être mis en œuvre selon des approches très variées (photo-interprétation, PIAO, analyse et traitement d’images, classification, segmentation, analyse spatiale, modélisation, intelligence artificielle…). En conséquence, pour valider l’information géographique ainsi générée, il est impossible de faire abstraction de cette notion d’interprétation : un même objet, ou espace donné, peut être qualifié et représenté différemment (selon l’objectif poursuivi, la thématique privilégiée, les moyens employés pour générer cette information géographique, l’échelle de travail, les spécifications en quelque sorte…). D’ailleurs, il faut bien prendre en considération que dans la production d’une base de données géographiques, l’information réellement issue d’un processus d’interprétation ne représente pas forcément l’ensemble de l’information générée, une partie pouvant découler d’autres bases de données pré-existantes (référentiel, extraction ou croisement de données thématiques, millésime antérieur, …).
Donc, avec quelle donnée de “vérité-terrain“ peut-on valider une base de données géographiques ?
(1) Si la validation s’effectue sur le terrain (oui, cela existe encore), l’enquêteur (notamment quand celui-ci n’est pas un·e photo-interprète ou un·e géomaticien·ne) doit se mettre dans la peau de l’opérateur qui a réalisé la cartographie. Pour établir un lien entre le regard (perspicace bien sûr) de l’enquêteur sur le terrain et l’information géographique produite, le travail de cet enquêteur consiste en l’analyse in situ du “monde réel“ au travers de l’objectif cartographique. Et, effectivement, cela consiste encore en un processus d’interprétation, en prenant en compte d’une part toutes les spécifications définies pour la production de cette cartographie, et d’autre part la nature des différents processus d’interprétation mis en œuvre dans le cadre de cette production.
Cette quête de la réalité de terrain au travers de l’objectif cartographique est primordiale : elle permet que les deux visions, du géomaticien et du thématicien, se rejoignent. Et la tâche n’est pas forcément facile, que ce soit pour celui dont l’œil reste d’ordinaire rivé sur la carte ou son écran, ou pour celui qui a du mal à prendre du recul par rapport à l’échelle 1:1.
Incontestablement, les deux principaux obstacles qui perturbent souvent le regard de l’enquêteur sur le terrain sont, d’une part la difficulté de faire le lien entre la vision au sol et la vue verticale procurée par la donnée “image“, et d’autre part l’exercice de changement d’échelle que représente la relation entre les objets vus in situ et les éléments cartographiés obtenus suite un processus de généralisation en rapport avec l’échelle de restitution.
Par ailleurs, il apparaît parfois difficile de valider sur le terrain quand l’information cartographiée est liée plus ou moins directement à une donnée exogène : quid de la qualification de l’usage d’un espace donné, de celle d’un état transitoire sans avoir l’historique, de prise en compte de limites virtuelles qui n’apparaissent pas sur le terrain, etc…
Tout cela pour dire que, autant le travail de terrain apparaît très constructif lors de l’initialisation du processus d’interprétation, avant et en début de production, autant la démarche de validation des résultats sur le terrain ne constitue pas systématiquement la meilleure solution.
(2) Ainsi, à la fois pour des raisons évidentes de coût, mais aussi par souci d’efficacité, il apparaît désormais difficile de réaliser une validation uniquement sur le terrain. Ainsi, classiquement, le contrôle d’une base de données géographique est entrepris devant un ordinateur, au travers d’un échantillonnage, celui-ci permettant d’analyser des éléments représentatifs de la base de données, au regard de l’ensemble des données disponibles : une vérité-terrain en distanciel…
Cette analyse est généralement effectuée par PIAO, la donnée géographique de référence étant habituellement une ortho-image (soit la même donnée source de référence, quand celle-ci est à haute résolution, qui sert de base à la fois pour la production et pour la validation, soit une donnée image plus fine pour la validation, quand cela est nécessaire). Avec la prise en compte des données exogènes, des spécifications qui ont été imposées au producteur, et de la connaissance de l’ensemble des traitements mis en œuvre lors de la production, il apparaît que la validation est encore effectuée au travers d’un processus d’interprétation.
Il semble pour cela important que le producteur soit distinct de l’opérateur chargé de la validation (dénommée pour cela CQE, contrôle qualité externe), la vision interprétative de chacun pouvant alors rester indépendante l’une de l’autre. Dans une démarche de validation, il s’agit d’être ainsi en mesure d’approfondir l’analyse par PIAO sur ces points d’échantillonnage pour tenter d’approcher au plus près …la réalité de terrain, quitte à conserver la possibilité d’effectuer ponctuellement des contrôles sur le terrain : ceci permettant ainsi de répondre à des interrogations ou des doutes exprimés sur les interprétations initialement proposées.
(3) Enfin, est-ce-que la validation peut être produite à partir d’une base de données ? La réponse a déjà été donnée en introduction : seulement si celle-ci a été conçue de façon spécifique comme une base de connaissance de la réalité de terrain afin d’alimenter le processus de validation. Ne pouvant disposer de ce type de base de données sur étagères, la création en amont de celle-ci – répondant à des spécifications bien précises, et nécessairement actualisée au regard de la donnée source de référence – représente une lourde tâche. Par ailleurs, ce travail de création relève des deux premiers points explicités ci-avant (couplage PIAO, données exogènes, et terrain), la difficulté étant dans ce cas qu’il faut estimer par avance la distribution des éléments cartographiés pour définir un échantillonnage représentatif…
En guise de conclusion
Pour justifier de l’intérêt de la vérité-terrain recueillie in situ (la véritable vérité-terrain qu’il convient de ne pas “enterrer“), il ressort de l’expérience que le travail de terrain peut représenter un atout à ne pas négliger : quand il est possible d’y réunir les différents acteurs, c’est l’occasion de rapprocher la vision de chacun, et de se forger une culture commune sur les objectifs et le concept même de la cartographie en projet. Ceci est primordial pour établir un lien fort entre réalité du terrain, données “source“ de référence, et informations géographiques générées. Et quoi de mieux qu’une confrontation avec la réalité du terrain, que devant un ordinateur …ou en visio-conférence.
Certes, d’une façon générale, une mission sur le terrain représente un investissement conséquent, mais il est désormais possible d’en limiter grandement son usage. En effet, un travail approfondi par PIAO sur des images à la résolution décimétrique permet aujourd’hui d’approcher au mieux la réalité, une quantité phénoménale d’informations pouvant être recueillie en complément par ailleurs : cf. par exemple parmi toutes les données exogènes, l’exploitation de l’imagerie à haute répétitivité temporelle ou simplement celle des images d’archive (en complément d’une image source de référence, pour comprendre les évolutions), ou l’usage de StreetView le long de certains axes routiers (pour s’immerger dans le monde réel, comme si on y était). Sachant que les contrôles ponctuels sur le terrain, qui s’avèrent parfois nécessaires, restent toujours envisageables.
Pour espérer disposer d’un processus efficace de validation thématique, il convient donc en premier lieu d’éviter de reposer le contrôle sur des données pré-existantes. La conduite d’un travail spécifique de validation (CQE, contrôle qualité externe), en parallèle avec celui conduit par le producteur mais indépendamment de lui, et basé sur l’analyse décrite ci-avant (couplage échantillonnage PIAO + données exogènes + terrain), apporte une vision interprétative indépendante, ayant vocation à s’approcher de la réalité et à être comparée à celle du producteur pour juger de la conformité thématique.
En définitive, ajoutons que quand il est question de qualité thématique d’une base de données géographiques, il apparaît la plupart du temps que celle-ci se joue principalement dans les phases préparatoire et d’initialisation de la production : l’étroite collaboration entre les acteurs (commanditaire, producteur, validateur ou contrôle qualité externe, thématicien, utilisateur final de la base de données), dès le début du projet, doit permettre d’établir un équilibre entre ce qui est souhaité ou attendu, ce qui est demandé, ce qui est faisable, et ce qui représente au mieux la réalité.
La validation des résultats n’en est alors que plus facile.
* – Introduction à l’étude de la télédétection aérospatiale et de son vocabulaire, La Documentation Française, 1991