No Banner to display

Accord DGFiP Google : mais que s’est-il passé ?

| 11 octobre 2021 | 0 commentaire

Catégorie: Cadastre, Contrats, Imagerie, Institutions, Logiciels, Marché, Open Data, Reportages, Secteur public

Environ 7 mn de lecture

Au cœur de l’été, le Canard Enchaîné s’est fait l’écho d’une nouvelle bien étrange : la Direction Générale des Finances Publiques a signé un contrat avec Google pour l’aider à identifier piscines, vérandas, courts de tennis… non déclarés. Aurions-nous vendu notre âme au diable comme le dénoncent de nombreux commentateurs ? Sans doute pas, mais cette annonce n’en laisse pas moins un goût amer à bien des acteurs de la géomatique.

DGFiP Google

Quartier pavillonnaire vu par la BD Ortho de l’IGN

L’exemple était trop beau pour ne pas être cité lors du grand débat des GéoDataDays ! Alors que les invités expliquaient tout l’apport de l’open data et comment la notion d’intérêt général allait permettre d’embarquer certaines sociétés privées, alors qu’ils se félicitaient de l’émergence d’une stratégie numérique de l’État, alors que le soutien aux entreprises apparaissait comme l’une des clés essentielles à l’émergence d’un écosystème solide au service du bien commun, voilà qu’un grain de sable vient gripper la belle machine de la discussion : La DGFiP choisit Google, son cloud et ses algorithmes d’intelligence artificielle pour l’aider à identifier les piscines et autres extensions non déclarées !

DGFiP Google

Le grand débat sur l’intérêt général organisé lors des GéoDataDays a rassemblé sur scène Jacques Beas-Garcia (CNES), Alain Buogo (swisstopo), Bertrand Monthubert (CNIG), Sébastien Soriano (IGN), Eric Thalgott (GeoFit), Thomas Cottinet (MTE), Aude de Touchet (ORE) et François Perusel-Morin (RGD Savoie Mont-Blanc)

L’annonce de cette collaboration a généré de nombreux papiers et commentaires depuis l’article initial dans Le Canard Enchaîné. Peut-on demander à une entreprise qui est elle-même en délicatesse avec les impôts d’aider à repérer les mauvais payeurs ? Les données personnelles gérées par la DGFIP ne risquent-elles pas de partir aux États-Unis ? Quid de notre souveraineté numérique ? Les géomètres du cadastre ne peuvent-ils pas assurer ce travail manuellement comme ils l’ont fait à Marmande en 2017 (avec l’aide de Google Maps semble-t-il) ?

Retour aux faits

Revenons donc sur ce que nous savons du contrat. Cette annonce se fait dans le cadre de l’assistance à maîtrise d’ouvrage effectuée par Capgemini pour le projet baptisé « Foncier innovant » destiné à exploiter l’intelligence artificielle pour mieux lutter contre la fraude aux impôts locaux, un projet d’une valeur de 12 millions d’euros. Il vise à compléter les logiciels « métier » de la DGFIP, afin de faciliter la détection de parcelles présentant des anomalies (différence entre le bâti et le niveau d’imposition). Cette assistance à la détection devra intégrer différents composants dont la reconnaissance automatisée des bâtis : bâtiments principaux, garages, vérandas, piscines enterrées, courts de tennis…, toutes constructions qui peuvent amener à une augmentation des taxes foncières ou locales d’habitation. Mais il y aura d’autres couches logicielles pour assurer le rapprochement avec les déclarations fiscales des propriétaires et ne faire ressortir que celles qui présentent des anomalies. Ce sera ensuite aux agents de déclencher si nécessaire une procédure de contrôle sur le terrain.

Le rôle de Google dans ce projet est double : fournir l’infrastructure Cloud d’hébergement des données images ainsi que les briques de machine learning dûment entraînées pour la détection des bâtis (et des dépendances) sous forme de service hébergé (sorte de Machine Learning as a Service). Ces briques open source seront donc appelées par la suite applicative que doit construire Capgemini. Ce contrat fait suite à une première expérimentation menée sur 3 ans avec Accenture qui avait apparemment donné satisfaction (et a coûté 800 000 €) sur le fond (3 000 bassins « mal déclarés » ont été identifiés sur 3 départements), mais pas sur la forme, Accenture refusant d’ouvrir les sources de ses algorithmes. Quant aux données qui serviront de base à cette détection automatique, il s’agit bien de la BD Ortho de l’IGN en open data, et non d’images satellites Google comme on a pu le lire.

Donc, pas de panique, d’après ce que l’on sait du contrat, nos données fiscales personnelles ne vont pas être diffusées à tout va, les traitements assurant le rapprochement entre la détection du bâti et ces données s’appuyant sur l’architecture interne de la DGFIP.

DGFiP Google

La réaction du directeur général de l’IGN ! Manifestement, il n’a pas été consulté.

Une politique industrielle en question

Si Capgemini est bien titulaire d’un marché d’assistance à maîtrise d’ouvrage pour la DGFiP, une partie des prestations concernant le projet « Foncier Innovant » n’ont pas fait l’objet d’un appel d’offres et sont passées par l’UGAP, la plateforme d’achat des services publics. « Cela permet de faire appel à des prestataires référencées, en fonction du type de besoins. Ces prestataires peuvent faire appel à des sous-traitants sur des besoins spécifiques pour mener à bien la mission qui leur est confiée » précise David Talabardon en charge du projet chez Capgemini.

Google est-il indispensable sur cette opération ? D’autres offres ont-elles été considérées ? « La DGFiP a mené une phase de sourcing préalable au lancement du projet visant à identifier des prestataires en capacité d’offrir un accompagnement tant sur la partie infrastructure cloud qu’en matière de développement des modèles d’IA, répond François Rollo, en charge du projet à la DGFiP. Plusieurs critères ont guidé notre choix du prestataire : sa capacité à offrir un dispositif industriel de très haute performance permettant un déploiement de la solution à grande échelle, l’offre d’accompagnement des équipes de la DGFiP dans l’appropriation de la solution et la montée en compétences, la pleine maîtrise par la DGFiP des modèles algorithmiques développés et leur propriété intellectuelle. Au regard de ces critères, le choix s’est naturellement porté sur la société Google et l’utilisation des briques technologiques qu’elle a inventées et popularisées en les rendant open source. » Après une phase de rodage qui commence en ce moment sur 9 départements, la DGFiP entend traiter l’ensemble du territoire en 2022

Pourtant, la France ne manque pas de solutions côté reconnaissance automatique de bâti, piscines et autres constructions adaptées au contexte national basé sur des algorithmes d’intelligence artificielle. Citons par exemple Pixstart (détection de piscines), mais également Magellium, CLS, Gaiddon, GeoFit… pour n’en citer que quelques-uns (les autres nous pardonneront). Tous ont développé des chaînes de traitement, certes ciblées sur certains éléments mais certainement adaptables à d’autres contextes. Idem sur les solutions Cloud et d’infrastructures as a service. Mais, effectivement, personne n’est en mesure de répondre à la demande de la DGFiP en l’état (architecture cloud + briques IA consommées « as a service » + détection d’objets de natures différentes…).

En fait, ce choix est emblématique de notre politique industrielle dans le domaine du numérique. D’un côté, l’État, ses établissements et les collectivités soutiennent l’innovation dans les entreprises françaises, à coup de POC (preuves de concepts), de hackathons, de prix, de labs d’incubation… De l’autre, ces mêmes entreprises peinent à valoriser leurs innovations auprès du secteur public et à sécuriser leur modèle économique. Rappelons ainsi le cas de Pixstart, soutenu haut et fort en 2018 par le CNES pour son intelligence artificielle de détection de piscines, qui lui a valu un prix au challenge Copernicus, mais qui n’a pas réussi à commercialiser sa solution auprès des collectivités (et n’a pas réussi à avoir de contact sérieux avec la DGFIP à l’époque). L’entreprise a changé son IA d’épaule : elle commercialise sa solution auprès des fabricants de piscines et vendeurs de produits d’entretien, afin de développer la vente de produits et services.

Entre l’expérimentation et le déploiement industriel, il semble manquer une étape dans le processus d’accompagnement des innovations. Même si les POC ressemblent de plus en plus à des produits finis, leur industrialisation permettant de traiter rapidement de gros volumes de données de façon sécurisée est difficile à financer pour les entreprises, d’autant qu’elles n’ont aucune garantie d’accéder à des marchés garantissant un retour sur investissement… Dans le domaine de la détection d’objets, elles préfèrent valoriser des prestations à la demande que des produits ou géoservices sur étagère, ce qui n’était semble-t-il pas la demande de la DGFIP et ne les a sans doute pas rendues « acceptables » par une grande entreprise de services comme Capgemini. Plutôt que d’aider des PME à « grandir » en investissant sur leur capacité d’innovation et d’industrialisation avec l’aide d’une société de services de renom, la DGFiP a choisi une solution a priori prête à l’emploi émanant d’une référence mondiale en matière de briques de machine learning, qui plus est, publiée en open source.

Des choix politiques ?

Le 20 septembre, la CGT Finances Publiques publiait un communiqué de presse demandant l’arrêt du projet, après avoir notamment constaté que l’apprentissage de l’algorithme avait été sous-traité à Madagascar. Rappelons à cette occasion, que l’étiquetage est loin d’être un job de rêve et que de nombreuses entreprises le réserve à des employés situés bien loin de chez nous !

Les choix effectués par la DGFIP nous rappellent également que ce qui est ouvert, l’est pour tout le monde : les bases de données de l’IGN, les briques d’IA de Google… Mais les modèles économiques à l’œuvre derrière cette ouverture sont de natures très différentes : financement amont par la puissance publique pour l’open data de l’IGN (grâce à nos impôts), mais financement annexe par toutes sortes de services payants pour Google, dont les composants open source servent de produits d’appel.

Certes, à terme, c’est bien la DGFiP qui aura la maîtrise de la solution technique développée et assemblée par Capgemini avec l’aide de l’infrastructure et des composants Google, sans danger donc pour notre souveraineté numérique. Mais, quand un projet de cette ampleur est sur la table, ne faudrait-il pas en profiter pour faire monter les PME françaises en compétence ?

 

Pour aller plus loin :

Compte rendu de réunion de la CGT Finances publiques du 3 mars 2021 autour du projet Foncier Innovant sous ce lien.

 

 

 

 

Print Friendly, PDF & Email
Signaler un contenu

Laisser un commentaire

No Banner to display