Cancer et exposome : l’apport des géodata et des SIG
Catégorie: Cartographie, Données, Environnement, Open Data, Recherche, Reportages, Réseaux/Transports, Utilisateurs, WebMapping
Environ 6 minutes de lecture
Les SIG sont de bons outils pour révéler les interactions entre phénomènes spatiaux. En cancérologie, ils semblent bien adaptés à l’approche par l’exposome. Mais les chercheurs ne sont encore qu’au début de leurs analyses.
Hypertension artérielle, cancers du sein…, la famine qui a sévi en Hollande à la fin de la deuxième guerre mondiale a encore des impacts sanitaires sur la deuxième génération d’enfants dont les parents sont nés pendant cette période. C’est ce type de constat qui a fait émerger le concept d’exposome, formalisé par un cancérologue britannique en 2005. Pour comprendre les cancers, il ne suffit pas d’analyser les facteurs génétiques et l’exposition à tel ou tel polluant. Les relations entre environnement et santé sont bien plus complexes et se déroulent à la fois dans le temps, dans l’espace, et à des niveaux d’interactions variés, avec des effets cumulés. L’exposome s’intéresse par conséquent à la pollution, au bruit, à ce que nous ingérons, mais englobe également tout l’environnement social, économique et culturel, et ce, tout au long de la vie des humains. Les SIG et l’analyse spatiale sont des alliés précieux dans ces analyses. Mais c’est un domaine où les avancées se font à petit pas, comme ont tenu à le rappeler les intervenants à la journée Géocancer organisée par le Cancéropole d’Ile-de-France le 21 janvier.
Cancer du sein : huit polluants passés à la loupe
Même si de nombreuses recherches, menées en laboratoire, font désormais le lien entre polluants et différents types de cancer, il n’est pas aisé de leur donner une dimension spatiale. « Les études épidémiologiques doivent être menées sur un temps long, afin de prendre en compte le temps de latence entre l’exposition au polluant et la survenue de la maladie. Elles doivent englober beaucoup de gens, d’où l’intérêt des cohortes*, prévient Thomas Coudon, post-doctorant à l’INSERM, centre Léon Bérard à Lyon. Il faut prendre en compte différents types de sources, des tendances d’émissions variées et de multiples modèles de propagation. Enfin, il faut trouver le bon compromis entre analyse précise sur un territoire et robustesse du raisonnement, de façon à pouvoir le généraliser. » Malgré toutes ces contraintes, géomaticiens et chercheurs avancent. Ainsi, le projet GEO3N-XENAIR, centré sur le cancer du sein, commencé sur la région Auvergne-Rhône-Alpes, étudie l’exposition d’une cohorte de plus de dix mille femmes (dont la moitié a été atteinte) à huit polluants différents entre 1990 et 2011 dans toute la France. 60 000 adresses différentes ont été géolocalisées. Comme plusieurs polluants étudiés ont des origines industrielles (dioxine, Cadmium), 2 700 sources de pollution ont également été géocodées. En prenant en compte l’intensité des émissions, la distance, la direction du vent dominant, les hauteurs de cheminées… chaque sujet de la cohorte a pu être classé selon son niveau d’exposition atmosphérique. Un autre modèle basé sur l’occupation du sol (proximité des routes, zones industrielles…) a servi à la cartographie des polluants plus diffus tels que dioxyde d’azote, ozone et particules fines. L’équipe a également reconstitué les niveaux d’émission du dioxyde d’azote des années 90, grâce au modèle de dispersion Chimère de l’Ineris. Ainsi, plusieurs couches SIG ont été produites, mais l’analyse des expositions cumulées est encore à mener, de même qu’une meilleure prise en compte du temps. D’autres projets de recherche s’intéressent également aux multi-expositions aux polluants, notamment sur les trajets domicile-travail.
Des facteurs socio-économiques
L’approche est radicalement différente à l’hôpital Georges Pompidou, qui a géocodé la quasi-totalité des patients passés par l’hôpital depuis son ouverture en 2000, soit 1,9 million d’adresses cartographiées. Les dossiers des patients servent à la gestion quotidienne de l’hôpital mais alimentent également un site de recherche intégré sur le cancer, en commun avec Cochin et Necker, baptisée CARPEM. À l’aide d’un logiciel d’analyse et de représentation de données massives (OmniSci), ces données de patients ont permis de produire tableaux de bords et analyses géographiques. L’équipe s’attache à les croiser avec des données socio-économiques (données INSEE à l’Iris) mais aimerait également mener des analyses sur les données environnementales (Open Data Airparif par exemple, mais pourquoi pas également celles publiées par PlumeLabs). Là encore, si le concept d’exposome guide les chercheurs, force est de constater que les analyses sont encore très partielles.
Cary P. Gross de la faculté de médecine de Yale a fait un point sur les études sur le cancer faisant appel aux SIG dans son pays. Aux États-Unis comme en France, les chercheurs essayent de comprendre les variations régionales du taux de mortalité dû aux cancers. Assez intuitivement, la carte des disparités de mortalité et celle des revenus se superposent. Les plus pauvres meurent plus de cancer que les plus riches. Mais pourquoi ? Son équipe a testé une quarantaine de facteurs en forte corrélation avec le niveau de revenu : taux de Sida, système de santé, qualité des premiers soins, coûts des mammographies, tabagisme, obésité, activité physique…. Huit facteurs expliquent 80 % de cette variation. Celui qui ressort le plus clairement est l’insécurité alimentaire (20 %), suivi par la faible qualité des premiers soins, l’activité physique et le tabagisme. Cette approche lui a permis de cartographier un index de risque à l’échelle du pays. « Ce type de carte doit nous aider à être plus efficaces en termes de politiques de prévention par exemple » espère le chercheur, qui souhaite que les cartes servent des besoins opérationnels.
Beaucoup de données mobilisables
De nombreux jeux de données sont mobilisables par les chercheurs, avec l’aide de spécialistes en traitement des données. Le PMSI, géré par l’Agence technique de l’information sur l’hospitalisation (ATIH) et le Système National des Données de Santé (SNDS) leur donnent accès à une vision détaillée des activités de soins (en milieu hospitalier et en médecine de ville) ainsi qu’à une base des causes de décès. Les données à caractère géographiques y sont regroupées par « codes géographiques », qui correspondant plus ou moins aux codes postaux, avec des regroupements pour arriver à des bassins de population d’au moins mille personnes. L’accès à ces bases de données est très réglementé et elles ont de nombreuses limites car ce sont avant tout des bases conçues pour la gestion et la facturation des actes. Toutes les informations recueillies lors d’un séjour à l’hôpital ne sont pas reprises, ni les résultats des examens médicaux. Il est ainsi difficile de faire des liens entre pathologie et alcoolisme ou tabagisme. Elles peuvent cependant être utiles à l’analyse des facteurs non génétiques des cancers, car, malgré l’anonymisation, elles permettent de reconstituer les parcours des patients, et donnent une vision de leur répartition sur le territoire. Avec une profondeur temporelle de 9 ans, le PMSI et le SNDS sont sans doute parmi les bases de données les plus importantes en France. Institutionnels et chercheurs accèdent sur demande aux données brutes. Quelques extractions sont désormais disponibles en open data (DREES, Assurance Maladie). Le site ScanSanté propose une centaine d’indicateurs synthétiques et préparés sous Geoclip Air. Atlasanté, le WebSIG des agences régionales de santé est également une mine d’informations, mais, là encore, reste tributaire d’angles d’analyse prédéterminés. « Dites-nous ce sont vous avez besoin, et nous vous produirons les jeux de données nécessaires » insiste Xavier Vitry, en charge d’Atlasanté au ministère de la Santé pour le compte des ARS.
Outre ces données sur les patients, les pathologies et le système de soins, l’environnement peut être abordé par de nombreuses données, comme l’ont montré les exemples présentés au cours de la journée. « Nous avons identifié une quarantaine de jeux de données décrivant l‘environnement qui pourraient être utiles en analyse sanitaire » résume Jean-Yves Lascaux, délégué Ile-de-France de l’IGN : photos aériennes anciennes, âge des bâtiments, registre parcellaire graphique, occupation du sol, mais également revenus par carreaux… les sources ne manquent pas.
Comment aller plus loin et quelles limites ?
« Nous avons besoin de données réelles » ont répété à l’envi les intervenants de la journée Géocancer. Comment cerner au plus près les multiples dimensions d’une vie humaine afin de nourrir les analyses environnementales, socio-économiques, culturelles… nécessaires à la compréhension de l’exposome ? Nos smartphones recèlent sans doute bien des données qui pourraient être utiles à de telles analyses. « Quand j’ai enregistré pendant 500 jours l’ensemble de mes déplacements grâce à une application, j’ai obtenu une cartographie de mes mobilités qui pourrait tout à faire servir en santé » notait ainsi Jacques Lévy, venu partager ses réflexions sur cartographie et justice spatiale. Mais se posent alors de nombreuses questions de respect de la vie privée. « Jusqu’où peut-on aller ? » se sont demandé les participants à la dernière table-ronde baptisée « Traçage des individus dans l’espace et dans le temps, limites techniques et éthiques. » Aucune réponse simple n’est possible, mais des dispositifs sont à inventer afin de faire participer des personnes à différentes études encadrées, sans pour autant envoyer tous les détails de leur vie sur un serveur lointain.
Pour aller plus loin
– Le site du centre Léon Bérard apporte beaucoup d’informations sur le lien Cancer Environnement.
– Retrouvez un ancien dossier de DécryptaGéo « Bonne géo-santé ! » sous ce lien
* Cohorte : les études de cohortes s’appuient sur des groupes de personnes, suivies dans le temps (parfois sur des dizaines d’années) à l’échelle individuelle. En épidémiologie, elles sont alors régulièrement interrogées sur les événements de santé qu’elles vivent. « Ce type d’étude est donc particulièrement bien adapté pour évaluer le risque qui est relié à l’exposition à des substances dangereuses pour la santé. » (Wikipedia).