L’avenir de l’épidémiologie passera-t-il par Google et Twitter ?
Catégorie: A l'actu, Cartographie, Données, Environnement, Recherche
Par Sukran Dal
Utiliser les points d’intérêt de Google et les tweets afin de lutter plus efficacement contre la propagation de la dengue ? C’est l’idée qu’a creusé Alexandre Cebeillac, doctorant à Rouen. Un travail de modélisation qui a été primé début novembre lors de la conférence SAGEO, à Rouen.
Dans la famille de la dengue, je veux… le vecteur, le virus, l’hôte et l’environnement. Le vecteur, c’est le moustique. L’hôte, c’est l’humain, qui se déplace avec le virus. Mais le climat, les lieux de ponte, ou l’environnement (urbain ou naturel), jouent également un rôle, de même que les cycles de vie du virus. Sur Bangkok, pauvre en données « officielles », Alexandre Cebeillac a essayé une nouvelle approche, en vue d’intégrer les discontinuités spatiales et les mobilités humaines dans la modélisation de ce système complexe d’interactions.
La toile de fond
Il s’agissait dans un premier temps de comprendre la structure de l’espace afin de repérer les lieux potentiellement attractifs pour les humains, et par voie de conséquence, pour les moustiques. Une image Landsat8 a servi de fond pour ventiler les chiffres du recensement selon les grandes catégories d’occupation du sol et estimer la population résidente. Le jeune chercheur a également récupéré près de 260 000 points d’intérêt (POI) Google grâce à un code Python se connectant à l’API Google Place. Il les a regroupés dans des mailles de la taille d’un pâté de maisons, ce qui lui a permis de créer une typologie fonctionnelle de la ville.
Les mobilités
Il s’est ensuite attaché à comprendre les mobilités dans la ville. Pendant un an et demi, plus de vingt millions de tweets géolocalisés ont été recueillis. Au bout d’un nettoyage drastique, en excluant les robots ou les usagers peu réguliers, les lieux de résidence et les espaces d’activités de trente-cinq mille utilisateurs ont été exploités. Les déplacements d’un individu d’un khwaeng (l’équivalent d’un arrondissement) à un autre ont ensuite été estimés. La probabilité de présence d’un individu dans un khwaeng est définie par le rapport entre le nombre de jours où un individu a tweeté dans un khwaeng et le nombre total de jours où il a été actif sur le réseau social. En agrégeant les individus par zone, une matrice de probabilités d’interactions entre zones permet d’avoir une vue d’ensemble des mobilités intra-urbaines.
Un projet d’avenir
Ces deux étapes permettent de définir des horaires de fréquentation moyenne pour chaque type de quartier. « Nous pourrions définir des scénarios entre les facteurs (virus, hôte, vecteur, environnement) et la propagation de la dengue, à l’instar du projet MO3. Pour cela, il faudrait que je poursuive mon modèle à base d’agents. Des phénomènes inattendus pourraient émerger, conclut Alexandre Cebeillac. J’aimerais également tester le modèle dans d’autres villes. À condition de trouver les financements ! »
- L’article d’Alexandre Cebeillac dans les actes de Sageo 2017 sous ce lien.