Big pictures & big data
Catégorie: Cartographie, Données, Dossier : Sur les traces des touristes, Entreprises, Grand public, Marché, Open Data, Recherche, Uncategorized, WebMapping
Une équipe pluridisciplinaire associant géographes, informaticiens et anthropologue s’est intéressée à d’autres types de traces : celles laissées volontairement par les touristes dans leurs commentaires ainsi que dans les photos qu’ils mettent en ligne. Même si la question de la représentativité reste posée, cette approche offre une nouvelle vision des pratiques touristiques.
Tripadvisor, Hotels.com, Panoramio, Flikr, Instagram, Airbnb… les chercheurs du groupe Net(h)no-graphies analysent quelques-unes des milliards de traces numériques laissées par les touristes sur la Toile. Car ces sites regorgent d’informations utiles à qui sait les capter. Tripadvisor présente des notes et commentaires laissés par les clients des hôtels, restaurants et autres hébergements. Mais Gaël Chareyron et ses collègues de l’École supérieure d’ingénieurs Léonard de Vinci savent en outre récupérer les métadonnées associées à ces commentaires (date de mise en ligne, site associé, langue) et aux commentateurs (pays et ville d’origine, sexe, âge tels que déclarés). A partir d’un profil, ils retrouvent le nombre de commentaires postés, les autres sites visités et leur ordre chronologique. Approche similaire avec Flikr, Panoramio et Instagram où ils repèrent les éventuels mots clés, les géolocalisations, les horodatages, ainsi que les données sur les profils des contributeurs. « Nous utilisons les API quand elles existent, comme pour Flikr ou Instagram. Sinon, nous pratiquons le scraping* des pages web, explique le spécialiste du big data. Il y a également un travail important de filtrage. Nous utilisons des bases comme Mongo DB pour certaines données, mais PostGIS est très utile, bien adapté au géocodage. » Agnostique en termes d’outils, Gaël Chareyron et ses collaborateurs utilisent aussi bien des SIG que des développements ad hoc pour spatialiser leurs analyses.
Le tourisme vu autrement
Plusieurs études ont été menées, soit dans le cadre de projets de recherche, soit pour vulgariser ce type de traitement. L’Expansion, Libération, Mediapart, Les Échos… les travaux menés par la petite équipe montrent, cartes à l’appui, qu’il vaut mieux s’éloigner des hauts lieux touristiques de la capitale pour manger correctement et qu’une bonne centaine de multi-loueurs sont à la tête de plus de six mille chambres sur Airbnb à Paris.
Ces données permettent d’aborder de nombreuses questions. Les nouvelles zones touristiques internationales définies par Emmanuel Macron le sont-elles vraiment ? Un indice calculé à partir de la densité de photographes à l’hectare et du ratio des commentaires sur TripAdvisor émis par des personnes vivant à l’étranger donne des résultats sans appel qui laissent Beaugrenelle et les Olympiades loin derrière Les Halles ou le Marais.
Commentaires et photos servent à reconstituer des parcours temporels, montrant par exemple que 10 % des visiteurs d’Eurodisney vont aussi à Versailles mais que l’inverse est beaucoup moins évident. Ils révèlent enfin des formes de voyages originales comme celle des chasseurs de méridiens qui suivent le méridien zéro pendant des centaines de kilomètres dans le Sahara.
Des analyses utiles aux territoires
Ces analyses et représentations sont également utiles aux acteurs publics soucieux de mieux comprendre le tourisme sur leur territoire. Le programme de recherche Imagitour, en partie financé par la région Centre, s’est centré sur le comportement des vacanciers dans le Val-de-Loire. L’approche quantitative a exploité les photos mises en ligne par les internautes, les articles de Wikipédia, et les avis postés sur hotels.com et Tripadvisor. Elle a été complétée par des enquêtes et des observations ethnographiques dans différents sites et circuits de la région. Une fois anonymisées et nettoyées, les données ont été géocodées, afin de produire des premières représentations sous ArcGIS. De nombreuses analyses ont ensuite été menées, montrant par exemple la provenance des touristes étrangers selon les châteaux visités ou l’apparition de « saisons » plus ou moins nettes selon les zones. Une première approche de la « connexion » entre sites a révélé que Blois a une relation territoriale plus importante avec les communes en aval de la Loire qu’avec une ville comme Orléans, située en amont.
« Ce type d’analyse nous permet de passer d’une approche par entité à une approche par les mobilités, se félicite Sébastien Jacquot, le géographe de l’équipe, maître de conférence à Paris 1 et membre de l’EIREST. Nous développons une lecture plus relationnelle de l’espace, qui renouvelle l’image des destinations touristiques. » La prise de conscience des connexions entre territoires devrait aider les collectivités à se rapprocher les unes des autres pour proposer des prestations adaptées.
- Définition = Scraping : Extraction, via des programmes informatiques, des contenus de sites Web (textes, images, données chiffrées).
- À lire : Revue Espaces n°316 – Dossier : Big data, traces numériques et observation du tourisme
- Accès direct à une vidéo où Gaël Chareyron et Sébastien Jacquot présentent leur travail sous ce lien
À lire dans ce dossier