Si la crise actuelle offre l’opportunité de démontrer leur valeur, elle met aussi en exergue les problèmes de leur gouvernance.
Stefania Rubrichi, Erwan Le Quentrec et Zbignew Smoreda
La pandémie COVID-19 a confronté le monde à des défis sans précédent, appelant les pays à prendre des mesures urgentes et résolues pour répondre à l'urgence sanitaire et atténuer les conséquences économiques et sociales associées. Dans ce contexte, les données mobiles sont devenues une source cruciale d’aide à la décision.
Les gouvernements, les autorités de santé publique et les scientifiques se sont fermement engagés à mettre rapidement au point des solutions pour mieux faire face aux infections à coronavirus et les combattre. Ces actions couvrent le développement de diagnostics, de traitements et de vaccins, ainsi que l'utilisation de la technologie et des données numériques. Parmi ces dernières, les données des téléphones mobiles participent au dispositif de gestion de crise. Fédérées par le Challenge Data for Development1 et la conférence phare NetMob2, les données générées par nos usages du téléphone mobile sont devenues l'une des principales sources de données précises et en temps quasi réel pour les études sur la présence humaine, la mobilité et les interactions sociales3. En particulier, leur utilité a été prouvée dans de nombreux contextes épidémiologiques4 5 6 7 8 9.
Quelques jours après le début de l'épidémie, lors de la première vague, une pression considérable a été exercée par une large communauté de scientifiques qui se sont mobilisés et ont appelé les gouvernements et les entreprises des télécommunications à agir. Ils ont fait valoir la nécessité d'accéder aux données agrégées sur la mobilité humaine10, et aux données des téléphones mobiles en particulier11, comme une source d’informations cruciales pour mieux comprendre et contrôler la diffusion du virus COVID-19.
Parallèlement, en mars 2020, la Commission Européenne a défendu des initiatives visant à mobiliser les données de télécommunications anonymisées et agrégées des opérateurs de téléphonie mobile de l'Union européenne dans la lutte contre COVID-1912. Par la suite, en avril, elle a publié une feuille de route pour la levée progressive des mesures de confinement et a appuyé la collecte et l'utilisation de ces données pour la gérer13.
Alors que l'épidémie s'aggrave et que des politiques d'endiguement sont mises en œuvre, des chercheurs et des entreprises privées du monde entier ont uni leurs forces et commencé à collaborer pour la gestion de l’épidémie. Certains se sont concentrés sur la détection et la localisation des contacts proches des personnes infectées, d'autres sur l'identification des ‘clusters’ de transmission ou sur l'évaluation des mesures de restrictions de mobilité et des interactions sociales14 15 16 17 18 19 20 21.
Le groupe Orange aussi, a déployé immédiatement une taskforce pour contribuer à la cause COVID19 avec plusieurs actions autour de l'utilisation des technologies de télécommunication.
Dans cet article, nous rapportons une initiative de partage et d'utilisation des données entre des acteurs des secteurs privés et public en France qui a rassemblé des chercheurs de l'Institut national de la Santé, de la Recherche Médicale (INSERM) et d’Orange Labs dans le cadre d’un projet de recherche collaboratif. Nous faisons le point sur les principaux résultats obtenus jusqu'à présent et nous analysons les questions, les limites et les implications de ce type d'initiatives.
Le projet collaboratif EVALCOVID-19
En mars 2020, lorsque l’Agence Nationale de la Recherche française a alloué un financement exceptionnel pour un appel à des recherches sur l'épidémie22, le consortium INSERM-Orange Labs a pu y répondre rapidement avec la proposition de projet EVALCOVID-1923 en s’appuyant sur une collaboration déjà initiée sur l’épidémie Ebola en Afrique.
Ce projet propose d'utiliser des indicateurs agrégés sur la mobilité de la population construits en temps quasi réel à partir du réseau téléphonie mobile pour éclairer les autorités de santé publique, tout au long des phases successives de l'épidémie.
Le travail a débuté dès la seconde moitié du mois de mars lorsque l'épidémie s'est installée sur le territoire français avec une dynamique exponentielle. Pendant cette phase d'accélération, de lourdes restrictions de la mobilité et des contacts sociaux par le biais d'un confinement national ont été mis en œuvre, pour retarder et contenir l'épidémie et soulager la pression sur le système de santé. À ce stade, l’analyse de la mobilité est essentielle pour identifier les dynamiques comportementales et sociétales qui façonnent mais aussi limitent l'étendue des restrictions. Pour cela, nous avons utilisé les indicateurs fournis par Flux Vision24 (Orange Business Services) et étudié les changements dans les comportements de mobilité des Français en réponse à la situation épidémiologique et aux interventions imposées par le gouvernement français, à différentes échelles spatiales et temporelles25.
Cette étude a montré que le confinement réduisait fortement la mobilité liée au travail ou à la scolarité, surtout aux heures de pointe, ainsi que les longs trajets. Mais ces baisses étaient variables selon les régions en raison de facteurs démographiques et socio-économiques ainsi que des différences dans les secteurs d'activité (fig. 1).
Figure 1. Réduction de la mobilité induite par le premier confinement: (a) Réduction de la mobilité par âge, heure de la journée et (b) par région ; (c) réduction de la mobilité selon les indicateurs démographiques, socio-économiques et épidémiques.
De plus, d'importantes réductions ont été observées dans les régions connaissant le plus fort niveau d’épidémie, ce qui suggère que la prise de conscience des risques ait pu renforcer le suivi des recommandations. La mise en lumières de ces facteurs explicatifs est importante pour définir au mieux les restrictions de mouvement actuelles et futures.
Pendant la phase de décélération de l'épidémie, lorsque le pic des infections a été atteint, les résultats de cette première étude ont été utilisés immédiatement pour paramétrer avec précision un modèle stochastique de transmission basé sur le profil d'âge et les données de contact social26. Ce modèle a permis (i) d'évaluer la situation de la pandémie de COVID-19 en France selon des projections à court terme; (ii) d'évaluer l'impact du confinement sur la diffusion virale; (iii) d'explorer les stratégies de sortie possibles, en termes de type d’intervention (lesquelles, quelles combinaisons), de temps (meilleur moment pour les mettre en œuvre, la durée) et d'espace (quelles régions, départements) ; (iv) évaluer les besoins en capacité du système de santé pour toutes les situations épidémiques ci-dessous (fig 2).
Ces recherches, publiées rapidement, ont été mises à disposition des autorités de santé publique. Après le déconfinement au printemps 2020, ces travaux ne se sont pas arrêtés afin de suivre et d’anticiper d’éventuels rebonds.
À l’heure où cet article est rédigé (début de l'année 2021), une nouvelle vague de l'épidémie a frappé le pays, obligeant les autorités à introduire de nouvelles restrictions. Les 17 et 24 octobre, un couvre-feu a été progressivement mis en place dans 54 départements de la France métropolitaine. Un deuxième confinement généralisé a été acté du 30 octobre au 13 décembre 2020. Un couvre-feu national est actuellement en place. De plus fortes restrictions futures sont probables, car la vaccination commence seulement et de nouveaux variants circulent27. Les mesures prises et leur acceptation peuvent rapidement changer justifiant la pérennisation des outils construits28.
Figure 2. Analyse de l'impact du premier confinement sur l'activité épidémique en Île-de-France : (a) Calibration du modèle sur les données d'hospitalisation journalière en Île-de-France avant le confinement et projections pour la phase de confinement ; (b) projections du nombre de lits en USI occupés pendant le confinement.
Accès et partage des données personnelles : des questions toujours ouvertes
Dans ce contexte, il est clair que les indicateurs de mobilité délivrés rapidement sont une source d'information essentielle pour les décideurs et les autorités. Si la crise actuelle offre l’opportunité de démontrer leur valeur, elle met aussi en exergue les problèmes de leur gouvernance. Ces indicateurs construits à partir des usages de nos clients sont en effet très sensibles quant à leur collecte, stockage, utilisation voire partage. Tout cela pose des questions légitimes en termes juridiques, économiques et éthiques29.
Dans le cadre de cette recherche collaborative, seuls les indicateurs de mobilité agrégés, anonymes - sous la forme de matrices origine-destination - nécessaires aux objectifs explicitement définis du projet sont partagés entre les deux institutions. Plus précisément, ces indicateurs sont produits par la solution commerciale Flux Vision, basée sur le traitement à la volée de données de téléphonie mobile préalablement rendues anonymes conformément aux exigences strictes en matière de respect de la vie privée, auditée par l'autorité française de protection des données (CNIL, Commission Nationale de l'Informatique et des Libertés).
Cette solution préexistante a permis une réponse immédiate à la crise. Cependant elle a quelques limitations.
Elle a été conçue initialement en tenant compte des exigences réglementaires et technologiques, particulièrement de la directive ‘Vie privée et communications électroniques’ (e-privacy)30 et de sa transposition nationale.
De plus, en tant que solution propriétaire l’ensemble du processus de leur construction n’est pas d’emblée partagé, ce qui peut soulever des questionnements31 32 33 Comme l’illustrent les auteurs du rapport Using Data to fight COVID-1934 : « Quelques entreprises de télécommunications, comme Telefonica avec SmartSteps, Orange avec FluxVision ou Vodafone avec Vodafone Analytics, ont développé des systèmes et des produits commerciaux. Cependant, ces solutions sont propriétaires et fermées, de sorte qu'il est difficile de fonder des politiques publiques sur leur base. ». En même temps, l’idée de transparence entre aussi en tension avec le droit de la propriété intellectuelle, les algorithmes s’apparentant à un secret industriel dont la divulgation pourrait mettre en danger un modèle économique35.
Enfin, comme tout système conçu pour répondre à d’autres besoins (dans ce cas des secteurs du tourisme ou des transports), les indicateurs ne sont pas nécessairement toujours adaptés au contexte spécifique de la crise épidémiologique actuelle. Des ajustements doivent alors être testés.
Cette solution préexistante a permis une réponse immédiate à la crise. Cependant elle a quelques limitations. Elle a été conçue initialement en tenant compte des exigences réglementaires et technologiques, particulièrement de la directive ‘Vie privée et communications électroniques’ (e-privacy) et de sa transposition nationale. De plus, en tant que solution propriétaire l’ensemble du processus de leur construction n’est pas d’emblée partagé, ce qui peut soulever des questionnements. Comme l’illustrent les auteurs du rapport Using Data to fight COVID-19: « Quelques entreprises de télécommunications, comme Telefonica avec SmartSteps, Orange avec FluxVision ou Vodafone avec Vodafone Analytics, ont développé des systèmes et des produits commerciaux. Cependant, ces solutions sont propriétaires et fermées, de sorte qu'il est difficile de fonder des politiques publiques sur leur base. ». En même temps, l’idée de transparence entre aussi en tension avec le droit de la propriété intellectuelle, les algorithmes s’apparentant à un secret industriel dont la divulgation pourrait mettre en danger un modèle économique.
Enfin, comme tout système conçu pour répondre à d’autres besoins (dans ce cas des secteurs du tourisme ou des transports), les indicateurs ne sont pas nécessairement toujours adaptés au contexte spécifique de la crise épidémiologique actuelle. Des ajustements doivent alors être testés.
Une approche complémentaire pourrait se baser sur l’accès sécurisé à des données pseudonymisées - en l'occurrence les comptes rendus d’appels (CRA) déjà collectés pour des raisons de facturation - suivant un modèle d’usage dit ‘privacy-conscientious’ proposé par certains chercheurs36. Par exemple il pourrait être utile de mobiliser des indicateurs qui visent à mieux saisir la problématique de mixage de populations dans le temps et l’espace ou encore de mieux qualifier la sémantique des déplacements. Indicateurs qui seraient construits de façon transparente avec l’ensemble des parties prenantes d’une part, tout en respectant la confidentialité des clients grâce au progrès en termes d’algorithmie d’autre part37. Malgré de nombreuses initiatives au cours des dernières années sur les meilleures pratiques pour un nouveau modèle de partage et utilisation des données pseudonymisées respectueux de la vie privée, des freins sur la réglementation subsistent.
La crise sanitaire actuelle a rappelé l’urgence à traiter cette question38. Le 10 février 2021 le Conseil de l'Union Européenne, qui réunit les ministres des Etats membres, a trouvé un consensus pour un texte final sur la réglementation e-privacy qui autorise l’utilisation des métadonnées, notamment pour surveiller les épidémies et leur propagation ou dans les situations d'urgence humanitaire39. Il doit, désormais, être soumis à la délibération et au vote du Parlement Européen.
Ce projet de recherche en cours, rappelle que les données de nos réseaux recèlent des cas d’usages singuliers qui participent aussi de notre engagement en tant qu'entreprise socialement responsable. Comme beaucoup de travaux démarrés en urgence sous l’ombre d’une maladie inconnue, il a condensé différentes problématiques et controverses autour de l’utilisation et du partage des données personnelles à des fins de la recherche.
Extrait de notre livre blanc : Défis et progrès à lère de l'intelligence artificielle
1 “NetMob 2019, 8-10 July Mathematical Institute, Oxford University, Oxford, UK.” https://netmob.org/#pasteditions (accessed Jan. 28, 2021).
2 V. Blondel, A. Decuyper, and G. Krings, “A survey of results on mobile phone datasets analysis,” EPJ Data Science, vol. 4, Feb. 2015, doi: 10.1140/epjds/s13688-015-0046-0.
3 L. Bengtsson et al., “Using mobile phone data to predict the spatial spread of cholera,” Sci Rep, vol. 5, p. 8923, Mar. 2015, doi: 10.1038/srep08923.
4 F. Finger et al., “Mobile phone data highlights the role of mass gatherings in the spreading of cholera outbreaks,” PNAS, vol. 113, no. 23, pp. 6421–6426, Jun. 2016, doi: 10.1073/pnas.1522305113.
5 M. Tizzoni et al., “On the Use of Human Mobility Proxies for Modeling Epidemics,” PLOS Computational Biology, vol. 10, no. 7, p. e1003716, Jul. 2014, doi:10.1371/journal.pcbi.1003716.
6 A. Wesolowski et al., “Quantifying the Impact of Human Mobility on Malaria,” Science, vol.338, no. 6104, p. 267, Oct. 2012, doi: 10.1126/science.1223467.
7 A. Wesolowski et al., “Impact of human mobility on the emergence of dengue epidemics in Pakistan,” Proc Natl Acad Sci U S A, vol. 112, no. 38, pp. 11887–11892, Sep. 2015, doi: 10.1073/pnas.1504964112.
8 S. Rubrichi, Z. Smoreda, and M. Musolesi, “A comparison of spatial-based targeted disease mitigation strategies using mobile phone data,” EPJ Data Sci., vol. 7, no. 1, Art. no. 1, Dec. 2018, doi:10.1140/epjds/s13688-018-0145-9.
9 C. O. Buckee et al., “Aggregated mobility data could help fight COVID-19,” Science, vol. 368, no. 6487, p.145, Apr. 2020, doi: 10.1126/science.abb8021.
10 N. Oliver et al., “Mobile phone data for informing public health actions across the COVID-19 pandemic life cycle,” Science Advances, vol. 6, no. 23, p.eabc0764, Jun. 2020, doi: 10.1126/sciadv.abc0764.
11 “European Commission tells carriers to hand over mobile data in coronavirus fight,” POLITICO. https://www.politico.com/news/2020/03/24/europe-mobiledata-coronavirus-146074 (accessed Jan. 28, 2021).
12 “Joint European Roadmap towards lifting COVID-19 containment measures,” Apr. 15, 2020. http://www.clustercollaboration.eu/node/16975 (accessed Jan.28, 2021).
13 “Valencia prepara un proyecto pionero con datos de móviles para trazar el movimiento del coronavirus | Tecnología | EL PAÍS.” https://elpais.com/tecnologia/2020-03-19/valencia-prepara-unproyecto-pionero-con-datos-de-moviles-para-trazar-elmovimiento-del-coronavirus.html (accessed Jan. 28, 2021).
14 B. Klein et al., “Assessing changes in commuting and individual mobility in major metropolitan areas in the United States during the COVID-19 outbreak,” p. 29.
15 M. U. G. Kraemer et al., “The effect of human mobility and control measures on the COVID-19 epidemic in China,” Science, vol. 368, no. 6490, pp.493–497, May 2020, doi: 10.1126/science.abb4218.
16 S. Lai et al., “Effect of non-pharmaceutical interventions to contain COVID-19 in China,” Nature, vol. 585, no. 7825, Art. no. 7825, Sep. 2020, doi:10.1038/s41586-020-2293-x.
17 “COVID-19 outbreak response: a first assessment of mobility changes in Italy following national lockdown | medRxiv.” https://www.medrxiv.org/content/10.1101/2020.03.22.20039933v2 (accessed Jan. 28, 2021).
18 M. Qian et al., “Oxford COVID-19 Imapct monitor,” Our World in Data. https://oxford-covid-19.com/ (accessed Jan. 28, 2021).
19 “Covid-19 UK Mobility Project,” Covid-19 UK Mobility Project. https://covid19-uk-mobility.github.io/Firstreport.html (accessed Apr. 17, 2020).
20 D. Martín-Calvo, A. Aleta, A. Pentland, Y. Moreno, and E. Moro, “Effectiveness of social distancing strategies for protecting a community from a pandemic with a data-driven contact network based on census and realworld
mobility data,” Complex Dig, 2020, Accessed: Jan. 28, 2021. [Online]. Available: http://ide.mit.edu/publications/effectiveness-social-distancing-strategiesprotecting-community-pandemic.
21 “Appel à projets Flash COVID-19,” Agence nationale de la recherche. https://anr.fr/fr/detail/call/appel-aprojets-flash-covid-19/ (accessed Jan. 29, 2021).
22 Ce projet s’inscrit dans le domaine de recherche d’Orange Digital Society sous la direction de Roxane Adle Aiguier (programme Transforming Society and Digital Humanities piloté par Christian Warocquier).
23 Les deux principaux piliers de la législation sur la protection des données personnelles dans l'Union Européenne sont le Règlement général sur la protection des données (RGDP), et la directive « Vie privée et communications électroniques » (e-privacy). Contrairement au RGPD qui est fondée sur la notion de gestion de risques, offrant ainsi des marges de manoeuvre pour définir des solutions sur mesure et qui permet aussi des exceptions explicites pour le traitement des données personnelles, tels que l'intérêt public, la recherche scientifique ou les statistiques publiques, la directive e-privacy limite explicitement ces conditions, en interdisant aux opérateurs d'utiliser leurs données sans le consentement des clients.
24 “Appel à projets Flash COVID-19,” Agence nationale de la recherche. https://anr.fr/fr/detail/call/appel-aprojets-
flash-covid-19/ (accessed Jan. 29, 2021).
25 “Flux Vision,” Orange Business Services. https://www.orange-business.com/fr/produits/flux-vision (accessed Feb. 05, 2021).
26 G. Pullano, E. Valdano, N. Scarpa, S. Rubrichi, and V. Colizza, “Evaluating the effect of demographic factors, socioeconomic factors, and risk aversion on mobility during the COVID-19 epidemic in France under lockdown: a population-based study,” Lancet Digit Health, vol. 2, no. 12, pp. e638–e649, Dec. 2020, doi:10.1016/S2589-7500(20)30243-0.
27 L. Di Domenico, G. Pullano, C. E. Sabbatini, P.-Y. Boëlle, and V. Colizza, “Impact of lockdown on COVID-19 epidemic in Île-de-France and possible exit strategies,” BMC Medicine, vol. 18, no. 1, p. 240, Jul. 2020, doi: 10.1186/s12916-020-01698-4.
28 GOV.UK, “Investigation of novel SARS-CoV-2 variant: Variant of Concern 202012/01,” GOV.UK. https://www.gov.uk/government/publications/investigation-ofnovel-sars-cov-2-variant-variant-of-concern-20201201
(accessed Jan. 29, 2021).
29 EPIcx lab INSERM, “COVID-2019 pandemic assessment,” EPIcx lab. https://www.epicx-lab.com/ covid-19.html (accessed Jan. 29, 2021).
30 E. Letouzé, N. Oliver, M. A. Bravo, and N. Shoup, “Using Data to Fight COVID-19 – And Build Back Better,” Nov. 2020. Accessed: Jan. 29, 2021. [Online]. Available: https://datapopalliance.org/publications/policy-paper-using-data-to-fight-covid-19-and-buildback-better/.
31 “Directive on Privacy and Electronic communications.” Accessed: Jan. 29, 2021. [Online]. Available: https://eur-lex.europa.eu/eli/dir/2002/58/oj.
32 J. Morley, J. Cowls, M. Taddeo, and L. Floridi, “Ethical guidelines for COVID-19 tracing apps,” Nature, vol. 582, no. 7810, Art. no. 7810, Jun. 2020, doi:10.1038/d41586-020-01578-0.
33 M. Taddeo, “The Ethical Governance of the Digital During and After the COVID-19 Pandemic,” Minds & Machines, vol. 30, no. 2, pp. 171–176, Jun. 2020, doi:10.1007/s11023-020-09528-5.
34 L. Floridi and M. Taddeo, “What is data ethics?,” Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences, vol. 374, no. 2083, p. 20160360, Dec. 2016, doi:10.1098/rsta.2016.0360.
35 “cnil_rapport_garder_la_main_web.pdf.” Accessed:Mar. 17, 2021. [Online]. Available: https://www.cnil.fr/sites/default/files/atoms/files/cnil_rapport_garder_la_main_web.pdf.
36 Y.-A. de Montjoye et al., “On the privacyconscientious use of mobile phone data,” Scientific Data, vol. 5, no. 1, Art. no. 1, Dec. 2018, doi: 10.1038/sdata.2018.286.
37 A. Oehmichen, S. Jain, A. Gadotti, and Y. d Montjoye, “OPAL: High performance platform for large-scaleprivacy-preserving location data analytics,” in 2019 IEEE International Conference on Big Data (Big Data), Dec. 2019, pp. 1332–1342, doi: 10.1109/BigData47090.2019.9006389.
38 Les deux principaux piliers de la législation sur la protection des données personnelles dans l'Union Européenne sont le Règlement général sur la protection des données (RGDP), et la directive « Vie privée et communications électroniques » (e-privacy). Contrairement au RGPD qui est fondée sur la notion de gestion de risques, offrant ainsi des marges de
manoeuvre pour définir des solutions sur mesure et qui permet aussi des exceptions explicites pour le traitement des données personnelles, tels que l'intérêt public, la recherche scientifique ou les statistiques publiques, la directive e-privacy limite explicitement ces conditions, en interdisant aux opérateurs d'utiliser leurs données sans le consentement des clients.
39 Council of the European Union, Proposal for a Regulation of the European Parliament and of the Council concerning the respect for private life and the protection of personal data in electronic communications and repealing Directive 2002/58/EC (Regulation on Privacy and Electronic Communications). 2021.
Ecrit par Stefania Rubrichi, Erwan Le Quentrec et Zbignew Smoreda
Extrait du libre blanc Défis et progrès à l’ère des données et de l’intelligence artificielle
Si la crise actuelle offre l’opportunité de démontrer leur valeur, elle met aussi en exergue les problèmes de leur gouvernance.