Comprendre la dynamique de l'épidémie

De nombreux facteurs influencent la propagation du coronavirus. Pour mieux prédire la progression de l'épidémie, des chercheuses et chercheurs de l'ETH Zurich et de l'Université de Californie à Los Angeles ont lancé un « datathon ». Les participant·es du monde entier sont appelé·es à développer des modèles basés sur des données accessibles au public.
Logo du datathon « datathon épidémiologique en temps réel ». (Image: ETH Zurich)

Les politicien·nes du monde entier tentent actuellement de contenir le coronavirus en utilisant des mesures telles que d'énormes restrictions à la liberté de mouvement. La progression d'une épidémie est influencée par de nombreux facteurs. C'est pourquoi les scientifiques de l'ETH invitent les chercheuses et chercheurs du monde entier à développer de nouveaux modèles de prévision de la propagation du virus. L'objectif du « datathon épidémique », qui a débuté la semaine dernière, est de mieux comprendre la dynamique de l'épidémie. Le terme « datathon » est dérivé de « hackathon » et fait référence à un défi par lequel les participant·es utilisent des données pour trouver de nouvelles solutions à des problèmes existants dans un court laps de temps.

Le datathon est organisé par une équipe interdisciplinaire de l'ETH Zurich: outre Nino Antulov-Fantulin et Dirk Helbing de la chaire de sciences sociales computationnelles, l'équipe comprend Lucas Böttcher de l'Institut de physique théorique de l'ETH Zurich et du département de médecine computationnelle de l'Université de Californie à Los Angeles (UCLA), ainsi que Zhang Ce et David Dao du département d'informatique de l'ETH Zurich.

Les données accessibles au public constituent la base du datathon - par exemple, les données relatives aux nombres de cas et de tests ou à la mobilité de la population. « Les participant·es développent des modèles qu'ils et elles vérifient ensuite en temps réel », explique le coorganisateur Nino Antulov-Fantulin. Les participant·es au datathon vérifient l'exactitude des prédictions plusieurs fois après quelques jours et semaines en utilisant des données réelles ; par exemple, en comparant le nombre prévu de personnes infectées dans un pays avec le nombre réel de cas. Les participant·es au datathon peuvent ainsi déterminer lequel de leurs modèles est le plus efficace. Il a été délibérément décidé de ne pas décerner de prix pour des raisons éthiques.

Le comportement de la population est crucial

Il existe déjà des modèles épidémiologiques qui décrivent la progression de l'épidémie, mais ils ne sont significatifs que dans une mesure limitée car ils ne tiennent pas compte de divers facteurs. La vitesse de propagation du coronavirus n'est pas une question purement biologique, mais dépend également des mesures prises pour l'endiguer. Le comportement de la population est également crucial. « Tous ces facteurs devraient idéalement être pris en compte dans les modèles », déclare Nino Antulov-Fantulin.

Les données sont globales et interdisciplinaires : outre les professionnel·les de la médecine et les épidémiologistes, des économistes, des spécialistes des sciences sociales et de l'apprentissage automatique sont également demandé·es. C'est pourquoi le comité consultatif du datathon est composé d'experts internationaux issus de divers domaines spécialisés.

Des modèles de prédiction plus précis pourraient nous aider à comprendre comment les différentes mesures de confinement affecteront la propagation de Covid-19 à court et moyen terme. Des goulets d'étranglement dans le système de santé pourraient également être anticipés sur cette base. Toutefois, Nino Antulov-Fantulin met en garde contre des attentes trop élevées : « C'est un projet ouvert et nous ne savons toujours pas si et quand des résultats valables seront disponibles ».

Le succès du datathon dépend en grande partie de ses participant·es. Les étudiant·es de l'ETH Zurich dans le domaine de la science des données ont déjà commencé avec les premiers modèles de prévision. Le datathon est également ouvert aux participant·es internationales et internationaux depuis le 30 mars et plusieurs équipes d'universités renommées se sont déjà inscrites.