Calculer les débuts de l'épidémie de coronavirus
Depuis le début de l'actuelle épidémie de coronavirus, les scientifiques et les autorités ont déterminé l'empreinte génétique d'échantillons de virus provenant de nombreux pays touchés. Plus de 100 de ces séquences de gènes, qui sont présentes dans les coronavirus sous forme d'ARN, sont disponibles dans des bases de données publiques. Tanja Stadler, professeur de biologie computationnelle au Département de science et d'ingénierie des biosystèmes de l'ETH Zurich à Bâle et spécialiste des questions d'épidémiologie moléculaire, a récemment étudié ces données. En utilisant un modèle statistique que son groupe a développé pour analyser la généalogie génétique des agents pathogènes, elle a acquis de nouvelles connaissances sur les débuts de l'épidémie en Chine.
Les analyses du professeur Tanja Stadler suggèrent que l'épidémie en Chine a commencé dans la première moitié de novembre 2019, alors que la plupart des estimations précédentes supposaient que le virus ne passait pas d'un animal au premier humain avant la deuxième moitié de novembre. "L'hypothèse largement répandue selon laquelle la première personne a été infectée dans un marché d'animaux en novembre est toujours plausible", déclare Tanja Stadler. "Nos données excluent effectivement le scénario selon lequel le virus aurait circulé chez l'homme pendant une longue période avant cela."
Propagation rapide avant la mise en quarantaine
Tanja Stadler a également analysé la dynamique de l'épidémie avant que la ville de Wuhan ne soit mise en quarantaine le 23 janvier 2020. Elle a utilisé les données génétiques pour calculer le nombre de reproduction de base du nouveau coronavirus, un chiffre qui indique le nombre moyen de personnes qu'une personne infectée va ensuite infecter à son tour. Selon les estimations de Tanja Stadler, il se situe entre 2 et 3,5 pour la période en question. Cela corrobore les estimations précédentes basées sur le nombre de cas de coronavirus confirmés, qui suggéraient un chiffre entre 2 et 4. Cela signifie que les infections se produisent beaucoup plus rapidement que dans le cas de la grippe saisonnière (dont le taux de reproduction de base est généralement inférieur à 1,5).
"Le taux de reproduction de base est l'un des paramètres centraux d'une épidémie", explique la scientifique. "Il fournit des informations importantes sur l'efficacité de mesures telles que la quarantaine. Les mesures de contrôle ne sont efficaces que si elles sont capables de réduire ce nombre." C'est pourquoi Tanja Stadler veut déterminer ce chiffre pendant la durée de la quarantaine de Wuhan. Cependant, dit-elle, les données pour cette période à Wuhan ne sont pas claires, ce qui rend une analyse fiable impossible pour l'instant.
Déterminer le chiffre caché
Comme les génomes viraux sont en constante évolution, Mme Stadler pourrait utiliser ces changements pour reconstruire l'histoire de l'évolution du virus. "En utilisant des méthodes statistiques, nous pouvons calculer combien de personnes ont été infectées à un moment donné dans le passé", explique-t-elle. Son analyse a montré que le 23 janvier, entre 4 000 et 19 000 personnes ont dû être infectées. A cette date, il y avait 581 cas confirmés de la maladie. Cela signifie que dans le cas le plus extrême, seulement 1 personne infectée sur 33 figurait dans les statistiques officielles ; dans le meilleur des cas, 1 sur 7.
Tanja Stadler souligne qu'il existe d'autres méthodes que la sienne pour déterminer les paramètres épidémiologiques. Toutefois, sa méthode, qui consiste à analyser les génomes, présente un grand avantage dans la mesure où elle permet de tirer des conclusions fiables même avec des données provenant de relativement peu de patients. En particulier, sa méthode est utile dans les situations où l'on ne sait plus clairement qui a infecté qui. C'est actuellement le cas dans notre pays voisin, l'Italie, et c'est le cas en Chine depuis un certain temps.
Rendre possible l'analyse en temps réel
Enfin, la méthode de Tanja Stadler permettrait même l'analyse en temps réel d'une épidémie, ce qui permettrait aux autorités de revoir et d'ajuster en permanence l'efficacité des mesures de contrôle. Une condition préalable serait de procéder régulièrement à des contrôles ponctuels pour examiner le génome viral chez les personnes nouvellement infectées. Toutefois, à l'heure actuelle, presque aucune donnée de séquence n'est publiée pour les nouveaux génomes viraux de Wuhan.
Tanja Stadler et ses collègues ont mis leurs analyses à la disposition d'autres scientifiques sur Virological, un portail en ligne. Les chercheurs de l'ETH Zurich soulignent que leurs travaux n'ont pas été examinés par d'autres scientifiques, comme c'est la pratique courante dans la recherche, car cela prendrait trop de temps dans une situation comme celle que nous connaissons actuellement. Mme Stadler souligne également que la qualité de ses analyses ne peut être qu'à la mesure de la qualité et de la quantité des données génétiques publiées. Dans cette étude, son équipe a analysé 93 séquences d'ARN - la plupart provenant de Chine, et 38 d'autres pays. Mme Stadler poursuivra son analyse et l'élargira avec les données sur le génome récemment publiées.