Utilisation de méthodes statistiques pour prédire l'évolution de la maladie

Les données contiennent bien plus que les informations de surface. Grâce aux statistiques, des relations de cause à effet plus profondes peuvent être mises en évidence. C'est ce que recherche Alexander Marx en tant que Fellow à l'AI Center de l'ETH Zurich en utilisant l'intelligence artificielle. L'un de ses objectifs est de pouvoir faire des prédictions concernant le diabète chez les enfants.
A l'AI Center de l'ETH Zurich, Alexander Marx s'attaque à des questions médicales dans le cadre de la science des données. L'objectif est de réunir la théorie et la pratique. (Photo: ETH Zurich / Nicola Pitaro)

Chez les diabétiques, l'hypoglycémie ne survient généralement pas au hasard, tout comme un cours de bourse ne s'effondre pas sans raison. Cela signifie que les deux sont également prévisibles, du moins en théorie. Dans la pratique, cependant, de telles prévisions n'ont jusqu'à présent réussi que dans les cas les plus rares. Mais si le projet d'Alexander Marx aboutit, cela changera pour les enfants atteints de diabète de type 1. «Nous travaillons sur des modèles prédictifs qui peuvent détecter à temps s'il y a un risque d'hypoglycémie pendant la nuit», explique le boursier de l'AI Center de l'ETH Zurich, ajoutant: «Lorsque les enfants pratiquent une activité physique intense pendant la journée, leur glycémie peut descendre en dessous d'un seuil critique pendant leur sommeil. Avec un modèle de prévision fiable, ce risque pourrait être évité.»

Mettre en lumière les réseaux de cause à effet

Alexander Marx explore cette hypothèse dans le cadre du groupe de science des données médicales de Julia Vogt. «Je viens plutôt d'un milieu théorique et j'ai surtout travaillé avec des données générées artificiellement. L'objectif de l'AI Center est de réunir la théorie et la pratique, ce que je trouve passionnant. Je dois maintenant faire en sorte que mes concepts théoriques fonctionnent avec des données réelles.»

Alexander Marx a acquis son bagage scientifique à l'Université de la Sarre à Sarrebruck, en Allemagne. Après avoir obtenu un master en bio-informatique, il s'est penché sur la découverte causale dans le cadre de sa thèse de doctorat à l'Institut Max Planck d'informatique, basé dans cette ville. Ces méthodes statistiques permettent de créer, à partir de données d'observation, ce que l'on appelle des graphes causaux, qui mettent en évidence des réseaux de causes et d'effets.

Déterminer des prédictions à partir de corrélations

Une façon d'appliquer ces méthodes est d'utiliser les données d'enquête pour identifier tous les facteurs qui sont soupçonnés d'avoir un effet sur une variable particulière. Un exemple général serait la façon dont le revenu d'une personne dépend de son âge, de son lieu de résidence, de son sexe, de son niveau d'éducation, de sa situation matrimoniale ou du nombre de ses enfants. Sur la base des corrélations trouvées, des prédictions peuvent alors être faites pour les individus qui n'ont pas été interrogés. Alexander Marx précise que pour ce faire, il n'est même pas nécessaire de définir l'ensemble des chaînes de dépendance; il suffit d'obtenir le plus petit ensemble de facteurs requis pour faire une prédiction.

Des données synthétiques à la réalité clinique

Avec l'aide de l'intelligence artificielle basée sur des données simulées, Alexander Marx a utilisé ces méthodes pour étudier comment les activités d'environ 500 gènes sélectionnés dans une cellule humaine sont liées. Idéalement, ces méthodes pourront être étendues à l'avenir pour inclure l'ensemble des quelque 25'000 gènes d'une cellule. De telles analyses informatiques des réseaux de gènes permettraient à la recherche biologique et médicale d'acquérir facilement et rapidement une compréhension globale des processus qui se déroulent dans une cellule. L'obtention de ce résultat par le biais d'expériences en laboratoire nécessiterait des efforts considérables, car les scientifiques devraient désactiver chaque gène individuellement à l'aide d'outils de génie génétique, puis mesurer l'impact de cette désactivation sur l'activité de tous les autres gènes.

«Avec notre projet, nous nous aventurons dans des domaines que nous ne maîtrisons pas encore avec les méthodes disponibles.»      Alexander Marx

Pour les projets auxquels Alexander Marx s'attaque à l'AI Center, il doit porter les méthodes de découverte des causes à un nouveau niveau de complexité. Au lieu d'utiliser des ensembles complets de données d'observation ou des données synthétiques, comme dans le cas de l'expression génétique, il travaille désormais avec des données réelles issues de la pratique clinique. Cela rend la tâche nettement plus difficile, comme il l'a rapidement constaté: «Dans la réalité, il manque souvent des informations individuelles, des mesures ou des ensembles de données entiers, et la manière dont les données sont collectées diffère aussi toujours d'un hôpital à l'autre et parfois même d'un ou une médecin à l'autre.»

Élimination des corrélations non pertinentes

Les données cliniques qu'Alexander Marx analyse pour son modèle de prédiction en collaboration avec des médecins de l'Hôpital universitaire pour enfants de Bâle (UKBB) comprennent des séries temporelles du pouls et de la glycémie, ainsi que des informations sur les activités physiques, l'apport calorique, les injections d'insuline et la qualité du sommeil. Il s'agit ensuite de filtrer les données pour exclure du modèle toutes les corrélations qui ne sont pas liées à la question de recherche.

Si l'on veut que les prévisions destinées à une ou un médecin traitant soient robustes et compréhensibles, le nombre de facteurs doit être maintenu aussi bas que possible. Quoi qu'il en soit, il est trop tôt pour prédire si le modèle sera efficace dans la pratique: «Avec notre projet, nous nous aventurons dans des domaines que nous ne maîtrisons pas encore avec les méthodes disponibles.»

Nature, montagne et escalade en communauté

En tout cas, le jeune chercheur a pris un bon départ à Zurich. «Lorsque je suis arrivé ici à l'automne, je me suis très vite senti chez moi. La ville est très belle et les montagnes sont toutes proches», explique-t-il. Passionné d'escalade, Alexander Marx aime particulièrement être si proche de la nature, notamment des montagnes. «L'escalade me permet de me déconnecter et de concentrer toute mon attention sur les prises. Il y a aussi la communauté autour de la grimpe - j'aime faire des choses ensemble avec d'autres personnes.» À Sarrebruck, il était loin des montagnes et faisait donc principalement du bloc en salle. Maintenant qu'il est basé à Zurich, il se réjouit de pouvoir se rendre plus souvent en terrain alpin.

Extraordinairement international et interdisciplinaire

Alexander Marx aime l'AI Center tout autant que la ville de Zurich et ses environs: «Le Centre est extraordinairement international. Il y a aussi une grande variété de sujets. C'est impressionnant et inspirant de pouvoir avoir des discussions entre pairs avec des autorités de premier plan de différentes disciplines scientifiques dans le cadre normal de la routine quotidienne.»

«Après mes premières expériences ici, je suis convaincu que mon séjour à l'ETH Zurich me préparera parfaitement aux deux options de carrière - le monde universitaire et l'industrie.»      Alexander Marx

Le caractère interdisciplinaire de l'AI Center ne se limite toutefois pas à l'interaction sociale. Aux côtés de la bioinformaticienne Julia Vogt, Alexander Marx a un co-mentor en la personne de Peter Bühlmann, qui est spécialisé dans les statistiques à haute dimension. Celles-ci peuvent être utilisées pour examiner des ensembles de données dans lesquels de nombreux attributs sont associés à chaque objet. Cela inclut les données sur le diabète qu'Alexander Marx analyse. En outre, il existe une collaboration établie avec le groupe d'informatique biomédicale dirigé par Gunnar Rätsch, qui mène des recherches à l'interface de l'apprentissage automatique et de la bioinformatique.

Apprendre à partir de différentes sources de données

Alexander Marx lui-même est actif dans plusieurs domaines. Il a un autre projet dans lequel il explore ce que l'on appelle l'apprentissage multimodal. L'objectif est de trouver des points communs entre des données provenant de sources différentes. Par exemple, il combine les résultats de la tomographie par émission de positons (TEP), qui permet de visualiser en 3D les anomalies du métabolisme des tissus, avec les résultats de la tomographie par ordinateur à rayons X (CT), qui révèle les anomalies de densité dans les couches de tissus.

La combinaison de l'analyse des deux méthodes d'imagerie, automatisée par l'apprentissage automatique, pourrait permettre des avancées majeures dans le diagnostic des tumeurs. La vision est celle d'un système d'IA qui trouve les points communs entre les deux ensembles de données et les applique pour établir des diagnostics et des pronostics fiables.

Première expérience en tant que conférencier

Pour l'instant, Alexander Marx se réjouit de son premier cours magistral, qu'il donnera au prochain semestre d'été avec ses collègues de l'AI Center. «J'ai toujours aimé travailler avec des étudiantes et étudiants, et les étudiants et étudiantes de master de l'ETH Zurich sont d'un niveau très avancé. Les discussions génèrent toujours des idées que je n'avais pas envisagées moi-même», explique Alexander Marx. Sa bourse lui permet donc non seulement d'affiner ses compétences scientifiques, mais aussi d'acquérir une première expérience en tant que chargé de cours.

Alexander Marx ne veut pas encore se risquer à des prédictions concrètes sur son propre avenir: «Après mes premières expériences ici, je suis convaincu que mon séjour à l'ETH Zurich me préparera parfaitement aux deux options de carrière - académique et industrielle.»