Concevoir des interactions moléculaires par l'IA

En utilisant des «empreintes» générées par apprentissage profond pour caractériser des millions de fragments de protéines, des chercheurs de l’EPFL ont conçu de nouveaux ligands protéiques qui s'attachent parfaitement à des cibles clés, y compris la protéine Spike du SARS-CoV-2.
Les surfaces protéiques, très diverses, sont aussi dynamiques, si bien qu'il est difficile de prédire comment et où les liaisons vont se faire. © Ella Maru Studio

En 2019, des scientifiques du laboratoire de conception de protéines et d'immuno-ingénierie (LPDI), commun à la Faculté des sciences de l'ingénieur et à la Faculté des sciences de la Vie et dirigé par Bruno Correia, ont développé MaSIF, une méthode basée sur l’intelligence artificielle (IA) qui permet de scanner des millions de surfaces de protéines en l’espace de quelques minutes pour analyser leur structure et leurs propriétés fonctionnelles. L'objectif ultime des chercheurs était de concevoir par ordinateur des interactions entre protéines en trouvant des correspondances optimales entre les molécules sur la base de leurs «empreintes» de surface chimiques et géométriques.

Quatre ans plus tard, l’objectif est atteint. Dans un article publié dans Nature, ils déclarent avoir créé de tout nouveaux ligands protéiques (à base de protéines) conçus pour interagir avec quatre protéines cibles pertinentes sur le plan thérapeutique, y compris la protéine Spike du SARS-CoV-2.

Créer une correspondance moléculaire parfaite

Les interactions physiques entre les protéines influencent tout autant la signalisation et la croissance cellulaires que les réponses immunitaires. C’est dire l’intérêt, en biologie et en biotechnologie, de pouvoir contrôler les interactions entre protéines. S'il peut paraître simple de représenter une liaison protéique en y voyant un simple assemblage de pièces de puzzle, la réalité est plus complexe: les surfaces des protéines, très diverses, sont aussi dynamiques, si bien qu'il est difficile de prédire comment et où les liaisons vont se faire.

«Une pièce de puzzle est bidimensionnelle. Avec les surfaces des protéines, nous avons affaire à de multiples dimensions: composition chimique, comme les interactions de charge positive/négative, complémentarité de forme, courbure, etc.», explique Anthony Marchand, étudiant-doctorant au LPDI et co-auteur.

«L'idée que, dans la nature, tout ce qui se lie est complémentaire – une charge positive et une charge négative par exemple – est une notion de longue date dans le domaine, que nous avons intégrée dans notre cadre computationnel.»

Pour concevoir de nouveaux ligands protéiques, les chercheurs ont utilisé MaSIF pour créer des «empreintes» de la surface des protéines et identifier ensuite des surfaces complémentaires pour des protéines cibles clés en se basant sur une base de données de fragments. Ils ont ensuite greffé les fragments sur de plus grandes structures protéiques et sélectionné les ligands susceptibles d'interagir au mieux avec les cibles. Après avoir synthétisé et testé ces ligands protéiques en laboratoire, les chercheurs ont pu confirmer l’hypothèse générée par ordinateur.

«Le fait que nous soyons capables de concevoir de nouveaux ligands protéiques spécifiques à chaque site en l’espace de quelques mois à peine rend cette méthode extrêmement intéressante dans le domaine thérapeutique. Ce n’est pas juste un outil, c’est un pipeline», affirme Anthony Marchand.

Tout droit sorti de l’ordinateur

Les chercheurs étaient en train de développer des ligands protéiques pour trois grandes cibles en immunothérapie anticancéreuse quand la pandémie de COVID a éclaté, ce qui les a amenés à ajouter la protéine Spike du SARS-CoV-2 à leur liste. Basés sur cette approche, les quatre ligands qu'ils ont produits présentaient d’excellentes affinités avec leurs cibles.

Le taux de réussite de MaSIF, combiné avec sa capacité à produire rapidement des structures de haute qualité spécifiques à chaque site démontre son potentiel thérapeutique. Ainsi, la capacité à générer aussi rapidement des ligands protéiques précis pourrait se révéler être un grand avantage pour les applications épidémiologiques, comme dans le cas de la protéine Spike du SARS-CoV-2. Anthony Marchand estime que le pipeline pourrait aussi faciliter le développement de récepteurs antigéniques chimériques (CAR-T) créés pour permettre aux cellules immunitaires du patient de cibler les cellules cancéreuses.

«De nouvelles avancées dans le domaine de l’intelligence artificielle aideront à améliorer notre méthode, mais aujourd'hui déjà, notre travail fournit une stratégie pour le développement rapide d’agents thérapeutiques à base de protéines – tout droit sorti de l’ordinateur.»