PeSTo: un nouvel outil IA de prédiction des interactions protéiques

Une équipe de scientifiques de l’EPFL a mis au point un modèle IA, baptisé PeSTo, pour prédire avec un haut degré de confiance les interfaces de liaison de protéines es protéines avec les protéines, les acides nucléiques, les lipides, les ions et de petites molécules. Son faible coût de calcul permet le traitement d’importantes quantités de données structurelles, ouvrant la voie à des découvertes biologiques inédites.
La méthode PeSTo utilisée pour prédire les interfaces de liaison des protéines. (rouge: les acides aminés impliqués dans l'interface de liaison des protéines). Crédit: Lucien Krapp (EPFL)

Les protéines sont essentielles aux fonctions biologiques de la plupart des organismes vivants. Elles ont évolué pour pouvoir interagir avec d’autres protéines, des acides nucléiques, des lipides, etc., toutes ces interactions donnant naissance à de grands complexes «supramoléculaires». La compréhension des interactions protéiques est cruciale pour percer de nombreux processus cellulaires.

Des chercheurs du groupe de Matteo Dal Peraro à l’EPFL ont accompli une grande avancée avec le développement d’un nouvel outil, appelé PeSTo (pour Protein Structure Transformer), capable de prédire les régions spécifiques de la surface d’une protéine pouvant interagir non seulement avec d’autres protéines mais aussi avec des acides nucléiques, des lipides, des ions et de petites molécules. Ces interfaces sont capitales pour la formation de complexes supramoléculaires et la modulation des fonctions.

«...cette méthode capture efficacement les interactions complexes au sein des structures protéiques pour permettre une prédiction précise des interfaces de liaison des protéines.»      Lucien Krapp, principal développeur de PeSTo

PeSTo s’appuie sur un réseau de neurones reposant sur la technologie des transformeurs. Dans le contexte de I’apprentissage automatique, un transformeur est un type de réseau neuronal conçu pour traiter des données séquentielles, telles que le langage naturel, en faisant appel à des mécanismes d’auto-attention pour attribuer des poids à différentes parties de la séquence d’entrée selon leur importance relative et faire des prédictions. Cette technologie lancée par Google Brain, en 2017, est aujourd’hui une composante centrale de bon nombre d’outils modernes d’IA.

Comment fonctionne PeSTo?

«Le modèle évalue le contexte chimique et physique de chaque atome en examinant tous les atomes voisins», explique Lucien Krapp, principal développeur de PeSTo. «En utilisant le mécanisme d'auto-attention, il se concentre sur les atomes et les interactions significatifs au sein de la structure de la protéine. Cela signifie que cette méthode capture efficacement les interactions complexes au sein des structures protéiques pour permettre une prédiction précise des interfaces de liaison des protéines».

Comme les prédictions de PeSTo sont basées uniquement sur la position dans l'espace et le type d'atomes, il peut faire des prédictions sans avoir besoin de décrire la physique et la chimie de l'interface de la protéine à l'aide de méthodes externes supplémentaires. Cela élimine les «frais généraux» liés au calcul préalable des surfaces moléculaires et des propriétés supplémentaires, ce qui le rend beaucoup plus rapide, robuste et général que les méthodes actuelles.

PeSTo a ainsi la vitesse suffisante pour traiter des ensembles volumineux de données structurelles protéiques, p. ex. de simulations moléculaires dynamiques ou même des «foldomes» entiers, avec à la clé une accélération des découvertes d’interfaces non détectées dans les structures statiques conventionnelles déterminées expérimentalement.

PeSTo est plus performant que les autres méthodes de prédiction des interfaces d’interaction des protéines et capable de déterminer les interactions avec des acides nucléiques, des lipides, des ligands, des ions et de petites molécules avec un haut degré de confiance. De par son faible coût de calcul, il représente un outil précieux pour la communauté scientifique.

PeSTo appliqué au foldome humain

Les chercheurs ont appliqué PeSTo à une base de données de structures protéiques 3D prédites qui s’étoffe de plus en plus, le « foldome » humain. Leur analyse des interactions entre les protéines humaines et d’autres molécules a abouti à des informations détaillées sur l’«interfaceome» humain, c’est-à-dire la totalité des interfaces interagissant avec les protéines dans le corps humain. Ils ont utilisé pour cela les ressources computationnelles de la base de données AlphaFold European Bioinformatics Institute (AF-EBI).

PeSTo a été mis à disposition gratuitement et sans inscription sur un serveur web convivial, gratuitement et sans enregistrement préalable. Toutes les structures ou modèles protéiques au format PDB peuvent être soumis. Les interfaces prédites peuvent être visualisées directement dans le navigateur. Les interfaces prédites peuvent être visualisées directement dans le navigateur avec des informations supplémentaires sur la confiance de la prédiction par résidu.

Dans leur article publié dans Nature Communications, les auteurs soulignent divers avantages de PeSTo par rapport aux méthodes antérieures, notamment la possibilité de traiter des formes de toutes sortes de molécules sans nécessairement avoir toutes les précisions physico-chimiques à leur sujet. Ces atouts font de PeSTo un outil plus puissant et plus général pour l’étude des systèmes moléculaires et de leurs interactions.