Entwicklung molekularer Interaktionen mit maschinellem Lernen

Mit Hilfe von durch Deep Learning erzeugten «Fingerabdrücken» zur Charakterisierung von Millionen von Proteinfragmenten haben EPFL-Forschende rechnerisch neuartige Proteinbinder entwickelt, die sich nahtlos an wichtige Ziele anlagern, darunter das SARS-CoV-2-Spike-Protein.
Proteinoberflächen variieren stark und sind dynamisch, so dass es schwierig ist, vorherzusagen, wie und wo Bindungsereignisse stattfinden werden. © Ella Maru Studio

2019 entwickelten Wissenschaftlerinnen und Wissenschaftler des gemeinsamen Labors of Protein Design and Immunoengineering (LPDI) der Fakultäten für Ingenieurwesen und für Life Sciences, unter Leitung von Bruno Correia, MaSIF, eine auf maschinellem Lernen basierende Methode zum Scannen von Millionen von Proteinoberflächen innerhalb von Minuten, um deren Struktur und funktionale Eigenschaften zu analysieren. Das ultimative Ziel der Forschenden war es, Proteininteraktionen rechnerisch zu entwerfen, indem sie optimale Übereinstimmungen zwischen Molekülen auf der Grundlage ihrer chemischen und geometrischen «Fingerabdrücke» auf der Oberfläche finden.

Vier Jahre später haben sie genau das erreicht. In einem in Nature veröffentlichten Artikel berichten sie, dass sie brandneue Proteine, so genannte Binder, entwickelt haben, die mit vier therapeutisch relevanten Proteinzielen interagieren sollen, darunter das SARS-CoV-2-Spike-Protein.

Entwicklung einer perfekten molekularen Übereinstimmung

Physikalische Wechselwirkungen zwischen Proteinen beeinflussen alles, von der Zellsignalisierung über das Wachstum bis hin zu Immunreaktionen. Daher ist die Fähigkeit, Protein-Protein-Wechselwirkungen zu kontrollieren, von grossem Interesse für die Bereiche Biologie und Biotechnologie. Während die Darstellung der Proteinbindung in Lehrbüchern so einfach aussieht wie das Zusammenfügen von Puzzleteilen, ist die Realität komplexer: Proteinoberflächen variieren stark und sind dynamisch, so dass es schwierig ist, vorherzusagen, wie und wo Bindungsereignisse stattfinden werden.

«Ein Puzzleteil ist zweidimensional, aber bei Proteinoberflächen betrachten wir mehrere Dimensionen: die chemische Zusammensetzung, z. B. Wechselwirkungen zwischen positiven und negativen Ladungen, die Komplementarität der Form, die Krümmung usw.», erklärt LPDI-Doktorand und Mitautor Anthony Marchand.

«Die Idee, dass alles, was in der Natur bindet, komplementär ist – zum Beispiel bindet eine positive Ladung mit einer negativen Ladung – ist eine seit langem bestehende Idee in diesem Bereich, die wir in unserem Berechnungsrahmen erfasst haben.»

Um neuartige Proteinbinder zu entwerfen, verwendeten die Forschenden MaSIF, um «Fingerabdrücke» von Proteinoberflächen zu erstellen, und identifizierten dann komplementäre Oberflächen für wichtige Zielstellen von Proteinen aus einer Datenbank von Fragmenten. Anschließend pfropften sie die Fragmente digital auf grössere Proteingerüste auf und wählten die resultierenden Bindemittel aus, von denen vorhergesagt wurde, dass sie am besten mit ihren Zielen interagieren. Nachdem sie diese ausgewählten Bindemittel im Labor synthetisiert und getestet hatten, konnten die Forscher die rechnerisch erstellte Hypothese bestätigen.

«Die Tatsache, dass wir in der Lage sind, neuartige, ortsspezifische Proteinbinder in nur wenigen Monaten zu entwickeln, macht diese Methode für Therapeutika sehr interessant. Es ist nicht nur ein Werkzeug, es ist eine Pipeline», sagt Marchand.

Direkt vom Computer aus

Als die COVID-Pandemie ausbrach, waren die Forschenden gerade dabei, Proteinbinder für drei wichtige Ziele der Krebsimmuntherapie zu entwickeln, und nahmen das SARS-CoV-2-Spike-Protein in ihre Liste auf. Mit ihrem Ansatz zeigten die vier hergestellten Binder eine hervorragende Affinität zu ihren Zielen.

Die Erfolgsquote von MaSIF in Verbindung mit seiner Schnelligkeit und seiner Fähigkeit, qualitativ hochwertige, ortsspezifische Designs zu erstellen, belegen sein therapeutisches Potenzial. Die Fähigkeit, in so kurzer Zeit präzise Proteinbinder zu generieren, könnte beispielsweise ein grosser Vorteil für epidemiologische Anwendungen sein, wie im Fall des SARS-CoV-2-Spike-Proteins. Marchand sieht auch die Möglichkeit, dass die Pipeline die Entwicklung von chimären Antigenrezeptor-Proteinen (CAR-T) erleichtert, die so konstruiert werden können, dass sie Immunzellen von Patienten in die Lage versetzen, Krebszellen zu bekämpfen.

«Weitere Fortschritte bei den Methoden des maschinellen Lernens werden dazu beitragen, unsere Methode zu verbessern, aber unsere Arbeit bietet bereits heute eine Strategie für die Entwicklung innovativer Therapien zum Nutzen der Patienten durch die schnelle Entwicklung proteinbasierter Therapeutika – direkt aus dem Computer.»