Wir erleben derzeit, wie Computer­algorithmen die Biologie revolutionieren

Mit künstlicher Intelligenz lässt sich die 3D-Struktur von Proteinen vorhersagen. Bald schon dürfte es mit solchen Algorithmen möglich werden, massgeschneiderte künstliche Proteine zu entwickeln, schreibt Beat Christen.
Proteine sind fadenförmige Moleküle, die sich zu einer bestimmten dreidimensionalen Form zusammenlagern. (Grafik: Shutterstock)

Computeralgorithmen unterstützen seit Jahrzehnten die biomedizinische Forschung und sind dabei ständig wichtiger geworden. Was wir derzeit erleben, ist allerdings ein Quantensprung, der alles Bisherige in den Schatten stellt, und der ungeahnte Auswirkungen haben wird: Mit Algorithmen der Künstlichen Intelligenz (KI) ist es möglich geworden, alleine anhand der linearen Abfolge der Bausteine von Proteinen – der Aminosäuren – vorauszusagen, zu welcher dreidimensionalen Struktur sich diese Kette von Bausteinen zusammenlagert, und das extrem genau.

Um die Bedeutung davon zu verstehen, muss man wissen, dass es in der Biologie auf zellulärer Ebene eigentlich immer um die räumliche Wechselwirkung von Molekülen geht, und diese Wechselwirkung wird bestimmt durch deren dreidimensionale Struktur. Erst wenn wir Strukturen und Wechselwirkungen kennen, verstehen wir die Biologie. Und nur wenn wir die Struktur von Molekülen kennen, können wir gezielt Medikamente entwickeln, welche die Funktion dieser Moleküle beeinflussen.

Bis jetzt konnte man die dreidimensionale Struktur von Proteinen mit drei experimentellen Methoden bestimmen: Röntgenstrukturanalyse, Kernspinresonanz sowie seit wenigen Jahren die Kryoelektronenmikroskopie. Dass nun mit KI eine vierte präzise Methode dazukommt, hat nicht nur mit verbesserten KI-Algorithmen und den heute zur Verfügung stehenden grossen Rechenleistungen zu tun. Damit KI präzise Voraussagen machen kann, braucht sie auch sehr viele Daten in hervorragender Qualität, mit denen sie trainiert werden kann. Möglich geworden ist der Quantensprung somit dank immenser Fortschritte und Anstrengungen in beiden Bereichen: der Datenwissenschaft und der experimentellen Proteinforschung.

Wettbewerb von privater und öffentlicher Forschung

Im Scheinwerferlicht steht derzeit vor allem das KI-Programm Alphafold von Deepmind, einer zum Google-Konzern gehörenden Firma. Diese ist derzeit wohl der wichtigste Player bei der Vorhersage von Proteinstrukturen. In der öffentlichen Diskussion geht allerdings oft unter, dass Deepmind längst nicht der einzige Akteur in diesem Feld ist und insbesondere rund um David Baker von der University of Washington exzellente Forschung betrieben wird.

Diese Konkurrenz von privater und öffentlicher Forschung dürfte das Forschungsfeld insgesamt beflügelt und vorangetrieben haben. Selbstverständlich behalten die privaten Akteure viele ihrer Erkenntnisse aus Geschäftsinteresse für sich. Dennoch führte die hochkompetitive Forschung auch dazu, dass sich die veröffentlichten KI-Algorithmen, welche die ganze Wissenschaftsgemeinschaft nun verwenden und weiterentwickeln kann, immens verbessert haben. Ich gehe davon aus, dass der Trend weitergeführt wird. Bald werden uns KI-Algorithmen hochpräzise Strukturen für alle uns bekannten Proteine liefern. Dies wird uns ermöglichen, weitere zielgenaue Medikamente am Computer zu entwerfen.

«Der logische nächste Schritt wird nun sein, die KI-Algorithmen in umgekehrter Richtung zu verwenden.»      Beat Christen

Ausgehend von einer am Computer entwickelten dreidimensionalen Molekülstruktur dürfte es in Zukunft möglich werden, mit KI eine Abfolge von Aminosäuren zu berechnen, die sich genau zur gewünschten Struktur mit der gewünschten molekularen Funktion zusammenlagert.

Ist diese Abfolge von Aminosäuren einmal bestimmt, kommt mein Forschungsgebiet ins Spiel. Ich befasse mich mit der Entwicklung von künstlichen Genen und Genomen und benütze ebenfalls Computeralgorithmen. Ausgehend von Aminosäuren-Abfolgen berechnen wir, wie diese in Gen-Baustein-Abfolgen übersetzt werden, also in DNA. Und zwar auf eine Weise, dass sich diese Gene in der Praxis auch einfach künstlich herstellen lassen.

Umgekehrter Informationsfluss

Es dürfte somit bald möglich sein, ausgehend von einer beliebigen, am Computer entwickelten dreidimensionalen Proteinstruktur ein künstliches Gen zu berechnen und dieses zu synthetisieren. Biotechnologisch lassen sich damit in Mikroorganismen künstliche Proteine herstellen, zum Beispiel neue pharmazeutische Wirkstoffe, Impfstoffe oder für die Industrie interessante Enzyme.

Von den allerersten Lebewesen vor mehreren Milliarden Jahren bis jetzt ist biologische Informationen immer in Form von DNA gespeichert worden. In biologischen Zellen wird diese Information übersetzt, zunächst in RNA-Moleküle, dann in Proteine. Bis jetzt gibt es keinen Prozess, der diesen Informationsfluss umkehrt und Protein-Information in DNA-Information zurückübersetzt. Mit KI wird sich das nun bald ändern. Für Biologen wie mich ist das eine unglaublich spektakuläre Entwicklung. Sie wird einen riesengrossen Einfluss haben auf die Biotechnologie und die Medizin.

Zum Autor

Beat Christen ist Professor am Departement Biologie der ETH Zürich.