Ein Algorithmus für schärfere Protein-Filme

Proteine sind biologische Moleküle, die in sämtlichen Lebensformen beinahe alle biochemischen Aufgaben übernehmen. Dabei führen die winzigen Strukturen ultraschnelle Bewegungen aus. Um diese dynamischen Prozesse künftig genauer als bisher ergründen zu können, haben Forschende einen neuen Auswertungsalgorithmus entwickelt, mit dem sich Messungen an Freie-Elektronen-Röntgenlasern wie dem SwissFEL effizienter auswerten lassen. Diesen stellen sie nun im Fachblatt Structural Dynamics vor.
Die Physikerin Cecilia Casadei war Teil eines internationalen Teams, das einen neuen Auswertungsalgorithmus entwickelt hat. Mit ihrer Methode namens «Low-pass spectral analysis» lassen sich die Daten effizienter auswerten als bisher. (Photo: Institut Paul Scherrer/Mahir Dzambegovic)

Manchmal, wenn man beim Autofahren das Navigationssystem benutzt, verortet einen das Gerät kurzzeitig neben der Strasse. Dies liegt an der Ungenauigkeit der GPS-Positionierung, die mehrere Meter beträgt. Der Algorithmus im Navi wird dies jedoch bald bemerken und auf dem Bildschirm die angezeigte Fahrspur korrigieren, also das Fahrzeug wieder auf der Strasse verorten.

Ein vergleichbares Prinzip, um unrealistische Bewegungsabläufe zu erkennen, hat nun ein Team von Forschenden um die PSI-Physikerin Cecilia Casadei erfolgreich angewandt. Ihre Untersuchungsobjekte sind allerdings rund eine Milliarde Mal kleiner als ein Personenwagen: Es handelt sich um Proteine. Diese Bausteine des Lebens erfüllen entscheidende Funktionen in allen bekannten Organismen. Dabei führen sie oft ultraschnelle Bewegungen aus. Diese genau zu untersuchen, ist entscheidend, um Proteine besser zu verstehen, was beispielsweise zur Entwicklung neuer medizinischer Wirkstoffe beitragen kann.

Wie man Proteine «filmt»…

Damit sich Proteinbewegungen künftig besser als zuvor ergründen lassen, hat Casadei gemeinsam mit weiteren PSI-Forschern, einem Forscher am DESY in Hamburg sowie weiteren Kollegen an der Universität Wisconsin in Milwaukee, USA, einen verbesserten Algorithmus entwickelt. Dieser wertet Daten aus, die in Experimenten an einem Freie-Elektronen-Röntgenlaser (XFEL) gewonnen wurden. Ein XFEL ist eine Grossforschungsanlage, die extrem intensive und kurze Blitze aus Röntgenlicht in Laserqualität liefert. Hier lassen sich mit einer Methode namens zeitaufgelöste serielle Femtosekunden-Kristallografie (auf Englisch: time-resolved serial femtosecond X-ray crystallography (TR-SFX)) die ultraschnellen Bewegungen der Proteine vermessen.

Diese Messungen sind aus mehreren Gründen komplex: Die Proteine sind viel zu klein, als dass man sie direkt ablichten könnte; ihre Bewegungsabläufe sind enorm schnell; und zudem zerstört der intensive Röntgenlichtpuls eines XFEL die Proteine komplett. Auf der experimentellen Ebene löst TR-SFX bereits all diese Probleme: Es werden keine einzelnen Moleküle vermessen, sondern man lässt sehr viele gleichartige Proteinmoleküle in regelmässiger Anordnung zu Proteinkristallen zusammenwachsen. Scheint das XFEL-Röntgenlicht auf diese Kristalle, wird die Information rechtzeitig eingefangen, bevor die Kristalle und ihre Proteine vom Lichtpuls zerstört werden. Die rohen Messdaten liegen dann als sogenannte Diffraktionsbilder vor: Lichtpunkte, die durch die regelmässige Anordnung der Proteine im Kristall entstehen und die von einem Detektor registriert werden.

… und wie man die Messdaten auswertet

Wo die experimentellen Herausforderungen bewältigt sind, fängt die Auswertung der Daten erst an. «Die Vermessung jedes einzelnen Kristalls liefert nur zwei Prozent der Daten eines vollständigen Bildes.» Diese sogenannte Unvollständigkeit hat physikalische und experimentelle Gründe und lässt sich nur aus der Welt schaffen, indem man auf sinnvolle Weise die Messdaten vieler Kristalle kombiniert. Wie genau man dabei vorgeht, das ist Gegenstand von Casadeis Forschung.

Die bisher etablierte Methode nennt sich «Binning and Merging», zu Deutsch etwa «Einteilung und Verschmelzung». «Mit ihr wurde im letzten Jahrzehnt schon viel erreicht», sagt Casadei. Bei dieser Methode werden die Daten in Zeitabschnitte eingeteilt und alle Daten innerhalb eines Abschnitts werden gemittelt. Allerdings gehen bei dieser Mittelung auch viele Detailinformationen verloren. «Man könnte sagen, die Einzelbilder des Proteinfilms sind dann alle ein wenig verwaschen», so Casadei weiter. «Wir haben darum eine Methode entwickelt, mit der sich mehr aus den Messdaten herausholen lässt.»

Die neue Methode, die Casadei und ihre Kollegen nun erarbeitet haben, trägt den Namen «Low-pass spectral analysis», kurz LPSA. «Ähnlich wie in der Elektronik oder in der Audiotechnik wenden wir einen Tiefpassfilter an», erklärt Casadei. «Allerdings kommt er bei uns in Form anspruchsvoller linearer Algebra vor. Wir wenden diese Formeln an, um unerwünschtes Rauschen aus den Daten zu entfernen, ohne die relevanten Details zu verlieren.»

Kurz und einfach gesagt: Die Rohdaten, also die Diffraktionsbilder der Proteinkristalle, werden über die gesamte Proteinbewegung hinweg verfolgt. Diese Bewegung wird als geschmeidig, also ruckelfrei, angenommen. Ähnlich wie das Navigationssystem sich korrigiert, wenn das Auto vermeintlich den Verlauf der Strasse verlässt, so verringert auch der neue Algorithmus von Casadei und ihren Kollegen Fehler in der Rekonstruktion der Proteinbewegung.

HDR für Protein-Filme

Laien werden in den neuen Protein-Filmen womöglich keinen immensen Unterschied erkennen. Aber für die Cineasten an Freie-Elektronen-Röntgenlasern ist die Verbesserung vergleichbar wie der Umstieg von einem DVD-Film auf HDR-Qualität.

«Vor allem bedeutet der neue Algorithmus für die Forschenden hier am SwissFEL des PSI, dass sie nun mehr Informationen aus ihren Daten herausholen können», sagt Casadei. Im Umkehrschluss bedeutet dies, dass der Algorithmus helfen kann, lange Messzeiten zu verkürzen. Da Strahlzeit an Grossforschunganlagen allgemein und am SwissFEL im Besonderen stets knapp ist, ist dies eine höchst willkommene Aussicht für Protein-Forschende, die diese Spitzenanlage nutzen.

Originalveröffentlichung

Low-pass spectral analysis of time-resolved serial femtosecond crystallography data.
C. M. Casadei, A. Hosseinizadeh, T. Weinert, J. Standfuss, R. Fung, G. F. X. Schertler, R. Santra
Structural Dynamics, 26.05.2023 (online)
DOI: 10.1063/4.0000178