Un algorithme pour des films de protéines plus nets

Les protéines sont des molécules biologiques qui assurent pratiquement l’ensemble des tâches biochimiques dans toutes les formes de vie. Ce faisant, ces minuscules structures exécutent des mouvements ultrarapides. Pour pouvoir sonder plus précisément ces processus dynamiques, des scientifiques ont développé un nouvel algorithme d’évaluation qui permet d’analyser plus efficacement les mesures effectuées aux lasers à rayons X à électrons libres comme le SwissFEL. Ils viennent de présenter cet algorithme dans la revue spécialisée Structural Dynamics.
Cecilia Casadei, physicienne, fait partie d’une équipe internationale qui a développé un nouvel algorithme d’évaluation. Sa méthode baptisée low-pass spectral analysis permet d’évaluer plus efficacement les données générées lors des mesures de protéines aux lasers à rayons X à électrons libres. (Photo: Institut Paul Scherrer/Mahir Dzambegovic)

Parfois, lorsqu’on roule en voiture en utilisant un système de navigation, l’appareil nous localise brièvement à côté de la route. Ce phénomène est dû à l’imprécision du positionnement GPS, qui peut atteindre plusieurs mètres. L’algorithme du navigateur ne tarde pas à le remarquer et corrige l’affichage à l’écran, en nous repositionnant sur la route.

Une équipe de chercheurs, emmenée par Cecilia Casadei, physicienne au PSI, vient d’appliquer avec succès un système comparable, capable de reconnaître les séquences de mouvements irréalistes. Leurs objets d’étude, toutefois, sont environ un milliard de fois plus petits qu’une voiture: il s’agit de protéines. Ces constituants du vivant assurent des fonctions décisives dans tous les organismes connus. Ce faisant, ils exécutent souvent des mouvements ultrarapides. Si l’on veut mieux comprendre les protéines, il est essentiel d’étudier ces mouvements de manière précise pour pouvoir, par exemple, contribuer au développement de nouveaux principes actifs de médicaments.

Comment on «filme» les protéines …

Pour pouvoir mieux explorer à l’avenir les mouvements des protéines, Cecilia Casadei a développé un algorithme amélioré avec d’autres chercheurs du PSI, un chercheur du DESY, à Hambourg en Allemagne, et d’autres collègues de l’Université du Wisconsin, à Milwaukee aux Etats-Unis. Cet algorithme analyse les données générées lors d’expériences conduites à un laser à rayons X à électrons libres (XFEL). Un XFEL est une grande installation de recherche qui produit de brefs flashes de rayons X ayant la qualité du laser. Une méthode appelée cristallographie sérielle à l’échelle de la femtoseconde résolue en temps (ou TR-SFX de l’anglais time-resolved serial femtosecond X-ray crystallography) permet de mesurer à ces grandes installations les mouvements ultrarapides des protéines.

Ces mesures sont complexes pour plusieurs raisons: les protéines sont beaucoup trop petites pour être radiographiées directement; leurs mouvements sont extrêmement rapides; et de plus, l’intense impulsion de lumière de type rayons X d’un XFEL les détruit complètement. Au niveau expérimental, la TR-SFX résout tous ces problèmes: on ne mesure pas les molécules une à une, mais on fait croître un très grand nombre de molécules de protéines similaires, arrangées de manière régulière, pour former des cristaux de protéines. Lorsque la lumière de type rayons X du XFEL éclaire ces cristaux, l’information est captée à temps avant que les cristaux et leurs protéines ne soient détruits par l’impulsion lumineuse. Les données de mesures brutes sont alors disponibles sous forme de diagrammes de diffraction: des points lumineux qui apparaissent à cause de l’arrangement régulier des protéines dans le cristal et qui sont enregistrés par un détecteur.

… et comment on analyse les données de mesure

Mais si les défis de l’expérience sont surmontés, l’évaluation des données ne fait que commencer. «La mesure de chaque cristal ne fournit que 2 % des données nécessaire pour une image complète», souligne Cecilia Casadei. Cette incomplétude a des causes physiques et expérimentales, et ne peut être éliminée qu’en combinant de manière pertinente les données de mesures de nombreux cristaux. La manière dont il faut procéder précisément pour y arriver est l’objet des recherches de Cecilia Casadei.

La méthode établie à ce jour s’appelle ‘binning and merging’, c’est-à-dire ‘groupement et estimation de la moyenne’. «Elle a permis d’accomplir des progrès considérables ces dernières années», explique Cecilia Casadei. Dans le cas de cette méthode, les données sont réparties dans des périodes de temps et l’on calcule la moyenne de toutes les données qui se trouvent dans une période. Mais lors de ce calcul de moyenne, beaucoup d’informations sur les données se perdent. «On peut dire que les images individuelles du film de protéines sont ensuite quelque peu diluées, poursuit Cecilia Casadei. Nous avons donc développé une méthode qui permet d’extraire davantage des données de mesures.»

La nouvelle méthode que Cecilia Casadei et ses collègues ont mise au point s’appelle low-pass spectral analysis ou LPSA. «Comme dans l’électronique ou dans la technique audio, nous appliquons un filtre passe-bas, explique Cecilia Casadei. Mais chez nous, il se présente sous forme d’algèbre linéaire. Nous appliquons ces formules pour supprimer le bruit indésirable des données, sans pour autant perdre les détails importants.»

Pour simplifier: les données brutes, c’est-à-dire les diagrammes de diffraction des cristaux de protéines, sont suivies sur l’ensemble du mouvement de la protéine. L’algorithme présuppose que le mouvement est décrit par une evolution lisse, c’est-à-dire qu’il déroule sans à-coups. De la même manière que le navigateur se corrige lorsque la voiture quitte soi-disant la route, le nouvel algorithme de Cecilia Casadei et de ses collègues réduit lui aussi les erreurs lors de la reconstitution du mouvement de protéines.

Le HDR pour films de protéines

Les amateurs ne remarqueront sans doute pas d’immenses différences dans les nouveaux films de protéines. Mais pour les cinéastes aux lasers à rayons X à électrons libres, la différence est comparable au passage d’un film de qualité DVD à une qualité HDR.

«Le nouvel algorithme signifie avant tout pour les scientifiques au SwissFEL du PSI qu’ils peuvent dès à présent extraire davantage d’informations de leurs données», souligne Cecilia Casadei. Inversement, cela signifie que l’algorithme peut contribuer à raccourcir les temps de mesure. Or comme le temps de faisceau est toujours compté aux grandes installations de recherche en général et au SwissFEL en particulier, pour les scientifiques spécialisés dans le domaine des protéines qui utilisent cette installation de pointe, c’est une perspective bienvenue.

Publication originale

Low-pass spectral analysis of time-resolved serial femtosecond crystallography data.
C. M. Casadei, A. Hosseinizadeh, T. Weinert, J. Standfuss, R. Fung, G. F. X. Schertler, R. Santra
Structural Dynamics, 26.05.2023 (en ligne)
DOI: 10.1063/4.0000178