Le séquençage de l'ARN entre dans l'ère du big data

La spin-off de l’EPFL Alithea Genomics donne un coup d’accélérateur à l’analyse de l’ARN en vrac, essentiel notamment dans la découverte de biomarqueurs et de médicaments. Sa technologie permet d’apposer facilement des codes-barres moléculaires de reconnaissance à des tronçons d’ARN qui peuvent ensuite être analysés par centaines dans une seule éprouvette.
© 2022 Istock

La recherche de nouveaux médicaments et de biomarqueurs, indicateurs de certaines pathologies, passe aujourd’hui de plus en plus par le séquençage des ARN messagers. Un instantané de ces envoyés spéciaux de l’ADN, permet en effet de décrypter peu à peu le «langage» intracellulaire, détecter les anomalies et apprendre à les réparer. Pour obtenir des statistiques intéressantes, apprendre à des intelligences artificielles ce qui diffère de la norme et donner un coup d’accélérateur à la recherche, l’heure du big data de l’ARN est attendu: profiler massivement et rapidement l’état fonctionnel de milliers d’échantillons. La technologie de la spin-off Alithea Genomics permet d’étiqueter les brins d’ARN afin de pouvoir les analyser pêle-mêle dans un seul tube, peu importe le génome dont ils proviennent. Ce procédé, 25 fois moins cher que la méthode actuellement utilisée, fait passer le temps nécessaire pour le décryptage de centaines de génomes de plusieurs jours à quelques heures. Forte des 1 million de francs levés en mai, la jeune entreprise qui emploie sept personnes se prépare à produire ses kits à plus large échelle et élargir le champ de ses applications.

Un tri à l’image des bagages dans un aéroport

Connu depuis longtemps pour l’ADN, le séquençage de nouvelle génération s’avère plus compliqué pour l’ARN. Le principe de ce type d’analyse est de réunir divers échantillons pour les analyser en une seule fois afin de gagner en rapidité et en coût. Une des étapes importantes pour le décryptage rapide est la constitution d’une bibliothèque. Des code-barres, qui se présentent sous la forme d’une courte séquence d'ADN connue, identifient les éléments d’un même groupe. L’objectif est de pouvoir les réattribuer ensuite, via un logiciel dédié, au bon échantillon. Le système est à l’image des bagages dans le centre de tri d’un aéroport: ils finiront par se retrouver dans le bon avion.

La constitution d’une bibliothèque d’ADN dans les laboratoires de recherche est un procédé commun qui se fait via des kits choisis en fonction du type de cellule et du système d’analyse souhaité. Pour l’ARN, les échantillons sont encore le plus souvent analysés un à un, car les étapes, même si elles sont globalement les mêmes, sont plus délicates et souvent sujettes à des biais. Le procédé d’Alithea Genomics, appelé Bulk RNA Barcoding and sequencing (BRB-seq) et décrit dans un article publié en 2021 dans Genome Biology, permet aux chercheurs de préparer leurs échantillons d’ARN et leur donner un code-barre de manière simple et rapide. Jusqu’à 384 échantillons peuvent ensuite être réunis dans une éprouvette pour les séquencer simultanément. Un gain de temps et d’argent important auquel s’ajoute une économie dans la quantité de plastique et de produit utilisé.

Une fois l’échantillon séquencé par des machines de laboratoire traditionnelles, les données sont facilement attribuées au bon génome grâce à un logiciel en cloud développé spécifiquement par l’entreprise. «La version actuelle est en ligne et peut être utilisée librement par tous les utilisateurs de nos kits», note Riccardo Dainese.

«C'est très excitant de voir que notre technologie commence à ouvrir des portes pour l'application généralisée du séquençage d'ARN vers des applications industrielles, soit au-delà de la recherche fondamentale.»      Riccardo Dainese, CEO d’Alithea Genomics

L'industrie intéressée

C’est dans un premier temps pour faciliter ses propres recherches sur le génome que le Laboratoire de biologie des systèmes et de génétique, ne trouvant rien d’équivalent sur le marché, a développé cette méthode de séquençage de l’ARN. Le procédé, désormais commercialisé par la start-up, a été utilisé avec succès par exemple dans une analyse de l’ARN messager des adipocytes pour évaluer l'expression de certains gènes mitochondriaux chez la drosophile, pour évaluer l'efficacité de thérapies ciblées contre le cancer ou encore fournir de nouvelles informations sur le rythme circadien. De nombreux autres laboratoires s’y sont intéressés depuis, dont de grandes sociétés pharmaceutiques. «C'est très excitant de voir que notre technologie commence à ouvrir des portes pour l'application généralisée du séquençage d'ARN vers des applications industrielles, soit au-delà de la recherche fondamentale», souligne Riccardo Dainese, CEO d’Alithea Genomics.

Ce nouveau procédé permet d’analyser beaucoup plus d'échantillons avec le même budget, augmentant ainsi considérablement la portée et la reproductibilité des expériences. Mais plus largement, le passage au big data dans le domaine de l’ARN messager est une condition sine qua non aux progrès rapides en transcriptomique. Le transcriptome est un instantané de l’ARN messager dans une cellule à un moment donné. Alors que le génome, l’ADN que l’on trouve dans le noyau des cellules, est principalement fixé dans le temps et spécifique à un organisme, le transcriptome varie en fonction du temps, du tissu ou du type cellulaire et de l'environnement. Obtenir grâce à une grande quantité de données, des statistiques et des analyses sur les molécules d’ARN présentes dans certaines situations permet de mieux comprendre le fonctionnement des cellules. Ces biomarqueurs pourront servir plus tard pour le diagnostic de certaines maladies ou la mise au point de nouveaux médicaments.

La start-up compte pour l’instant utiliser sa première levée de fonds pour accélérer la commercialisation, étendre le champ d’application de ses kits et personnaliser son logiciel d’analyse.