Un nouveau site pour les sciences des données

Un nouveau site du Swiss Data Science Center verra le jour à l’Institut Paul Scherrer PSI. Le Conseil des EPF a approuvé à cet effet une augmentation de 5 millions de francs du budget du grand axe stratégique Sciences des données. Cette expansion devrait surtout permettre d’améliorer l’évaluation et le traitement des quantités croissantes de données que génèrent les grandes installations de recherche complexes, les réseaux de capteurs ainsi que les banques de données du PSI et des trois autres stations de recherche fédérale Empa, WSL et Eawag. Les ressources et l’expertise seront mises à disposition de tous les instituts du Domaine des EPF.
Un autre site du Swiss Data Science Center au PSI devrait donner un nouvel élan à la science des données en Suisse. (Shutterstock.com)

Des méthodes de mesure plus précises et plus modernes sont synonymes d’informations plus détaillées sur le monde qui nous entoure. Mais elles génèrent en conséquence une masse accrue de données. «Traiter et évaluer ces dernières représente un défi toujours plus important», explique Gerd Mann, responsable général de l’informatique au PSI.

Le Swiss Data Science Center (SDSC) aide le Domaine des EPF à relever les défis spécifiques aux problèmes de recherche nécessitant un traitement complexe des données grâce à son expertise et de nouvelles méthodes, telles que l’apprentissage automatique et l’intelligence artificielle. Le SDSC a vu le jour en 2017 dans le cadre du grand axe stratégique Sciences des Données. Pour l’heure, il est sis à l’ETH Zurich et à l’EPFL. Un troisième site sera mis en place au cours des prochaines années au PSI à Villigen. «Cette nouvelle unité contribuera à davantage combler le fossé entre les data scientists et les domain scientists, tout en répondant à l'explosion des données scientifiques collectées par les infrastructures de recherche à grande échelle en Suisse», déclare Olivier Verscheure, Directeur du SDSC.

A cette fin, le PSI cherche aussi à élargir sa collaboration avec le Centre suisse de calcul scientifique Centro Svizzero di Calcolo Scientifico CSCS.

L’explosion des données: une opportunité pour la recherche scientifique

Selon certaines estimations, au cours des quatre prochaines années, les quantités de données générées chaque année rien qu’au PSI vont passer d’environ 3,6 pétaoctets aujourd’hui (soit 3,6 millions de milliards d’octets) à plus de 50 pétaoctets. Cette augmentation est due notamment à l’upgrade prévu de la Source de Lumière Suisse (projet SLS 2.0), mais aussi à la mise en service régulier du laser à rayons X à électrons libres SwissFEL, avec des lignes de faisceaux supplémentaires et donc de nouveaux détecteurs encore plus complexes.

«Il n’y a pas que le PSI qui doive faire face au défi et aux opportunités dont s’accompagnent ces quantités croissantes de données, ajoute Gerd Mann. C’est aussi le cas d’autres domaines de recherche au sein et en dehors du Domaine des EPF.» Autrement dit, partout où la recherche porte sur des systèmes complexes, on mesure aujourd’hui davantage de données et celles-ci sont plus complexes. Ce constat vaut aussi, par exemple, pour les sciences de la vie et les sciences de l’environnement, qui travaillent beaucoup sur la base de photos et de vidéos. Or les enregistrements vidéo à haute résolution, par exemple, produisent plus 7 téraoctets de données brutes par heure.