«Nous devons nous demander ce qu'il faut faire des données piratées»

Ces dernières années, plusieurs bases de données ont été piratées et les pirates ont publié les données volées sur l'internet. Les scientifiques sont-ils autorisé·e·s à utiliser ces données pour leurs recherches? Le bioéthicien de l'ETH Zurich Marcello Ienca et la professeure Effy Vayena ont abordé cette question dans un article publié dans la revue Nature Machine Intelligence. ETH News s'est entretenu avec Marcello Ienca.
Le biotethicien Marcello Ienca. (Photographie privée)

ETH News : Les scientifiques sont-ils autorisé·e·s à analyser les données piratées publiées sur Internet, d'un point de vue purement juridique ?
Marcello Ienca: La réponse courte est oui - du moins si les scientifiques ell·eux-mêmes ne sont pas responsables du piratage, car le piratage lui-même est un crime. Cependant, si des pirates anonymes téléchargent des données sur un dépôt public, il s'agit de données publiques. La réponse est moins claire lorsque les scientifiques cherchent à télécharger ces données sur leurs propres ordinateurs. Dans certaines juridictions, cela pourrait être interprété comme de la possession de biens volés. Toutefois, je n'ai connaissance d'aucun cas où des scientifiques ont été inculpé·es pour cela.

Et d'un point de vue éthique? Les scientifiques sont-il·les autorisé·es à faire tout ce qui est légalement permis, c'est-à-dire à analyser également des données qui ont été initialement volées à quelqu'un ?
Non, car la science n'est pas une activité comme une autre, mais une pratique culturelle qui a droit à des normes d'intégrité élevées. Nous, scientifiques, avons une responsabilité sociale dont nous devons nous acquitter. Ainsi, la simple perspective de nouvelles connaissances ne suffit pas pour mener une étude. La science doit être pratiquée avec soin et de manière responsable.

Dans votre travail, vous donnez quelques exemples d'analyses de données piratées: Les données détaillées des utilisateur·ices de la plateforme de rencontres Ashley Madison, et les documents de guerre en Afghanistan et en Irak de l'armée américaine. Des chercheur·ses ont analysé ces données au cours des dernières années. Était-ce éthique ?
Dans certains cas, cela a pu être justifié, dans d'autres moins. Dans notre étude, Effy Vayena et moi-même faisons valoir que la recherche scientifique avec des données piratées est toujours moralement problématique. Cependant, dans des circonstances et des conditions très spécifiques, une telle analyse pourrait être éthiquement acceptable. Dans notre étude, nous mentionnons six conditions:

  • La source des données et le contexte de la collecte des données doivent être rendus transparents. Cela devrait également empêcher les autres scientifiques de se sentir poussé·es à voler ell·eux-mêmes des données.
  • La vie privée et la protection des données doivent être respectées. Les scientifiques doivent anonymiser les données, même si des données personnelles sont accessibles au public dans le cadre d'un piratage.
  • Le projet de recherche ne doit pas exposer les personnes concernées à un risque plus important que celui qu'elles courent déjà du fait du piratage.
  • Le projet de recherche doit présenter un intérêt scientifique et social élevé.
  • L'objectif de la recherche ne peut être atteint qu'en utilisant les données piratées et pas autrement.
  • Et enfin: chaque projet de recherche qui utilise des données piratées devrait être approuvé par un comité d'éthique.

Existe-t-il réellement des limites à l'utilisation de données provenant de sources moralement répréhensibles? Serait-il éthique de réutiliser aujourd'hui les résultats d'expériences médicales sur des prisonniers dans les camps de concentration nazis afin de les réanalyser?
Il existe un consensus clair dans le monde scientifique selon lequel aucune étude non éthique ne devrait être réalisée. Et ces expériences étaient contraires à l'éthique, il n'y a aucun doute là-dessus. Plus difficile est la question de savoir ce que d'autres scientifiques sont autorisé·es à faire des résultats si les études ont déjà été réalisées. Car dans ce cas, les scientifiques ne sont pas impliqué·es dans le comportement contraire à l'éthique. En principe, les critères ci-dessus peuvent également être appliqués à d'autres cas de données obtenues de manière moralement problématique ou clairement répréhensible.

Retour aux données piratées accessibles au public. Aujourd'hui, la recherche avec des données accessibles au public ne nécessite généralement pas l'approbation d'un comité d'éthique. Un changement serait-il nécessaire?
Oui, à notre avis, la recherche avec des données piratées n'est pas la même que les autres recherches qui utilisent des données publiques. Ce ne devrait pas être la tâche des chercheur·ses individuel·les de déterminer si un projet de recherche avec des données piratées remplit les cinq premières conditions mentionnées. Cette évaluation devrait être effectuée par un comité d'éthique professionnel. On pourrait inclure ce point dans la législation sur la recherche sur l'humain·e.

Que reste-t-il à faire ?
Avec notre travail, nous souhaitons susciter un débat au sein de la communauté scientifique. Nous espérons que cette discussion aboutira à un consensus. Et nous tenterons de formuler des lignes directrices et des recommandations éthiques pour le traitement des données piratées, en collaboration avec des organisations internationales et des sociétés professionnelles et universitaires. Nous supposons qu'avec l'augmentation de la cybercriminalité, la quantité de données piratées accessibles au public va également augmenter. En tant que scientifiques, nous devons nous demander ce que nous devons faire de ces données.

Plus d'informations

Marcello Ienca était jusqu'à récemment un chercheur senior dans le groupe d'Effy Vayena, professeur de bioéthique à l'ETH Zurich, et il est maintenant chef de groupe à l'EPFL. Ses recherches portent notamment sur l'éthique et la gouvernance des données biomédicales, l'intelligence artificielle et les technologies émergentes à l'interface homme-machine.

Référence

Ienca M, Vayena E : Ethical requirements for responsible research with hacked data, Nature Machine Intelligence 2021, 3 : 744, doi :10.1038/s42256-021-00389-w