Un outil de l'EPFL montre le déclin du discours politique aux USA

Quotebank, un nouvel outil mis au point par l’EPFL, a permis aux chercheuses et chercheurs de fournir les premières données probantes à grande échelle d’un changement radical vers une tonalité politique plus négative depuis le début de la campagne de la primaire de Donald Trump en juin 2015.
Dans l’étude, publiée dans Nature Scientific Reports, les chercheuses et chercheurs se sont intéressés aux personnalités politiques américaines. (© iStock 2023)

Selon la plupart des Américaines et Américains, la tonalité et la nature du débat politique aux États-Unis sont devenues plus négatives ces dernières années. Plus de la moitié d’entre eux a l’impression que Donald Trump en est le responsable.

Mais ces impressions subjectives reflètent-elles le véritable état du débat politique aux États-Unis? La politique ayant des répercussions sur presque tous les aspects de notre vie, la réponse à cette question a d’importantes implications pour la société, notamment le niveau de soutien apporté aux institutions politiques et leur légitimité perçue, ce qui entraîne une baisse de la confiance dans les processus politiques.

Jusqu’à présent, les données probantes d’une évolution perçue vers une tonalité politique plus négative ont été rares, en partie en raison de la difficulté d’obtenir tous les propos des personnalités politiques. Des chercheuses et chercheurs du Laboratoire de science des données (dlab) de la Faculté informatique et communications, ont mis au point une nouvelle base de données appelée Quotebank. Ils l’ont utilisée pour analyser l’évolution de la tonalité du langage des personnalités politiques américaines, tel qu’il est rapporté dans les médias en ligne, entre 2008 et 2020.

Quotebank contient un corpus de près d’un quart de milliard (235 millions) de citations uniques. Celles-ci sont extraites de 127 millions d’articles d’actualité publiés par un ensemble complet de sources d’information en ligne sur une période de près de 12 ans. Un algorithme d’apprentissage machine attribue ensuite automatiquement les citations aux personnes qui les ont vraisemblablement prononcées.

Dans l’étude, publiée dans Nature Scientific Reports, les chercheuses et chercheurs se sont intéressés aux personnalités politiques américaines, en extrayant un sous-ensemble de 24 millions de citations de 18 627 oratrices et orateurs, enrichies d’informations biographiques provenant de la base de connaissances Wikidata. Comme il n’existait auparavant aucun ensemble comparable de citations attribuées à une oratrice ou un orateur, Quotebank a permis aux chercheuses et chercheurs d’analyser la tonalité du langage public des personnalités politiques américaines, tel qu’il est perçu par les médias d’information en ligne, à un niveau de représentativité et d’exhaustivité jusqu’alors impossible.

La tonalité négative confirmée

«Afin de quantifier la prévalence du langage négatif au fil du temps, nous avons utilisé des outils psycholinguistiques reconnus pour noter chaque citation en fonction de son contenu émotionnel. Nous avons regroupé les citations par mois et nous avons travaillé avec les séries chronologiques ainsi obtenues», explique le professeur Robert West, directeur du dlab.

«Nous avons constaté que, pendant le mandat de Barack Obama à la Maison-Blanche, la fréquence des mots à connotation négative a régulièrement diminué, mais qu’elle a soudainement augmenté lors des campagnes des primaires de 2016. Si l’on retire les citations de Donald Trump des données, l’augmentation des mots à connotation négative observée en juin 2015, lorsque Trump a lancé sa campagne, a chuté de 40%. À l’inverse, si l’on conserve les citations de Trump, l’ampleur du phénomène a augmenté de 63%. Trump a donc été clairement le principal responsable de ce phénomène, même s’il n’est pas le seul», poursuit Robert West.

Les résultats confirment l’impression de la plupart des Américaines et Américains, à savoir que ces dernières années ont été marquées par un changement profond et durable vers une tonalité plus négative dans le langage des personnalités politiques américaines tel qu’il se reflète dans les actualités en ligne, et que l’apparition de Donald Trump sur la scène politique était liée à un changement de direction, plutôt qu’à une poursuite des tendances existantes en matière de tonalité politique.

«Nos résultats ont des répercussions sur notre façon de voir le passé et l’avenir de la politique américaine. Ils soulignent les symptômes de la toxicité croissante de la politique américaine sous un nouvel angle et mettent en évidence le danger futur d’une boucle de rétroaction positive de la négativité. Trouver les moyens de sortir de ce cycle de négativité est l’un des grands défis auxquels sont confrontés les États-Unis aujourd’hui», confie Robert West.

Quotebank

L’article intitulé United States politicians’ tone became more negative with 2016 primary campaigns a été le premier à être publié à l’aide de Quotebank, le nouvel outil conçu et créé par le dlab, et d’autres projets de recherche sont en cours d’élaboration. L’équipe a commencé à travailler sur la plateforme en 2017. Elle a utilisé l’intelligence artificielle pour extraire l’ensemble de données, puis a peaufiné le cadre de traitement du langage naturel open source BERT de Google pour la tâche spécifique d’attribution des citations aux oratrices et orateurs.

Il contient deux types de données: des données centrées sur les citations, dans lesquelles les citations sont agrégées pour toutes leurs occurrences dans les actualités, et des données centrées sur les articles: chaque entrée de cet ensemble de données est un article d’actualité qui contient une ou plusieurs citations.

Doctorant au dlab, Akhil Arora, dont les recherches ont porté sur Quotebank, se dit fier d’avoir contribué au développement d’un outil très accessible qui peut jouer un rôle clé dans le maintien d’une démocratie impartiale. Il a également salué les contributions de Jozef Coldenhoff, étudiant en master affilié au dlab, qui a joué un rôle important dans le déploiement de l’outil.

«Ces données ont toujours été accessibles aux programmeurs, mais grâce à cette interface, tout le monde peut désormais les explorer. Je pense que Quotebank est très utile pour la responsabilisation et la vérification des faits. Pour la première fois, nous disposons d’un outil puissant en libre accès qui vous permet de rechercher tous les faits relatifs à ce que quelqu’un a dit. En politique, c’est très important, déclare Akhil Arora. Un autre outil est la réflexivité. Les journalistes, par exemple, n’ont peut-être même pas conscience de la détérioration de leur domaine au fil du temps. Les recherches sur Trump montrent clairement une augmentation de l’utilisation d’un langage non objectif.»

Robert West est de cet avis. L’une des limites de Quotebank est que l’ensemble de données est statique. Selon lui, les partenariats pourraient surmonter les difficultés d’accès aux données.

«Notre technologie est simple. Ainsi, au lieu d’apporter des données à notre algorithme, Google News, Reuters ou Bloomberg, qui collectent des informations et les mettent à la disposition du public, pourraient utiliser notre algorithme et ajouter une interface de citations à leur base de données. Ce serait le scénario idéal. Nous aurions un baromètre permanent de l’état de notre démocratie et de nos structures d’information, ce qui nous permettrait d’agir si les choses commençaient à se gâter», conclut-il.