Comment les mots acquièrent leur signification

Des chercheurs du Collège des Humanités à l’EPFL ont recouru au machine learning pour découvrir comment les humains comblaient le fossé souvent important entre le signe et le sens dans la communication.
La recherche du DCML s’intéresse à l’énigme fondamentale de la communication. © iStock/SI photography

Robert Lieck et Martin Rohrmeier, du DCML (Digital and Cognitive Musicology Laboratory), se sont aidés du machine learning et de l’intelligence artificielle pour explorer les concordances et les discordances entre les signes – comme les mots et les gestes – et le sens dans la communication. Leurs découvertes ont été publiées récemment dans Cognition, une revue réputée sur les sciences cognitives.

Robert Lieck, chercheur postdoctorant et auteur principal de l’article, explique que la recherche du DCML s’intéresse à l’énigme fondamentale de la communication et à l’évolution du sens dans le langage.

«Le problème est que les mots sont rigides et ne peuvent indiquer qu’une seule idée, alors que les sentiments ou les couleurs, par exemple, sont de nature continue et progressive. En substance, cela signifie qu’entre deux mots, il existe une infinité de sens, que les mots ne peuvent pas saisir à eux seuls.»

Les humains sont capables d’exprimer précisément des significations floues, notamment en s’aidant du ton de la voix ou de gestes. Pourquoi, par conséquent, avons-nous commencé à séparer des sens continus pour les comprimer dans des mots distincts?

Les propriétés discrètes des mots (comment ils sont combinés) et les propriétés continues (comment ils sont prononcés) peuvent transmettre leur sens de manière très détaillée. Ce phénomène est illustré par les légères différences de sens que transmettent les différentes prononciations de cette phrase © Lieck et al 2021

La communication comme jeu

Robert Lieck et Martin Rohrmeier ont cherché à répondre à cette question de manière empirique en simulant par des méthodes de calcul l’évolution de la communication à la manière d’un jeu. Dans cette simulation fondée sur le machine learning, deux agents virtuels ont échangé et interprété des signes, et utilisé la rétroaction de leur environnement pour améliorer leurs stratégies de communication.

Les chercheurs ont obtenu trois réponses-clés: premièrement, les agents virtuels ont développé des signes distincts, ou des ‘mots’ pour les éléments structurels de leur environnement. Toutefois, ils ont aussi recouru à des moyens continus pour communiquer des nuances plus fines au sein de chacun de ces éléments, de manière analogue aux différentes prononciations d’un même mot.

Deuxièmement, même lorsqu’une communication parfaitement continue était possible, les agents n’étaient pas toujours en mesure de trouver une concordance optimale et créaient parfois des mosaïques composées de différents fragments de signes pour exprimer l’ensemble des significations.

Et enfin, les chercheurs ont trouvé que dans les cas où les signes et les sens sont continus, mais possèdent des formes logiques différentes (par ex. les signes suivent une forme circulaire et les sens une forme linéaire), des significations très différentes peuvent être attribuées à des signes très similaires. Cela force alors les agents à laisser des fossés entre ces signes pour éviter les malentendus.

Le décalage topologique entre l'espace de la forme (orange) et l'espace du sens (bleu). (a) : Les malentendus se produisent parce que les limites de l'espace de signification sont cartographiées à proximité du même point dans l'espace de forme (encart). (b) : Un écart dans l'espace des formes évite les malentendus. © Lieck et al 2021

Des animaux à Zoom

Ces découvertes ont des répercussions considérables non seulement sur la compréhension du langage humain, mais aussi sur d’autres systèmes de communication parmi lesquels figurent la communication animale et la musique.

«Notre recherche contribue à mieux comprendre comment les plans des significations évoluent dans les différentes formes de communication, et comment ils peuvent être utilisés pour exprimer des idées sur un monde complexe», explique Martin Rohrmeier.

Robert Lieck ajoute que ce travail offre une analyse homogène autant des aspects distincts et structurels du langage que des aspects continus et graduels: «Nous montrons que ce sont réellement deux faces d’une même pièce, et l’une ne peut pas être comprise sans l’autre.»

L’étude souligne également le rôle structurel fondamental joué par la communication non verbale. Ce point revêt une importance particulière durant une pandémie: lorsque nous envisageons le futur des vidéoconférences dans les domaines de l’éducation et du travail, nous sommes souvent confrontés à des conditions loin d’être optimales en matière de respect de la communication non verbale, mais nous développons également de nouvelles manières de nous exprimer au fil de l’évolution de la communication.