Le machine learning retrace l'évolution de la musique classique

Des chercheurs du Digital and Cognitive Musicology Lab du Collège des Humanités à l’EPFL ont utilisé un modèle de machine learning non supervisé pour «écouter» et classifier plus de 13 000 morceaux de musique classique occidentale. Ils ont ainsi mis en évidence l’évolution des modes (comme majeur et mineur) au cours de l’histoire.
L’approche du DCML est unique parce que c’est la première fois que des données non étiquetées sont utilisées pour analyser des modes. © iStock/Jocelyn Baker

Si beaucoup de gens ne savent peut-être pas définir ce qu’est un mode mineur en musique, la plupart sont très certainement capables de reconnaître un morceau joué en mineur. En effet, nous faisons intuitivement la distinction entre les gammes mineures, aux tonalités plutôt tristes, tendues et sombres, et les gammes majeures, plus souvent associées à la joie, à la force ou à la luminosité.

A travers l’histoire, toutefois, certaines périodes ont vu l’utilisation de multiples autres modes, ou encore l’absence de séparation nette entre les modes.

Dans une récente étude publiée dans la revue en libre accès Humanities and Social Sciences Communications, Daniel Harasim, Fabian Moss, Matthias Ramirez et Martin Rohrmeier, chercheurs au Digital and Cognitive Musicology Lab (DCML), ont voulu comprendre et visualiser ces différences au fil du temps. Ils ont mis au point pour leurs recherches un modèle de machine learning pour analyser plus de 13 000 morceaux de musique datant du XVe au XIXe siècle et couvrant les périodes musicales de la Renaissance, du classique, du baroque, du début et de la fin du romantisme.

«Nous savions déjà qu’à la Renaissance [1400-1600], par exemple, il y avait plus que deux modes. Toutefois, pour les périodes suivant l’époque classique [1750-1820], la distinction entre les modes s’estompe. Nous voulions voir si nous pouvions déterminer plus concrètement ces différences», explique Daniel Harasim.

Cette visualisation de données fondée sur le modèle des chercheurs montre la prédominance de quatre modes musicaux différents (indiqués en rouge, vert, violet et bleu) pendant la Renaissance. © DCML / EPFL

Ecoute (et apprentissage) automatique

Les chercheurs ont utilisé une modélisation mathématique pour déduire à la fois le nombre de modes et leurs caractéristiques lors de ces cinq périodes historiques de la musique classique occidentale. Leur travail a fourni des visualisations de données novatrices, en montrant comment des compositeurs de la Renaissance, comme Giovanni Pierluigi da Palestrina, avaient tendance à utiliser quatre modes, tandis que ceux de la période baroque, comme Jean-Sébastien Bach, se concentraient sur les modes mineur et majeur. Constat intéressant, les chercheurs n’ont pas réussi à identifier une séparation claire entre les modes dans la musique complexe des compositeurs de la fin du romantisme, tels que Franz Liszt.

Daniel Harasim explique que l’approche du DCML est unique parce que c’est la première fois que des données non étiquetées sont utilisées pour analyser des modes. Cela signifie que les morceaux constituant leur ensemble de données n’ont pas été classifiés au préalable selon les modes.

«Nous voulions savoir ce que ça donnerait si nous laissions l’ordinateur analyser les données sans influence humaine. Nous avons donc appliqué des méthodes de machine learning non supervisé, dans lesquelles l’ordinateur “écoute” de la musique et détermine par lui-même les modes, sans étiquette de métadonnées.»

Quoiqu’elle soit bien plus complexe à réaliser, cette approche non supervisée a produit des résultats particulièrement intéressants, qui, selon Daniel Harasim, sont plus «plausibles sur le plan cognitif» par rapport à la manière des humains d’écouter et d’interpréter de la musique.

«Nous savons qu’une structure musicale peut être très complexe et que les musiciens ont besoin d’années d’entraînement. Mais en même temps, l’apprentissage de ces structures se fait de manière inconsciente, de la même manière qu’un enfant apprend sa langue maternelle. Nous avons donc mis au point un modèle simple pour reconstituer ce processus d’apprentissage, en utilisant une famille de ce qu’on appelle les modèles bayésiens. Ces derniers sont utilisés en sciences cognitives, ce qui nous permet aussi de mobiliser les recherches effectuées dans ce domaine.»

D’un projet de classe à une publication... et au-delà

Daniel Harasim relève avec satisfaction que cette étude est issue d’un projet de classe que lui et ses coauteurs Fabian Moss et Matthias Ramirez ont réalisé ensemble quand ils étaient étudiants dans le cadre du cours Applied Data Analysis de Robert West, professeur à l’EPFL. Il espère poursuivre le projet en appliquant leur approche à d’autres questions et genres musicaux.

«Pour les morceaux dans lesquels les modes changent, il serait intéressant de déterminer à quel point exactement les changements interviennent. J’aimerais aussi appliquer la même méthodologie au jazz, ce sur quoi j’ai mis l’accent dans ma thèse de doctorat, car le jazz recourt à des tonalités bien plus riches que juste deux modes.»