Maschinelles Lernen zeichnet die Entwicklung der klassischen Musik nach

Forscher des EPFL-Labors für digitale und kognitive Musikwissenschaft am College der Geistes- und Sozialwissenschaften verwendeten ein unüberwachtes maschinelles Lernmodell, um mehr als 13 000 Stücke westlicher klassischer Musik zu «hören» und zu kategorisieren und so herauszufinden, wie sich Modi - wie Dur und Moll - im Laufe der Geschichte verändert haben.
Der Ansatz des DCML ist einzigartig, denn es ist das erste Mal, dass unbeschriftete Daten zur Analyse von Modi verwendet wurden. © iStock/Jocelyn Baker

Viele Menschen können vielleicht nicht definieren, was ein Moll-Modus in der Musik ist, aber die meisten würden mit ziemlicher Sicherheit ein Stück erkennen, das in einer Molltonart gespielt wird. Das liegt daran, dass wir intuitiv die Töne der Moll-Tonleiter – die eher dunkel, angespannt oder traurig klingen – von denen der Dur-Tonleiter unterscheiden, die eher mit Freude, Stärke oder Leichtigkeit assoziiert werden.

Doch im Laufe der Geschichte gab es immer wieder Perioden, in denen neben Dur und Moll auch mehrere andere Modi verwendet wurden – oder in denen überhaupt keine klare Trennung zwischen den Modi gefunden werden konnte.

Diese Unterschiede im Laufe der Zeit zu verstehen und zu visualisieren, haben sich die Forscher des Digital and Cognitive Musicology Lab (DCML) Daniel Harasim, Fabian Moss, Matthias Ramirez und Martin Rohrmeier in einer aktuellen Studie vorgenommen, die in der Open-Access-Zeitschrift Humanities and Social Sciences Communications veröffentlicht wurde. Für ihre Forschung entwickelten sie ein maschinelles Lernmodell, um mehr als 13 000 Musikstücke aus dem 15. bis 19. Jahrhundert zu analysieren, die die musikalischen Epochen Renaissance, Barock, Klassik, Frühromantik und Spätromantik abdecken.

«Wir wussten bereits, dass es zum Beispiel in der Renaissance [1400-1600] mehr als zwei Modi gab. Aber für die Perioden nach der Klassik [1750-1820] verschwimmt die Unterscheidung zwischen den Modi. Wir wollten sehen, ob wir diese Unterschiede konkreter festnageln können», erklärt Harasim.

Diese Datenvisualisierung, auf dem Modell der Forscher basierend, zeigt, wie vier verschiedene musikalische Modi – gekennzeichnet durch rot, grün, lila und blau – während der Renaissance vorherrschten. © DCML / EPFL

Maschinelles Hören (und Lernen)

Die Forscher verwendeten mathematische Modellierung, um sowohl die Anzahl als auch die Eigenschaften der Modi in diesen fünf historischen Perioden der westlichen klassischen Musik abzuleiten. Ihre Arbeit führte zu neuartigen Datenvisualisierungen, die zeigen, dass Musiker der Renaissance, wie Giovanni Pierluigi da Palestrina, dazu tendierten, vier Modi zu verwenden, während die Musik von Barockkomponisten, wie Johann Sebastian Bach, um die Dur- und Moll-Tonarten kreiste. Interessanterweise konnten die Forscher bei der komplexen Musik spätromantischer Komponisten wie Franz Liszt keine klare Aufteilung in Modi feststellen.

Harasim erklärt, dass der Ansatz des DCML einzigartig ist, weil es das erste Mal ist, dass unbeschriftete Daten zur Analyse von Modi verwendet wurden. Das bedeutet, dass die Musikstücke in ihrem Datensatz zuvor nicht von Menschenhand in Modi kategorisiert wurden.

«Wir wollten wissen, wie es aussieht, wenn wir dem Computer die Chance geben würden, die Daten zu analysieren, ohne dass der Mensch dabei voreingenommen ist. Also wendeten wir Methoden des unüberwachten maschinellen Lernens an, bei denen der Computer der Musik 'zuhört' und die Modi selbständig herausfindet, ohne Metadaten-Etiketten.»

Obwohl dieser «unüberwachte» Ansatz viel komplexer in der Ausführung ist, lieferte er besonders interessante Ergebnisse, die laut Harasim «kognitiv plausibler» sind in Bezug darauf, wie Menschen Musik hören und interpretieren.

«Wir wissen, dass musikalische Strukturen sehr komplex sein können und dass Musiker jahrelanges Training benötigen. Aber gleichzeitig lernt der Mensch diese Strukturen unbewusst, so wie ein Kind eine Muttersprache lernt. Deshalb haben wir ein einfaches Modell entwickelt, das diesen Lernprozess rückgängig macht, und zwar mit einer Klasse von sogenannten Bayes'schen Modellen, die von Kognitionswissenschaftlerinnen und -wissenschaftlern verwendet werden, so dass wir auch auf deren Forschung zurückgreifen können.»

Vom Klassenprojekt zur Veröffentlichung ... und darüber hinaus

Harasim stellt mit Genugtuung fest, dass diese Studie ihre Wurzeln in einem Klassenprojekt hat, das er und seine Co-Autoren Moss und Ramirez als Studenten im Kurs «Angewandte Datenanalyse» von EPFL-Professor Robert West durchführten. Er hofft, das Projekt noch weiterführen zu können, indem sie ihren Ansatz auf andere musikalische Fragen und Genres anwenden.

«Bei Stücken, in denen sich die Modi ändern, wäre es interessant, genau zu ermitteln, an welchem Punkt solche Änderungen auftreten. Ich würde die gleiche Methodik auch gerne auf den Jazz anwenden, der im Fokus meiner Doktorarbeit stand, weil die Tonalität im Jazz viel reicher ist als nur zwei Modi.»