Maschinelles Lernen sagt die Oxidationsstufen von Verbindungen vorher

Chemieingenieurinnen und -ingenieure der EPFL haben ein maschinelles Lernmodell entwickelt, das die Oxidationsstufe einer Verbindung vorhersagen kann – eine Eigenschaft, die so wichtig ist, dass viele Chemikerinnen argumentieren, sie müsse in das Periodensystem aufgenommen werden.
Chemikerinnen stimmen über die Oxidationsstufen von metallorganischen Gerüsten ab. Bildrechte: David Abbasi Pérez

Chemische Elemente machen so ziemlich alles in der physikalischen Welt aus. Stand 2016 kennen wir 118 Elemente, die alle im berühmten Periodensystem, das in jedem Chemielabor und Klassenzimmer hängt, kategorisiert werden können.

Jedes Element im Periodensystem erscheint als ein- oder zweibuchstabiges Kürzel (z. B. O für Sauerstoff, Al für Aluminium) zusammen mit seiner Ordnungszahl, die angibt, wie viele Protonen sich im Kern des Elements befinden. Die Anzahl der Protonen ist enorm wichtig, da sie auch bestimmt, wie viele Elektronen den Kern umkreisen, was das Element im Wesentlichen zu dem macht, was es ist und ihm seine chemischen Eigenschaften verleiht. Kurz gesagt, die Ordnungszahl ist der Ausweis eines Elements.

Das Periodensystem sollte Oxidationsstufen enthalten

In einer Veröffentlichung in Nature Chemistry untersuchen Chemieingenieurinnen der EPFL-Fakultät für Grundlagenwissenschaften eine weitere Zahl, die für jedes Element im Periodensystem angegeben werden muss: die Oxidationsstufe des Elements, auch bekannt als Oxidationszahl. Einfach ausgedrückt beschreibt die Oxidationsstufe, wie viele Elektronen ein Atom gewinnen oder verlieren muss, um eine chemische Bindung mit einem anderen Atom einzugehen.

«In der Chemie wird die Oxidationsstufe immer im chemischen Namen einer Verbindung angegeben», sagt Professor Berend Smit, der die Forschung leitete, «Oxidationsstufen spielen eine so wichtige Rolle in den Grundlagen der Chemie, dass einige argumentiert haben, dass sie als dritte Dimension des Periodensystems dargestellt werden sollten.» Ein gutes Beispiel ist Chrom: In der Oxidationsstufe III ist es für den menschlichen Körper essenziell, in der Oxidationsstufe IV ist es extrem giftig.

Komplexe Materialien verkomplizieren die Dinge

Doch während die Bestimmung der Oxidationsstufe eines einzelnen Elements recht einfach ist, wird es bei Verbindungen, die aus mehreren Elementen bestehen, kompliziert: «Bei komplexen Materialien ist es in der Praxis unmöglich, die Oxidationsstufe aus den ersten Grundsätzen vorherzusagen», sagt Smit, «die meisten Quantenprogramme benötigen sogar die Oxidationsstufe des Metalls als Eingabe.»

Der derzeitige Stand der Technik bei der Vorhersage von Oxidationszuständen basiert immer noch auf der so genannten «Bindungsvalenztheorie», die im frühen 20. Jahrhundert entwickelt wurde und die Oxidationsstufe einer Verbindung anhand der Abstände zwischen den Atomen ihrer Bestandteile schätzt. Doch das funktioniert nicht immer, vor allem bei Materialien mit Kristallstrukturen: «Es ist bekannt, dass nicht nur der Abstand eine Rolle spielt, sondern auch die Geometrie eines Metallkomplexes», sagt Smit, «aber Versuche, dies zu berücksichtigen, waren nicht sehr erfolgreich.»

Eine Lösung mit maschinellem Lernen

Bis jetzt, um genau zu sein. In der Studie konnten die Forschenden einen Machine-Learning-Algorithmus trainieren, um eine berühmte Gruppe von Materialien, die metallorganischen Gerüste, nach Oxidationsstufe zu kategorisieren.

Das Team nutzte die Cambridge-Strukturdatenbank, eine Sammlung von Kristallstrukturen, in der die Oxidationsstufe im Namen der Materialien angegeben ist. «Die Datenbank ist sehr chaotisch, mit vielen Fehlern und einer Mischung aus Experimenten, Schätzungen von Fachleuten und verschiedenen Variationen der Bindungsvalenztheorie, die verwendet werden, um Oxidationsstufen zuzuordnen», sagt Smit. «Wir gehen davon aus, dass die Chemie selbstkorrigierend ist», fügt er hinzu, «also während es viele Fehler auf einzelnen Konten gibt, wird die Gemeinschaft als Ganzes es richtig machen.»

«Wir haben im Grunde ein maschinelles Lernmodell erstellt, das das kollektive Wissen der Chemie-Community erfasst hat», sagt Kevin Jablonka, Doktorand in Smits Gruppe an der EPFL: «Unser maschinelles Lernen ist nichts anderes als das Fernsehspiel «Wer wird Millionär?» Wenn eine Chemikerin die Oxidationsstufe nicht kennt, besteht einer der Rettungsanker darin, das Chemie-Publikum zu fragen, was seiner Meinung nach die Oxidationsstufe sein sollte. Das geschieht, indem wir eine Kristallstruktur hochladen und unser Machine-Learning-Modell das Publikum aus Chemikerinnen und Chemikern ist, das ihr sagt, was die wahrscheinlichste Oxidationsstufe ist.»