Maschinelles Lernen hilft beim Aussortieren umfangreicher Materialdatenbanken
Metallorganische Gerüste (MOFs) sind eine Klasse von Materialien, die Poren in Nanogröße enthalten. Diese Poren verleihen MOFs rekordverdächtige innere Oberflächenbereiche, die bis zu 7800m2 in einem einzigen Gramm Material messen können. Infolgedessen sind MOFs äusserst vielseitig und finden vielfältige Einsatzmöglichkeiten: Trennung von Petrochemikalien und Gasen, Nachahmung von DNA, Herstellung von Wasserstoff und Entfernung von Schwermetallen, Fluoridanionen und sogar Gold aus Wasser sind nur einige Beispiele.
Aufgrund ihrer Popularität haben Materialforschende MOFs schnell entwickelt, synthetisiert, untersucht und katalogisiert. Gegenwärtig gibt es über 90 000 veröffentlichte MOFs, und die Zahl wächst täglich. So aufregend die schiere Zahl der MOFs auch ist, so stellt sie doch ein Problem dar: «Wenn wir jetzt vorschlagen, ein neues MOF zu synthetisieren, wie können wir dann wissen, ob es sich wirklich um eine neue Struktur handelt und nicht um eine geringfügige Variation einer bereits synthetisierten Struktur», fragt Professor Berend Smit von der EPFL Valais-Wallis, die eine grosse Chemieabteilung beherbergt.
Um dieses Problem zu lösen, hat sich Smit mit Professorin Heather J. Kulik vom MIT zusammengetan und mit Hilfe des maschinellen Lernens eine «Sprache» entwickelt, um zwei Materialien zu vergleichen und die Unterschiede zwischen ihnen zu quantifizieren. Die Studie wird in Nature Communications veröffentlicht.
Bewaffnet mit ihrer neuen «Sprache» machten sich die Forschenden auf, die chemische Vielfalt in den Datenbanken der MOFs zu erforschen. «Früher lag der Schwerpunkt auf der Anzahl der Strukturen», sagt Smit, «aber jetzt stellten wir fest, dass die grossen Datenbanken alle möglichen Vorurteile gegenüber bestimmten Strukturen haben.» Es hat keinen Sinn, teure Screening-Studien über ähnliche Strukturen durchzuführen. Man ist besser dran, wenn man eine Reihe sehr unterschiedlicher Strukturen sorgfältig auswählt, die mit viel weniger Strukturen viel bessere Ergebnisse liefern.
Eine weitere interessante Anwendung ist die «wissenschaftliche Archäologie»: Die Forschenden verwendeten ihr maschinelles Lernsystem, um die MOF-Strukturen zu identifizieren, die zum Zeitpunkt der Studie als sehr verschieden von den bereits bekannten Strukturen veröffentlicht wurden.
«So haben wir jetzt ein sehr einfaches Werkzeug, das einer Versuchsgruppe zeigen kann, wie unterschiedlich ihr neuartiges MOF im Vergleich zu den 90 000 anderen bereits untersuchten Strukturen ist», sagt Smit.