Le machine learning peut prédire l'état d'oxydation d'un composé

Les ingénieurs chimistes de l’EPFL ont mis au point un modèle d’apprentissage machine qui peut prédire l’état d’oxydation d’un composé, une propriété qui est tellement essentielle que de nombreux chimistes affirment qu’elle doit faire partie du tableau périodique.
Des chimistes votent sur les états d'oxydation des réseaux organométalliques. Crédit : David Abbasi Pérez.

Les éléments chimiques composent à peu près tout dans le monde physique. En 2016, nous connaissions 118 éléments, qui peuvent tous être classés dans le célèbre tableau périodique que l’on retrouve dans chaque laboratoire et classe de chimie.

Chaque élément du tableau périodique apparaît sous forme d’abréviation à une ou deux lettres (par ex. O pour oxygène, Al pour aluminium) avec son numéro atomique, qui indique le nombre de protons présents dans le noyau de l’élément. Le nombre de protons est très important car il détermine le nombre d’électrons en orbite autour du noyau, ce qui définit l’élément et donne ses propriétés chimiques. En résumé, le numéro atomique est la carte d’identité de l’élément.

Le tableau périodique doit inclure les états d’oxydation

Dans la revue Nature Chemistry, des ingénieurs chimistes de la Faculté des Sciences de Base de l’EPFL étudient un autre nombre qui doit être indiqué pour chaque élément dans le tableau périodique: l’état d’oxydation de l’élément, également connu sous le nom de nombre d’oxydation. Pour simplifier, l’état d’oxydation décrit le nombre d’électrons que doit gagner ou perdre un atome afin de former une liaison chimique avec un autre atome.

«En chimie, l’état d’oxydation est toujours indiqué dans le nom chimique d’un composé», explique le professeur Berend Smit qui a dirigé la recherche. «Les états d’oxydation jouent un rôle si important dans les principes fondamentaux de la chimie que certains estiment qu’ils devraient être représentés comme la troisième dimension du tableau périodique.» Le chrome est un bon exemple: dans l’état d’oxydation III il est essentiel au corps humain; dans l’état d’oxydation IV, il est extrêmement toxique.

Les matériaux complexes compliquent les choses

Cependant, bien que la détermination de l’état d’oxydation d’un seul élément soit assez simple, les choses se compliquent lorsqu’il s’agit de composés constitués de plusieurs éléments. «Pour les matériaux complexes, il est impossible dans la pratique de prédire l’état d’oxydation à partir des principes de base», affirme Berend Smit. «En fait, la plupart des programmes quantiques exigent l’état d’oxydation du métal comme donnée d’entrée.»

L’état actuel des connaissances en prédiction des états d’oxydation reste basé sur ce que l’on appelle la «théorie de la liaison de valence» développée au début du 20e siècle, qui estime l’état d’oxydation d’un composé sur la base des distances entre les atomes de ses éléments constitutifs. Mais cela ne fonctionne pas tout le temps, en particulier dans les matériaux avec des structures cristallines. «On sait que ce n’est pas seulement la distance qui importe, mais aussi la géométrie d’un complexe métallique», déclare Berend Smit. «Mais quand on a essayé d’en tenir compte, cela n’a pas été très fructueux.»

Une solution d’apprentissage machine

Aujourd’hui, ça l’est. Dans l’étude, les chercheurs ont réussi à entraîner un algorithme d’apprentissage machine pour classer un groupe célèbre de matériaux, les réseaux organométalliques, par état d’oxydation.

L’équipe a utilisé la Cambridge structural database, un répertoire de structures cristallines où l’état d’oxydation est indiqué dans le nom des matériaux. «La base de données est très désordonnée, avec de nombreuses erreurs et un mélange d’expériences, de suppositions d’experts et de différentes variations de la théorie de la liaison de valence qui sont utilisées pour attribuer les états d’oxydation», explique Berend Smit. «Nous partons du principe que la chimie s’autocorrige», ajoute-t-il. «C’est pourquoi, même s’il y a de nombreuses erreurs sur les comptes individuels, l’ensemble de la communauté les corrigera.»

«En fait, nous avons créé un modèle d’apprentissage machine qui a intégré les connaissances collectives de la communauté de chimistes», déclare Kevin Jablonka, doctorant dans le laboratoire de Berend Smit. «Notre apprentissage machine s’apparente au jeu télévisé "Who Wants to Be a Millionaire?". Si un chimiste ne connaît pas l’état d’oxydation, il a comme solution de demander l’avis de la communauté de chimistes. En téléchargeant une structure cristalline et notre modèle d’apprentissage machine, la communauté de chimistes lui indiquera l’état d’oxydation le plus probable.»