Loading…
Thumbnail Image

Machine learning for electronic structure

Bogojeski, Mihail

Machine learning (ML) methods have recently experienced rising popularity in quantum chemistry as a means to bypass expensive electronic structure calculations, which are used to calculate quantum mechanical properties for systems of atoms. This has led to advances in a broad range of applications, largely due to the fact that ML approximations have a much lower computational cost in comparison to electronic structure calculations, while maintaining comparable levels of accuracy. However, most of these models are designed to predict a predetermined set of quantum chemical properties and need to be retrained if an application requires properties outside of this set. Therefore, the focus of this thesis is constructing ML models that are capable of directly predicting the electronic structure of a system of atoms, since any other electronic property can be derived from it. Electronic structure is usually expressed in the form of a wave function or electron density, which are continuous multidimensional functions, making the learning problem non-trivial. In the course of this thesis, we explore appropriate compact representations for electronic structure and develop ML methods capable of learning and accurately reproducing these representations. By incorporating prior knowledge about the electronic structure problem into the machine learning models, we are able to construct models that also preserve the symmetries of electronic structure under various transformations, leading to high data-efficiency. We demonstrate the utility of these machine learning models for electronic structure by applying them to a range of quantum chemical problems, such as learning a density functional mapping between different levels of electronic structure calculations to enable accurate and fast approximations, reconstruction of highly accurate electron densities and infrared spectra and prediction of electronic wave functions via representations of the Hamiltonian operator.
Methoden des maschinellen Lernens (ML) erfreuen sich seit einiger Zeit wachsender Beliebtheit in der Quantenchemie. In vielen Fällen können diese teure elektronischen Strukturberechnungen quantenmechanischer Eigenschaften von Atomsystemen ersetzen. Dies hat zu Fortschritten in einem breiten Spektrum von Anwendungen geführt, was vor allem darauf zurückzuführen ist, dass ML-Approximationen im Vergleich zu elektronischen Strukturberechnungen einen viel geringeren Rechenaufwand haben, während eine vergleichbare Genauigkeit beibehalten wird. Die meisten dieser Modelle sind jedoch nur für die Vorhersage von bestimmten quantenchemischen Eigenschaften ausgelegt und müssen für neue Anwendungen die zusätzliche Eigenschaften benötigen erneut trainiert werden. Daher liegt der Schwerpunkt dieser Arbeit auf der Konstruktion von ML-Modellen, die in der Lage sind, die elektronische Struktur eines Atomsystems direkt vorherzusagen, da jede andere elektronische Eigenschaft daraus abgeleitet werden kann. Die elektronische Struktur wird üblicherweise in Form einer kontinuierlichen, mehrdimensionale Wellenfunktion oder Elektronendichte ausgedrückt, was zu einem nichttrivialem Lernproblem führt. Im Rahmen dieser Arbeit untersuchen wir geeignete kompakte Repräsentationen für die elektronische Struktur und entwickeln ML-Methoden, die in der Lage sind, diese Repräsentationen zu lernen und genau wiederzugeben. Durch die Einbeziehung von Vorwissen über das elektronische Strukturproblem in die maschinellen Lernmodelle sind wir in der Lage, Modelle zu konstruieren, die auch die Symmetrien der elektronischen Struktur unter verschiedenen Transformationen bewahren, was zu einer hohen Dateneffizienz führt. Wir demonstrieren den Nutzen dieser maschinellen Lernmodelle für die elektronische Struktur, indem wir sie auf eine Reihe von quantenchemischen Problemen anwenden, wie z. B. das Erlernen von Dichtefunktionalen zwischen verschiedenen Approximationsstufen von elektronischen Strukturberechnungen um genaue und schnelle Approximationen zu ermöglichen, die Rekonstruktion von hochgenauen Elektronendichten und Infrarot-Spektren und die Vorhersage elektronischer Wellenfunktionen über Darstellungen des Hamiltonoperators.