Thumbnail Image

Towards more efficient and performant computations in quantum chemistry with machine learning

Pronobis, Wiktor

Kernel methods allow an efficient solution of highly non-linear regression problems often encountered in quantum chemistry. Due to its flexibility it is unclear how to design a similarity matrix represented by the kernel which encodes a given learning problem in a compact and beneficial way. In this thesis, we propose novel kernels for quantum mechanical systems which are composed of two- and three-body interaction terms. Specifically, we develop descriptors of molecules which are of fixed size and invariant with respect to translation, rotation and atom indexing. For these representations, we demonstrate their ability to accurately predict quantum mechanical properties in combination with kernel ridge regression. A feature importance analysis reveals insights about the two- and three-body interactions in small organic molecules. Our descriptors are extended by novel decomposition kernels which encode the comparison of two- and three-body combinations of atoms directly into the similarity matrix. The special structure of these kernels is used to analyse interaction potentials for molecular dynamics data sets. These kernel methods are complemented by a new approximate matrix inversion scheme based on banded Toeplitz matrices. For all of these three methodologies, we demonstrate their efficiency and performance to solve quantum chemical problems.
Kern-basierte Methoden erlauben es, effizientere Lösungen von hoch nichtlinearen Regressionsproblemen zu entwickeln, die häufig in der Quantemchemie auftreten. Wegen ihrer Flexibilität, ist es unklar, wie man eine kern-basierte Ähnlichkeitsmatrix aufstellt, die das Lernproblem in einer kompakten und nutzbaren Weise kodiert. In dieser Arbeit schlagen wir neue Kerne für quantenmechanische Systeme vor, die auf Zwei- und Dreikörperinteraktionstermen beruhen. Genauer entwickeln wir Deskriptoren von Molekülen, die konstante Größe haben und invariant sind gegenüber der Translation, Rotation und Atomindizierung. Für diese Repräsentationen demonstrieren wir die akkurate Vorhersage von quantenmechanischen Eigenschaften in Kombination mit Gaußprozess-Regression. Eine Wichtigkeitsanalyse der Features enthüllt Einsichten über die Zwei- und Dreikörper-interaktionen in kleinen organischen Molekülen. Unsere Deskriptoren werden weiterentwickelt zu zerlegbaren Kernen, die den Vergleich zwischen Zwei- und Dreierkörperkombinationen von Atomen direkt in der Ähnlichkeitsmatrix kodieren. Die spezielle Struktur dieser Kerne wird genutzt um die Interaktionspotentiale für moleküldynamik Datensätze zu untersuchen. Unsere Kernmodelle werden ergänzt durch ein approximiertes Matrix-Invertierungsverfahren für schmalbandige Toeplitzmatrizen. Für alle diese drei Ansätze zeigen wir deren Effizienz und Leistungsfähigkeit, quantenchemische Probleme zu lösen.