Please use this identifier to cite or link to this item: http://dx.doi.org/10.14279/depositonce-15926
For citation please use:
Main Title: Unraveling the interior evolution of terrestrial planets through machine learning
Translated Title: Die Entschlüsselung der inneren Entwicklung terrestrischer Planeten durch maschinelles Lernen
Author(s): Agarwal, Siddhant
Advisor(s): Tosi, Nicola
Montavon, Grégoire
Breuer, Doris
Kessel, Pan
Müller, Klaus-Robert
Referee(s): Müller, Klaus-Robert
Schumacher, Jörg
Tosi, Nicola
Granting Institution: Technische Universität Berlin
Type: Doctoral Thesis
URI: https://depositonce.tu-berlin.de/handle/11303/17147
http://dx.doi.org/10.14279/depositonce-15926
License: https://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Mantle convection plays a fundamental role in the long-term thermal evolution of terrestrial planets like Earth, Mars, Mercury and Venus. Yet, key parameters and initial conditions of the partial differential equations governing mantle convection are poorly constrained. This often requires a large sampling of the parameter space to determine which combinations can satisfy certain observational constraints. Traditionally, 1D models based on scaling laws used to parameterize convective heat transfer, have been used to tackle the computational bottleneck of high-fidelity forward runs in 2D or 3D. However, these are limited in the amount of physics they can model (e.g. depth dependent material properties are difficult to incorporate into these models) and predict only mean quantities such as the mean mantle temperature. In the first study, feed-forward neural networks (FNN) are trained on a large number of 2D simulations of a Mars-like planet to overcome these limitations. Given five key parameters governing mantle convection, the FNNs can reliably predict the evolution of the entire 1D laterally-averaged temperature profile in time. The five parameters that are varied throughout the thesis are: reference viscosity (which controls the overall vigor of convection), activation energy and activation volume of the diffusion creep rheology (which accounts for the pressure- and temperature-dependence of the viscosity, respectively), an enrichment factor for radiogenic elements in the crust (which controls the partitioning of the radiogenic elements in the mantle and the crust), and the initial radial distribution of the mantle temperature. In a related study, machine learning is used for probabilistic inversion. Using Mixture Density Networks (MDN), various sets of synthetic present-day observables for a Mars-like planet are inverted to infer the same five mantle convection parameters. It is shown that the constraints on a parameter can be quantified using the log-likelihood value, the negative of which is used as the loss function to train an MDN. The crustal enrichment factor of radiogenic heat sources can be constrained the best, followed by reference viscosity, when all the observables are available: core-mantle-boundary heat flux, surface heat flux, radial contraction, melt produced and duration of volcanism. The initial mantle temperature can be constrained if the radial contraction is available with at least some parts of the temperature profile. Activation energy of diffusion creep can only be weakly constrained, while the activation volume of diffusion creep cannot be constrained at all in the present setup. Different levels of uncertainty were also emulated in the observables and it was found that constraints on different parameters loosen with varying rates, with initial temperature being the most sensitive. The marginal MDN is modified to obtain a joint probability model, which captures the cross-correlations among all parameters. Finally surrogate modeling is revisited, but for predicting the full 2D temperature field, which contains more information in the form of convection structures such as rising hot plumes and sinking cold downwellings. Deep learning techniques are able to produce reliable parameterized surrogates (i.e. surrogates that predict state variables such as temperature based only on input parameters) of the solution of the underlying partial differential equations. First, convolutional autoencoders are used to compress the size of each temperature field and retain only the most important features in form of a latent space. Then, FNNs and long-short term memory networks (LSTM) are used to predict the compressed fields from the five mantle convection parameters. Proper orthogonal decomposition of the LSTM and FNN predictions shows that despite a lower mean relative accuracy, LSTMs capture the flow dynamics better than FNNs.
Die Mantelkonvektion spielt eine grundlegende Rolle in der langfristigen thermischen Entwicklung von terrestrischen Planeten wie Erde, Mars, Merkur und Venus. Es ist jedoch schwer, die Schlüsselparameter und Anfangsbedingungen der partiellen Differentialgleichungen, die die Mantelkonvektion steuern, einzuschränken. Dies erfordert häufig eine große Stichprobe des Parameterraums, um zu bestimmen, welche Konvektionsparameter mit den Beobachtungen übereinstimmen. Traditionell wurden 1D-Modelle verwendet, um den rechnerischen Aufwand von High-Fidelity-Vorwärtsläufen in 2D oder 3D zu erleichtern. Diese basieren auf Skalierungsgesetzen, die den konvektiven Wärmetransport parametrisieren. Solche 1D-Modelle können aber nur eine begrenzte Menge an physikalischen Prozessen modellieren (z. B. lassen sich tiefenabhängige Materialeigenschaften nur schwer in diese Modelle integrieren) und nur durchschnittliche Ergebnisse wie der Mittelwert der Manteltemperatur vorhersagen. In der ersten Studie werden Feed-Forward Neural Networks (FNN) mit einer großen Anzahl von 2D-Simulationen eines marsähnlichen Planeten trainiert, um diese Einschränkungen zu überwinden. Angesichts von fünf Schlüsselparametern, die die Mantelkonvektion bestimmen, können die FNNs zuverlässig die zeitliche Entwicklung des gesamten seitlich gemittelten 1D-Temperaturprofils vorhersagen. Die fünf Parameter, die während der gesamten Arbeit variiert werden, sind: Referenzviskosität (die die Gesamtstärke der Konvektion steuert), Aktivierungsenergie und Aktivierungsvolumen der Diffusionskriechrheologie (die jeweils die Druck- und Temperaturabhängigkeit der Viskosität berücksichtigen), ein Anreicherungsfaktor für radiogene Elemente in der Kruste (der die Verteilung der radiogenen Elemente im Mantel und in der Kruste steuert) und die anfängliche radiale Verteilung der Manteltemperatur. In einer verwandten Studie wird maschinelles Lernen zur probabilistischen Inversion von Beobachtungen verwendet, um die Mantelkonvektionsparameter eines marsähnlichen Planeten einzuschränken. Mithilfe von Mixture Density Networks (MDN) werden verschiedene Datensätze heutiger synthetischer Observablen für einen marsähnlichen Planeten invertiert, um auf dieselben fünf Parameter zu schließen. Es wird gezeigt, dass die Einschränkungen eines Parameters unter Verwendung des Log-Likelihood-Werts quantifiziert werden können. Der Negativwert des Log-Likelihoods wird als Verlustfunktion zum Trainieren eines MDN verwendet. Der Krustenanreicherungsfaktor kann am besten bestimmt werden, gefolgt von der Referenzviskosität, wenn alle Observablen verfügbar sind: Kern-Mantel-Grenzwärmefluss, Oberflächenwärmefluss, radiale Kontraktion, produzierte Schmelze und Dauer des Vulkanismus. Die anfängliche Manteltemperatur kann bestimmt werden, wenn die radiale Kontraktion und zumindest einige Teile des Temperaturprofils verfügbar sind. Die Aktivierungsenergie des Diffusionskriechens kann nur schwach eingeschränkt werden, während das Aktivierungsvolumen des Diffusionskriechens in der vorliegenden Studie überhaupt nicht bestimmt werden kann. In den Beobachtungen wurden auch unterschiedliche Unsicherheitsgrade emuliert, und es wurde festgestellt, dass sich die Einschränkungen für verschiedene Parameter unterschiedlich schnell lockern, wobei die Anfangstemperatur am empfindlichsten ist. Die marginale MDN wird modifiziert, um ein gemeinsames Wahrscheinlichkeitsmodell zu erhalten, das die Kreuzkorrelationen zwischen allen Parametern erfasst. Schließlich wird die Surrogatemodellierung erneut aufgegriffen, jedoch für die Vorhersage des vollständigen 2D-Temperaturfelds, das mehr Informationen in Form von Konvektionsstrukturen wie heißen Schwaden und kalten Abwärtsströmungen enthält. Deep-Learning-Algorithmen sollen in der Lage sein, zuverlässige parametrisierte Surrogate (d. h. Surrogate, die Zustandsvariablen wie Temperatur nur auf der Grundlage von Parametern vorhersagen) zu erzeugen. Zunächst werden Convolutional-Autoencoder verwendet, um die Größe jedes Temperaturfelds zu komprimieren. Dann werden FNNs und Long-Short-Term Memory Netze (LSTM) verwendet, um die komprimierten Felder aus den fünf Mantelkonvektionsparametern vorherzusagen. Die Proper Orthogonal Decomposition der LSTM- und FNN-Vorhersagen zeigt, dass LSTMs trotz einer geringeren durchschnittlichen relativen Genauigkeit die Strömungsdynamik besser erfassen als FNNs.
Subject(s): mantle convection
machine learning
fluid dynamics
surrogate modeling
probabilistic inversion
Mantelkonvektion
maschinelles Lernen
Strömungsmechanik
Surrogate-Modellierung
probabilistische Inversion
Issue Date: 2022
Date Available: 3-Aug-2022
Exam Date: 21-Jun-2022
Language Code: en
DDC Class: 006 Spezielle Computerverfahren
TU Affiliation(s): Fak. 4 Elektrotechnik und Informatik » Inst. Softwaretechnik und Theoretische Informatik » FG Maschinelles Lernen
Appears in Collections:Technische Universität Berlin » Publications

Files in This Item:
agarwal_siddhant.pdf
Format: Adobe PDF | Size: 46.4 MB
DownloadShow Preview
Thumbnail

Item Export Bar

This item is licensed under a Creative Commons License Creative Commons