Computing high-dimensional value functions of optimal feedback control problems using the Tensor-train format

dc.contributor.advisorSchneider, Reinhold
dc.contributor.authorSallandt, Leon Jasper
dc.contributor.grantorTechnische Universität Berlinen
dc.contributor.refereeSchneider, Reinhold
dc.contributor.refereeKunisch, Karl
dc.contributor.refereeBreiten, Tobias
dc.date.accepted2021-12-06
dc.date.accessioned2022-01-13T14:41:22Z
dc.date.available2022-01-13T14:41:22Z
dc.date.issued2022
dc.description.abstractWe consider high-dimensional, non-linear functional equations. These functional equations are mostly the Bellman equation known from optimal control or related fields. Within this framework we deal with the occurring non-linearity using fixed-point iterations, for the most part the Policy Iteration algorithm, reducing them to a series of linear problems. These linear problems suffer from the so-called curse of dimensionality. We apply hierarchical tensor formats, in particular tensor-trains, to represent the sought function. Here, we also make use of an extension of the tensor-train format, where single functions can be added into the function space. The linear problems are approximated by regression and minimal residual formulations, which means that high-dimensional integrals appear. We apply Monte Carlo methods to estimate these integrals. Applying this framework, we compute feedback controllers of infinite and finite horizon optimal control problems. For the finite horizon case we also consider an algorithm based on open-loop control and provide a novel error propagation bound. We also consider the case of stochastic exit-time control problems. Finally, we consider a regression approach in the context of parabolic partial differential equations, which can be reformulated to backward stochastic differential equations. In this context, we apply the tensor-train model and compare to state-of-the-art neural network methods with respect to run-time and accuracy. We numerically observe that for many problems, low-rank approximation of the sought functions can be found, yielding close to optimal feedback controllers.en
dc.description.abstractWir betrachten hochdimensionale, nicht-lineare Funktionengleichungen, wie zum Beispiel die Bellmangleichung, bekannt aus dem Gebiet der optimalen Steuerung. Die auftretende nicht-Linearität behandeln wir mit Fixpunktiterationen, insbesondere der Policy Iteration, und erhalten damit eine Folge von linearen Problemen. Diese Probleme leiden in hohen Dimensionen unter dem sogenannten Fluch der Dimensionalität (curse of dimensionality), was wir mit der Verwendung von hierarchischen Tensorformaten, insbesondere Tensor-Trains, behandeln. Wir stellen damit die gesuchten Funktionen dar und verwenden auch eine Erweiterung des Konzepts, bei der einzelne Funktionen in den Funktionenraum hinzugefügt werden. Die auftretenden linearen Probleme werden dann mithilfe von Regression und ähnlichen Methoden gelöst. Die daher auftretenden hoch-dimensionalen Integrale werden mithilfe von Monte Carlo Methoden approximiert. Mithilfe dieses Ansatzes werden optimale Feedbacksteuerungen von verschiedenen Optimalsteuerungsproblemen berechnet - von (deterministischen) Problemen mit endlichem und unendlichem Zeithorizont zu stochastischen Problemen mit Exit-Bedingung. Schlussendlich werden noch allgemeine semi-lineare parabolische Differentialgleichungen mithilfe von backward stochastic differential equations gelöst, wobei wir die Ergebnisse mit state-of-the-art neuronalen Netz Methoden vergleichen. Hier achten wir auf die Genauigkeit der Ergebnisse und auf die Laufzeit des Algorithmus. Wir beobachten numerisch, dass für viele Probleme gute Approximationen der gesuchten Funktionen, und damit auch des optimalen Feedbackgesetzes, mithilfe des Tensor-Train Ansatzes gefunden werden können.de
dc.identifier.urihttps://depositonce.tu-berlin.de/handle/11303/14013
dc.identifier.urihttp://dx.doi.org/10.14279/depositonce-12786
dc.language.isoenen
dc.rights.urihttp://rightsstatements.org/vocab/InC/1.0/en
dc.subject.ddc518 Numerische Analysisde
dc.subject.ddc519 Wahrscheinlichkeiten, angewandte Mathematikde
dc.subject.otherTensor trainen
dc.subject.otherfeedback controlen
dc.subject.otherhighdimensional PDEen
dc.subject.othervalue functionen
dc.subject.otherBSDEen
dc.subject.otherTensor-Zugde
dc.subject.otherFeedback-Steuerungde
dc.subject.otherhochdimensionale PDEde
dc.subject.otherWertefunktionde
dc.titleComputing high-dimensional value functions of optimal feedback control problems using the Tensor-train formaten
dc.title.translatedBerechnung von Wertefunktionen von optimalen Feedbacksteuerungsproblemen mit Nutzung des Tensor-Train-Formatsde
dc.typeDoctoral Thesisen
dc.type.versionacceptedVersionen
tub.accessrights.dnbfreeen
tub.affiliationFak. 2 Mathematik und Naturwissenschaften::Inst. Mathematik::FG Modellierung, Simulation und Optimierung in Natur- und Ingenieurwissenschaftende
tub.affiliation.facultyFak. 2 Mathematik und Naturwissenschaftende
tub.affiliation.groupFG Modellierung, Simulation und Optimierung in Natur- und Ingenieurwissenschaftende
tub.affiliation.instituteInst. Mathematikde
tub.publisher.universityorinstitutionTechnische Universität Berlinen

Files

Original bundle
Now showing 1 - 1 of 1
Loading…
Thumbnail Image
Name:
sallandt_leon.pdf
Size:
1.9 MB
Format:
Adobe Portable Document Format
Description:
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
4.86 KB
Format:
Item-specific license agreed upon to submission
Description:

Collections