A statistical physics approach to inference problems on random networks

dc.contributor.advisorOpper, Manfred
dc.contributor.authorBachschmid Romano, Ludovica
dc.contributor.grantorTechnische Universität Berlinen
dc.contributor.refereeOpper, Manfred
dc.contributor.refereeBerg, Johannes
dc.contributor.refereeSaad, David
dc.date.accepted2017-12-15
dc.date.accessioned2018-12-19T10:14:54Z
dc.date.available2018-12-19T10:14:54Z
dc.date.issued2018
dc.description.abstractRecent advances in measurement technologies have resulted in the availability of large datasets from a variety of fields spanning the natural and social sciences. This posed the challenge to develop new statistical tools to extract relevant information from the data. A paradigmatic model that has been successfully applied to analyze large datasets is the Ising model of binary spins interacting through pairwise connections. In this thesis, we use methods of statistical physics to tackle several open problems related to modelling the stochastic dynamics of the Ising model and reconstructing the unknown net- work of interactions from data. First, we derive a novel mean-field solution to the discrete time parallel dynamics of the Ising model, based on a weak coupling expansion of the log-generating function with constrained first and second order moments over time, the result of which outperforms other mean field techniques in predicting single site magnetization. Next, for both the equilibrium and kinetic models, we analyze the inverse problem of learning the couplings between the variables based on a set of observations on spin configurations. Using the cavity and replica methods of statistical physics, we compare the performance of different inference algorithms, by analytical computation of the estimation error as a function of the size of the dataset, and study its deviation from asymptotic optimality. We also derive optimal algorithms for learning the couplings. Finally, we consider the case where a subset of the spin trajectories is observed while the rest are hidden. This enabled us to model systems where only a finite fraction of the system is experimentally accessible, but allowed the hidden variables to affect the dynamics of the observed variables. A central question is the prediction of the hidden spin state when the couplings are known. For the average case scenario, we investigate the theoretically optimal performance for predicting hidden spins by computing the error of the Bayes optimal predictor. We also derive a mean- field formalism to accurately estimate the single-site magnetisation of hidden spins for single instances of the network.en
dc.description.abstractDie verfügbare Datenmenge in Gebieten der Natur- und Sozialwissenschaften wächst stetig durch den technischen Fortschritt bei Methoden zur Datenerhebung. Dieser Zuwachs ist eine Herausforderung für Algorithmen, die Daten auf relevanten Informationen reduziert. Ein paradigmatisches Modell, das mit Erfolg auf große Datenmengen angewendet wurde, ist das “Ising Modell” für binäre Spins, welche durch paarweise Wechselbeziehungen voneinander abhängig sind. In dieser Arbeit verwenden wir Methodik der statistischen Physik zur Lösung verschiedener offener Probleme, verbunden mit der Modellierung stochastischer Dynamik und der Rekonstruktion unbekannter Netzwerke durch Interaktionen, welche in Daten beobachtet werden. Als erstes leiten wir eine neue “Mean-field” Lösung her für die zeitdiskrete parallele Dynamik des Ising Modells. Hierzu entwickeln wir die logarithmische Moment generierende Funktion in den schwachen Kopplungen bedingt auf ersten und zweiten Momenten an jedem Zeitpunkt. Weiterhin untersuchen wir das inverse Ising Problem für sowohl das Gleichgewicht als auch das kinetische Modell. Das heißt, wir analysieren das Lernen der Kopplungen zwischen Variablen gegeben ein Set von Beobachtungen. Durch den Gebrauch von “Cavity-” und “Replikamethoden” aus der statistischen Physik vergleichen wir verschiedene Inferenzalgorithmen durch analytische Berechnung des Schätzfehlers abhängig von der Menge der verfügbaren Daten und untersuchen die Abweichungen dieser von der optimalen Asymptotik. Außerdem leiten wir optimale Algorithmen zum Lernen der Kopplungen her. Am Ende betrachten wir den Fall, in dem ein Teil der Spintrajektorien bekannt ist, während ein Teil nicht beobachtet wird. Dies erlaubt uns Systeme zu modellieren, die uns experimentell nur unvollständig zugänglich sind, unter Berücksichtigung, dass die unbeobachteten Variablen die beobachteten Dynamiken beeinflussen können. Von zentraler Bedeutung ist die Vorhersage des Zustands der nicht beobachteten Spins, wenn die Kopplungen bekannt sind. Für den gemittelten Fall untersuchen wir das theoretisch optimale Ergebnis zur Vorhersage der nicht beobachteten Spins durch berechnen des Fehlers eines Bayes optimalen Prädiktors. Wir leiten einen “Mean-field” Formalismus für einzelne Instanzen von Netzwerken her, um die marginale Magnetisierung der nicht beobachteten Spins präzise zu schätzen.de
dc.identifier.urihttps://depositonce.tu-berlin.de/handle/11303/8374
dc.identifier.urihttp://dx.doi.org/10.14279/depositonce-7523
dc.language.isoenen
dc.rights.urihttp://rightsstatements.org/vocab/InC/1.0/en
dc.subject.ddc519 Wahrscheinlichkeiten, angewandte Mathematikde
dc.subject.ddc539 Moderne Physikde
dc.subject.othercomputational neuroscienceen
dc.subject.otherinformation theoryen
dc.subject.othermachine learning,en
dc.subject.otherstatistical physicsen
dc.subject.othercomputationale Neurowissenschaftde
dc.subject.otherInformationstheoriede
dc.subject.othermaschinelles Lernende
dc.subject.otherStochastikde
dc.titleA statistical physics approach to inference problems on random networksen
dc.title.subtitleIsing and kinetic Ising modelsen
dc.title.translatedEin Ansatz der statistischen Physik zu Inferenzproblemen in Zufallsnetzwerkende
dc.title.translatedsubtitleIsing- und kinetisches Ising-Modellde
dc.typeDoctoral Thesisen
dc.type.versionacceptedVersionen
tub.accessrights.dnbdomainen
tub.affiliationFak. 4 Elektrotechnik und Informatik::Inst. Softwaretechnik und Theoretische Informatikde
tub.affiliation.facultyFak. 4 Elektrotechnik und Informatikde
tub.affiliation.instituteInst. Softwaretechnik und Theoretische Informatikde
tub.publisher.universityorinstitutionTechnische Universität Berlinen

Files

Original bundle
Now showing 1 - 1 of 1
Loading…
Thumbnail Image
Name:
bachschmid_romano_ludovica.pdf
Size:
6.9 MB
Format:
Adobe Portable Document Format
Description:
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
4.9 KB
Format:
Item-specific license agreed upon to submission
Description:

Collections