Thumbnail Image

Advances in hierarchical Bayesian learning with applications to neuroimaging

Hashemi, Ali

Electro- and Magnetoencephalography (E/MEG) are non-invasive imaging techniques that enable us to measure brain electrical activity with high temporal resolution. This remarkable feature makes these imaging modalities indispensable tools in basic neuroscience and clinical neurology. The downside of both techniques, however, lies in their low spatial resolution. Brain source imaging (BSI) aims to mitigate this limitation, but is an inherently ill-posed inverse problem because of the large number of brain sources compared to the small number of sensors. To deal with the ill-posed characteristic of the BSI problem, various regularization techniques introducing prior assumptions on the spatio-temporal structure of the source activations have been proposed. One particularly successful approach is Type-II Bayesian learning, also called sparse Bayesian learning (SBL). The primary contribution of the first part of the thesis is to provide a unifying theoretical platform to reformulate three popular SBL algorithms for BSI under the majorization-minimization (MM) framework. This unification perspective allows us to compare different properties of SBL algorithms like their convergence behavior or reconstruction performance within a common theoretical framework. Building on the MM principle, we also propose a novel method that achieves favorable source reconstruction performance in low signal-to-noise-ratio settings. Precise knowledge of the parameters of the noise distribution, namely its scale and correlation structure, is a fundamental requirement for obtaining accurate solutions to many Type-II learning problems. In the second part of the thesis, we present novel principled techniques that can learn the noise covariance jointly with the distribution of the reconstructed sources within the framework of Type-II Bayesian learning. First, we derive analytic rules to update noise variance adaptively. Second, we propose spatial and temporal cross-validation schemes, where either subsets of E/MEG channels or recorded samples are left out of the source reconstruction, and where the noise variance is selected as the minimizer of the divergence between model and hold-out data. Finally, we extend our framework to a setting where the noise has full covariance structure. Using Riemannian geometry, we are able to derive an efficient algorithm for updating source variances and a full-structure noise covariance along the manifold of positive definite matrices. E/MEG data are known to possess a complex intrinsic spatio-temporal structure. In the final part of the thesis, we propose a novel and efficient Type-II algorithmic framework within which the spatio-temporal dynamics of model parameters and noise are modeled to have Kronecker product covariance structure. Exploiting the concept of geodesic convexity on the Riemannian manifold of covariance matrices with Kronecker structure, we are then able to derive robust, fast, and efficient MM optimization algorithms for model inference with provable convergence guarantees. We also show that assuming a Toeplitz structure for the temporal covariance matrix results in computationally efficient update rules. Extensive simulation studies and several real data analyses underline the usefulness and favorable performance of the proposed methods in this thesis.
Elektro- und Magnetoenzephalographie (E/MEG) sind nicht-invasive bildgebende Verfahren, die es uns ermöglichen, die elektrische Aktivität des Gehirns mit hoher zeitlicher Auflösung zu messen. Diese bemerkenswerte Eigenschaft macht diese bildgebenden Verfahren zu unverzichtbaren Instrumenten in den Grundlagen der Neurowissenschaften und der klinischen Neurologie. Der Nachteil beider Verfahren liegt jedoch in ihrer geringen räumlichen Auflösung. Brain-Source-Imaging (BSI) zielt darauf ab, diese Einschränkung zu mildern, ist aber aufgrund der großen Anzahl von Hirnquellen im Vergleich zur geringen Anzahl von Sensoren ein inhärent schlecht gestelltes inverses Problem. Um mit dem schlecht gestellten Charakter des BSI-Problems umzugehen, wurden verschiedene Regularisierungstechniken vorgeschlagen, die Annahmen über die räumlich-zeitliche Struktur der Quellenaktivierungen einführen. Ein besonders erfolgreicher Ansatz ist das Typ-II-Bayesianische Lernen, auch sparse-Bayesian-learning (SBL) genannt. Der primäre Beitrag des ersten Teils der Arbeit besteht darin, einen vereinheitlichenden theoretischen Rahmen zur Neuformulierung von drei populären SBL-Algorithmen für BSI unter Verwendung der Majorization-Minimization (MM) zu schaffen. Diese Vereinheitlichungsperspektive ermöglicht es uns, verschiedene Eigenschaften von SBL-Algorithmen, wie ihr Konvergenzverhalten oder ihre Rekonstruktionsleistung, innerhalb eines gemeinsamen theoretischen Rahmens zu vergleichen. Aufbauend auf dem MM-Prinzip schlagen wir außerdem eine neuartige Methode vor, die eine vorteilhafte Quellenrekonstruktion bei niedrigem Signal-Rausch-Verhältnis erreicht. Die genaue Kenntnis der Parameter der Rauschverteilung, d.h. ihres Maßes und ihrer Korrelationsstruktur, ist eine grundlegende Voraussetzung für die Erzielung genauer Lösungen bei vielen Typ-II-Lernproblemen. Im zweiten Teil der Arbeit stellen wir neuartige prinzipielle Techniken vor, die die Rauschkovarianz gemeinsam mit der Verteilung der rekonstruierten Quellen im Rahmen des Typ-II-Bayesianischen Lernens lernen können. Zunächst leiten wir analytische Regeln zur adaptiven Aktualisierung der Rauschvarianz ab. Zweitens schlagen wir räumliche und zeitliche Kreuzvalidierungsverfahren vor, bei denen entweder Teilmengen von E/MEG-Kanälen oder aufgezeichnete Proben aus der Quellenrekonstruktion herausgenommen werden und bei denen die Rauschvarianz als Minimierung der Divergenz zwischen Modell und Hold-out-Daten ausgewählt wird. Schließlich erweitern wir unseren theoretischen Rahmen auf eine Situation, in der das Rauschen eine vollständige Kovarianzstruktur aufweist. Mit Hilfe der Riemannschen Geometrie können wir einen effizienten Algorithmus für die Aktualisierung der Varianzen der Quellen und der Kovarianz des Vollstrukturrauschens entlang der Mannigfaltigkeit der positiv-definiten Matrizen ableiten. E/MEG-Daten besitzen bekanntermaßen eine komplexe intrinsische Raum-Zeit-Struktur. Im letzten Teil der Arbeit schlagen wir einen neuartigen und effizienten Typ-II-Algorithmus vor, in dem die Raum-Zeit-Dynamik von Modellparametern und Rauschen so modelliert wird, dass sie eine Kronecker-Produkt-Kovarianzstruktur aufweist. Unter Ausnutzung des Konzepts der geodätischen Konvexität auf der Riemannschen Mannigfaltigkeit von Kovarianzmatrizen mit Kronecker-Struktur sind wir dann in der Lage, robuste, schnelle und effiziente MM-Optimierungsalgorithmen für die Modellinferenz mit beweisbaren Konvergenzgarantien abzuleiten. Wir zeigen auch, dass die Annahme einer Toeplitz-Struktur für die temporale Kovarianzmatrix zu rechnerisch effizienten Aktualisierungsregeln führt. Ausführliche Simulationsstudien und mehrere Analysen realer Daten unterstreichen die Nützlichkeit und die gute Leistung der in dieser Arbeit vorgeschlagenen Methoden.