Treelet transform for untargeted metabolomics data

dc.contributor.advisorBoeing, Heineren
dc.contributor.authorFörster, Janaen
dc.contributor.grantorTechnische Universität Berlin, Fakultät VII - Wirtschaft und Managementen
dc.contributor.refereeBoeing, Heineren
dc.contributor.refereeBusse, Reinharden
dc.date.accepted2014-08-05
dc.date.accessioned2015-11-20T23:42:10Z
dc.date.available2014-08-14T12:00:00Z
dc.date.issued2014-08-14
dc.date.submitted2014-08-13
dc.description.abstractIn den letzten Jahrzehnten gab es zahlreiche Entwicklungen in der Metaboliterfassung in Gewebeproben – untargeted metabolomics [1] erfasst alle vorhandenen Verbindungen in einer biologischen Probe. Chromatographie und Massenspektrometrie ermöglichen eine präzisere Darstellung des menschlichen Metabolismus, welcher hunderte von Metaboliten und ihre Beziehungen beinhaltet. Diese Entwicklungen erfordern außerdem spezifische statistische Methoden, um so generierte Datensätze zu bearbeiten. Einige etablierte Methoden, wie die Hauptkomponentenanalyse und Faktoranalyse, beachten korrelierte Variablen in hochdimensionalen Datensätze und generieren latente Variablen für weiterführende Analysen. 2011 wurde eine alternative Methode für die Dimensionsreduktion vorgestellt – TreeletTransform (TT)- welche ebenfalls hochkorrelierte Variablen zu latenten Variablen zusammenfasst [2]. Die vorliegende Arbeit untersucht Serummetabolite und Serumlipide mit TT, welche mit einem untargeted metabolomics Ansatz in 226 Probanden einer EPIC-Potsdam Querschnittsstudie erhoben wurden. Die Ergebnisse wurden verglichen mit Ergebnissen einer Hauptkomponentenanalyse mit demselben Datensatz. Zusätzlich wurden alle extrahierten Metabolit- und Lipidprofile auf ihre Korrelationen mit anthropometrischen Parametern und intestinaler Mikrobiota untersucht. TT mit Serummetaboliten generierte fünf Treeletkomponenten (TCs), die 18.9% der Varianz innerhalb der Metabolitdaten erklärten. Die fünf TCs wurden charakterisiert von Aminosäuren, Fettsäuren, Zuckerverbindungen und Carbonsäuren, Aminosäurederivaten und Zuckeralkoholen. Auch die mit einer Hauptkomponentenanalyse extrahierten Faktoren wurden von diesen Metabolitgruppen außer den Zuckeralkoholen geladen. Die Hauptkomponentenanalyse resultierte in der Extraktion von 4 Faktoren, die 37,5% der Varianz erklärten. Die Stabilität der latentenm Variablen, welche mit Bootstrap sampling erhoben wurde, war größer für die Metabolitkomponenten der TT Analyse als die der Hauptkomponentenanalyse-Faktoren. Drei Lipidkomponenten und –faktoren wurden durch TT und eine Hauptkomponentenanalyse mit den Serumlipidvariablen extrahiert. Die Komponenten und Faktoren wurden geladen von gesättigten und einfach ungesättigten Triglyceriden, mehrfach ungesättigten Triglyceriden und Phosphatidylcholinen und –ethanolaminen. Die erklärte Varianz und auch die Stabilität der latenten Variablen waren in der Hauptkomponentenanalyse größer als in der TT Analyse (17.8% vs 39.8% und 40.7% vs 80%). Zwei Metabolitkomponenten und –faktoren, Aminosäuren und Aminosäurederivate, und alle Lipidkomponenten und –faktoren zeigten Korrelationen zu anthropometrishen Parametern. Die stärkste positive Korrelation wurde zwischen dem mehrfach ungesättigte Triglyceride Faktor und der Waist-to-Height ratio beobachtet (r= 0,331), die stärkste negative Korrelation zwischen dem Phosphatidylcholine und –ethanolamin Faktor und dem viszeralem Fett (r= 0,297). Alle extrahierten Metabolitprofile, Lipidkomponenten und zwei Lipidfaktoren waren mit der intestinalen Mikrobiota korreliert. Insgesamt stellt die TT Methode eine vielversprechende Alternative zur Hauptkomponentenanalyse dar. Die Faktoren erklären mehr Varianz, aber sie bestehen auch aus sehr viel mehr hochladenden Originalvariablen. Daher ist die Interpretation der TT Komponenten sehr viel einfacher als die Interpretation der Hauptkomponentenanalyse Faktoren. Die Public Health Relevanz dieser Methode wurde gezeigt, sie resultierte in Metabolitprofilen, welche dabei helfen können, metabolisch gesunde Übergewichtige von metabolisch ungesunden Übergewichtigen zu unterscheiden [3]. 1. Nicholson, J.K. and J.C. Lindon, Systems biology: Metabonomics. Nature, 2008. 455(7216): p. 1054-6 2. Gorst-Rasmussen, A., et al., Exploring dietary patterns by using the treelet transform. Am J Epidemiol, 2011. 173(10): p. 1097-104 3. van Vliet-Ostaptchouk, J et al., The prevalence of metabolic syndrome and metabolically healthy obesity in Europe: a collaborative analysis of ten large cohort studies, BMC Endocrine Disorders 2014, 14:9de
dc.description.abstractDevelopments in metabolite detection in tissue samples could be observed in the last decades – untargeted metabolomics [1] assessing all detectable compounds in a biological sample. Chromatography and mass spectrometric methods enable a more precise depiction of the human metabolism containing hundreds of metabolites and their relationships. These developments also require specific statistical methods to handle data sets generated with untargeted metabolomics approaches. Some established methods, such as principal component analysis (PCA) and factor analysis consider correlative variables in high-dimensional data sets and generate latent variables for further analysis. In 2011 an alternative method for dimension reduction - treelet transform (TT) - was proposed, also summarising high-correlative variables to latent ones [2]. The present work investigates serum metabolites and serum lipids with TT, assessed with an untargeted metabolomics approach in 226 participants of a cross-sectional sub-study within the EPIC-Potsdam cohort. The results are compared with results of a PCA on the same data set. Further, all extracted metabolite and lipid profiles are investigated for their correlation with anthropometric parameters and intestinal microbiota. TT with serum metabolites generated five treelet components (TCs) explaining 18.9% of the variance in the metabolite data. The five TCs were characterised by amino acids, fatty acids, sugar compounds and carboxylic acids, amino acid derivatives and sugar alcohols, respectively. Also the factors extracted by a PCA on the same data set loaded on these metabolite groups except the sugar alcohols. The PCA resulted in the extraction of 4 factors explaining 37.5% of the variance. Stability of the latent variables, assessed by bootstrap sampling, is higher for the metabolite components generated by TT than for the PCA factors. Three lipid components and factors were extracted by TT and PCA, respectively, from serum lipid variables. The components and factors reflect saturated and monounsaturated triglycerides, polyunsaturated triglycerides and phosphatidylcholines and –ethanolamines. The explained variance and also the stability of the latent variables were higher in PCA factors compared to TT components (17.8% vs 39.8% and 40.7% vs 80%, respectively). Two metabolite components and factors, amino acid and amino acid derivatives, and all lipid components and factors were correlated to anthropometric parameters. The highest positive correlation could be observed between the polyunsaturated triglycerides factor and waist-to-height ratio (r= 0.331), the highest negative between the phosphatidylcholines and –ethanolamines factor and visceral fat (r=-0.297). All extracted metabolite profiles, all lipid TCs and two lipid factors were correlated to intestinal microbiota bands. Overall, the TT method represents an auspicious alternative to PCA. Factors explain more variance, but consist of more highly loaded original variables. Therefore the interpretation of the TT components is much easier than the interpretation of PCA factors. The public health relevance of this method was shown, it resulted in metabolite profiles that can help to distinguish metabolic healthy obese from metabolic unhealthy obese individuals [3]. 1. Nicholson, J.K. and J.C. Lindon, Systems biology: Metabonomics. Nature, 2008. 455(7216): p. 1054-6 2. Gorst-Rasmussen, A., et al., Exploring dietary patterns by using the treelet transform. Am J Epidemiol, 2011. 173(10): p. 1097-104 3. van Vliet-Ostaptchouk, J et al., The prevalence of metabolic syndrome and metabolically healthy obesity in Europe: a collaborative analysis of ten large cohort studies, BMC Endocrine Disorders 2014, 14:9en
dc.identifier.uriurn:nbn:de:kobv:83-opus4-55853
dc.identifier.urihttps://depositonce.tu-berlin.de/handle/11303/4447
dc.identifier.urihttp://dx.doi.org/10.14279/depositonce-4150
dc.languageEnglishen
dc.language.isoenen
dc.rights.urihttp://rightsstatements.org/vocab/InC/1.0/en
dc.subject.ddc500 Naturwissenschaften und Mathematiken
dc.subject.otherAnthropometriede
dc.subject.otherDarmmikrobiotade
dc.subject.otherSerummetabolitede
dc.subject.otherÜbergewichtde
dc.subject.otherAnthropometryen
dc.subject.otherIntestinal microbiotaen
dc.subject.otherObesityen
dc.subject.otherSerum metabolitesen
dc.subject.otherTreelet Transformen
dc.titleTreelet transform for untargeted metabolomics dataen
dc.title.subtitleTreelet transform generates serum metabolite and lipid components that are correlated to anthropometry and intestinal microbiota in a cross-sectional EPIC-Potsdam sub-studyen
dc.title.translatedTreelet Transform für untargeted metabolomics Datende
dc.title.translatedsubtitleTreelet Transform erzeugt Serummetabolit- und Serumlipidkomponenten, welche mit Anthropometrie und intestinaler Microbiota in einer EPIC-Potsdam Querschnittsstudie korreliert sindde
dc.typeDoctoral Thesisen
dc.type.versionpublishedVersionen
tub.accessrights.dnbfree*
tub.affiliationFak. 7 Wirtschaft und Managementde
tub.affiliation.facultyFak. 7 Wirtschaft und Managementde
tub.identifier.opus45585
tub.publisher.universityorinstitutionTechnische Universität Berlinen

Files

Original bundle
Now showing 1 - 1 of 1
Loading…
Thumbnail Image
Name:
foerster_jana.pdf
Size:
5.41 MB
Format:
Adobe Portable Document Format

Collections