Loading…
Modelling approaches for the integration of different omics and database-information for Clostridium acetobutylicum
Modelling approaches for the integration of different omics and database-information for Clostridium acetobutylicum
Curth, Sebastian
Inst. Biotechnologie
Diese Arbeit umfasst die Methoden-Erstellung zur Erforschung der Butanol-
Bildung von Clostridium acetobutylicum über in silico Modelle. Zwei dieser
Modelle werden hier ausführlich besprochen und die notwendige Basis aus mathematischen
Formalismen für die Evaluierung sowie informationstechnischen
Herangehensweisen eingeführt, wie z.B. die Etablierung einer lokalen Datenbank
der Clostridien-Annotation aus KEGG.
Das erste zu besprechende Modell ist ein statisches Pathway-Model, das es
ermöglicht Transkriptom-Daten unter Zuhilfenahme eines metabolischen Netzwerkes
darzustellen und zu analysieren. Insbesondere wird eine boolesche Logik
diskutiert, die die Daten-Integration vollzieht. Charakteristische Eigenschaften
des Netzwerkes werden so hervorgehoben und metabolische Zustände visuell
zugänglich gemacht. Die Bildung experimenteller Hypothesen wird erleichtert:
Hier wird die Möglichkeit einer 3-Hydroxybutyrate dehydrogenase Aktivität in C.
acetobutylicum näher beleuchtet. Die resultierende Prioritätenliste des Annotations-
Transfers beinhaltet sowohl funktionale als auch regulatorische Informationen aus
Datenbanken und Experimenten und bietet somit einen optimalen Startpunkt,
experimentelle Forschung zu initiieren.
Das zweite zu besprechende Modell ist ein dynamisches Modell, das benutzt wird,
um Metabolom- und Transkriptom-Daten aus Fermentations-Experimenten zu
vereinigen. Seine besondere Struktur ermöglicht eine Vielzahl neuartiger Analysen
- bringt aber ebenso neuartige Probleme mit sich. Die Resultate deuten
darauf hin, dass der pH-Shift in C. acetobutylicm allein von der Dynamik der
Transkriptom-Daten abhängt. Optimierungsstrategien auf Transkript-Ebene und
auf Parameter-Ebene des Modells werden implementiert und ihre Resultate diskutiert.
Schließlich wird über Hauptkomponenten-Analyse sowohl eine Methode zur Optimierung
der Laufzeiten eines solchen Modells gegeben als auch zwei neue Methoden
geschlussfolgert: Eine, um die zeitliche Dynamik der Transkriptom-Daten geeignet
zu variieren ohne regulatorische Profile zu verändern, die andere um Gene anhand
ihrer regulatorischen Ähnlichkeit zu klassifizieren.
This work establishes methods to investigate the butanol formation of Clostridium
acetobutylicum. In particular, the generation of two types of models will be extensively
discussed. Therefor, the required formal basis for the model evaluation and
the information technological standards will be introduced, e.g. the construction
of a local database of clostridial annotation in KEGG.
The first model is a static pathway-model that provides the integration of transcriptome
data into a metabolic-network model for visualisation and analysis
purposes. It is proposed to use a novel rule from boolean logic for data integration
to facilitate visual access to characteristics of the metabolic network. As consequence,
the postulation of experimental hypotheses is facilitated: The possibility
of a 3-hydroxybutyrate dehydrogenase activity in C. acetobutylicum is illuminated.
The resulting priority list from annotation transfer contains functional and
regulatory aspects of the data and the databases and it hereby offers an optimal
starting point to initiate experimental work.
The second model is a dynamic model that is used to map metabolome and
transcriptome data from fermentation experiments together. Its unique structure
allows a number of new analyses - and shows new problems. Its simulation results
suggest that the pH-shift in C. acetobutylicum can be solely related to transcript
dynamics. Optimisation strategies on the transcript level and the parameter level
of the model will be implemented and their results discussed.
Finally, the principal component analysis will be used to optimise computation
times of such a model and from this, two novel methods will be derived: dynamic
aspects of transcriptome data will be alternated to construct regulatory similar
expression profiles with different amplitudes, and genes will be classified according
to their regulatory similarity in a novel clustering approach.