Loading…
Thumbnail Image

The 3D gene regulatory landscape in human bone cells and its influence on cell differentiation and disease

Ali, Salaheddine

The human genome encodes for around 20.000 genes tightly regulated in both tissue and time-specific manner. Even though they comprise less than 2% of the genome, coding regions are the most studied and evolutionary conserved sequences. Genetic variants in the protein-coding sequence can directly lead to missing or misfolded proteins and hence, perturbations of cellular function that can lead to disease phenotypes. Based on mutation studies, thousands of genes have been associated with diseases and defined as risk factors. However, variants in the non-coding part of the genome have been overlooked by geneticists, and the impact of such genome variations regarding their respective gene regulation needs to be better understood. The activation of genes and their expression levels depend largely on cis-regulatory elements (CREs) like enhancers, which are not necessarily part of the gene sequence, sometimes located megabases away from the gene(s) they regulate. Such long-range enhancer-promoter interactions are often facilitated through precise patterns of spatiotemporal chromosome organization and subdivided into regulatory landscapes called topologically associated domains (TADs). Even though sequence alterations in TADs are generally less perturbing than in genes, variants in regulatory elements such as enhancers can profoundly influence transcription factor (TF) binding and cause gene dysregulation. With this respect, variants in enhancers are considered essential drivers of cell development and enhancer sequence alterations as potential risk loci for genetic diseases. Here, we used in-vitro bone cells (osteoblasts and osteoclast) and their progenitors (monocytes and mesenchymal stromal cells) to study the regulatory landscape in a 3D context. The first part of this thesis investigates enhancers of bone cells from the perspective of genetic diagnostics. We found thousands of enhancers and transcription factor binding sites in bone cells and used a chromosome conformation capture (3C) method called Hi-C to connect enhancers to their target genes. These interconnected genes have been partially identified as known bone genes. However, we have found a list of genes not described as bone relevant. To test the diagnostic potential of our database, we investigated an unsolved case of osteopetrosis and a set of unexplained GWAS hits. We found that the mutation/ GWAS variants intersect with our bone enhancers. Therefore, we were able to assign these regions to potential target genes. In general, the strong promoter-enhancer interconnections in our database suggest that the enhancers described in this thesis are essential regulatory elements for bone development and disease, therefore, must be considered in patient phenotype-matched genetic screenings. The second part of this thesis investigates the differentiation capacity of different types of mesenchymal stromal cells as osteoblast progenitors. A controversy in therapeutic medicine is that MSC types are not always compatible with regeneration and bioengineering processes due to their lack of differentiation capacity. Here, I characterized enhancers in five types of MSCs and revealed a profound enhancer variation despite largely similar gene expression profiles, especially in osteogenic genes. In critical-size bone fracture experiments, the enhancers and their respective downstream analysis coincide with the regenerative capacity. Thus, they might reflect an epigenetic pre-determination of mesenchymal stromal cell types.
Das menschliche Genom kodiert rund 20.000 Gene, die sowohl in gewebespezifischer als auch in zeitabhängiger Weise streng reguliert sind. Obwohl sie weniger als 2% des Genoms ausmachen, sind kodierende Regionen, die am meisten untersuchten und evolutionär am stärksten konservierten Sequenzen. Genetische Varianten in der protein-kodierenden Sequenz können direkt zu fehlenden oder falsch gefalteten Proteinen führen und damit Störungen der Zellfunktion verursachen, die zu Krankheitsphänotypen führen können. Aufgrund von Mutationsstudien wurden tausende Gene mit Krankheiten in Verbindung gebracht und als Risikofaktoren definiert. Allerdings wurden Varianten im nicht-kodierenden Teil des Genoms von Genetikern übersehen, und die Auswirkungen solcher Genomvariationen in Bezug auf ihre jeweilige Genregulation müssen besser verstanden werden. Die Aktivierung von Genen und ihre Expressionslevel hängen in hohem Maße von cis-regulatorischen Elementen (CREs) wie Enhancern ab, die zwingend Teil der Gensequenz sind und manchmal Megabasen entfernt von Genen liegen, die sie regulieren. Solch distale Enhancer-Promotor-Interaktionen werden oft durch präzise spatio-temporale Chromosomenorganisation erleichtert und in regulatorische Regionen unterteilt, die als topologisch assoziierte Domänen (TADs) bezeichnet werden. Obwohl Sequenzänderungen in TADs im Allgemeinen weniger störend sind als in Genen, können Varianten in regulatorischen Elementen wie Enhancer die Bindung von Transkriptionsfaktoren (TFs) stark beeinflussen und eine Gendysregulation verursachen. In diesem Zusammenhang gelten Varianten in Enhancer als wesentliche Treiber der Zellentwicklung und Enhancer-Sequenzveränderungen als potenzielle Risikoloci für genetische Krankheiten. Hier haben wir in-vitro-Knochenzellen (Osteoblasten und Osteoklasten) und ihre Vorläufer (Monozyten und mesenchymale Stromazellen) verwendet, um die regulatorische Landschaft in einem 3D-Kontext zu untersuchen. Der erste Teil dieser Arbeit untersucht Enhancer von Knochenzellen aus der Perspektive der genetischen Diagnostik. Wir haben tausende Enhancer und Transkriptionsfaktor-Bindungsstellen in Knochenzellen gefunden und eine Methode zur Analyse der Chromosomenstruktur namens Hi-C verwendet, um Enhancer mit ihren Zielgenen zu verbinden. Diese miteinander verbundenen Gene wurden teilweise als bekannte Knochengene identifiziert. Allerdings haben wir eine Liste von Genen gefunden, die nicht als knochenrelevant beschrieben wurden. Um das diagnostische Potenzial unserer Datenbank zu testen, haben wir einen ungeklärten Fall von Osteopetrose und eine Reihe von unerklärten GWAS-Treffern untersucht. Wir haben festgestellt, dass sich die Mutationen/GWAS-Varianten mit unseren Knochen-Enhancern überschneiden. Daher konnten wir diese Regionen potenziellen Zielgenen zuordnen. Im Allgemeinen legen die Promoter-Enhancer-Verbindungen in unserer Datenbank nahe, dass die in dieser Arbeit beschriebenen Enhancer wesentliche regulatorische Elemente für die Knochenentwicklung und -krankheit sind und daher in genetischen Screenings berücksichtigt werden müssen. Der zweite Teil dieser Arbeit untersucht die Differenzierungsfähigkeit verschiedener Arten von mesenchymalen Stromazellen als Osteoblasten-Vorläufer. Ein Streitpunkt in der regenerativen Medizin ist, dass MSC-Typen, aufgrund ihrer fehlenden Differenzierungsfähigkeit, nicht immer mit Regenerations- und Bioengineering-Prozessen kompatibel sind. Hier habe ich Enhancer in fünf Arten von MSCs charakterisiert und trotz weitgehend ähnlicher Genexpressionsprofile, eine tiefgreifende Enhancer-Variation aufgedeckt, die besonders in Knochen relevanten Genen stark ausgeprägt ist. In Experimenten mit Knochenbrüchen (die eine kritische Größe aufweisen) korreliert zudem die regenerative Kapazität mit den Enhancern die Knochenrelevant sind und daher eine epigenetische Vorbestimmung der mesenchymalen Differenzierung widerspiegeln könnte.