Loading…
Thumbnail Image

Interoperability of geo-information in remote sensing-based biodiversity monitoring

Nieland, Simon

Rapid technological advances coupled with modern analysis methods has increased the quantity of geographical data and has therefore improved monitoring of local, regional and global environmental phenomena at much finer detail. Despite these advances, insufficient data interoperability remains to be a barrier to reusability, discovery and access to geographical information. To overcome this heterogeneity it is crucial to generate syntactic interoperability, which determines fixed standards in data exchange, but also semantic interoperability, a possibility to generate comparability by using shared descriptions with unambiguous meaning stored in semantic systems. In the field of nature conservation, semantic heterogeneity is a big challenge since national and regional data acquisition methodologies vary broadly. Moreover, trans-national data (which are required for multi-national legal processes like the EU Habitats Directive (HabDir), the Water Framework Directive or INSPIRE) are generated bottom-up, using mostly national or regional acquisition guidelines. This dissertation addresses four aspects of interoperability in nature conservation. The first part provides a methodology for semantic mediation of remote-sensing based data products, which were generated in different countries in Europe by taking into account differing sensor types and base classification schemes. The results indicate that automated, semantic-based data transformation is feasible, but is highly dependent on the conceptualisation of the respective nomenclatures. Therefore transparent, hierarchical nomenclatures are far more important for transferability than the sensor or study area. The second part applies the developed method in an up-scaling application to generate a comparable automated delineation of selected habitats in different countries by generating transferable aggregation rules. For the different habitats in the two sites an accuracy of above 70% was achieved in regard to a manual, expert-based delineation. This meets approximately the percentages of the comparison of two manual delineations since the process of manual delineation is always subjective and highly dependent on the personal qualification and perception of the surveyor and therefore inherits a high degree of uncertainty. The third part addresses the challenge of generating reproducible and formalized information in remote-sensing analysis in a semantic, ontology-based classification approach. This approach combines advanced machine learning algorithms and ontological data management and classification. It produces results with similar quality to established machine learning algorithms like the Extra Tree Classifier (ET) but preserves transferable classification rules and ontological formalism. The fourth part evaluates the automated aggregation approach of part two in respect to manual, expert-based delineation and gives recommendations for the international guidelines in terms of scale effects, minimum mapping units and the potential of the usage of remote sensing-based data sets in automated up-scaling procedures for European legal purposes. Semantic systems inherit great potential for nature conservation in terms of data storage, information retrieval and derivation and comparability of data. This thesis shows this potential by proving feasibility of semantic transformation between different nature conservation data sets, the application of this transformation procedure in up-scaling processes, and the ability to use semantic-based technologies in classification procedures. It therefore indicates that using semantic systems for data interoperability in nature conservation is possible but underlies, up to now, certain limitations. From a technical point of view the main restrictions are the absence of theme-specific controlled vocabularies and semantic infrastructures which are increasingly developed and provided by regional and international authorities. With regard to the content of the nature conservation data, limitations occur because of the high degree of uncertainty in data acquisition, semantic impreciseness of data descriptions and natural gradients in the composition of habitats.
Technologische Veränderungen gepaart mit modernen Analysemethoden haben die Menge an geographischen Daten in den letzten Jahren erheblich erhöht. Diese Entwicklung hat das Potential, lokale, regionale und globale Umweltphänomene in einem verbesserten Detaillierungsgrad zu erfassen. Trotz dieser Fortschritte bleibt ungenügende Dateninteroperabilität ein Hemmnis für die Wiederverwendbarkeit, die Auffindbarkeit und den Zugang zu geographischer Information. Um diese Datenheterogenität zu überwinden ist es zunehmend entscheidend semantische Interoperabilität zu gewährleisten. Semantische Systeme geben die Möglichkeit Vergleichbarkeit zwischen Datenpaketen zu generieren indem sie gemeinsame eindeutige Beschreibungen nutzen. Im Bereich des Naturschutzes ist semantische Heterogenität eine große Herausforderung, da sich nationale und internationale Erhebungsvorschiften zwischen den verschiedenen Ländern erheblich unterscheiden. Darüber hinaus werden transnationale Richtlinien wie die Flora-Fauna-Habitat Richtlinie oder die Wasserrahmenrichtlinie mit buttom-up Ansätzen erstellt, wobei mehrheitlich nationale und regionale Erhebungsrichtlinien verwendet werden. Diese Dissertation adressiert vier Aspekte von Interoperabilität im Naturschutz. Der erste Teil stellt eine Methode zur semantischen Mediation von fernerkundungsbasierten Datenprodukt vor, die in unterschiedlichen Ländern Europas mit unterschiedlichen Sensortypen und Nomenklaturen erstellt wurden. Die Ergebnisse zeigen, dass eine automatisierte semantische Datentransformation möglich, die Qualität der Ergebnisse allerdings stark von der Konzeptualisierung der zugehörigen Nomenklaturen abhängig ist. Daher sind transparente, hierarchische Nomenklaturen für die Vergleichbarkeit wesentlich wichtiger als Sensoren oder das Untersuchungsgebiet. Der zweite Teil wendet die entwickelte Methode in einer räumlichen Hochskalierungsanwendung an, um mit Hilfe von überführbaren Generalisierungsregeln vergleichbare, automatisierte Abgrenzungen von ausgewählten Habitattypen in unterschiedlichen Ländern zu erzeugen. Für die verschiedenen Habitattypen in den zwei Untersuchungsgebieten konnte eine übereinstimmung von über 70 % zu einer manuellen, expertenbasierten Habitatabgrenzung erreicht werden. Das entspricht etwa einem Vergleich von zwei manuellen Abgrenzungen da der Prozess der manuellen Kartierung immer Subjektiv ist, stark von der persönlichen Qualifikation und Wahrnehmung des Kartierers abhängig ist und somit einen hohes Maß an Ungenauigkeit beinhaltet. Der dritte Teil adressiert die Herausforderung, reproduzierbare und formalisierte Information mit Hilfe von Fernerkundung in einem semantischen, ontologiebasierten Klassifikationsansatz herzustellen. Dieser Ansatz kombiniert fortschrittliche Methoden des maschinellen Lernens mit ontologischem Datenmanagement und Klassifikation. Er erstellt Ergebnisse mit vergleichbarer Qualität wie etablierte Algorithmen des maschinellen lernens, bewahrt aber transferierbare Klassifikationsregeln und ontologischen Formalismus. Der vierte Teil evaluiert den automatisierten Aggregationsansatz des zweiten Teils hinsichtlich einer manuellen, expertenbasierten Habitatabgrenzung und gibt Empfehlungen für internationale Richtlinien in Form von Skaleneffekten, Mindestkartiereinheiten und dem Potential der Nutzung von Fernerkundungsdatensätzen in automatisierten räumlichen Hochskalierungsanwendungen. Semantische Systeme beinhalten ein großes Potential für den Naturschutz in Form von Datenspeicherung, Informationsgewinnung und der Ableitung von Datenvergleichbarkeit. Diese Arbeit zeigt dieses Potential auf indem sie die Machbarkeit semantischer Transformation zwischen verschiedenen Naturschutzdatensätzen belegt und deren Anwendung in räumlichen Hochskalierungsanwendungen aufzeigt. Darüber hinaus werden Möglichkeiten zur Nutzung von semantischen Systemen für Klassifikationsprozesse aufgezeigt. Die Arbeit zeigt daher, dass semantische Systeme für Dateninteroperabilität im Naturschutz nutzbar sind, aber bislang einigen Einschränkungen unterliegen. Von einem technischen Punkt sind die maßgeblichen Restriktionen nicht vorhandene thematische, kontrollierte Vokabulare und semantische Infrastruktur, die zunehmend von nationalen und internationalen Behörden entwickelt und bereitgestellt werden. Hinsichtlich des Inhalts von Naturschutzdaten ergeben sich Einschränkungen aufgrund der Unsicherheiten in der Datenaufnahme, der semantischen Ungenauigkeit bei der Datenbeschreibung und natürlicher Verläufe der Pflanzenzusammensetzungen von Habitaten.