Please use this identifier to cite or link to this item: http://dx.doi.org/10.14279/depositonce-1428
Main Title: Ein Annotationsschema für deutsche Sätze
Translated Title: An Annotation Scheme for German Sentences
Author(s): Simon, Bernd-Paul
Advisor(s): Erdmann, Peter
Granting Institution: Technische Universität Berlin, Fakultät I - Geisteswissenschaften
Type: Doctoral Thesis
Language: German
Language Code: de
Abstract: Diese Arbeit bietet ein Annotationsschema für deutsche Sätze zur Verwendung mit NEGRA-@nnotate. Sie enthält eine Überarbeitung der beiden unmittelbaren Vorarbeiten (STTS-Annotationsschema, NEGRA-Annotationsschema). Ein Partikelnsystem, ein Adverbialsystem und ein System von sekundären Links wurden zusätzlich entwickelt, welche wiederum den Praxistest der Korpusannotation zu bestehen hatten. Mit Hilfe des vorliegenden Annotationsschemas kann eine Vielzahl deutscher Sätze sowohl phrasenstrukturell als auch mit semantischen Funktionen deskriptiv annotiert werden. Das STTS wurde vereinheitlicht und aktualisiert durch die Beschreibung von Vorgehensweisen zum Taggen von Texten in neuer Rechtschreibung. Dann wurde das rhetorische Interpunktionstagging eingeführt und definiert. Ein kleines Tagset zur Beschreibung einer Auswahl wortrhetorischer Figuren wurde definiert. Das NEGRA-Annoationsschema wurde überarbeitet, um eine stärkere Vereinheitlichung zu erreichen sowie ungeklärte oder unterspezifizierte Fälle zu erkunden und für diese eine Lösung anzubieten. Dazu zählen u.a. verblose Sätze, verschiedene Paraphraseformeln, weitere Annotationen zu Platzhalterphrasen, innere Strukturgestaltung von Adverbphrasen und unterschiedliche Arten von Fernabhängigkeiten, wie sie im Deutschen zuweilen anzutreffen sind. Im Rahmen der Erweiterung des NEGRA-Annotationsschemas wurden entwickelt: Eine Konvention zur geklammerten Darstellung von sekundären Links, die Neugliederung der NEGRA-Kategorien MO und MNR und eine einheitliche Behandlung prä- und postnominaler Attribute. Schließlich wurden mehrere Testbatterien zusammengestellt, die bei der Unterscheidung der Partikeln von den Adverbialen und den Satzpartikeln helfen. Ein Gliederungssystem der Partikeln und eine umfangreiche Klassifikation der Adverbiale mit vielen Subklassen schließen sich an. Schließlich werden Relationen vorgestellt, welche textkonstituierende Wirkung haben und primär durch sekundäre Links dargestellt werden. Durch die Annotation von Korpora durch diese Links zusammen mit der primären syntaktischen Struktur wird ein partieller Einblick in die Textgrammatik auf Mikroebene möglich, welcher als Datenstruktur kodierbar wird. Ein mögliches Anwendungsgebiet von @nnotate-Korpora liegt in der Unterstützung von maschinellen oder maschinell gestützten Übersetzungscomputern, denn zum besseren Verständnis von fremdsprachlichen Sätzen und deren treffsicheren Übersetzung in eine Zielsprache sind strukturelle Analysen eine große Hilfe.
This thesis offers an annotation scheme for German sentences and is intended to be used in connection with NEGRA-@nnotate. The annotation scheme on hand allows annotating a multitude of German sentences, their phrase structure and their semantic functions, in a descriptive way. A revision and extension of immediately preceding schemes (STTS annotation scheme, NEGRA annotation scheme) is included. A particle system, an adverbial system and a system of secondary links were developed additionally. These extensions had to prove their applicability to corpus annotation by being put into practice. The STTS was adapted as well as updated by stating routines for tagging texts in the “new” spelling convention. Rhetorically tagged punctuation was invented and defined. A minor tagset for describing a selection of stylistic figures was defined. The NEGRA annotation scheme was revised with the following aim in mind: To arrive at an improved standardization, to explore cases unaccounted for or left unspecified, and to offer solutions for them. This relates to verbless sentences, various paraphrase formulas, more annotations for placeholder phrases, internal structures of adverb phrases and various remote dependencies of phrases, as they can be found in German. The framework was extended by developing a convention for the bracketed representation of secondary links, a restructuring of the NEGRA categories MO and MNR, and a standardized treatment for pre- and postnominal attributes. Eventually several test batteries were assembled to assist in differentiating particles, sentence particles and adverbials. A system of how to subdivide and classify particles and adverbials was added as well. Relations with text constituting effect are presented finally, primarily represented through secondary links. Annotating corpora with these links together with the primary syntactic annotation gives a partial insight in text grammar on micro level, coded as data structure. @nnotate copora may prove useful in supporting automatic or machine-based translation systems, for structural analyses are a valuable aid in reaching an improved understanding of sentences in a foreign language, and their accurate translation in a target language.
URI: urn:nbn:de:kobv:83-opus-13712
http://depositonce.tu-berlin.de/handle/11303/1725
http://dx.doi.org/10.14279/depositonce-1428
Exam Date: 27-Feb-2004
Issue Date: 11-Sep-2006
Date Available: 11-Sep-2006
DDC Class: 400 Sprache
Subject(s): @nnotate
Annotationslexikon
Annotationsschema
Korpuslinguistik
Phrasenstrukturgrammatik
@nnotate grammar corpus
Annotation scheme
PSG
Usage rights: Terms of German Copyright Law
Appears in Collections:Technische Universität Berlin » Fakultäten & Zentralinstitute » Fakultät 1 Geistes- und Bildungswissenschaften » Institut für Sprache und Kommunikation » Publications

Files in This Item:
File Description SizeFormat 
Dokument_35.pdf14,12 MBAdobe PDFThumbnail
View/Open


Items in DepositOnce are protected by copyright, with all rights reserved, unless otherwise indicated.