Please use this identifier to cite or link to this item: http://dx.doi.org/10.14279/depositonce-1047
Main Title: mArachna
Subtitle: Eine semantische Analyse der mathematischen Sprache für ein computergestütztes Information Retrieval System
Author(s): Natho, Nicole
Advisor(s): Seiler, Ruedi
Granting Institution: Technische Universität Berlin, Fakultät II - Mathematik und Naturwissenschaften
Type: Doctoral Thesis
Language: German
Language Code: de
Abstract: Eine wichtige Komponente von eLearning-Plattformen ist ein Information Retrieval Mechanismus. Dazu müssen die vorhandenen Inhalte zunächst schematisiert und kategorisiert, und die dabei gewonnenen Informationen in ein Beziehungsnetzwerk eingeordnet werden. Benutzeranfragen können dann grundsätzlich anhand der in der Sprache manifestierten inhaltlichen Beziehungen beantwortet werden. Aufgrund der großen Menge der verfügbaren mathematischen Inhalte ist es wünschenswert, diesen Prozess weitestgehend zu automatisieren. In dieser Arbeit wird ein Verfahren für die grundsätzliche Erstellung eines solchen Beziehungsnetzwerks aus deutschsprachigen mathematischen Texten vorgestellt. Dabei liegt der Fokus auf der Analyse feingranularer mathematischer Textbausteine wie Definitionen und Theoremen. Die Inhalte in diesen sogenannten Entitäten sind der wesentliche Informationsträger in mathematischen Texten, weshalb die Entitäten auch die inhaltlichen Grundbausteine der mathematischen eLearning-Plattform Mumie bilden, als deren Teilprojekt diese Arbeit entstand. Es wird gezeigt, dass die Entitäten in mathematischen Texten linguistisch gut strukturiert und damit schematisierbar sind. Darauf aufbauend wird ein computerlinguistisches Verfahren entwickelt, um semantische Informationen aus den Entitäten zu gewinnen. Diese werden in eine Wissensbasis eingefügt, die auf einer eigens entworfenen Ontologie der mathematischen Fachsprache basiert. Dabei werden im Text vorkommende Begriffe als Knoten dargestellt, während die zwischen ihnen herrschenden sprachlichen Beziehungen als Kanten repräsentiert werden.Inhaltliche Beziehungen zwischen Begriffen werden dabei anhand der verwendeten Sprachkonstrukte erkannt (nicht aufgrund inhaltlicher mathematischer Abhängigkeiten). Auf der Grundlage der entwickelten Verfahren wurde ein experimenteller morphologischer, syntaktischer und semantischer Parser in Java implementiert, der in der Lage ist, einfache mathematische Definitionen und Theoreme computerlinguistisch zu analysieren. Aufbauend auf den Ergebnissen dieser Arbeit ließe sich beispielsweise ein Retrieval Interface entwickeln, in dem ein Benutzer eine Anfrage zu einem mathematischen Begriff stellt, und vom System Informationen zu diesem und damit zusammenhängigen Begriffen etwa in Form eines Wissensnetzes dargestellt bekommt.
URI: urn:nbn:de:kobv:83-opus-9471
http://depositonce.tu-berlin.de/handle/11303/1344
http://dx.doi.org/10.14279/depositonce-1047
Exam Date: 17-Feb-2005
Issue Date: 10-Mar-2005
Date Available: 10-Mar-2005
DDC Class: 510 Mathematik
Subject(s): Computerlinguistik
Information Retrieval
Mathematische Sprache
Ontologie
Semantik
Sprachanalyse
Wissensbasis
Usage rights: Terms of German Copyright Law
Appears in Collections:Technische Universität Berlin » Fakultäten & Zentralinstitute » Fakultät 2 Mathematik und Naturwissenschaften » Publications

Files in This Item:
File Description SizeFormat 
Dokument_4.pdf1.57 MBAdobe PDFThumbnail
View/Open


Items in DepositOnce are protected by copyright, with all rights reserved, unless otherwise indicated.