Loading…
Thumbnail Image

mArachna

Eine semantische Analyse der mathematischen Sprache für ein computergestütztes Information Retrieval System

Natho, Nicole

Eine wichtige Komponente von eLearning-Plattformen ist ein Information Retrieval Mechanismus. Dazu müssen die vorhandenen Inhalte zunächst schematisiert und kategorisiert, und die dabei gewonnenen Informationen in ein Beziehungsnetzwerk eingeordnet werden. Benutzeranfragen können dann grundsätzlich anhand der in der Sprache manifestierten inhaltlichen Beziehungen beantwortet werden. Aufgrund der großen Menge der verfügbaren mathematischen Inhalte ist es wünschenswert, diesen Prozess weitestgehend zu automatisieren. In dieser Arbeit wird ein Verfahren für die grundsätzliche Erstellung eines solchen Beziehungsnetzwerks aus deutschsprachigen mathematischen Texten vorgestellt. Dabei liegt der Fokus auf der Analyse feingranularer mathematischer Textbausteine wie Definitionen und Theoremen. Die Inhalte in diesen sogenannten Entitäten sind der wesentliche Informationsträger in mathematischen Texten, weshalb die Entitäten auch die inhaltlichen Grundbausteine der mathematischen eLearning-Plattform Mumie bilden, als deren Teilprojekt diese Arbeit entstand. Es wird gezeigt, dass die Entitäten in mathematischen Texten linguistisch gut strukturiert und damit schematisierbar sind. Darauf aufbauend wird ein computerlinguistisches Verfahren entwickelt, um semantische Informationen aus den Entitäten zu gewinnen. Diese werden in eine Wissensbasis eingefügt, die auf einer eigens entworfenen Ontologie der mathematischen Fachsprache basiert. Dabei werden im Text vorkommende Begriffe als Knoten dargestellt, während die zwischen ihnen herrschenden sprachlichen Beziehungen als Kanten repräsentiert werden.Inhaltliche Beziehungen zwischen Begriffen werden dabei anhand der verwendeten Sprachkonstrukte erkannt (nicht aufgrund inhaltlicher mathematischer Abhängigkeiten). Auf der Grundlage der entwickelten Verfahren wurde ein experimenteller morphologischer, syntaktischer und semantischer Parser in Java implementiert, der in der Lage ist, einfache mathematische Definitionen und Theoreme computerlinguistisch zu analysieren. Aufbauend auf den Ergebnissen dieser Arbeit ließe sich beispielsweise ein Retrieval Interface entwickeln, in dem ein Benutzer eine Anfrage zu einem mathematischen Begriff stellt, und vom System Informationen zu diesem und damit zusammenhängigen Begriffen etwa in Form eines Wissensnetzes dargestellt bekommt.