Loading…
Thumbnail Image

Trace Link Recovery using Semantic Relation Graphs and Spreading Activation

Schlutter, Aaron; Vogelsang, Andreas

Trace Link Recovery tries to identify and link related existing requirements with each other to support further engineering tasks. Existing approaches are mainly based on algebraic Information Retrieval or machine-learning. Machine-learning approaches usually demand reasonably large and labeled datasets to train. Algebraic Information Retrieval approaches like distance between tf-idf scores also work on smaller datasets without training but are limited in providing explanations for trace links. In this work, we present a Trace Link Recovery approach that is based on an explicit representation of the content of requirements as a semantic relation graph and uses Spreading Activation to answer trace queries over this graph. Our approach is fully automated including an NLP pipeline to transform unrestricted natural language requirements into a graph. We evaluate our approach on five common datasets. Depending on the selected configuration, the predictive power strongly varies. With the best tested configuration, the approach achieves a mean average precision of 40% and a Lag of 50%. Even though the predictive power of our approach does not outperform state-of-the-art approaches, we think that an explicit knowledge representation is an interesting artifact to explore in Trace Link Recovery approaches to generate explanations and refine results.
Trace Link Recovery versucht, verwandte bestehende Anforderungen zu identifizieren und miteinander zu verknüpfen, um weitere technische Aufgaben zu unterstützen. Bestehende Ansätze basieren hauptsächlich auf algebraischem Information Retrieval oder maschinellem Lernen. Machine-Learning-Ansätze erfordern in der Regel relativ große und vorab klassifizierte Datensätze zum Trainieren. Algebraische Ansätze wie z.B. tf-idf funktionieren auch bei kleineren Datensätzen ohne Training, sind aber in der Bereitstellung von Erklärungen für Verknüpfungen begrenzt. In dieser Arbeit stellen wir einen Trace Link Recovery Ansatz vor, der auf einer expliziten Darstellung des Inhalts von Anforderungen durch einen semantischen Relationsgraphs basiert und die Ausbreitungsaktivierung verwendet, um Verknüpfungen über diesen Graphen zu identifizieren. Unser Ansatz ist vollständig automatisiert, einschließlich einer NLP-Pipeline zur Umwandlung uneingeschränkt natürlichsprachlicher Anforderungen in einen Graphen. Wir evaluieren unseren Ansatz anhand von fünf öffentlichen Datensätzen. Abhängig von der gewählten Konfiguration variiert die Performanz stark. Mit der am besten getesteten Konfiguration erreicht der Ansatz eine Genauigkeit von 40% und einen Lag von 50%. Auch wenn die Vorhersagekraft unseres Ansatzes dem Stand der Technik nicht überlegen ist, sind wir der Meinung, dass eine explizite Wissensrepräsentation ein interessantes Artefakt ist, das in Trace Link Recovery Ansätzen untersucht werden sollte, um Erklärungen zu generieren und die Ergebnisse zu verfeinern.
Published in: 28th IEEE International Requirements Engineering Conference, RE 2020, Institute of Electrical and Electronics Engineers (IEEE)
In Copyright