Please use this identifier to cite or link to this item: http://dx.doi.org/10.14279/depositonce-3549
Main Title: Database Support for Uncertain Data Analysis and Correlation Handling in Scenario Planning
Translated Title: Datenbankunterstützung für die Analyse unsicherer Daten mit Korrelationsstrukturen im Rahmen der Szenarioplanung
Author(s): Eisenreich, Katrin
Advisor(s): Markl, Volker
Granting Institution: Technische Universität Berlin, Fakultät IV - Elektrotechnik und Informatik
Type: Doctoral Thesis
Language: English
Language Code: en
Abstract: Die Bedingungen, unter denen Unternehmen ihre Aktivitäten planen, unterliegen in der heutigen Zeit einem sich immer weiter beschleunigenden Wandel. In Planungsprozessen ist es daher wichtig, die Unstetigkeit und Unsicherheit von Einflussgrößen, welche das Erreichen angestrebter Ziele beeinflussen können, zu berücksichtigen und in die Planung einzubeziehen. Die Szenarienplanung bietet einen Ansatz, dieser Herausforderung zu begegnen, indem sie es Experten ermöglicht, verschiedene potentielle Geschäftsszenarien basierend auf unterschiedlichen Annahmen über Einflussfaktoren zu evaluieren. Bestehende Anwendungen zur Planung und Risikoanalyse unterstützen die Methodik der Szenarienplanung zum Teil. Jedoch führt die Ausführung von Analysefunktionalitäten in der Anwendungsschicht potentiell zu Performanzeinbußen aufgrund von Datentransfers zur Anwendungsschicht zur Laufzeit. Dies ist insbesondere bei sehr datenintensiven Operationen der Fall. Zudem entstehen durch die anwendungsspezifische Implementierung von Datenmodellen und Analysefunktionalitäten Integrationsdefizite, da die Szenariodaten und Analyseergebnisse nicht problemlos von anderen Anwendungen genutzt werden können. Ein Ansatz, diesen Problemen zu begegnen, ist die Bereitstellung von Funktionalitäten, die die Repräsentation und Verarbeitung von Szenarioanalysedaten in der Datenbank implementieren. Auf diese Weise können verschiedene Anwendungen einzelne Operationen als Bausteine in anwendungsspezifischen Analyseprozessen nutzen, während kostenintensive Datenzugriffe und Berechnungen auf der Datenbankebene durchgeführt werden. Diese Arbeit beschäftigt sich speziell mit dem Aspekt der Unsicherheit in Szenarioplanungsprozessen. Der Fokus liegt hierbei insbesondere auf der Verarbeitung von unsicheren Werten, welche kontinuierlichen Verteilungen unterliegen. Als Grundlage der Arbeit wird ein Datenmodell, welches die Repräsentation verschiedener Aspekte der Unsicherheit in Szenariodaten erlaubt, konzipiert. Aufbauend auf diesem Datenmodell wird eine Menge von Operatoren für die Erstellung, Analyse, und Modifikation von Szenariodaten bereitgestellt. Besonders intensiv wird in diesem Rahmen die Problematik der Korrelation behandelt. Da Korrelationsstrukturen in praktisch allen Bereichen der Wirtschaft einen erheblichen Einfluss haben, ist es wichtig, diese in Analysen von Chancen und Risiken im Rahmen der Szenarioplanung einzubeziehen. Nutzern muss es ermöglicht werden, beliebige komplexe Korrelationsstrukturen und deren Einflüsse auf relevante Maßzahlen und Planwerte zu evaluieren. Zu diesem Zwecke stellt diese Arbeit einen Ansatz vor, der es erlaubt, Korrelationsstrukturen flexibel zu modellieren und effizient in Berechnungen einzubeziehen. Die entwickelten Ansätze gehen über bisherige Techniken im Bereich des probabilistischen Datenmanagement hinaus, indem sie die Analyse beliebiger Korrelationen mittels eines modularen Ansatzes unterstützen. Um eine sinnvolle Interpretation von Analyseergebnissen sowie eine effiziente Neuberechnung derselben zu ermöglichen, wird weiterhin die Thematik der Datenherkunft behandelt. Insbesondere wird hierbei ein Ansatz untersucht, mit dessen Hilfe Analyseprozesse über modifizierten Daten unter Ausnutzung von Datenherkunftsinformationen effizient neu berechnet werden können. Zusammenfassend addressiert diese Arbeit sowohl daten- als auch prozessorientierte Aspekte, welche im Rahmen der Unsicherheit in Szenarioplanungsprozessen relevant sind. In diesem Sinne unterscheiden sich die vorgestellten Ansätze von bisher existierenden Lösungen im Bereich der unsicheren Datenbanken, welche meist auf die Verarbeitung traditioneller relationaler Anfragen über unsicheren Daten ausgerichtet sind. Die entwickelten Funktionalitäten können Anwendungen im Bereich der strategischen und operativen Planung, der Analyse, und des Geschäfts- und Risikomanagements als Grundlage für eine effiziente und flexible Verarbeitung unsicherer Daten in Planungsprozessen dienen.  
Today, the environment in which companies devise their plans for the future evolves at a fast pace. In a planning process, one must keep in mind the highly volatile, and therefore uncertain factors that determine whether a goal can be achieved and what are the associated risks. One approach to address this issue is scenario planning---a methodology that allows experts to evaluate different possible scenarios of the future based on assumptions about relevant business influences. Existing tools for planning and risk analysis partially support scenario planning. However, their application-specific implementation of data models and operators can come at the cost of inefficient processing and hinder the integration between applications. First, since all processing steps are carried out on the application level, especially data-intensive operations incur high additional costs for data transfer at runtime. Second, since the resulting scenario data is stored and accessed in an application-specific manner, it is not easily accessible from other applications. An approach to address those problems is to provide database support for representing and processing data in a scenario planning process. Applications can access this functionality as building blocks to assemble specific analysis and planning processes, while individual calculation steps are carried out at the database. This thesis addresses especially the aspect of handling uncertainty in scenario planning processes, with focus on the analysis of continuously distributed data at the database level. At the core of the thesis, a probabilistic data model is used to address the representation of uncertain scenario data. Building on this model, a set of analytical operators for the creation and analysis of such data is provided. In this context, we specifically focus on the flexible analysis of correlation structures in data. Correlation is a highly relevant aspect when analyzing risks or chances associated with business activities, since most real-world developments are subject to complex dependencies. Therefore, it is crucial to enable users to flexibly evaluate arbitrary correlation structures and their impact on potential outcomes of a plan. To this end, an approach for modeling correlation structures at the database and efficient methods for their construction and processing are presented in this thesis. The proposed techniques go beyond existing approaches for correlation handling in probabilistic databases, supporting the analysis of complex correlations between arbitrary distributions in a modular and flexible manner. To enable both the interpretation and the efficient recomputation of derived scenario data, the thesis further addresses the topic of provenance for scenario data. In particular, an approach for exploiting provenance information for a selective, and thus more efficient, recomputation of analysis results is presented and evaluated. In summary, this thesis addresses both data- and process-centric aspects of uncertainty in scenario planning processes. The presented approaches thus go beyond the scope of many existing solutions in the field of probabilistic data management, which mostly focus on managing and processing uncertain data in a traditional relational setting. The developed functionalities can serve applications in the field of strategic and operational planning, predictive analytics, and enterprise and risk management as a foundation for an efficient and flexible processing of uncertain data in scenario planning processes.
URI: urn:nbn:de:kobv:83-opus-38112
http://depositonce.tu-berlin.de/handle/11303/3846
http://dx.doi.org/10.14279/depositonce-3549
Exam Date: 22-Oct-2012
Issue Date: 11-Apr-2013
Date Available: 11-Apr-2013
DDC Class: 004 Datenverarbeitung; Informatik
Subject(s): Analyse
Copulas
Datenbank
Korrelation
Probabilistische Daten
Analysis
Copulas
Correlation
Database
Probabilistic data
Usage rights: Terms of German Copyright Law
Appears in Collections:Technische Universität Berlin » Fakultäten & Zentralinstitute » Fakultät 4 Elektrotechnik und Informatik » Institut für Softwaretechnik und Theoretische Informatik » Publications

Files in This Item:
File Description SizeFormat 
Dokument_17.pdf6.89 MBAdobe PDFThumbnail
View/Open


Items in DepositOnce are protected by copyright, with all rights reserved, unless otherwise indicated.