Please use this identifier to cite or link to this item: http://dx.doi.org/10.14279/depositonce-4619
Main Title: Time series distance measures
Subtitle: Segmentation, classification, and clustering of temporal data
Translated Title: Distanzmaße für Zeitreihen
Translated Subtitle: Segmentierung, Klassifikation, und Clustern von Temporalen Daten
Author(s): Spiegel, Stephan
Advisor(s): Albayrak, Sahin
Referee(s): Albayrak, Sahin
Kurths, Jürgen
Mattern, Friedemann
Granting Institution: Technische Universität Berlin, Fakultät IV - Elektrotechnik und Informatik
Type: Doctoral Thesis
Language: English
Language Code: en
Abstract: Zeitreihen kommen unter anderem in vielzähligen Bereichen der Medizin, Astronomie, Geophysik, Konstruktion, und Finanzwirtschaft vor. Im Allgemeinen bezeichnet man eine Zeitreihe als Sequenz von Datenpunkten die mit fortlaufender Zeit in gleichmäßigen Zeitabständen gemessen wurde. Diese These beschäftigt sich hauptsächlich mit der Auswertung von Zeitreihen, was die Segmentierung, Klassifikation, und Gruppierung von temporalen Daten beinhaltet. Viele Algorithmen die diese Aufgaben lösen bedingen den paarweisen Vergleich von Sequenzen, was das fortwährende Forschungsinteresse an Distanzmaßen als entscheidende Subroutine begründet. Im Verlauf dieser Arbeit führen wir mehrere neue Distanzmaße ein welche die wesentlichen Charakteristiken von Zeitreihen erfassen und die Unterscheidung von verschiedenen, in einem Datensatz vorkommenden, Klassen ermöglichen. Unsere vorgeschlagenen Distanzmaße adressieren häufige, bei der Auswertung von Zeitreichen auftretende, Herausforderung. Dazu gehören die Untersuchung von multivariaten Daten, der Rechenaufwand von paarweisen Ähnlichkeitsberechnungen, die Messstörungen und Verzerrungen von temporalen Daten, das Trennen von gemischten Signalen, sowie die Analyse von nicht linearen Systemen. Unsere Arbeit leistet einen Betrag im Gebiet der Zeitreihenanalyse indem wir neue Ansätze zur Erkennung von Mustern in temporalen Daten einführen, robuste Distanzmaße für die effiziente Klassifikation von Zeitreihen bereitstellen, zuvor unbeachtete Invarianz betrachten und entsprechende Distanzberechnungen vorschlagen, unterschiedliche Methoden des Maschinellen Lernens für die Trennung von Signalen vergleichen, und nicht lineare Model für die Untersuchung von Zeitreichen adaptieren. Des Weiteren demonstrieren wir die Einsetzbarkeit unserer vorgeschlagen Distanzmaße in praktischen Anwendungen, wie z.B. bei der Optimierung von Fahrzeugmotoren in Bezug auf den Schadstoffausstoß sowie die Optimierung von Heizplänen unter Betrachtung des Energieverbrauches. Darüber hinaus präsentieren wir mehrere eigens entwickelte Zeitreihenanalysewerkzeuge die unsere eingeführten Distanzmaße anwenden.
Time series can be found in domains as diverse as medicine, astronomy, geophysics, engineering, and quantitative finance. In general, a time series is a sequence of data points, measured at successive points in time and spaced at uniform time intervals. This thesis is concerned with time series mining, including segmentation, classification, and clustering of temporal data. Many algorithms for these tasks depend upon pairwise (dis)similarity comparisons of (sub)sequences, which accounts for the continued research on time series distance measures as an important subroutine. In the course of this work we introduce several novel distance measures, which describe time series characteristics that may distinguish the individual classes contained in the data. Our proposed time series distance measures address frequently encountered issues, such as the processing of multivariate data, the computational complexity of pairwise (dis)similarity comparisons, the invariance required for temporal data with distortions, the separation of mixed signals, and the analysis of nonlinear systems. Our work contributes to the time series community by introducing novel approaches to pattern recognition in temporal data, presenting miscellaneous sensor fusion techniques for multivariate measurements, offering efficient and robust distance measures for fast time series classification, introducing previously disregarded invariance and proposing corresponding distance measures, comparing various machine learning algorithms for signal separation, and providing nonlinear models for time series mining. In addition to our theoretical contributions, we furthermore demonstrate that our proposed time series distance measures are beneficial in real-world applications, including the optimization of vehicle engines with regard to exhaust emission and the optimization of heating control in terms of energy efficiency. Furthermore, we present several specifically developed time series mining tools, which implement our introduced distance measures and provide graphical user interfaces for straightforward parameter setting as well as exploratory data analysis.
URI: urn:nbn:de:kobv:83-opus4-70240
http://depositonce.tu-berlin.de/handle/11303/4916
http://dx.doi.org/10.14279/depositonce-4619
Exam Date: 27-Jul-2015
Issue Date: 14-Aug-2015
Date Available: 14-Aug-2015
DDC Class: 004 Datenverarbeitung; Informatik
Subject(s): Zeitreihen
Distanzmaße
Wissensextraktion
Mustererkennung
maschinelles Lernen
Time series
distance measures
data mining
pattern recognition
machine learning
Usage rights: Terms of German Copyright Law
Appears in Collections:Technische Universität Berlin » Fakultäten & Zentralinstitute » Fakultät 4 Elektrotechnik und Informatik » Institut für Wirtschaftsinformatik und Quantitative Methoden » Publications

Files in This Item:
File Description SizeFormat 
spiegel_stephan.pdf10.58 MBAdobe PDFThumbnail
View/Open


Items in DepositOnce are protected by copyright, with all rights reserved, unless otherwise indicated.