Please use this identifier to cite or link to this item: http://dx.doi.org/10.14279/depositonce-3825
Main Title: Verbesserung der Quellentrennung bei mehrkanaligen Audiosignalmischungen mittels neuartiger Ansätze zur Permutationskorrektur und zur Zeit-Frequenz-Maskierung
Translated Title: Improvement of source separation of multi-channel audio signal mixtures by means of new approaches for the permutation correction and the time-frequency masking
Author(s): Hoffmann, Eugen
Referee(s): Orglmeister, Reinhold
Meffert, Beate
Granting Institution: Technische Universität Berlin, Fakultät IV - Elektrotechnik und Informatik
Type: Doctoral Thesis
Language: German
Language Code: de
Abstract: Blinde Quellentrennung (Blind Source Separation, BSS) ist ein Verfahren zur Rekonstruktion der Quellsignale aus beobachteten Mischungen, wobei weitere Informationen über die Quellen, Quellenkonstellation oder Mischungsart nicht vorliegen. Mögliche Einsatzgebiete der Blinden Quellentrennung könnten beispielsweise rausch-robuste Spracherkennung, sprachgesteuerte Telekommunikationssysteme und Hörhilfen sein. Der Einsatz von Verfahren der Blinden Quellentrennung in realen Umgebungen ist jedoch mit gewissen Problemen verbunden. Zum einen tritt bei der Entmischung ein so genanntes Permutationsproblem auf, das durch die Eigenschaften der BSS-Algorithmen entsteht und das es, um korrekte Ergebnisse zu bekommen, zu lösen gilt. Zum anderen kommt es dazu, dass die Ausgangssignale durch bleibende Übersprecher gestört sind. Die Idee der Zeit-Frequenz-Maskierung ist es, die vorhandenen Störgeräusche durch Verwendung einer geeigneten Maske zu minimieren. So werden unterschiedliche Zeit-Frequenz-Maskierungsverfahren immer öfter als eine Nachverarbeitungsstufe bei BSS bzw. Beamforming eingesetzt. Das Ziel der Arbeit sind die Entwicklung und der Einsatz neuer Algorithmen zur Permutationskorrektur sowie von Zeit-Frequenz-Maskierungsverfahren und der Vergleich der neuen Algorithmen mit den bereits existierenden. Zur Lösung des Problems werden die statistischen, räumlichen und informationstheoretischen Eigenschaften der vorliegenden Signale untersucht. Weiterhin werden die bereits existierenden Verfahren zur einkanaligen Störgeräuschreduktion auf Erweiterbarkeit und Anwendbarkeit in einem mehrkanaligen Szenario bzw. für die Verbesserung der bereits existierenden Zeit-Frequenz-Maskierungsverfahren geprüft. Zur Bewertung und zum Vergleich der resultierenden Algorithmen dienen neben den objektiven Bewertungsmaßen (wie Signal-to-Interference-Ratio und Signal-to-Distortion-Ratio) auch subjektive auditive Bewertungen in Form von Hörtests.
Blind source separation (BSS) is an approach of recovering source signals from observed mixtures when both the mixing process and the sources are unknown. Possible applications of the blind source separation could for example be noise-robust speech recognition, voice-controlled telecommunications systems and hearing aids. However, the use of methods of blind source separation in real environments is associated with certain problems. Firstly, due to the nature of the BSS algorithms, a so-called permutation problem that arises that has to be solved. On the other hand, in some cases the output signals of the BSS algorithms are disturbed by constant crosstalk. The idea of the time-frequency masking is to reduce the present noise by using a suitable mask. Thus, different time-frequency masking methods are used more often as a post-processing stage in BSS and beamforming. The goal of this work is to developt and implement new algorithms for permutation correktion and of time-frequency masking methods and to compare the new algorithms with the existing ones. For the solution of the permutation problem the usefulness of statistical, spatial and information theoretic properties of the signals has to be investigated. Furthermore, the existing single-channel methods for noise reduction have to be examined for extensibility and applicability to a multi-channel scenario, and for the improvement of the existing time-frequency masking methods. In order to evaluate and compare the resulting algorithms, the objective evaluation measures (such as signal-to-interference ratio and signal-to-distortion ratio) and subjective auditory reviews in the form of listening tests are used.
URI: urn:nbn:de:kobv:83-opus4-42141
http://depositonce.tu-berlin.de/handle/11303/4122
http://dx.doi.org/10.14279/depositonce-3825
Exam Date: 20-Sep-2013
Issue Date: 9-Oct-2013
Date Available: 9-Oct-2013
DDC Class: 620 Ingenieurwissenschaften und zugeordnete Tätigkeiten
Subject(s): Blinde Quellentrennung
Permutationsproblem
Zeit-Frequenz-Maskierung
Blind source separation
ICA
Independent component analysis
Usage rights: Terms of German Copyright Law
Appears in Collections:Technische Universität Berlin » Fakultäten & Zentralinstitute » Fakultät 4 Elektrotechnik und Informatik » Institut für Energie- und Automatisierungstechnik » Publications

Files in This Item:
File Description SizeFormat 
eugen_hoffmann.pdf2.17 MBAdobe PDFThumbnail
View/Open


Items in DepositOnce are protected by copyright, with all rights reserved, unless otherwise indicated.