Verbesserung der Quellentrennung bei mehrkanaligen Audiosignalmischungen mittels neuartiger Ansätze zur Permutationskorrektur und zur Zeit-Frequenz-Maskierung

dc.contributor.authorHoffmann, Eugenen
dc.contributor.grantorTechnische Universität Berlin, Fakultät IV - Elektrotechnik und Informatiken
dc.contributor.refereeOrglmeister, Reinholden
dc.contributor.refereeMeffert, Beateen
dc.contributor.submitterHoffmann, Eugenen
dc.date.accepted2013-09-20
dc.date.accessioned2015-11-20T22:49:07Z
dc.date.available2013-10-09T12:00:00Z
dc.date.issued2013-10-09
dc.date.submitted2013-09-27
dc.description.abstractBlinde Quellentrennung (Blind Source Separation, BSS) ist ein Verfahren zur Rekonstruktion der Quellsignale aus beobachteten Mischungen, wobei weitere Informationen über die Quellen, Quellenkonstellation oder Mischungsart nicht vorliegen. Mögliche Einsatzgebiete der Blinden Quellentrennung könnten beispielsweise rausch-robuste Spracherkennung, sprachgesteuerte Telekommunikationssysteme und Hörhilfen sein. Der Einsatz von Verfahren der Blinden Quellentrennung in realen Umgebungen ist jedoch mit gewissen Problemen verbunden. Zum einen tritt bei der Entmischung ein so genanntes Permutationsproblem auf, das durch die Eigenschaften der BSS-Algorithmen entsteht und das es, um korrekte Ergebnisse zu bekommen, zu lösen gilt. Zum anderen kommt es dazu, dass die Ausgangssignale durch bleibende Übersprecher gestört sind. Die Idee der Zeit-Frequenz-Maskierung ist es, die vorhandenen Störgeräusche durch Verwendung einer geeigneten Maske zu minimieren. So werden unterschiedliche Zeit-Frequenz-Maskierungsverfahren immer öfter als eine Nachverarbeitungsstufe bei BSS bzw. Beamforming eingesetzt. Das Ziel der Arbeit sind die Entwicklung und der Einsatz neuer Algorithmen zur Permutationskorrektur sowie von Zeit-Frequenz-Maskierungsverfahren und der Vergleich der neuen Algorithmen mit den bereits existierenden. Zur Lösung des Problems werden die statistischen, räumlichen und informationstheoretischen Eigenschaften der vorliegenden Signale untersucht. Weiterhin werden die bereits existierenden Verfahren zur einkanaligen Störgeräuschreduktion auf Erweiterbarkeit und Anwendbarkeit in einem mehrkanaligen Szenario bzw. für die Verbesserung der bereits existierenden Zeit-Frequenz-Maskierungsverfahren geprüft. Zur Bewertung und zum Vergleich der resultierenden Algorithmen dienen neben den objektiven Bewertungsmaßen (wie Signal-to-Interference-Ratio und Signal-to-Distortion-Ratio) auch subjektive auditive Bewertungen in Form von Hörtests.de
dc.description.abstractBlind source separation (BSS) is an approach of recovering source signals from observed mixtures when both the mixing process and the sources are unknown. Possible applications of the blind source separation could for example be noise-robust speech recognition, voice-controlled telecommunications systems and hearing aids. However, the use of methods of blind source separation in real environments is associated with certain problems. Firstly, due to the nature of the BSS algorithms, a so-called permutation problem that arises that has to be solved. On the other hand, in some cases the output signals of the BSS algorithms are disturbed by constant crosstalk. The idea of the time-frequency masking is to reduce the present noise by using a suitable mask. Thus, different time-frequency masking methods are used more often as a post-processing stage in BSS and beamforming. The goal of this work is to developt and implement new algorithms for permutation correktion and of time-frequency masking methods and to compare the new algorithms with the existing ones. For the solution of the permutation problem the usefulness of statistical, spatial and information theoretic properties of the signals has to be investigated. Furthermore, the existing single-channel methods for noise reduction have to be examined for extensibility and applicability to a multi-channel scenario, and for the improvement of the existing time-frequency masking methods. In order to evaluate and compare the resulting algorithms, the objective evaluation measures (such as signal-to-interference ratio and signal-to-distortion ratio) and subjective auditory reviews in the form of listening tests are used.en
dc.identifier.uriurn:nbn:de:kobv:83-opus4-42141
dc.identifier.urihttps://depositonce.tu-berlin.de/handle/11303/4122
dc.identifier.urihttp://dx.doi.org/10.14279/depositonce-3825
dc.languageGermanen
dc.language.isodeen
dc.rights.urihttp://rightsstatements.org/vocab/InC/1.0/en
dc.subject.ddc620 Ingenieurwissenschaften und zugeordnete Tätigkeitenen
dc.subject.otherBlinde Quellentrennungde
dc.subject.otherPermutationsproblemde
dc.subject.otherZeit-Frequenz-Maskierungde
dc.subject.otherBlind source separationen
dc.subject.otherICAen
dc.subject.otherIndependent component analysisen
dc.titleVerbesserung der Quellentrennung bei mehrkanaligen Audiosignalmischungen mittels neuartiger Ansätze zur Permutationskorrektur und zur Zeit-Frequenz-Maskierungde
dc.title.translatedImprovement of source separation of multi-channel audio signal mixtures by means of new approaches for the permutation correction and the time-frequency maskingen
dc.typeDoctoral Thesisen
dc.type.versionpublishedVersionen
tub.accessrights.dnbfree*
tub.affiliationFak. 4 Elektrotechnik und Informatik::Inst. Energie- und Automatisierungstechnikde
tub.affiliation.facultyFak. 4 Elektrotechnik und Informatikde
tub.affiliation.instituteInst. Energie- und Automatisierungstechnikde
tub.identifier.opus44214
tub.publisher.universityorinstitutionTechnische Universität Berlinen

Files

Original bundle
Now showing 1 - 1 of 1
Loading…
Thumbnail Image
Name:
eugen_hoffmann.pdf
Size:
2.12 MB
Format:
Adobe Portable Document Format

Collections