Microphone arrays and sound field decomposition for dynamic binaural recording

dc.contributor.advisorWeinzierl, Stefan
dc.contributor.authorBernschütz, Benjamin
dc.contributor.grantorTechnische Universität Berlinen
dc.contributor.refereeWeinzierl, Stefan
dc.contributor.refereePörschmann, Christoph
dc.contributor.refereeSpors, Sascha
dc.date.accepted2016-02-15
dc.date.accessioned2016-04-08T12:13:28Z
dc.date.available2016-04-08T12:13:28Z
dc.date.issued2016
dc.description.abstractThis thesis discusses a field-related recording technique based on microphone arrays and orthogonal sound field decomposition that delivers a suitable description for dynamic binaural reproduction. Dynamic binaural reproduction refers to a mostly headphone-based reproduction method that allows for presenting localizable virtual sources and accounts for the head movements of the recipient in order to decouple them from the spatial orientation of the virtual auditory scene. Increased source localization and externalization stability can be regarded as primary advantages compared to classic static binaural reproduction. Spatially stationary or dynamic virtual sound sources can be presented that maintain their spatial positions or move in relation to a fixed external world coordinate system, which is independent from the recipient's head movements. Dynamic binaural reproduction requires either object-based audio production or specific field-related recording techniques. The focus of this thesis lies on the latter. Using microphone arrays paired with orthogonal sound field decomposition appears to be a particularly promising approach for field-related dynamic binaural recording. It is based on an elegant, closed-form mathematical solution and allows accounting for head-tracking in all rotational degrees-of-freedom during the playback of a recorded auditory scene. Theoretically, even translation of the recipient can be considered. The method inherently comprises individualization capabilities by employing individual head-related transfer functions (HRTFs) and allows for point-to-multipoint distribution. Due to the close mathematical relationship with higher-order Ambisonics (HOA), the respective formats and codecs can be used for storage and distribution of the audio data. The theoretical mathematical approach under ideal physical conditions is discussed and a closed-form solution is derived. Due to constraints in technical systems, such as discrete spatial sampling or noise in the signal paths for instance, ideal conditions cannot be maintained in practice. The major constraints are pointed out and their specific impact is analyzed and assessed. Various approaches for improving the transmission characteristics of the system are proposed and evaluated. The perceptual properties under dedicated technical constraints and realistic conditions are assessed in listening experiments. Optimal technical parameters for the system are also determined. It turns out that an array-based system for dynamic binaural recording with satisfying perceptual properties can be realized within reasonable technological and economical limits.en
dc.description.abstractDie Dissertation behandelt ein feldbezogenes räumliches Audioaufnahmeverfahren, das auf Mikrofonarrays und orthogonaler Schallfeldzerlegung beruht und eine geeignete Beschreibung für dynamische binaurale Wiedergabe liefert. Dynamische binaurale Wiedergabe bezeichnet ein meist kopfhörerbasiertes räumliches Audiowiedergabeverfahren zur Darbietung lokalisierbarer virtueller Schallquellen, das die Kopfbewegung des Rezipienten berücksichtigt, um sie von der räumlichen Orientierung der wiedergegeben virtuellen auditorischen Szene zu entkoppeln. Die wesentlichen Vorteile gegenüber statischer binauraler Wiedergabe bestehen in einer verbesserten Lokalisation und Externalisierung der virtuellen Quellen, sowie der Möglichkeit, statische oder dynamische virtuelle Quellen wiederzugeben, die unabhängig von der Kopfbewegung des Rezipienten ortsfest verbleiben oder sich in Bezug zu einem statischen weltbezogenen Koordinatensystem bewegen. Dynamische binaurale Wiedergabe setzt entweder objektbasierte Audioproduktion oder spezifische feldbezogene Aufnahmeverfahren voraus. Letztere liegen im Fokus dieser Arbeit. Der Einsatz von Mikrofonarrays in Kombination mit orthogonaler Schallfeldzerlegung stellt hierzu einen vielversprechenden Lösungsansatz dar. Das Verfahren beruht auf einer eleganten mathematisch geschlossenen Lösung. Kopfbewegungen des Rezipienten können in allen rotatorischen Freiheitsgraden berücksichtigt werden. In der Theorie lassen sich auch translatorische Freiheitsgrade einbeziehen. Durch Einsatz individueller kopfbezogener Übertragungsfunktionen (HRTFs) kann die Wiedergabe individualisiert werden. Das Verfahren eignet sich für Punkt-zu-Mehrpunkt Übertragung. Aufgrund enger mathematischer Verwandtschaft zum higher-order Ambisonics (HOA) Verfahren, lassen sich die dort eingesetzten Formate und Codecs zur Speicherung und Übertragung der Audiodaten nutzen. Unter Annahme idealer physikalischer Bedingungen wird zunächst der theoretische Ansatz diskutiert und eine mathematisch geschlossene Lösung abgeleitet. Aufgrund verschiedener Einschränkungen in technischen Systemen, wie beispielsweise raumdiskrete Abtastung oder Rauschen in den Signalwegen, sind in der Praxis allerdings keine idealen Bedingungen erzielbar. Die wichtigsten Einschränkungen werden aufgezeigt und ihr jeweiliger Einfluss auf das Systemverhalten untersucht. Verschiedene Methoden zur Verbesserung der Übertragungseigenschaften werden diskutiert. In Hörversuchen werden perzeptive Eigenschaften des Systems im Hinblick auf spezifische technische Einschränkungen sowie realistische Bedingungen evaluiert. Ferner werden optimale Systemparameter ermittelt. Es zeigt sich, dass arraybasierte Systeme für die feldbezogene dynamische Binauralaufnahme mit guten perzeptiven Eigenschaften unter vertretbarem technischen und wirtschaftlichen Aufwand realisierbar sind.de
dc.description.sponsorshipBMBF, 1707X08, Analysis and Synthesis of the Directional Acoustic Properties of Rooms (ASAR)en
dc.description.sponsorshipBMBF, 17009X11, Microphone Arrays for Room Acoustics and Auralization (MARA)en
dc.identifier.urihttps://depositonce.tu-berlin.de/handle/11303/5407
dc.identifier.urihttp://dx.doi.org/10.14279/depositonce-5082
dc.language.isoenen
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/en
dc.subject.ddc620 Ingenieurwissenschaften und zugeordnete Tätigkeitende
dc.subject.ddc621 Angewandte Physikde
dc.subject.othermicrophone arraysen
dc.subject.othersound field decompositionen
dc.subject.otherbinaural technologyen
dc.subject.otherspatial audioen
dc.subject.othersound recordingen
dc.subject.othermikrofonarraysde
dc.subject.otherSchallfeldzerlegungde
dc.subject.otherBinauraltechnikde
dc.subject.other3D-Audiode
dc.subject.otherAufnahmetechnikde
dc.titleMicrophone arrays and sound field decomposition for dynamic binaural recordingen
dc.title.translatedMikrofonarrays und Schallfeldzerlegung für die dynamische Binauralaufnahmeen
dc.typeDoctoral Thesisen
dc.type.versionacceptedVersionen
tub.accessrights.dnbfreeen
tub.affiliationFak. 1 Geistes- und Bildungswissenschaften::Inst. Sprache und Kommunikationde
tub.affiliation.facultyFak. 1 Geistes- und Bildungswissenschaftende
tub.affiliation.instituteInst. Sprache und Kommunikationde
tub.publisher.universityorinstitutionTechnische Universität Berlinen

Files

Original bundle
Now showing 1 - 1 of 1
Loading…
Thumbnail Image
Name:
bernschütz_benjamin.pdf
Size:
14.4 MB
Format:
Adobe Portable Document Format
Description:
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
5.75 KB
Format:
Item-specific license agreed upon to submission
Description:

Collections