Thumbnail Image

Perzeptiv motivierte, parametrische Synthese binauraler Raumimpulsantworten

Stade, Philipp

Diese Dissertation beschäftigt sich mit der Entwicklung und Untersuchung von Methoden zur Synthese binauraler Signale für eine dynamische Hörbarmachung von akustischen Gegebenheiten über Kopfhörer. Es werden verschiedene Modelle gebildet, die diffuse und gerichtete Schallfeldkomponenten separat analysieren und mittels Parametern charakterisieren. Anschließend werden diese raumabhängigen Merkmale zur Generierung synthetischer binauraler Raumimpulsantworten (SBRIRs) verwendet. Im Mittelpunkt der Untersuchungen steht die auditive Wahrnehmung des Menschen. Es wird angestrebt, Schallfeldkomponenten die für die Perzeption irrelevant sind, nicht zu betrachten und so eine wirksame Reduktion der Informationen zu ermöglichen, mit möglichst geringen hörbaren Einflüssen. Die generierten SBRIRs können in dynamischer Binauralsynthese durch Faltung mit nachhallfreien Audiosignalen zur Hörbarmachung des Raumes eingesetzt werden und erlauben bei Änderung der Kopfausrichtung des Rezipienten, eine ortsfeste Wiedergabe der virtuellen Schallquellen. Durch die Gegenüberstellung der SBRIRs mit einer binauralen Referenz auf Basis von Kunstkopf- Messungen in einer ABC/HR Testumgebung werden die Modelle perzeptiv evaluiert. Ergebnisse dieser Untersuchungen fließen stets in nachfolgende Modelle ein, sodass ein wachsender Prozess abhängig der auditiven Wahrnehmung entsteht. Zur Charakterisierung der akustischen Situation werden verschiedene Ansätze kombiniert: Gerichtete Schallfeldkomponenten können mit Methoden der Wellenfeldanalyse auf Basis von Messungen mit sphärischen Mikrofonarrays räumlich und zeitlich detektiert werden. Außenohrübertragungsfunktionen werden anschließend entsprechend der detektierten richtungsabhängigen Komponenten räumlich ausgewählt, verzögert und energetisch sowie spektral angepasst, sodass synthetische Reflexionen erzeugt werden. Die diffusen Komponenten können durch frequenzabhängige Energieabklingkurven und die interaurale Kohärenz repräsentiert werden. Diese Parameter werden verwendet, um weißes Rauschen gemäß der binauralen Referenz zu adaptieren und so synthetisch ein binaurales diffuses Signal zu generieren. Die Arbeit zeigt, das eine starke Reduktion des Detailgrades der messtechnisch erfassten Situation erfolgen kann. Die Vereinfachung des Schallfeldes im Raum auf einige wenige Parameter erlaubt weiterhin die adäquate Hörbarmachung der akustischen Situation durch die erzeugten SBRIRs. Dabei kann eine geringere Relevanz der diskreten Reflexionen im Gegensatz zum diffusen Nachhall beobachtet werden. Dieser sollte mit hoher Frequenzauflösung und entsprechend des Verlaufs der binauralen Kohärenz diffuser Schallfelder adaptiert werden. Die Modelle können in Systemen der virtuellen oder erweiterten Realität Anwendung finden und schaffen Möglichkeiten zur flexiblen Adaption des Raumeindrucks bei effektiver Reduktion der Informationen.
This thesis discusses the development and the investigation of different approaches for the synthesis of binaural signals to achieve a dynamic auralisation of arbitrary acoustical conditions via headphones. Various models are defined, which analyze diffuse and directional components of the sound field separately and characterize them with individual parameters. After that, these room-dependent features are used to generate synthetic binaural room impulse responses (SBRIRs). The presented investigations strongly focus on human auditory perception. The parametric models aim for an efficient reduction of the information of the sound field with preferably minor audible influences. Components which are irrelevant for the perception should not be regarded in the synthesis. In order to auralize rooms, the SBRIRs can be applied in dynamic binaural synthesis for the convolution with anechoic audio signals. This method allows for localizable and static virtual sound sources considering the orientation of the listener. An ABC/HR test paradigm is used for the perceptual evaluation of the parametric models. The auralisation based on the SBRIRs is directly compared with the auralisation based on a measured binaural reference (recorded with an artificial head). Results are incorporated in subsequent models with the result of an increasing process dependent on the auditory perception. Different approaches are combined to characterize the acoustical environment: Directional components of the sound field can be spatial-temporal detected with spherical microphone arrays using wave field anaysis. Head-related transfer functions are selected dependent on the detected direction of arrival of the directional components. By delaying, attenuating and spectral filtering of these impulse responses, synthetic reflections which are spatial distributed can be generated. Diffuse components are represented with frequency-dependent energy decay curves and the interaural coherence. These parameters are used to adapt white noise signals according to the binaural reference and to create syntehtic decaying signals with the binaural cues of the diffuse sound field of the reference room. This thesis reveals that the details of the measured information can be considerably reduced. Furthermore, the simplification of the sound field with sparse parameters allows for an adequate auralisation of the acousticial situation using the generated SBRIRs. In contrast to the diffuse components, a minor impact of the directional components can be observed. For the adaption of the diffuse components, though, a detailed frequency resolution is required and the binaural coherence of the diffuse sound field has to be taken into account. The parametric models can be used in applications for virtual or augmented reality and open up new possibilities for the flexible adaption of the spatial impression in combination with an effective reduction of the information.