Please use this identifier to cite or link to this item: http://dx.doi.org/10.14279/depositonce-3621
Main Title: Identification of Stimulus Cues in Tone-in-Noise Detection with Sparse Logistic Regression
Translated Title: Identifikation von Schlüsselreizen im Stimulus bei der Entdeckung von mit Rauschen maskierten Tönen mit Hilfe der spärlichen Logistischen Regression
Author(s): Schönfelder, Vinzenz H.
Advisor(s): Wichmann, Felix
Granting Institution: Technische Universität Berlin, Fakultät IV - Elektrotechnik und Informatik
Type: Doctoral Thesis
Language: English
Language Code: en
Abstract: Das zentrale Ziel der Psychophysik ist das Verständnis der funktionellen Zusammenhänge zwischen der physischen und psychischen Welt. Aktuelle Forschung strebt nach diesem Ziel, indem sie sich darauf konzentriert menschliches Verhalten in bestimmten psychophysischen Paradigmen quantitativ zu messen und zu erklären. In diesem Umfeld ergibt sich eine prinzipielle Frage: Welche Reizeigenschaften bestimmen individuelle Entscheidungen in Verhaltensexperimenten? In Bezug auf dieses Problem wurde das klassische psychophysische Paradigma der Entdeckung von durch Rauschen maskierten Tonsignalen ("tone-in-noise detection", TiN) in den vergangenen 70 Jahren gründlich untersucht. Dieses Experiment bildet das Fundament für einen zentralen Begriff der auditorischen Wahrnehmung: das "kritische Band". Gleichwohl wurde bislang keine abschließende Antwort auf die Frage gefunden, welche auditorischen Reizeigenschaften die Hörer in dieser Aufgabe verwenden. Die vorliegende Studie beschreibt, wie eine moderne statistische Analysemethode angewendet werden kann, um dieses Problem im Rahmen der Modellierung psychophysischer Daten zu lösen. Diese Prozedur vereint das Konzept der relativen linearen Kombinationsgewichte ("relative linear combination weights") mit einer L1-regularisierten logistischen Regression--einer Methode die im Bereich des maschinellen Lernens entwickelt wurde. Die Methode erzwingt "spärliche" ("sparse") Lösungen, eine algorithmische Annäherung an das Postulat, dass ein gutes Modell nur diejenigen Prediktoren enthalten solle, die nötig sind um die beobachteten Daten zu erklären. Diese Eigenschaft ist entscheidend, um kritische Reizeigenschaften aus Beobachtermodellen zu extrahieren, nachdem diese an Verhaltensdaten angepasst wurden. Mit Hilfe von Daten aus simulierten TiN-Experimenten wird gezeigt, dass die Methode die für die Beobachter entscheidenden Reizeigenschaften identifizieren kann--sogar dann, wenn eine Vielzahl von kovariierende, untereinander abhängigen Eigenschaften zur Wahl steht. In dieser Situation versagen bislang verwendete Methoden der Korrelations- oder Regressionsanalyse. Des Weiteren konnte die hier vorgestellte Analysemethode die detaillierten Entscheidungsregeln der simulierten Beobachter rekonstruieren und so Antworten auf der Basis individueller Stimuli vorhersagen. Im praktischen Teil der vorliegenden Studie wird die "spärliche" Analysemethode angewendet, um die Wahrnehmungsmechanismen zu untersuchen, die der Entdeckungsleistung von Probanden in einem TiN-Entdeckungs-Paradigma zu Grunde liegen. Zu diesem Zweck wurden mit mehreren Beobachtern umfangreiche Daten mit Verhaltensinformationen auf der Ebene einzelner Stimulus-Antwort-Paare gesammelt. Anschließend wurden relative perzeptuelle Gewichte für einen Satz von vielfältigen auditorischen Reizeigenschaften geschätzt, bestehend aus Schallenergie, Ton-Feinstruktur und -Umhüllender. Das klassische lineare Beobachtermodell wurde außerdem durch behaviorale Prediktoren erweitert, um auch sequentielle Abhängigkeiten im Antwortverhalten der Beobachter zu berücksichtigen. Diese Abhängigkeiten verschlechtern generell die Entdeckungsleistung und treten auch dann auf, wenn die Probanden auf die Zufälligkeit der Reizreihenfolge hingewiesen werden. Die an die Daten angepassten Beobachtermodelle erklärten das Verhalten aller Probanden auf der Ebene von einzelnen Hörversuchen. Die geschätzten perzeptuellen Gewichte blieben über verschiedene Signalstärken hin konstant. Sie legen nahe, dass das Verhalten aller Beobachter von der Schallenergie abhing, sowie von Feinstruktur-Detektoren die den "kritischen Filtern" ähneln. Ein Teil der Beobachter zeigte eine zusätzliche Abhängigkeit von der Ton-Umhüllenden. Zusätzlich zu diesen Reizeigenschaften hatten bei einigen Probanden auch vorherige Entscheidungen einen wesentlichen Einfluss auf die aktuelle Antwort. In dieser Arbeit wurde ein klassisches Problem in der auditorischen Psychophysik mit einer fortgeschrittenen statistischen Analysemethode untersucht. Dadurch konnte ein bereits großer empirischer Wissensschatz um einige wichtige Aspekte erweitert werden. Gleichzeitig wurde die Leistungsfähigkeit und Effizienz der vorgeschlagenen Methode demonstriert. Da sie auf sehr allgemeinen Konzepten beruht, ist sie zugleich so flexibel, dass sie in verschiedensten Studien über Wahrnehmungsmechanismen angewendet werden kann.
The central aim of psychophysics is to understand the functional relationship between the physical and the psychological world. Striving for that goal, modern research focuses on quantitatively measuring and explaining observer behavior in specific psychophysical paradigms. In this context, a principal question arises: Which particular stimulus features govern individual decisions in a behavioral task? As regards this problem, the classical psychophysical paradigm of narrow-band Tone-in-Noise (TiN) detection has been under investigation for more than 70 years. This particular experiment stands at the heart of a central notion in auditory perception: the "critical band". Yet no conclusive answer has been given as to which auditory features listeners employ in this task. The present study describes how a modern statistical analysis procedure can be used to tackle this problem when modeling psychophysical data. The proposed technique combines the concept of relative linear combination weights with an L1-regularized logistic regression---a procedure developed in machine learning. This method enforces "sparse" solutions, a computational approximation to the postulate that a good model should contain the minimal set of predictors necessary to explain the data. This property is essential when extracting the critical perceptual features from observer models after they were fit to behavioral data. Using data generated from a simulated TiN detection paradigm, the method is shown to precisely identify observer cues from a large set of covarying, interdependent stimulus descriptors---a setting where standard correlation and regression methods fail. Furthermore, the detailed decision rules of the simulated observers were reconstructed, allowing predictions of responses on the basis of individual stimuli. The practical part of this study aimed at using the sparse analysis procedure to investigate the perceptual mechanisms underlying the detection performance of human observers in a TiN detection paradigm. Therefore, a large trial-by-trial data set was collected with multiple listeners. Relative perceptual weights were then estimated for a diverse set of auditory features encompassing sound energy, fine structure and envelope. By expanding the common linear observer model to allow for behavioral predictors, sequential dependencies in observer responses were also taken into account. These dependencies generally impair detection performance and even arise when study participants are made aware of the purely random stimulus sequence. The fitted models captured the behavior of all listeners on a single-trial level. The estimated perceptual weights were stable across signal levels. They suggest that all observers depend on stimulus energy, and "critical band"-like detectors in the fine structure domain while a subset of the listeners exhibited an additional dependence on stimulus envelope. In addition to stimulus characteristics, earlier responses appeared to substantially influence the current decision of some observers. In conclusion, by approaching a classical problem in auditory psychophysics with an advanced statistical analysis procedure, an already large pool of empirical knowledge was expanded in several important aspects. In that process, the power and efficiency of the proposed method was demonstrated. Based on very general concepts, it is flexible enough to be applicable in a wide variety of studies that investigate perceptual mechanisms.
URI: urn:nbn:de:kobv:83-opus-39933
http://depositonce.tu-berlin.de/handle/11303/3918
http://dx.doi.org/10.14279/depositonce-3621
Exam Date: 15-May-2013
Issue Date: 28-May-2013
Date Available: 28-May-2013
DDC Class: 530 Physik
Subject(s): Datenanalyse
Hören
Maschinelles Lernen
Psychophysik
Wahrnehmung
Audition
Data Analysis
Machine Learning
Perception
Psychophysics
Usage rights: Terms of German Copyright Law
Appears in Collections:Technische Universität Berlin » Fakultäten & Zentralinstitute » Fakultät 4 Elektrotechnik und Informatik » Institut für Softwaretechnik und Theoretische Informatik » Publications

Files in This Item:
File Description SizeFormat 
Dokument_40.pdf4,32 MBAdobe PDFThumbnail
View/Open


Items in DepositOnce are protected by copyright, with all rights reserved, unless otherwise indicated.