Please use this identifier to cite or link to this item: http://dx.doi.org/10.14279/depositonce-4186
Main Title: Towards efficient auditory BCI through optimized paradigms and methods
Translated Title: Effizientes auditorisches BCI durch optimierte Paradigmen und Methoden
Author(s): Schreuder, Evert-Jan Martijn
Advisor(s): Müller, Klaus-Robert
Tangermann, Michael
Referee(s): Müller, Klaus-Robert
Blankertz, Benjamin
Kübler, Andrea
Granting Institution: Technische Universität Berlin, Fakultät IV - Elektrotechnik und Informatik
Type: Doctoral Thesis
Language: English
Language Code: en
Abstract: Bis zum heutigen Tage hat sich die brain-computer interface (BCI) Forschung hauptsächlich auf visuelle Paradigmen fokussiert. Dieser Ansatz war bisher sehr erfolgreich, da Menschen generell über ausgezeichnete visuelle Fähigkeiten verfügen. Allerdings kämpft ein nicht vernachlässigbarer Teil der Gruppe der Endnutzer mit Problemen bei der Ausrichtung der Augen oder mit Problemen beim Sehen generell. Diese Probleme führen dazu, dass traditionelle visuelle BCI Paradigmen von diesen Endnutzern nicht verwendet werden können. Stattdessen werden alternative Paradigmen gebraucht die auf verdeckter Aufmerksamkeit beruhen. Hinzukommt dass, obwohl BCIs bereits von statistischen Verfahren aus dem Bereich Maschinelles Lernen profitieren, schnellere und robuste Anwendbarkeit erforderlich ist, um die klinische Gemeinschaft von ihrer Nützlichkeit zu überzeugen. Diese Dissertation trägt in zwei wichtigen Aspekten dazu bei, einen weiteren Schritt in Richtung vollständiger Inklusion von Endnutzern zu schaffen. Erstens wird unter dem Namen Auditory MUlticlass Spatial Event-related potential (AMUSE) eine auditorische Alternative vorgestellt, die die intrinsischen Probleme mit visuellen, auf ereigniskorrelierten Potentialen (ERP) basierten BCIs umgeht. AMUSE unterscheidet sich von den bisher meistens binären, auditorischen BCIs in einem entscheidenden Aspekt. Anstatt sich für die Klassenzuordnung ausschließlich auf Tonhöhe oder ähnliche physikalische Aspekte der Stimuli zu verlassen, spricht AMUSE die menschliche Fähigkeit für räumliche Lokalisierung von Schallquellen an. Bei AMUSE können die Stimuli solche physikalischen Unterschiede zwar haben, der entscheidende Faktor ist aber die räumliche Position der Schallquellen bzw. der Lautsprecher. Dieser Aspekt ermöglicht die Verwendung sehr kurzer Stimuli, woraus sich eine hohe Stimulationsgeschwindigkeit ergibt. Darüberhinaus kann die Anzahl von Klassen durch Hinzufügen von weiteren Schallquellen einfach erhöht werden. Die Grundlagen von AMUSE als BCI Paradigma werden sorgfältig validiert und eine auf AMUSE basierende Schreibanwendung wird vorgestellt welche nur minimal auf visuelle Fähigkeiten zurückgreift. Der Großteil der gesunden Versuchspersonen waren in der Lage einen vollständigen Deutschen Satz per BCI zu schreiben. Im Vergleich zu gegenwärtigen auf verdeckter Aufmerksamkeit basierenden BCIs arbeitet AMUSE sehr effizient, sowohl bezogen auf die Übertragungsgeschwindigkeit (ITR) als auch auf die Anzahl von geschriebenen Buchstaben pro Minute (CPM). Ein wichtiges Ziel der BCI Forschung ist eine erfolgreiche Anwendung bei Endnutzern. Dementsprechend wurde die auf AMUSE basierte Schreibanwendung mit fünf Endnutzern mit fortgeschrittener Lähmung getestet. Bis zu fünf Online-Sitzungen wurde mit jedem Endnutzer durchgeführt. Mit Ausnahme von zwei Sitzungen konnte BCI-Kontrolle erreicht werden, die über Zufallsniveau lag. Eine für die Endnutzer befriedigende Kontrolle konnte dennoch nicht erreicht werden. Dieses Ergebnis wird im Kontext der zur Verfügung stehenden Aufmerksamkeitsressourcen diskutiert, welche für mindestens einen Endnutzer nachweislich pathologisch waren. Der zweite wichtige Beitrag dieser Dissertation ist die Vorstellung eines neuen Algorithmus für die Optimierung von auf event-related potential (ERP) basierten BCIs, der als rank diff bezeichnet wird. ERP basierten BCIs ist ein Kompromiss zwischen der Länge der Stimulation und der Genauigkeit der Entscheidung inne. Längere Stimulation führt üblicherweise zu mehr Genauigkeit. In der Literatur wird dieser Kompromiss oftmals ignoriert und die Länge der Stimulation manuell gesetzt, was zu suboptimaler Leistung führt. Der hier vorgestellte Algorithmus rank diff benutzt die vorhandenen Kalibrationsdaten um einen adaptiven Schwellwert zu bestimmen, der überschritten werden muss bevor die Stimulation beendet wird. Das Anwenden von rank diff steigert die Effizienz von AMUSE bei gesunden Versuchspersonen um etwa 40 %. Als Folge nähert sich die Leistung von AMUSE dem Niveau von auf verdeckter Aufmerksamkeit beruhenden visuellen BCI-Schreibanwendungen. Desweiteren werden rank diff und ähnliche Methoden auf Benchmark-Daten validiert. Die Ergebnisse zeigen den verbessernden Effekt nicht nur für rank diff, sondern auch für verwandte Methoden. Effizienzsteigerungen von bis zu 78% zeigen, dass diese Art von Optimierung nicht länger ignoriert werden sollte.
To date, the brain-computer interface (BCI) based on visual stimulation is by far the most investigated. This makes a lot of sense given the excellent visual capabilities of humans, and it has been a most successful approach. Nevertheless, a non-negligible part of the BCI end-user population with advanced paralysis is incapable of directing their eye gaze or of seeing at all. Traditional visual BCIs will rarely be a solution for these end-users and alternative paradigms are required that rely on covert attention. Furthermore, though BCIs already benefit greatly from statistical methods coming from the field of machine learning, a faster and robust performance is required for adoption by the clinical community. This thesis contributes in two key facets in an attempt to take a step towards full inclusion of all end-users. First, an auditory alternative is proposed to address the intrinsic problems that exist with BCIs based on the visual event-related potential (ERP). It is named AMUSE (short for Auditory MUlticlass Spatial Event-related potential). Though it is not the first auditory BCI to be proposed, it differs from the mostly binary contemporary solutions in a crucial aspect. Instead of relying on pitch or other physical features of the stimuli to define the class membership, AMUSE targets the human capability of spatial localization of sound sources. With AMUSE, stimuli can contain physical differences but the main defining feature is the sound source or, more practically, the loudspeaker position. Using this feature, the stimuli can be short, stimulation speed can be high, and the number of classes can easily be increased by adding sources. The fundamentals of AMUSE as a BCI paradigm are carefully validated, and an AMUSE-based BCI speller is proposed with minimal reliance on the visual domain. The vast majority of the tested healthy subjects is able to write a full sentence using this speller. The average performance is high compared to contemporary covert attention-based BCIs, both in terms of the information transfer rate (ITR) and the amount of written characters per minute (char/min). Most BCI research is directed towards the final goal of successful end-user application. Accordingly, the AMUSE-based speller is tested with five end-users with advanced paralysis. Up to four online sessions are performed for each end-user, and performance is above chance on all but two sessions. Nevertheless, the performance does not suffice for the end-users to gain meaningful control over the AMUSE-based speller. This result is discussed in the context of the available attention resources, which was pathologically low for at least one end-user. The second important contribution of this thesis is a novel algorithm for performance optimization in ERP-based BCI in general, called rank diff. ERP-based BCIs have an intrinsic trade-off between the length of a trial and the accuracy of the resulting decision; longer trials typically result in more accurate decisions. In literature, this trade-off is mostly ignored and the length of the trial is simply fixed, leading to suboptimal performance. Rank diff uses the available calibration data to estimate a threshold on the required evidence necessary for a correct decision. Online, a trial is stopped as soon as this threshold is reached, leading to trials of varying length. By including rank diff in the AMUSE-based speller, the performance increases by about 40% for healthy subjects. As a result, the speller is competitive with covert attention-based visual spellers. Rank diff is further validated on benchmark data along with several other methods, showing the beneficial effect not only of rank diff, but of evidence accumulation methods in general. As average performance increases as high as 78% are found, these methods can no longer be ignored.
URI: urn:nbn:de:kobv:83-opus4-56655
http://depositonce.tu-berlin.de/handle/11303/4483
http://dx.doi.org/10.14279/depositonce-4186
Exam Date: 3-Apr-2014
Issue Date: 2-Oct-2014
Date Available: 2-Oct-2014
DDC Class: 500 Naturwissenschaften
Subject(s): Auditorisch
Ereigniskorrelierte Potentiale
Gehirn-Computer Schnittstelle
Auditory
Brain-computer interfaces
Event-related potentials
Creative Commons License: https://creativecommons.org/licenses/by/3.0/de/
ISBN: 978-3-7375-0485-0
Appears in Collections:Technische Universität Berlin » Fakultäten & Zentralinstitute » Fakultät 4 Elektrotechnik und Informatik » Institut für Softwaretechnik und Theoretische Informatik » Publications

Files in This Item:
File Description SizeFormat 
schreuder_evert_jan.pdf11.07 MBAdobe PDFThumbnail
View/Open


Items in DepositOnce are protected by copyright, with all rights reserved, unless otherwise indicated.