Loading…
Thumbnail Image

Processing of expected values in human visual cortex

Kallerhoff, Philipp

Inst. Softwaretechnik und Theoretische Informatik

Erfahrung könnte unsere Entscheidung verändern, wenn wir etwas über die zukünftige Belohnung gelernt haben. Insbesondere könnten wir an einem Zielort eine bestimmte Belohnung erwarten. Nach Pascal (1670) ist die erwartete Belohnung gegeben als die Vorhersehbarkeit der Belohnung und die Höhe der Belohnung an dem Zielort. In der ersten Studie, haben wir die erwartete Belohnung in einer einfachen binären Wahlaufgabe verändert, um rationale Entscheidungen im Kontext von komplexen erwarteten Belohnungsfunktionen zu untersuchen. Wir haben festgestellt, dass die Versuchspersonen wahrscheinlich der erwarteten Belohnung folgen und nicht maximieren, sowie wahrscheinlich einen kurzfristigen Durchschnitt benutzen, aber nicht das wahre generative Modell. In der zweiten Studie war es unser Ziel, die endogene Ausrichtung der Aufmerksamkeit graduell mit der erwarteten Belohnung zu modulieren. Verschiebungen in der Aufmerksamkeit wurden erzeugt, indem an einem Zielort eine höhere Belohnung erwartet werden konnte als an Anderen. Eine höhere erwartete Belohnung sollte dann die Wahrscheinlichkeit erhöhen, dass die Verswuchspersonen ihre Aufmerksamkeit auf einen Zielort konzentrieren und nicht über den gesamten Bildschirm verteilen. Die Diskriminierungsleistung an einem Zielort ist ein genauer Indikator der Aufmerksamkeit. Deshalb haben wir eine Diskriminierungsaufgabe erstellt und die Diskriminierungsleistung gemessen. Tatsächlich haben wir festgestellt, dass die Versuchspersonen die Diskriminierungsaufgabe besser gelöst haben, wenn die erwartete Belohnung am Zielort höher war. Die Modelle aus der ersten Studie erklären auch diese Ergebnisse sehr genau. Jedoch hat eine exakte Analyse auf der Basis der einzelnen Durchläufe ergeben, dass das wahre generative Modell wieder das Verhalten der Versuchspersonen nicht erklären kann, wohl aber ein kurzfristiger Durchschnitt über die letzten Zielorte. In der dritten Studie, haben wir das evozierte Potential (ERP – event‐related potential)während der Diskriminierungsaufgabe der zweiten Studie gemessen und mit den Entscheidungsmodellen der ersten Studie verglichen. Die durchschnittlichen ERP Wellen haben eine Zunahme in der frühen visuellen N1 Komponente mit zunehmender erwarteter Belohnung am Zielort gezeigt. Tatsächlich spiegeln sich die Diskriminierungsleistung und die Modulation durch Belohnung eng in den frühen‐visuellen und aufmerksamkeitsverwandten Komponenten des EEG wider. Daher kommen wir zum Schluss, dass die erwartete Belohnung in frühen visuellen Komponenten des EEG verarbeitet werden kann.
Experience might effectively modulate our choice if prior stimulation reveals some information about future reward. For example, experience might accumulate to an expected reward at different target locations. Following Pascal (1670) the expected reward is given as the predictability of the reward and the amount of reward associated with each location. In the first study, we modulated the expected reward in a simple binary choice task in order to test rational decision making in the context of complex expected value functions. We found that the subjects likely match, but do not maximize the expected reward and likely implement a short‐term average over stimulus appearances, but not the true generative model. In the second study, our aim was to gradually modulate the endogenous orientation of attention with the expected value of distributed reward in the environment. Shifts in attentional focus were induced by linking one location with a higher expected reward than other locations. Larger expected values should then increase the likelihood that subjects would focus their attention on one location rather than distribute it across the entire display. The discrimination performance at a target location is a close indicator of attention. Therefore we setup a discrimination task and measured the behavioral discrimination performance. In fact, we found that subjects increasingly discriminate the target status with a larger expected value. The models proposed in the first study account quite closely for basic properties of the behavioral results. However, a close analysis on a trial‐by‐trial basis showed that the true generative model cannot account for subjects’ behavior, which is however well explained by short‐term average over stimulus appearances. In the third study, we measured the event‐related potential (ERP) during the discrimination task introduced in the second study and compared the ERP modulations to the decision making models proposed in the first study. Grand average ERP waveforms showed an increase in components as early as the N1 component with increasing expected reward of the stimulus location. In fact, the performance in the discrimination task and the rewardmodulation are closely reflected in the amplitude of these early‐visual, attention‐related EEG‐responses. We therefore conclude the processing of expected rewards in early‐visual components of EEG.