Loading…
Thumbnail Image

Visual search, perception and cognition when reading stack mode cranial CT

Venjakob, Antje Cristine

Die Radiologie ist heutzutage eine der wichtigsten diagnostischen Disziplinen innerhalb der Medizin und hat sich in den letzten beiden Jahrzehnten durch Digitalisierung und Mehrschichtverfahren enorm verändert. Gleichzeitig ist jedoch wenig über visuelle Suche, Wahrnehmung und Kognition bei der Interpretation dieser veränderten Bilder bekannt, da sich die Wahrnehmungsforschung größtenteils auf die Interpretation von konventionellen Röntgenbildern konzentriert. Dies mag daher rühren, dass ein experimentelles Paradigma zur Untersuchung von Wahrnehmungsprozessen bei der Interpretation von Mehrschichtbildern fehlt. Das Hauptziel dieser Arbeit ist es daher, die Untersuchung von visueller Suche, Wahrnehmung und Kognition bei der Interpretation von Mehrschichtbildern zu ermöglichen. Dazu werden Blickparameter, die sich im Kontext konventioneller Radiografie als sinnvoll erwiesen haben, an den Mehrschichtkontext angepasst. Ein wichtiger Schritt ist hier die Berechnung von Fixationen unabhängig vom Stimulusmaterial, da die Fixationen oft mehrere Schichten umfassen. Darüber hinaus wurden weitere Parameter entwickelt, die das Scrollverhalten durch den Bilderstapel repräsentieren. Alle Parameter wurden anhand von zwei Faktoren, die die Bildinterpretation beeinflussen, getestet: die getroffene Entscheidung und die Bildgröße. In einem ersten Experiment wurden 16 Radiologen gebeten Blutungen auf kranialen CT Bildern zu identifizieren. Ihr Blick- und Scrollverhalten wurde mit wahr-positiven, wahr-negative, falsch-positiven und falsch-negativen Entscheidungen in Verbindung gebracht. Hierbei zeigte sich, dass Radiologen am längsten auf wahr-positiven Entscheidungsorten verweilten, gefolgt von falsch-positiven, falsch-negativen und schließlich wahr-negativen Orten. Radiologen benötigten signifikant länger, um Entscheidungen bezüglich falsch-negativen Orten zu treffen im Vergleich zu wahr-positiven und bezüglich falsch-positiven verglichen mit wahr positiven Orten. Unterschiede zwischen Orten mit falsch-positiven Entscheidungen und den anderen Orten zeigten sich auch bei der Anzahl der Fixationen und der Interpretationsdauer. Zwei weitere Experimente konzentrierten sich auf die Bildgröße. Insgesamt 43 Radiologen von zwei Institutionen interpretierten 20 kraniale CTs in zwei Bildgrößen (14 x 14 cm versus 28 x 28 cm) und identifizierten eventuell vorhandene Blutungen. Leistung, Interpretationsdauer und Präferenz unterschieden sich nicht zwischen den Bildgrößen. Es konnte damit gezeigt werden, dass keine der beiden Bildgrößen global besser ist als die andere. Wahrnehmungsprozesse unterschieden sich jedoch: In den kleineren Bildern traten längere Fixationen auf, die mehr Schichten umfassten. Das Scrollen bei gleichzeitigem Verweilen des Blicks in einer Position wurde mit Bewegungserkennung in Verbindung gebracht. Darüber hinaus war die Zeit bis zur ersten Fixation eines wahr-positiven Ortes kürzer bei kleinen Bildern, was darauf hindeutet, dass Zielobjekte früher entdeckt wurden. Die Verweildauer war bei kleinen Bildern länger als bei großen, was darauf hindeutet, dass die Auflösung in großen Bildern besser genutzt werden konnte. Basierend auf den Experimenten kann geschlossen werden, dass kleine Bilder in frühen diagnostischen Phasen genutzt werden können um einen Überblick über einen Fall zu bekommen. Für eine detailliertere Analyse können verdächtige Strukturen dann vergrößert werden. Die drei Experimente haben wertvolle Einblicke in die Herausforderungen gewährt, die bei der Untersuchung der Interpretation von Mehrschichtbildern angegangen werden müssen. Sie haben zudem gezeigt, dass die wissenschaftliche Untersuchung der Interpretation von Mehrschichtbildern möglich ist und genutzt werden sollte, um die moderne Radiologie zu verbessern.
Today, radiology is one of the most important diagnostic disciplines within medicine. In the last two decades, the discipline has changed tremendously by going digital and increasing the importance of multi-slice images. At the same time, there is little known about the processes of visual search, perception and cognition involved in their interpretation. Medical image interpretation research mostly concentrates on conventional radiography, possibly a result of the lack of an experimental framework that enables the study of perception processes in multi-slice imaging. The main aim of this thesis therefore is to enable the study of visual search, perception and cognition in multi-slice images. To this end, gaze parameters that have proved useful in the study of gaze behavior in conventional radiography interpretation were adapted to fit the challenges of stack mode reading. An important step herein is to calculate fixations independent of the stimulus material as they often cover multiple slices. Furthermore, additional parameters were developed for the multi-slice context, which describe the z-component of gaze represented by scrolling. The thesis aimed at testing these parameters by studying two different factors that influence the reading process. One factor is decision outcome. In a first experiment 16 radiologists were asked to identify hemorrhages on cranial CT cases. Their gaze and scrolling behavior linked to True Positive, True Negative, False Positive and False Negative decisions was examined. It emerged that radiologists dwelled longest on True Positive decision sites, followed by False Positive, False Negative and finally True Negative decision sites. Radiologists took considerably longer to decide on False Negative as compared to True Positive sites and on False Positive as compared to True Positive sites. Differences between False Positive decisions and other decision outcomes have also been identified with regard to the number of fixations and reading time. The second and third experiments concentrated on the factor 'image size'. A total of 43 radiologists in two institutions were asked to interpret cranial CT and to identify any intracranial hemorrhages that were present in twenty cases of two different sizes (14 x 14 cm versus 28 x 28 cm). Performance, reading time and preference of the radiologists did not differ between the two sizes. The experiments have hence demonstrated that none of the two image sizes is globally preferable to the other. However, perceptual processes appear to differ between the two image sizes: in small images fixations were longer and covered more slices. This was associated with the use of motion detection, as scrolling though the stack while resting the gaze in one position is linked to holistic recognition. Furthermore, in both institutions, the time to first fixation of True Positive locations was shortened for small as compared to large images. Detection of targets was hence faster in these images. At the same time, dwell time was prolonged in small images, suggesting that radiologists can better resolve large images. Based on the results of the two experiments, the use of small images can be recommended during the initial phase of interpretation to signal out potentially perturbed structures that are worth examining in detail. For a closer examination, these structures should be enlarged as larger structures appeared to be easier to resolve. The three experiments have yielded valuable insights into the challenges of multi-slice medical image interpretation research and demonstrated that scientific perception research of interpreting multi-slice images is possible and should be used to improve modern radiology.