Please use this identifier to cite or link to this item: http://dx.doi.org/10.14279/depositonce-5465
Main Title: Auswirkungen der Fehlspezifikation von Messfehlerkorrelationen auf die Parameterschätzung in linearen Strukturgleichungsmodellen in der Glaukomdiagnose
Translated Title: The effects of the misspecification of measurement-error correlations on parameter estimation in linear structural equation models in the diagnosis of glaucoma
Author(s): Orawa, Helmut
Advisor(s): Martus, Peter
Referee(s): Martus, Peter
Eid, Michael
Granting Institution: Technische Universität Berlin
Type: Doctoral Thesis
Language Code: de
Abstract: Strukturgleichungsmodelle (SEMs) kombinieren Pfadanalysen und Faktorenanalysen und erlauben die Analyse von postulierten Kausalstrukturen für latente Variable bzw. nicht messbare Konstrukte. Lineare Strukturgleichungsmodelle sind insbesondere in der medizinischen Diagnostik gut anwendbar. Denn bei der Diagnose von Krankheiten handelt es sich um die Bestimmung von Phänomenen, die sich häufig unmittelbarer Messung (Beobachtung) entziehen und vielfach nur mittelbar über verschiedene Indikatoren (diagnostische Messver-fahren) feststellbar sind. SEMs ermöglichen die Bewertung von Referenz- und neuen Diagnoseverfahren unter Berücksichtigung von Störgrößen und zeigen auf, wie gut diese den globalen Glaukomschaden quantifizieren. Da es in der Glaukomdiagnose bislang keinen allgemeinen "Goldstandard" gibt, ist ein individueller Patientenindex für den Glaukomschweregrad auf Basis von SEMs ist die beste Annäherung an einen solchen. Fehlspezifikation in einem SEM zur Glaukomdiagnose kann jedoch zu Fehlinterpretation und letztlich zu gravierenden medizinischen Fehlentscheidungen führen und ist daher zu vermeiden. Es werden verschiedene Typen von Messmodellen und vollständigen Strukturgleichungsmodellen systematisch untersucht. Zur Durchführung dieser Analyse werden normalverteilte Daten mit vorher festgelegten Stichprobenmomenten erster und zweiter Ordnung erzeugt. Auf diese Weise können Modelle entwickelt und getestet werden, deren modellimplizite Kovarianzmatrix beliebig große Abweichungen zur so generierten "empirischen" Kovarianzmatrix aufweisen und demnach vollkommen richtig oder auch fehlspezifiziert sind. Fehlspezifikation besteht u. a. dann, wenn (latente) Fehlervariable tatsächlich korreliert sind, jedoch im Modell unkorrelierte Fehler angenommen werden. Dies führt zu erwartungsgemäß verzerrten Pfadkoeffizienten sowohl der Messmodelle als auch des Strukturmodells, aber nur unter bestimmten Umständen zur Modellablehnung. Nach mehrfacher Stichprobenziehung aus den generierten Daten (Simulation) werden Standardfehler (SE) von Modellparametern empirisch ermittelt, dem Mittelwert der modellbasiert geschätzten SE gegenübergestellt und in Fortführung der systematischen Untersuchung Ergebnisse erzielt, die a priori nicht zu erwarten gewesen wären. Im Falle der Messmodellpfadkoeffizienten überschätzt selbst in korrekt spezifizierten Modellen der mittlere geschätzte SE den empirischen um mindestens 25 %, so dass ein Korrekturfaktor von 0,8 vorgeschlagen wird. (In Modellen mit fehlspezifizierten Fehlerkorrelationen ist der modellbasiert geschätzte SE konservativer.) Da es sich beim Auge um ein paariges Organ handelt, ist in statistischen Analysen, die beide Augen eines Probanden einbeziehen, die statistische Abhängigkeit der beiden Augen (eines Individuums) voneinander zu berücksichtigen. Dies betrifft zum einen die Schätzung der SE der Pfadkoeffizienten, die in der Modellentwicklung bei der Entscheidung über die ins Modell aufzunehmenden Indikatoren bedeutsam sind, und zum anderen die Interpretation des globalen Tests für die Güte der Modellanpassung an die Daten. Nachdem softwarebedingt eine Berücksichtigung bislang nicht möglich erschien, zeigen nonparametrische Bootstrapping-Analysen auf Basis von synthetischen Daten, wie ein Korrekturfaktor für den SE des Pfadkoeffizienten von der Korrelation der Diagnoseverfahren zwischen linkem und rechtem Auge abhängt: Durch Zerlegung eines jeden dieser Verfahren in einen Anteil des latenten Glaukomschweregrads und einen latenten Messfehleranteil wird demonstriert, dass letzterer einen bedeutend stärkeren Einfluss auf den Korrekturfaktor besitzt. Anschließend werden Bootstrapping-Analysen an Patientendaten durchgeführt, die dem Erlanger Glaukomregister entstammen und auf Basis eines diagnostischen Messmodells mit acht Indikatoren bereits untersucht wurden (Martus, 2001). Bei einer Seitenkorrelation der Messverfahren in Höhe von 0,60 - 0,82 ergibt sich zum einen, dass die nicht nach Paarigkeit adjustierten SE der jeweiligen Pfadkoeffizienten um den Faktor 1,13 - 1,33 zur Berücksichtigung der intraindividuellen Abhängigkeit erhöht werden müssen. Zum anderen stellt sich heraus, dass das o. g. naive Bootstrapping zur Ermittlung eines entsprechenden Korrekturfaktors für den Chi-Quadrat-Wert des globalen Tests der Modellanpassungsgüte nicht geeignet ist. Deshalb wird eine von Bollen und Stine entwickelte Prozedur vorgeschlagen, bei der die Daten zunächst auf Modellkonformität transformiert und erst dann Boostrapping-Analysen durchgeführt werden. Die Methode zur Adjustierung der SE interessierender Pfadkoeffizienten lässt sich auch auf Daten mit komplexeren Clusterstrukturen übertragen (z. B. Messungen von Patienten mit einem oder zwei erkrankten paarigen Organen). Das publizierte Messmodell zur Glaukomdiagnose beinhaltet acht Verfahren, die durch den allgemeinen Glaukomschweregrad beeinflusst werden und in 3 Gruppen zu klassifizieren sind: Morphometrische (1), elektrophysiologische (3) und psychophysische Diagnoseverfahren (4). Letztere und ein elektrophysiologisches Verfahren sind laut Modell zusätzlich von der Konzentration der Probanden abhängig, so dass dieses Modell nicht nur einen Traitfaktor (Glaukomschweregrad) sondern auch einen Methodenfaktor (Konzentration) enthält. Es treten drei Phänomene auf, die die Messung der Reliabilität durch Cronbachs alpha bei dieser Modellstruktur als nicht ratsam erscheinen lassen: Die Korreliertheit der Fehlerterme führt zu Überschätzung, wohingegen Multidimensionalität und die Kongenerizität des Messmodells Unterschätzung bewirken. Die antagonistischen Effekte heben einander gerade auf, so dass die Reliabilität nach Cronbachs alpha hier mit der wahren Reliabilität (Yang et al., 2012) übereinstimmt (85 %). Um die wahre Reliabilität dieses Modells zu erhöhen, werden 2 weitere Methodenfaktoren implementiert. Der erste ersetzt eine von fünf Fehlerkorrelationen und wird mit "Visuell evoziertes Potential" bezeichnet, da er zwei elektrophysiologische Verfahren (Latenzzeit und Amplitude des visuell evozierten Potentials) beeinflusst. Zwei psychophysische Verfahren speisen sich aus der "Automatischen Perimetrie" und sind somit durch den entsprechend benannten zweiten Methodenfaktor beeinflusst. Diese Modelloptimierung bewirkt ein Absinken der wahren Unreliabilität um ein Drittel auf 10 %, so dass die systematische Fehlervarianz weitgehend erfasst ist (und sich eine wahre Reliabilität von 90 % ergibt).
Structural Equation Models (SEMs) combine path analyses and factor analyses, thus making it possible to analyze postulated causal structures for latent variables or non-measurable constructs. Linear Structural Equation Models are particularly applicable to medical diagnoses. This is because diagnosing diseases is about identifying phenomena that often defy actual measurement (observation) and can only be detected through various indicators (diagnostic measuring procedures). SEMs permit the evaluation of reference and new diagnostic procedures – taking account of confounding variables – and show how well they can quantitate global glaucoma damage. Since there is still no universal “gold standard” for diagnosing glaucoma, the best approximation for judging its severity is applying SEMs to an individual patient index. However, misspecifications in an SEM used for diagnosing glaucoma can lead to misinterpretations and eventually, to serious medical mistakes. For that reason, they should be avoided. Various types of measurement models and complete SEMs are systematically analyzed and normally distributed data with predetermined sample moments of the first and second order are generated. This way, models can be developed and tested whose implicit covariance matrix will display deviations of any size from the generated “empirical” covariance matrix and are either totally correct or incorrectly specified. Specification error can happen when (latent) error variables are correlated but errors are hypothesized as uncorrelated in the model. This leads to distorted path coefficients both in the measurement models and the structural model. However, only in certain circumstances does specification error lead to rejection of the model. After using the generated data for multiple random samplings (simulation), standard errors (SE) are empirically determined from model parameters and compared with the mean of the model-based estimated SE, which returns a priori unexpected results through systematic testing. When measuring model path coefficients, even in correctly specified models the mean estimated SE over-estimates the empirically determined SE by at least 25%, so that a correction factor of 0.8% is suggested. (In models with misspecified error correlations, the model-based estimated SE is more conservative.) Because the eyes are a paired organ, statistical analyses that involve both eyes of a single test subject must consider the statistical interdependence of the two eyes. This applies to the estimation of the SE of the path coefficients that are significant for deciding which indicators to include in the model being developed, as well as to interpreting the global test about how well the model fits the data. Once it seemed impossible to use software. Now, however, non-parametric bootstrapping analyses based on synthetic data are demonstrating how a correction factor for the SE of the path coefficients is dependent on the correlation between the diagnostic procedures for the left and right eyes. Breaking down all these diagnostic procedures into a share of the glaucoma’s latent severity and a share of latent measurement errors demonstrates that the latter has significantly greater influence on the correction factor. Bootstrapping analyses are then conducted of patient data from the Erlanger Glaucoma Registry that had been tested using diagnostic models with eight measurements (Martus, 2001). A lateral correlation of the measurement procedure at the level of 0.60 – 0.82 reveals the need to increase the SE not adjusted to the pairing of the relevant path coefficients by a factor of 1.13 – 1.32 with regard to the intra-individual dependence. It also becomes clear that such naive bootstrapping is not appropriate for determining a corresponding corrective factor for the chi-squared values of the global test of the model’s goodness-of-fit. A procedure developed by Bollen and Stine is suggested in which data are transformed to conform to the model before bootstrapping analyses are conducted. The methods for adjusting the SE path coefficients can also be applied to data with more complex cluster structures (e.g., measurements of patients with one or two diseased paired organs). The measurement model that has been issued for diagnosing glaucoma contains eight procedures influenced by the glaucoma’s general severity, which can be classified in three groups: morphometric (1 PCR), electrophysiological (3 PCRs) and psychophysical diagnostic procedures (4 PCRs). According to the model, the last four psychophysical procedures, as well as one electrophysiological procedure, are also dependent on the test subject’s concentration. So this model does not just include a trait factor (the severity of the glaucoma), it also includes a method factor (“psychophysical aspects of measurement” or “concentration”). The appearance of three phenomena makes it inadvisable to use Cronbachs Alpha to measure reliability with this model structure: The correlation of error terms leads to over-estimation, while the multidimensionality and congenericity of the measurement model cause the reliability to be under-estimated. The antagonistic effects cancel each other out so that the reliability using Cronbachs Alpha concurs with the true-score reliability (85%) (Yang et al., 2012). Two other method factors are implemented to increase the model’s true-score reliability. Because the first (method factor) influences two electrophysiological procedures (the latency period and the amplitude of the visually evoked potential), it is referred to as “visually evoked potential” and replaces one of the five error correlations. Two psychophysical procedures come from the “automated perimetry” and are thus influenced by the appropriately termed “second method factor”. This optimization model causes the true-score reliability to drop by a third to 10%, so that the systematic error variance is extensively recorded (and results in a true-score reliability of 90%).
URI: http://depositonce.tu-berlin.de/handle/11303/5869
http://dx.doi.org/10.14279/depositonce-5465
Exam Date: 26-Feb-2016
Issue Date: 2016
Date Available: 5-Sep-2016
DDC Class: DDC::600 Technik, Medizin, angewandte Wissenschaften
Subject(s): Fehlspezifikation
Messfehlerkorrelation
Strukturgleichungsmodell
Glaukomdiagnose
Standardfehler
specification error
measurement-error correlation
structural equation model
glaucoma diagnosis
standard error
Creative Commons License: https://creativecommons.org/licenses/by/4.0/
Appears in Collections:Institut für Technologie und Management (ITM) » Publications

Files in This Item:
File Description SizeFormat 
orawa_helmut.pdf6.71 MBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons