Research MEMORY ERROR II - Use of population data bases with double sampling for choice-based sample surveys and time-to-event data

Projektbeschreibung

In vielen wissenschaftlichen Untersuchungen, die auf administrativen Datenbanken beruhen, liegen nur Angaben zu gewissen Kovariablen oder zu Proxy-Maßen für alle Personen vor. Liegt für eine Stichprobe auch exakte Kovariableninformation vor, wird gewöhnlich allein die Information aus der Stichprobe für die Datenanalyse verwandt. Das Vernachlässigen der Information aus der Stichprobengrundgesamtheit führt zu einem Effizienzverlust bei der Parameterschätzung. Dieses Problem wurde in der Epidemiologie aufgegriffen, indem Zwei-Phasen oder Double Sampling Methoden entwickelt wurden, um die gemeinsamen Daten besser zu nutzen. Eine Konsequenz ist, dass die Kosten für Kovariablenmessungen in Surveys gesenkt werden können. Dieses Projekt wird die in der Epidemiologie entwickelten Ideen des Double Sampling auf das Design und die Analyse von Survey Daten übertragen, in denen der "Sampling Frame" aus einer Populationsdatenbank besteht. Likelihood-orientierte Methoden und auf Gewichtungen basierende Ansätze sind entwickelt worden, um die Datenquellen zu verknüpfen und die Effizienz zu verbessern. Die tatsächliche Performance diverser Zwei-Phasen Methoden wird in originären soziologischen wie epidemiologischen Datensätzen verglichen. Neue Methoden zur Stratifizierung, die die vorhandene Kovariableninformation der Stichprobengrundgesamtheit berücksichtigen, werden untersucht. Als epidemiologische Datenquelle dienen die im vorherigen Projekt "Errors in autobiographical memory and their effects in time-to-event analysis" erhobenen Befragungsdaten zu schweren Blutungen nach Einnahme von Blutverdünnern, die mit einer administrativen Datenbank verknüpft werden können. Im soziologischen Kontext bieten die ALWA-Daten eine gute Datengrundlage für Zwei-Phasen Methoden, da sie drei Datenquellen vereinen: administrative Daten, Befragungsdaten und psychometrische Daten. Ziel des Projektes ist die Entwicklung empirisch basierter Empfehlungen zur effizienten Nutzung vorhandener Phase-eins Information aus großen administrativen Datenbanken für die Planung von Studien mit zwei-phasigen "Choice-based Samples" und Ereigniszeitdaten.

 

Staff and Contact:

Prof. Dr. Rainer Schnell (Projektleitung), Universität Duisburg-Essen

Prof. Dr. Iris Pigeot (Projektleitung), Universität Bremen - Bremer Institut für Präventionsforschung und Sozialmedizin (BIPS)

Dr. Walter Schill, Universität Bremen - Bremer Institut für Präventionsforschung und Sozialmedizin (BIPS)

Dipl.-Math. Sigrid Behr, Universität Bremen - Bremer Institut für Präventionsforschung und Sozialmedizin (BIPS)


Funding

The project is part of the DFG Priority Programme 1292 on Survey Methodology.

 

Publications

Behr, Sigrid; Schill, Walter; Pigeot, Iris (2012). Does additional confounder information alter the estimated risk of bleeding associated with phenprocoumon use - Results of a two-phase study. Pharmacoepidemiology and Drug Safety, 21 (5):535 - 545. http://dx.doi.org/10.1002/pds.3193.