Kontakt

Kontakt für dieses Datenangebot

Forschungsdatenzentrum des Statistischen Bundesamtes

Servicenummer
+49 611 75-2420
+49 611 75-3915
forschungsdatenzentrum@destatis.de

Alle Standorte

Metadaten

Pfadnavigation

DOI: 10.21242/22621.2002.00.00.3.1.0

Stichprobendaten von Versicherten der gesetzlichen Krankenversicherung 2002, Scientific Use File (SUF)

Bitte beachten Sie, dass diese Statistik/dieses Produkt aufgrund einer sehr geringen Nachfrage nicht mehr im Produktangebot der FDZ enthalten ist. Aktuell laufende Nutzungen mit dieser Statistik / diesem Produkt können selbstverständlich zu den vereinbarten Konditionen zu Ende geführt werden.

Bei dem vorliegenden Scientific Use File (SUF) handelt es sich um eine 70%-Unterstichprobe von Versicherten der gesetzlichen Krankenversicherung (GKV). Das Datenmaterial enthält faktisch anonymisierte Mikrodaten der GKV-Stichprobenerhebung aus dem Jahr 2002 mit Informationen zu ambulanten Behandlungsfällen. Es umfasst insgesamt 62 Merkmale von 1,1 Millionen Versicherten der GKV. Aufgrund der verschiedenen Analyseebenen werden zwei Mikrodatenfiles angeboten: Die Jahresdaten der Versicherten enthalten für jede in die Unterstichprobe einbezogene Person Bestandsinformationen wie Geburtsjahr und Geschlecht. Ein zweiter File weist für jeden ambulanten Behandlungsfall Angaben zu den gestellten Diagnosen, Fachgruppen der Ärzte und Kosten der Behandlung auf. Somit sind detaillierte Analysen zu gesundheitswissenschaftlich relevanten Themen wie der Prävalenz bestimmter Erkrankungen oder gesundheitsökonomischen Fragestellungen möglich. Die Daten sind als Textdatei gespeichert. Einleseroutinen für SAS, SPSS und Stata erleichtern das Arbeiten mit den Daten.

Anonymisierungsmaßnahmen

Als Ausgangsmaterial für den SUF dienen die Daten von etwa 2,3 Millionen gesetzlich Krankenversicherten. Diese bestehen aus insgesamt 11 Satzarten und wurden für den SUF teilweise zusammengeführt oder gelöscht. Versicherte, die in einem oder mehreren Merkmalen Unplausibilitäten bzw. fehlende Werte aufwiesen, wurden komplett aus dem Datenmaterial entfernt. Zusätzlich wurde beim Merkmal Geburtsjahr aufgrund geringer Fallzahlen in den älteren Jahrgängen das Bottom-Coding als Anonymisierungsmaßnahme durchgeführt. Das heißt, dass Merkmalswerte, die unterhalb des Geburtsjahres 1913 liegen, auf diesen Wert festgesetzt wurden. Weiterhin wurden die Informationen zu den finanziellen Ausgaben gruppiert sowie zwei Facharztgruppen zusammengefasst. Alle Versicherten, die zudem mehr als 50 Diagnosen pro ambulantem Behandlungsfall aufwiesen, wurden aus dem Material gelöscht.