Navigation überspringen


Datenangebot | Lohn- und Einkommensteuerstatistik 1998

Anonymisierung | Metadaten | Ansprechpartner

 

Scientific-Use-File zur Off-Site-Nutzung

Mit FAST 98 veröffentlicht die amtliche Statistik erstmals Mikrodaten aus dem Bereich der Steuerstatistiken in Form von "Faktisch anonymisierten Daten aus der Lohn- und Einkommensteuerstatistik 1998 (FAST 98)". Diese Daten bieten der Wissenschaft die Möglichkeit, politisch relevante Fragestellungen zum Steuer- und Transfersystem auf der Grundlage echter Veranlagungsdaten am eigenen Arbeitsplatz zu analysieren.

FAST 98 umfasst Daten von rund 2,9 Millionen Steuerpflichtigen mit bis zu 350 Merkmalen. Neben den sozioökonomischen Merkmalen enthalten diese Mikrodaten die wichtigsten Angaben aus den Einkommensteuererklärungs-Formularen. Die Datenbasis für FAST 98 ist eine 10%-Stichprobe aller Einkommensteuerveranlagungen für das Kalenderjahr 1998.

FAST 98 weist eine Reihe von Merkmalen auf, die eine gezielte Analyse über Einkommensverteilungen für gesellschaftliche Gruppen ermöglicht. Beispielhafte Merkmale sind: Geschlecht, Religion, Veranlagungsart, Grund-/Splittingtabelle, Steuerklasse, Wirtschaftszweig, Zugehörigkeit zu den Freien Berufen, regionale Zuordnung und Altersangaben der Steuerpflichten. Die einzelnen Datensätze enthalten Angaben über einen Steuerpflichtigen, der im Fall der gemeinsamen Veranlagung von Ehegatten zwei Personen beschreibt.

FAST 98 ermöglicht Auswertungen nach dem Besteuerungsschema gemäß § 2 EStG über die einzelnen Einkunftsarten, Einkommen, zu versteuerndes Einkommen bis hin zur Steuerschuld des Steuerpflichtigen. Auch wenn bei der Anonymisierung größten Wert auf den Erhalt des Analysepotentials gelegt wurde sind nicht alle Fragestellungen der Wissenschaft exakt mit den Daten analysierbar. Trotz dieser Einschränkung ist erstmalig für die Wissenschaft ein so umfangreiches Datenmaterial aus der Lohn- und Einkommensteuerstatistik mit geringen Kosten für steuerliche Analysen zugänglich. FAST 98 stellt einen großen Fortschritt in der steuerlichen Datenbasis für die Wissenschaft dar.

 

Anonymisierungsmaßnahmen

Die Ausgangsdatenbasis für die FAST-Datei ist eine 10-Prozent-Stichprobe aus der rund 29 Millionen Einzeldatensätze umfassenden Grundgesamtheit aller Einkommensteuerpflichtigen. Hierbei handelt es sich um eine optimierte Stichprobe, die in erster Linie nach dem Gesamtbetrag der Einkünfte geschichtet ist.

Als allgemeine Anonymisierungsmaßnahmen sind Merkmale vergröbert oder gelöscht worden. Spezifische Anonymisierungsmaßnahmen sind in Abhängigkeit der Höhe des Gesamtbetrags der Einkünfte vorgenommen worden, wobei für die Extrembereiche eine stärkere Anonymisierung als für mittlere oder niedrige Bereiche durchgeführt wurde.

Seitenanfang

 

Metadaten zum Download

Datei Format Größe
Dokumentation Off-Site-Datensatz
der Lohn- und Einkommensteuerstatistik 1998
(komplett mit Anlagen)
zip 10.251 KB

oder als einzelne Dateien:

Datei Format Größe
Beschreibung des Scientific-Use-Files pdf 81 KB
Stellungnahme des wissenschaftlichen Beirates pdf 25 KB
Aufsatz "Einzeldatenmaterial und Stichproben innerhalb der Steuerstatistiken" pdf 9.985 KB
Schichtgrenzen der Stichprobe pdf 26 KB
Anonymisierungsverfahren (Kurzfassung) pdf 89 KB
Anonymisierungsverfahren (Langfassung) pdf 185 KB
Merkmalskatalog pdf 57 KB
Literaturhinweise pdf 109 KB

(Stand: 26. April 2005)

Weitere Quellen für Metadaten:

Seitenanfang

 

Ansprechpartner

Falls Sie weitere Fragen zum Scientific-Use-File haben, wenden Sie sich bitte an einen der Standorte der Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder oder direkt an:

Ansprechpartner Telefon E-Mail
Heike Habla
Statistisches Bundesamt
FDZ des Statistischen Bundesamtes
0611 75-3277 forschungsdatenzentrum@destatis.de
Sebastian Scharnhorst
Information und Technik NRW
FDZ der Statistischen Landesämter
0211 9449-2873 forschungsdatenzentrum@it.nrw.de

Seitenanfang