Datenangebot | Lohn- und Einkommensteuerstatistik 2001
Anonymisierung | Metadaten | Ansprechpartner
Scientific-Use-File zur Off-Site-Nutzung
Mit FAST 2001 veröffentlicht die amtliche Statistik zum zweiten Mal Mikrodaten aus dem Bereich der Steuerstatistiken in Form von "Faktisch anonymisierten Daten aus der Lohn- und Einkommensteuerstatistik 2001 (FAST 2001)". Diese Daten bieten der Wissenschaft die Möglichkeit, politisch relevante Fragestellungen zum Steuer- und Transfersystem auf der Grundlage echter Veranlagungsdaten am eigenen Arbeitsplatz zu analysieren.
Die Datei ist eine Stichprobe mit einem Umfang von zehn Prozent aus den Einzeldaten der Einkommensteuerstatistik des Veranlagungsjahres 2001. Die knapp drei Millionen Datensätze und über 600 Merkmale enthalten umfangreiche Informationen aus dem Besteuerungsverfahren, von den Einkommensquellen bis zur festgesetzten Einkommensteuer. Darüber hinaus sind Angaben zu Alter, Geschlecht, Familienstand und Kinderzahl enthalten.
FAST 2001 weist eine Reihe von Merkmalen auf, die eine gezielte Analyse über Einkommensverteilungen für gesellschaftliche Gruppen ermöglicht. Beispielhafte Merkmale sind: Religion, Veranlagungsart, Grund-/Splittingtabelle, Steuerklasse, Wirtschaftszweig, Zugehörigkeit zu den Freien Berufen und regionale Zuordnung der Steuerpflichten. Die einzelnen Datensätze enthalten Angaben über einen Steuerpflichtigen, der im Fall der gemeinsamen Veranlagung von Ehegatten zwei Personen beschreibt.
FAST 2001 ermöglicht Auswertungen nach dem Besteuerungsschema gemäß § 2 EStG über die einzelnen Einkunftsarten, Einkommen, zu versteuerndes Einkommen bis hin zur Steuerschuld des Steuerpflichtigen. Auch wenn bei der Anonymisierung größten Wert auf den Erhalt des Analysepotentials gelegt wurde sind nicht alle Fragestellungen der Wissenschaft exakt mit den Daten analysierbar. Unter Berücksichtigung dieser Einschränkung ist ein umfangreiches Datenmaterial aus der Lohn- und Einkommensteuerstatistik für die Wissenschaft mit geringen Kosten für steuerliche Analysen zugänglich.
Anonymisierungsmaßnahmen
Die Ausgangsdatenbasis für die FAST-Datei ist eine 10-Prozent-Stichprobe aus der rund 30 Millionen Einzeldatensätze umfassenden Grundgesamtheit aller Einkommensteuerpflichtigen. Hierbei handelt es sich um eine optimierte Stichprobe, die in erster Linie nach dem Gesamtbetrag der Einkünfte geschichtet ist.
Als allgemeine Anonymisierungsmaßnahmen sind Merkmale vergröbert oder gelöscht worden. Spezifische Anonymisierungsmaßnahmen sind in Abhängigkeit der Höhe des Gesamtbetrags der Einkünfte vorgenommen worden, wobei für die Extrembereiche eine stärkere Anonymisierung als für mittlere oder niedrige Bereiche durchgeführt wurde. Hierfür wurden verschiedene Anonymisierungsklassen gebildet, für die unterschiedlich starke Anonymisierungsmaßnahmen vorgenommen worden sind.
Metadaten zum Download
| Datei | Format | Größe |
|---|---|---|
| Dokumentation Off-Site-Datensatz der Lohn- und Einkommensteuerstatistik 2001 (komplett mit Anlagen) |
zip | 427 KB |
oder als einzelne Dateien:
| Datei | Format | Größe |
|---|---|---|
| Anonymisierungskonzept | 233 KB | |
| Datensatzbeschreibung | 122 KB | |
| Literaturverzeichnis | 99 KB | |
| Stichprobenrahmen | 134 KB | |
(Stand: 04. Juli 2007)
Weitere Quellen für Metadaten:
- Qualitätsberichte - Finanzen und Steuern (beim Statistischen Bundesamt)
- Klassifikationen (beim Statistischen Bundesamt)
Ansprechpartner
Falls Sie weitere Fragen zum Scientific-Use-File haben, wenden Sie sich bitte an einen der Standorte der Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder oder direkt an:
| Ansprechpartner | Telefon | |
|---|---|---|
| Heike Habla Statistisches Bundesamt FDZ des Statistischen Bundesamtes |
0611 75-3277 | forschungsdatenzentrum@destatis.de |
| Sebastian Scharnhorst Information und Technik NRW FDZ der Statistischen Landesämter |
0211 9449-2873 | forschungsdatenzentrum@it.nrw.de |
© Statistische Ämter des Bundes und der Länder
Letzte Änderung am 26.05.2011.
