Kontakt

Kontakt für dieses Datenangebot

Forschungsdatenzentrum der Statistischen Ämter der Länder

Herr Dr. Hans-Ullrich Mühlenfeld

+49 211 9449-2872
+49 211 9449-8087

Herr Colin Schmidt

+49 211 9449-2939
+49 211 9449-8087

forschungsdatenzentrum@it.nrw.de

Alle Standorte
Forschungsdatenzentrum des Statistischen Bundesamtes

Servicenummer
+49 611 75-2420
forschungsdatenzentrum@destatis.de

Alle Standorte

Haushalte

Pfadnavigation

Mikrozensus

Der Mikrozensus ist eine seit 1957 jährlich durchgeführte Befragung von einem Prozent aller Haushalte in Deutschland. Insgesamt nehmen jährlich etwa 370.000 Haushalte mit 810.000 Personen an der Erhebung teil. Als Mehrthemenumfrage konzipiert, liefert der Mikrozensus wichtige statistische Angaben in tiefer fachlicher Gliederung über die Bevölkerungsstruktur, die wirtschaftliche und soziale Lage der Bevölkerung, der Familien und der Haushalte, den Arbeitsmarkt, die berufliche Gliederung und die Ausbildung der Erwerbsbevölkerung sowie die Wohnverhältnisse.

Für den Großteil der Fragen besteht Auskunftspflicht.

Aufgrund des breiten Spektrums an Erhebungsmerkmalen und des großen Stichprobenumfangs eignet sich der Mikrozensus für die Analyse kleinerer Subpopulationen wie einzelner Migrations- oder Berufsgruppen. Die Bedeutung von (tief) regionalisierten Analysen, beispielsweise im Hinblick auf die Lebenschancen unterschiedlicher sozialer Gruppen, rückt zunehmend in den Vordergrund wissenschaftlicher Untersuchungen. Regionalisierte Ergebnisse lassen sich zum Beispiel auf Ebene der sog. regionalen Anpassungsschichten – räumliche Einheiten von durchschnittlich 500.000 Einwohnerinnen und Einwohnern – darstellen. Darüber hinaus ermöglicht die hohe Kontinuität des Erhebungsdesigns neben Querschnittsanalysen auch Untersuchungen im Zeitverlauf (Trendanalysen), mit denen sich historische Entwicklungen aufzeigen lassen. Dabei können einige Jahre des Mikrozensus, der als rotierendes Panel angelegt ist, ebenfalls für Panelanalysen genutzt werden.

Seit 2020 umfasst der Mikrozensus zudem die zuvor eigenständigen, EU-weiten Befragungen zu Einkommen und Lebensbedingungen (EU-SILC) sowie seit 2021 zur Nutzung von Informations- und Kommunikationstechnologien (IKT). In den FDZ-On-Site-Daten sind diese Erhebungen ebenfalls vorhanden. Für den Scientific Use File (SUF) gibt es einige Einschränkungen der Verfügbarkeit. Details finden sich in den jahresspezifischen Metadatenreports der Produkte. Der Mikrozensus eignet sich auch für Vergleiche im internationalen Kontext, da für verschiedene Themenbereiche internationale Standards (z.B. Labour-Force-Konzept) existieren.

Der Mikrozensus stellt mit seinem hohen Auswahlsatz, der thematischen Breite und zeitlichen Kontinuität eine wichtige Datenquelle für die Sozialwissenschaft dar.

Verfügbare Mikrodaten

Die folgenden Erhebungsjahre dieser Statistik können über die einzelnen Zugangsformen genutzt werden. Bitte beachten Sie dabei, dass die Gemeindekennziffer für das Bundesland Bayern am GWAP lediglich pseudonymisiert zur Verfügung steht.

Weitere Quellen für Metadaten

Klassifikationen (beim Statistischen Bundesamt)

Missy-Seite (gesis)

Mikrozensus (EVAS 12211)

Erhebungsjahr Form des Datenzugangs
Off-Site-Zugang Remote-Zugang On-Site-Zugang
Campus File (CF) Public Use File (PUF) Scientific Use File (SUF) Remote Scientific Use File (Remote-SUF) Gastwissenschaftsarbeitsplatz (GWAP), kontrollierte Datenfernverarbeitung (KDFV)
2023 - - verfügbar
Metadaten/DOI
verfügbar
Metadaten/DOI
verfügbar
Metadaten/DOI
2022 - - verfügbar
Metadaten/DOI
verfügbar
Metadaten/DOI
verfügbar
Metadaten/DOI
2021 - - verfügbar
Metadaten/DOI
verfügbar
Metadaten/DOI
verfügbar
Metadaten/DOI
2020 - - verfügbar
Metadaten/DOI
verfügbar
Metadaten/DOI
verfügbar
Metadaten/DOI
2019 - - verfügbar
Metadaten/DOI
verfügbar
Metadaten/DOI
verfügbar
Metadaten/DOI
2018 - - verfügbar
Metadaten/DOI
verfügbar
Metadaten/DOI
verfügbar
Metadaten/DOI
2017 - - verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
2016 - - verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
2015 - - verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
2014 - - verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
2013 - - verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
2012 - - verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
2011 - - verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
2010 verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
2009 - - verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
2008 - - verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
2007 - - verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
2006 - - verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
2005 - - verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
2004 - - verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
2003 - - verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
2002 verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
2001 - verfügbar
Metadaten/DOI
verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
2000 - - verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
1999 - - verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
1998 verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
1997 - - verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
1996 - - verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
1995 - - verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
1994 - - - - verfügbar
Metadaten/DOI
1993 - - verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
1992 - - - - verfügbar
Metadaten/DOI
1991 - verfügbar
Metadaten/DOI
verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
1990 - - - - verfügbar
Metadaten/DOI
1989 - - verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
1988 - - - - verfügbar
Metadaten/DOI
1987 - verfügbar
Metadaten/DOI
verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
1986 - - - - verfügbar
Metadaten/DOI
1985 - - verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
1982 - verfügbar
Metadaten/DOI
verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
1980 - - verfügbar
Metadaten/DOI
- -
1978 - - verfügbar
Metadaten/DOI
- -
1976 verfügbar
Metadaten/DOI
- verfügbar
Metadaten/DOI
- -
1973 - verfügbar
Metadaten/DOI
verfügbar
Metadaten/DOI
- -

Erhebungsjahre vor 1991 umfassen die Daten von Deutschland ohne die neuen Bundesländer.

FAQ - Häufig gestellte Fragen

Allgemeine Fragen

Wie erhalte ich Zugang zu den Mikrozensus-Daten?

Die MZ-Daten können bei den Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder beantragt werden. Die Datennutzung ist entgeltpflichtig. Auf den Seiten der Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder finden Sie nähere Informationen zum Datenangebot, Datenzugang, Beantragung und Bedingungen.

Wo erhalte ich Auskunft, wenn ich Fragen zum Mikrozensus habe?

Informationen zum gesamten Datenangebot und zum Datenzugang finden Sie unter der orangenen Schaltfläche am rechten Bildschirmrand und auf den jeweiligen Produktseiten der einzelnen Wellen und Zugangswege. Klicken Sie dafür in der obenstehenden Übersichtstabelle auf die Sie interessierenden Produkte. Sie finden dort die Fragebögen, das Schlüsselverzeichnis, den Qualitätsbericht und die Metadatenreports.

Im Metadatenreport Teil 1 finden Sie grundlegende Informationen zur Erhebung und Methodik. Dazu zählen unter anderem die in den Mikrozensus-Daten (MZ-Daten) verwendeten Hochrechnungsfaktoren sowie eine Übersicht der eingesetzten Klassifikationen. Teil 2 des Metadatenreports bezieht sich auf das Produkt und enthält u.a. Details zur Datenaufbereitung, zur Kodierung fehlender Werte (Missing-Kodierung) und zu den angewandten Anonymisierungsmaßnahmen. Zudem umfasst er ein Kapitel zur zeitlichen Vergleichbarkeit der Merkmale.

Ausführliche Informationen und Auswertungshilfen zum Scientific Use File des Mikrozensus – u. a. Tools zur Umsetzung sozialwissenschaftlicher Konzepte, Variablen-Zeitpunkte-Matrix, Verknüpfung von MZ-Querschnitterhebungen zu Panels, finden Sie auf den Produktseiten der jeweiligen Mikrozensus-Wellen. Sie stehen darüber hinaus auf dem Mikrodaten-Informationssystem (MISSY) der GESIS zur Verfügung.

Sollten Sie darüberhinausgehende Fragen haben, können Sie sich an die für den Mikrozensus fachlich zuständigen FDZ-Standorte, NRW und Bund, wenden.

Welche methodischen Veränderungen wurden ab 2020 umgesetzt?

Ab dem Erhebungsjahr 2020 ist neben der bereits seit 1968 integrierten Arbeitskräfteerhebung (LFS) auch die vorher separat erhobene Erhebung zu den Einkommen und Lebensbedingungen (SILC) in die Mikrozensuserhebung integriert. Die Arbeitskräfteerhebung wird seit 2020 durch eine unterjährige Wiederholungsbefragung ergänzt. Darüber hinaus ist ab dem Erhebungsjahr 2021 auch die Erhebung zur Nutzung von Informations- und Kommunikationstechnologie in privaten Haushalten (IKT) integriert.

Ab 2020 kommen neben persönlichen (CAPI), telefonischen (CATI) und postalischen Interviews auch Web-Interviews (CAWI) als neue Erhebungsform zum Einsatz.

Weitere Informationen finden Sie in der Publikation „Die Neuregelung des Mikrozensus ab 2020“ („WISTA - Wirtschaft und Statistik“, 6/2019).

Was wird im Kernprogramm des Mikrozensus erfragt?

Der Mikrozensus ist eine Befragung zu mehreren Themen. Die Befragung besteht aus einem Kernfrageprogramm und weiteren Erhebungsteilen.

Die Fragen des Kernprogramms beziehen sich auf folgende Themenbereiche:

  • Angaben zum Haushalt (wie Haushaltsgröße), zur Wohnung und zur Person (wie Geschlecht, Geburtsjahr, Familienstand, Staatsangehörigkeit)
  • Erwerbstätigkeit, Beruf, Arbeitssuche
  • Schule, Studium
  • Einkommens- und Beschäftigungssituation, Arbeitssuche
  • Aus- und Weiterbildung
  • Kinderbetreuung
  • Altersvorsorge

Detailliertere Angaben zu den Erhebungsinhalten finden sich u.a. auf den Produktseiten der einzelnen Erhebungsjahre in den jeweiligen Metadatenreports Teil I „Statistik“ für 2005-2019 und ab 2020. Klicken Sie dafür in der obenstehenden Übersichtstabelle auf die Sie interessierenden Produkte.

Welche Klassifikationen gibt es im MZ?

Alle Berufe sind unter Anwendung der Datenbank der Dokumentationskennzahlen (DKZ), der Klassifikation der Berufe (KldB) sowie der Internationalen Standardklassifikation der Berufe (ISCO) kategorisiert.

Für die Wirtschaftszweige (Branchen), innerhalb derer die genannten Tätigkeiten ausgeübt wurden, findet die Klassifikation der Wirtschaftszweige (WZ) Anwendung.

Der höchste Grad der schulischen oder beruflichen Bildung ist unter Anwendung der Bildungsskala ISCED (International Standard Classification of Education) klassifiziert.

Was muss beim Abgleich der Daten mit den Tabellen aus der GENESIS-Online Datenbank und anderen amtlichen Veröffentlichungen beachtet werden?

Um die Haushaltstabellen und Tabellen der Lebensformen14 nachzubilden, müssen die Daten nach Hauptwohnsitzhaushalten gefiltert werden. In den Tabellen aus der GENESIS-Online Datenbank und im Statistischen Bericht zu den Endergebnissen des Mikrozensus werden nur Hauptwohnsitzhaushalte betrachtet. Diese können mittels der Variable th0201h selektiert werden. In den Erhebungsteilen SILC und IKT werden nur Hauptwohnsitzhaushalte befragt.

Für Tabellen, in denen das Alter dargestellt wird, wird die Altersvariable tpalter_1 verwendet. Für Veröffentlichungen aus der SILC-Unterstichprobe wird rb081 oder rb082 verwendet.

Für das Geschlecht wird tpgeschlecht verwendet. Bei SILC wird rb090 verwendet. Im Erhebungsmerkmal ab0200p ist das Geschlecht mit vier möglichen Merkmalsausprägungen ausgewiesen. Die Ausprägungen 3 und 4 werden jedoch deutlich überschätzt und weisen weit höhere Anteile als in den Personenstandsregistern auf. Das Erhebungsmerkmal selbst wird nicht für amtliche Veröffentlichungen verwendet. Für eine Person, die bei der Variable ab0200p die Angabe „Divers“ oder „Ohne Angabe nach Geburtenregister“ gemacht hat, wurden für die Variable tpgeschlecht die Ausprägungen „männlich“ oder „weiblich“ zufällig zugeordnet.

Die Erhebungsmerkmale aus SILC sind nicht plausibilisiert und werden nicht unmittelbar für Veröffentlichungen verwendet. Für die Lieferung an die EU und amtliche Veröffentlichungen werden die SILC-Zielvariablen db100 bis ps102 verwendet. Diese werden auch für die Nutzung in den FDZ empfohlen. Um veröffentlichte Tabellen nachbilden zu können, müssen die SILC-Zielvariablen verwendet werden. Eine Übersicht der SILC-Zielvariablen kann dem Schlüsselverzeichnis entnommen werden, das Sie auf den Produktseiten der einzelnen Wellen finden.

Soll die tatsächliche Gesamtbevölkerung abgebildet werden, kann diese mittels der Variable tpbevlkrg in c(1,2,4) selektiert werden. Mit diesem Filter werden Personen am Nebenwohnsitz ausgeschlossen, d.h. berücksichtigt werden nur Personen am Hauptwohnsitz und in Gemeinschaftsunterkünften.

 

Fragen zum Datenzugang

Über welche Zugangswege sind die Mikrodaten des Mikrozensus verfügbar?

Die Mikrozensus-Daten können über verschiedene Zugangswege mit verschiedenen Graden der Anonymität genutzt werden.

Die formal anonymisierten Daten des Mikrozensus können über die On-Site Zugangswege Kontrollierte Datenfernverarbeitung (KDFV) und Gastwissenschaftsarbeitsplatz (GWAP) in vollem Umfang genutzt werden.

Über die Off-Site Zugangswege kann der Mikrozensus faktisch anonym als Scientific Use File (SUF) sowie absolut anonym als Public Use File (PUF) oder Campus File (CF) genutzt werden.

Zudem kann der Mikrozensus über den Remote-Zugang genutzt werden. Beim Remote Scientific Use File (Remote-SUF) sind die Daten ebenfalls faktisch anonym, jedoch mit einem höheren Informationsgehalt (u.a. Vollstichprobe und bis zur Ebene der Regionalen Anpassungsschichten regionalisierbar) als bei einem Off-Site SUF.

Welche Zugangswege für die einzelnen Wellen des Mikrozensus verfügbar sind, können Sie der Übersicht weiter oben auf dieser Seite entnehmen.

Was ist der Unterschied zwischen dem SUF und dem On-Site-Material des Mikrozensus?

Die Daten unterscheiden sich hinsichtlich des Merkmalsumfangs und des Informationsgehalts.

Über die On-Site Zugangswege Kontrollierte Datenfernverarbeitung (KDFV) und Gastwissenschaftsarbeitsplatz (GWAP) kann der Mikrozensus formal anonym in vollem Umfang genutzt werden. D.h. es steht die gesamte 1 % Stichprobe zur Verfügung, die tiefste enthaltene räumliche Gliederungsebene sind die Gemeinden. Für das Bundesland Bayern ist die Gemeindeebene am GWAP nur pseudonymisiert verfügbar.

Der SUF ist eine 70 %-Substichprobe aus dem Mikrozensusdatensatz. Ausgewählte Merkmale wurden entfernt, pseudonymisiert oder vergröbert. Die tiefste enthaltene räumliche Gliederungsebene sind die Regierungsbezirke (NUTS 2). Informationen zu den umgesetzten Anonymisierungsmaßnahmen können Sie im Metadatenreport Teil 2 der jeweiligen Erhebungsjahre nachlesen. Den Datenhandbüchern der SUF und den Schlüsselverzeichnissen der übrigen Zugangswege ist der jeweilige Merkmalskranz zu entnehmen Klicken Sie dafür in der obenstehenden Übersichtstabelle auf die Sie interessierenden Produkte.

 

Fragen zur Hochrechnung und Filterführung

Woher weiß ich, welcher Hochrechnungsfaktor für meine Auswertung der richtige ist?

Im Mikrozensus stehen verschiedene Hochrechnungsfaktoren zur Verfügung, die auf die gesamte Wohnbevölkerung skaliert sind. Dabei wird in Abhängigkeit von verschiedenen, für die Bevölkerung bekannten demografischen Eckwerten wie Altersgruppen, Geschlecht, Staatsangehörigkeit sowie regionale Verteilungen hochgerechnet. Ausführliche Informationen zur Hochrechnung ab 2020 sind Schmidt und Stein 2021 zu entnehmen.

Der „richtige“ Hochrechnungsfaktor ist abhängig davon, aus welchen Substichproben die ausgewerteten Merkmale stammen. Detaillierte Informationen zu den einzelnen Hochrechnungsfaktoren finden sich im Metadatenreport Teil 1 (unter „Hochrechnungen“) und dem Metadatenreport Teil 2 („Wann wird welcher Hochrechnungsfaktor verwendet?“). Die Metadatenreports der einzelnen Wellen finden Sie auf den jeweiligen Produktseiten. Klicken Sie dafür in der obenstehenden Übersichtstabelle auf die Sie interessierenden Produkte.

Was ist beim Abgleich der Daten mit den Veröffentlichungen des Statistischen Bundesamts zu beachten?

Für amtliche Publikationen wird nach Hauptwohnsitzhaushalten (th0201h = 1) gefiltert. 
In LFS, SILC und IKT werden nur Hauptwohnsitzhaushalte befragt.

Für Auswertungen auf Haushaltsebene wird nach Haupteinkommensperson (th0501h = 1) gefiltert.

Je nach Auswertung wird zusätzlich wie folgt gefiltert:

  • Für das Alter wird die Variable tpalter_1 verwendet 
    Für SILC-Veröffentlichungen wird hierfür rb081 oder rb082 verwendet
  • Für das Geschlecht wird tpgeschlecht verwendet. Hierbei ist ab0200p = 3 oder 4 mit je 50%-iger Wahrscheinlichkeit in „männlich“ oder „weiblich“ rekodiert 
    Für SILC-Veröffentlichungen wird hierfür rb090 verwendet

Die Erhebungsmerkmale aus SILC sind nicht plausibilisiert und werden nicht unmittelbar für Veröffentlichungen verwendet. Für die Lieferung an die EU und amtliche Veröffentlichungen werden die SILC-Zielvariablen db100 bis ps102 verwendet. Diese werden auch für die Nutzung in den FDZ empfohlen. Um veröffentlichte Tabellen nachbilden zu können, müssen die SILC-Zielvariablen verwendet werden. Eine Übersicht der SILC-Zielvariablen kann dem Schlüsselverzeichnis entnommen werden.

Soll die tatsächliche Gesamtbevölkerung abgebildet werden, kann diese mittels der Variable tpbevlkrg in c(1,2,4) selektiert werden. Mit diesem Filter werden Personen am Nebenwohnsitz ausgeschlossen, d.h. berücksichtigt werden nur Personen am Hauptwohnsitz und in Gemeinschaftsunterkünften.

Welche Filter nutzt die amtliche Statistik für das Zusatzprogramm Wohnen im neuen Mikrozensus ab 2020?

Ergebnisse zum Zusatzprogramm Wohnen beinhalten ausschließlich:

  • Hauptwohnsitzhaushalte: th0201h = 1
  • Wenn statt der Anzahl an Personen die Anzahl an Haushalten ausgewertet werden soll: th0501p = 1
  • In Gebäuden mit Wohnzweck ohne Wohnheime: ba0100h in (1 2 3)
  • Mit nur einem Haushalt in der Wohnung: tw0022w = 1

Ergebnisse zu Mieten und Mietbelastung beinhalten zudem ausschließlich Hauptmieterhaushalte: ba1901h = 3

Wie werden in den Mikrozensusdaten Haushalte selektiert?

Für den Mikrozensus sind ab 2020 (On-Site und Remote Access) und in den Scientific-Use-Files ab 2015 bereits IDs zur Personen- (idpers, idpersx), Haushalts- (idhh, idhhx) und Auswahlbezirkskennung (idawb, idawbx) im Datensatz enthalten.

In den IDs der längsschnittorientierten Daten (IDs ohne x am Ende) kann es auf Grund von Wiederholungsbefragungen des LFS-Teils ab 2020 und aufgrund von Überhanginterviews bis 2019 zu Dopplungen der IDs kommen. Dopplungsfrei, d.h. eindeutig sind die IDs mit x am Ende, welche für die querschnittsorientierten Daten genutzt werden können. Die Wiederholungsbefragungen sind bei der Erstellung von Jahresergebnissen einzubeziehen. Dies gilt nicht bezüglich LFS-Strukturvariablen, die nur in den Fragebögen 2 und 3 erhoben werden.

Bei der Verknüpfung über mehrere Erhebungsjahre kann es gewünscht sein, jeden Haushalt nur einmal je Erhebungsjahr zu berücksichtigen. Hierfür wird eine Entfernung der Wiederholungsbefragungen awbauswahlteil = 4 empfohlen. Die Bildung dieser IDs erfolgt ab 2020 für die jeweiligen Einheiten durch die Aneinanderreihung folgender Variablen:

  • idpers: land awbnummerfremd hhnummerfremd pernr
  • idpersx: land awbnummerfremd tpberichtsquartal hhnummerfremd pernr
  • idhh: land awbnummerfremd hhnummerfremd
  • idhhx: land awbnummerfremd tpberichtsquartal hhnummerfremd
  • idawb: land awbnummerfremd
  • idawbx: land awbnummerfremd tpberichtsquartal

Leerzeichen werden bei der Bildung der Identifikatoren durch Nullen ersetzt.

Wieso unterscheiden sich die hochgerechneten Gesamtfallzahlen zwischen verschiedenen Variablen bzw. zwischen verschiedenen Hochrechnungsfaktoren?

Die Unterschiede in den hochgerechneten Gesamtfallzahlen kommen aus verschiedenen Gründen zustande:

  1. Differenzen zwischen Jahres- und Quartalshochrechnungsfaktoren können sich daraus ergeben, dass in die Jahreshochrechnungsfaktoren tendenziell mehr für die Bevölkerung bekannte Eckwerte (z. B. Altersgruppen, Geschlecht, Staatsangehörigkeit sowie regionale Verteilungen) eingehen als in die Quartalshochrechnungsfaktoren. Genauere Informationen finden sich in Metadatenreport Teil I Statistik in Kapitel 2.6 (klicken Sie dafür in der obenstehenden Übersichtstabelle auf die Sie interessierenden Produkte) sowie in der Publikation „Die Hochrechnung im Mikrozensus ab 2020“ („WISTA - Wirtschaft und Statistik“, 6/2021).
  2. Abweichungen der LFS-Stichprobe kommen durch europäische Konsistenzanforderungen zustande. Diese sehen vor, dass Quartals- und Jahresergebnisse der LFS-Unterstichprobe miteinander konsistent sein müssen. Diese Anforderungen wurden gegenüber der nationalen Anforderung (Ergebniskonsistenz zwischen den einzelnen Unterstichproben) präferiert umgesetzt. Um die europäischen Anforderungen zu erfüllen, werden für amtliche Veröffentlichungen die LFS-Strukturmerkmale (sprich LFS-Jahresergebnisse) am MZ-Kern-Quartalsdurchschnitt hochgerechnet. Das MZ-Kern-Jahresergebnis entspricht nicht dem Quartalsdurchschnitt, sondern wird eigenständig hochgerechnet.

Bedingt durch die Ziehung der 70% Substichprobe ergeben sich zudem kleinere Abweichungen zwischen den hochgerechneten Summen des MZ-SUF und den in den Fachserien des Statistischen Bundesamtes veröffentlichten Zahlen bzw. der Original-Mikrozensusdaten.

 

Fragen zu den integrierten Erhebungsteilen

Wie ist das Rotationsschema der Haushalte aus der LFS-Substichprobe aufgebaut?

Um die unterjährigen Veränderungen auf dem Arbeitsmarkt besser analysieren zu können, wurde das Rotationsschema im Mikrozensus ab 2020 angepasst. Im Gegensatz zum Kern- und SILC-Programm, welche einmal jährlich abgefragt werden, rotiert der LFS-Teil in kürzeren Abständen.

Haushalte, die für den LFS-Teil ausgewählt wurden, werden im 2-(2)-2-Schema befragt. Das bedeutet, dass die Haushalte in zwei aufeinanderfolgenden Quartalen befragt werden, anschließend zwei Quartale pausieren und dann wieder zwei Quartale in Folge befragt werden. Verwendet werden dabei die Fragebögen in der Reihenfolge 3-4-2-4. Eine genauere Beschreibung dazu finden Sie in der Publikation „Die Neuregelung des Mikrozensus ab 2020“ („WISTA - Wirtschaft und Statistik“, 6/2019).

Warum sind in den integrierten Erhebungsteilen einige Variablen weniger stark besetzt als andere?

Mit Umsetzung der Neuerungen ab dem Mikrozensus 2020 wurden Unterstichproben eingeführt, die zur Folge haben, dass nicht alle Fragen allen zu befragenden Haushalten gestellt werden.

Für den MZ werden 1% der deutschen Bevölkerung befragt. Allen Befragten in Privathaushalten werden unabhängig von der Zugehörigkeit zu einer Unterstichprobe die Fragen des Mikrozensus-Kernprogramms gestellt.

Gemäß Mikrozensusgesetz werden zusätzlich in bis zu 45% der Auswahlbezirke Befragungen zur Arbeitsmarktbeteiligung (LFS) durchgeführt. Diese erhalten auch Fragen zu den Zusatzprogrammen, außer Wohnen, hierzu werden alle befragt.

Die Befragung zu Einkommen und Lebensbedingungen (SILC) erhalten bis zu 12% der Mikrozensus-Stichprobe. Seit 2021 ist auch die Statistik zur Nutzung von Informations- und Kommunikationstechnologien (IKT) im Mikrozensus integriert. Diese umfasst bis zu 3,5% der Befragten. Die realisierten Auswahlsätze können davon abweichen. Alle Substichproben sind überschneidungsfrei. Entsprechend weniger häufig als bei Kern-Variablen sind LFS-, SILC- und IKT-Variablen belegt.

Ebenso ist zu beachten, dass einige Fragen freiwillig sind und die Anzahl der Beobachtungen deshalb geringer ausfallen kann. Die coronabedingten Einschränkungen in der Qualität des Mikrozensus in den Erhebungsjahren 2020 und 2021 tragen ebenfalls zu Fehlwerten bei den Erhebungen 2020 und 2021 bei.

Die Publikation „Die Neuregelung des Mikrozensus ab 2020“ („WISTA - Wirtschaft und Statistik“, 6/2019) enthält weitere Informationen zu den Erhebungsteilen. Informationen zu den Unterstichproben sowie zur Anzahl der freiwilligen und auskunftspflichtigen Fragen je Befragungsprogramm sind dem Qualitätsbericht zum Mikrozensus zu entnehmen. Die Qualitätsberichte finden Sie bei den Metadaten der jeweiligen Berichtsjahre. Klicken Sie dafür in der obenstehenden Übersichtstabelle auf die Sie interessierenden Produkte.

 

Fragen zu Definition

Wie wird der Migrationshintergrund im Mikrozensus definiert?

Im Mikrozensus basiert der Migrationshintergrund auf der Staatsangehörigkeit zum Zeitpunkt der Geburt. So gilt eine Person als mit Migrationshintergrund, wenn sie als Deutsche und mindestens ein Elternteil mit anderer Staatsangehörigkeit geboren wurde. Diese Definition ist nur bedingt international anschlussfähig. Nachkommen von Vertriebenen, die vor 1950 eingewandert sind, gelten als Personen ohne Migrationshintergrund.

Ausführliche Informationen zu diesem Thema finden Sie in der Publikation „Die Umsetzung des Konzepts „Die Umsetzung des Konzepts ‚Einwanderungsgeschichte‘ im Mikrozensus 2022“ („WISTA - Wirtschaft und Statistik“, 4/2023).

Wie ist die Einwanderungsgeschichte im Mikrozensus definiert?

Auf Empfehlung einer Fachkommission wurde im Mikrozensus das Konzept der Einwanderungsgeschichte aufgenommen. Dieses basiert auf der Wanderungserfahrung. Diese Definition ist anschlussfähig an die Definition der UN und von Eurostat nach der alle Personen, die vor 1950 eingewandert sind, nicht als Eingewanderte und ihre Kinder nicht als Nachkommen von Eingewanderten gelten. Im Kern erfasst das Konzept nur Personen mit beidseitiger Einwanderungsgeschichte (d.h. von beiden Eltern). Um jedoch möglichst viele Bedarfe von Nutzenden mit der neuen Definition abdecken zu können und einen besseren Vergleich zum Migrationshintergrund zu ermöglichen, wird die Kategorie derjenigen mit sogenannter „einseitiger Einwanderungsgeschichte“ (also Personen, die in Deutschland geboren sind und nur ein seit 1950 eingewandertes Elternteil haben) separat ausgewiesen.

Ausführliche Informationen zu diesem Thema finden Sie in der Publikation „Die Umsetzung des Konzepts ‚Einwanderungsgeschichte‘ im Mikrozensus 2022“ („WISTA - Wirtschaft und Statistik“, 4/2023).

 

Fragen zu spezifischen Inhalten

Auf welchen regionalen Ebenen lassen sich die Daten sinnvoll auswerten?

Die Variablen aus dem Kernmaterial können von NUTS 0 bis zur regionalen Untergruppe ausgewertet werden. Bei der Unterstichprobe LFS sind Auswertungen bis zur regionalen Anpassungsschicht möglich. Die Unterstichproben SILC und IKT können bis zur NUTS 1-Ebene (Bundesländer) ausgewertet werden. Werden Variablen dieser Unterstichproben auf feineren regionalen Ebenen ausgewertet, kann es zu Verzerrungen kommen.

Warum gibt es inkonsistente Personeninformationen zwischen verschiedenen Erhebungsteilen?

Die verschiedenen Erhebungsteile haben unterschiedliche Abzugsdaten. Der Datenabzug aus der SILC beispielsweise findet aufgrund von EU-Lieferverpflichtungen deutlich früher statt als der Abzug des Kernmaterials. Daher kann es sein, dass im Kernmaterial Korrekturen von Personenmerkmalen (wie tpalter_1) stattfinden, die in den entsprechenden SILC-Zielvariablen (z.B. rb081) nicht mehr nachträglich korrigiert werden. So kann es vereinzelt auch dazu kommen, dass eine Person in der SILC-Unterstichprobe einem anderen Haushalt (hb030) zugeordnet wird als im Kernmaterial (idhh).

Wieso gibt es in den Daten ab 2022 Personen, bei denen nur die SILC- oder IKT-Variablen belegt sind, aber nicht die Kernvariablen?

Auch hier sind die unterschiedlichen Abzugsdaten verantwortlich für die Inkonsistenzen. Bei SILC und IKT findet der Datenabzug deutlich früher statt als beim Kernmaterial. So kommt es vereinzelt vor, dass Datensätze, die im SILC- oder IKT-Teil enthalten sind, im Kernteil nachträglich als unplausible Fälle rausgefiltert werden.

Was sind HWS-Haushalte?

HWS-Haushalte steht für Hauptwohnsitzhaushalt. Veröffentlichungen in der amtlichen Statistik werden grundsätzlich nach Hauptwohnsitzhaushalten gefiltert. Je nach Forschungsvorhaben kann es ratsam sein, ebenso vorzugehen.

Ein Privathaushalt ist ein Hauptwohnsitzhaushalt, wenn mindestens ein Haushaltsmitglied, das 16 Jahre oder älter ist, dort seinen Hauptwohnsitz hat. Dementsprechend können an Hauptwohnsitzhaushalten auch Personen ihren Nebenwohnsitz haben und sowohl an ihrem Haupt- als auch Nebenwohnsitz mitgezählt werden. Wenn man diese Doppelzählung vermeiden will, kann man das Merkmal TPBevlkrg nach den Ausprägungen 1, 2 und 4 filtern. Dadurch kann man auch Personen in Gemeinschaftsunterkünften einschließen. Gemeinschaftsunterkünfte, beispielsweise Alten- und Pflegeheime oder Klöster, gehören nicht zu den Privathaushalten und zählen somit nicht als Hauptwohnsitzhaushalte.

Weitere Informationen finden Sie in der Publikation "Haushalte in der Berichterstattung des Mikrozensus ab 2020“ („WISTA - Wirtschaft und Statistik“, 3/2020).

Wie können einer befragten Person Informationen zur im Haushalt lebenden Mutter und zum im Haushalt lebenden Vater zugeordnet werden?

Unter Verwendung der Haushaltsidentifikationsnummer (idhhx) kann ab 2020 über die Merkmale tl0702p und tl0802p die Personennummer der Mutter bzw. des Vaters ermittelt werden.

Der zugehörige Einzeldatensatz der Mutter/des Vaters lässt sich über die Personennummer pernr finden. Die Informationen können dann satzübergreifend der jeweiligen Referenzperson zugespielt werden.

Wie kann die Anzahl der Kinder im Haushalt bestimmt werden?

Zuerst muss der Datensatz nach der Haushaltsidentifikationsnummer (idhhx) gruppiert werden. Anschließend kann über das Merkmal tl0101p = 3 bestimmt werden, ob es sich um ein Kind im Haushalt handelt (und ggf. noch über tpalter_1 nach dem Alter gefiltert werden). Diese Information muss schließlich nur noch auf die gesamte Gruppe übertragen werden.

Warum gibt es inkonsistente Personeninformationen zwischen verschiedenen Erhebungsteilen?

Die verschiedenen Erhebungsteile haben unterschiedliche Abzugsdaten. Der Datenabzug aus SILC beispielsweise findet aufgrund von EU-Lieferverpflichtungen deutlich früher statt als der Abzug des Kernmaterials. Daher kann es sein, dass im Kernmaterial Korrekturen von Personenmerkmalen wie tpalter_1 stattfinden, die in den entsprechenden SILC-Zielvariablen (z.B. rb081) nicht mehr nachträglich korrigiert werden. So kann es vereinzelt auch dazu kommen, dass eine Person in SILC einem anderen Haushalt (hb030) zugeordnet wird als im Kernmaterial (idhh).

Sind zwischen den Mikrozensusdaten vor und nach der Methodenumstellung 2020 fachliche und räumliche Vergleiche möglich?

Vor dem Hintergrund bedeutender methodischer Veränderungen ist die Vergleichbarkeit mit den Vorjahren nur eingeschränkt möglich. Gleichwohl gibt es besonders im Kernprogramm bei vielen Variablen eine große Kontinuität. Die Erhebungsjahre 2020 und zum Teil auch noch 2021 waren zudem durch pandemiebedingte Kontaktbeschränkungen und methodisch-technische Neuerungen geprägt, die zu einer eingeschränkten Stichprobenausschöpfung und damit Interpretierbarkeit von jahresvergleichenden Ergebnissen führen (vgl. hierzu auch Kapitel 2.1 in den Metadatenreports Teil II „Produkt“; klicken Sie dafür in der obenstehenden Übersichtstabelle auf die Sie interessierenden Wellen).

Variablennamen folgen ab 2020 einer anderen Systematik und beginnen nicht mehr mit EF. Namen von Erhebungsmerkmalen bestehen aus zwei Buchstaben und vier Ziffern. Danach folgt die Kennung der Erhebungsebene (p: Person, h: Haushalt, l: Lebensform). Gegebenenfalls folgen weitere Untergliederungen mit dem Buchstaben u. Typisierte Merkmale beginnen mit t. Die Schlüsselverzeichnisse der einzelnen Erhebungsjahre verweisen aber auf die alten Bezeichnungen, sofern eine Variable auch in Jahren vor 2020 vorhanden war.

Im Mikrozensus 2020 ist nur die KldB enthalten. Warum fehlt die ISCO Klassifizierung der Berufe?

Für das Erhebungsjahr 2020 sind einmalig keine ISCO-Variablen enthalten, da die amtliche Statistik aufgrund von Qualitätsbedenken im MZ 2020 von einer Veröffentlichung absieht.

Für die meisten Wellen des Mikrozensus stehen Syntaxen zur Umsetzung der sozialwissenschaftlichen Konzepte ESeG (European Socioeconomic Groups), ESeC (European Socioeconomic Classification), ISEI (Internationaler Sozioökonomischer Index des beruflichen Status) und CASMIN (Bildungsklassifikation) für die Programmpakete SPSS und Stata auf dem Mikrodaten-Informationssystem (MISSY) der GESIS zur Verfügung. Da diese auf der ISCO basieren, werden sie 2020 einmalig ausgesetzt.

Warum beträgt die Anzahl der Befragungen (etwa 995.500) mehr als 1% der deutschen Bevölkerung?

Die tatsächliche Menge der Befragungen ist größer als die Stichprobengröße von 1%, da 7/9 des LFS-Anteils aufgrund der unterjährigen Wiederholungsbefragung zwei Mal im Erhebungsjahr befragt wird.

Mehr Informationen zur Stichprobenziehung auf Ebene der Auswahlbezirke und der Anzahl an Befragungen können dem Qualitätsbericht des Mikrozensus 2023 unter Kapitel 3 entnommen werden.

Das Statistische Bundesamt hat die Berechnung der Armutsgefährdungsquote umgestellt. Kann ich mit den FDZ-Daten die alte Berechnung nachbilden?

Bis 2023 wurden für die Ermittlung des Ausmaßes der Armutsgefährdung gemessen am Medianeinkommen auf Bundesebene zwei verschiedene Datenquellen verwendet, das MZ-Kernprogramm und die EU-SILC. Dies hatte unterschiedliche Ergebnisse zur Höhe der Armutsgefährdung zur Folge, was vor allem auf die unterschiedliche Definition und Erfassung des Haushaltsnettoeinkommens zurückzuführen ist. Die amtliche Hauptdatenquelle für die Messung von Einkommen und die daraus abgeleitete Armutsgefährdung in den Mitgliedstaaten der Europäischen Union ist EU-SILC.

Mit den FDZ-On-Site-Daten können Armutsgefährdungsquoten sowohl auf Basis des MZ-Kernprogramms als auch auf Basis von EU-SILC berechnet werden. Die amtliche Statistik veröffentlicht seit 2025 die Quoten für Deutschland auf Basis der EU-SILC-Daten, um für die breite Öffentlichkeit einheitliche Werte zu kommunizieren. Mit der Berechnung auf Basis von EU-SILC wird eine europaweite Outputharmonisierung erreicht, was einen EU-weiten Vergleich ermöglicht.

Hinweis: Im Statistikportal können weiterhin Armutsgefährdungsquoten aus dem MZ-Kern auf Basis des Landesmedians abgerufen werden.

Aufgrund der detaillierten Abfrage der einzelnen Einkommensbestandteile in EU-SILC wird das Einkommen von den Befragten präziser angegeben (zum Beispiel inklusive staatlicher Leistungen wie Kindergeld, Kinderzuschlag, BAföG, Pflegegeld oder Wohngeld) und auch nicht monatlich anfallende Einkommen oder kleinere Beträge werden erfasst. Während die Angaben im Kernmaterial in 24 Klassen angegeben sind, sind die EU-SILC-Daten auf den Euro gerundet erfasst. Dies ist ein entscheidender qualitativer Vorteil von den Einkommensangaben in EU-SILC gegenüber dem MZ-Kernprogramm.

Zur Berechnung der Armutsgefährdungsquote werden alle Angaben zum Haushaltseinkommen summiert und so das Gesamthaushaltseinkommen bestimmt. Anschließend erfolgt für alle Personen im Haushalt eine Bedarfsgewichtung. Dabei erhält die Hauptbezugsperson das Gewicht 1. Weitere Erwachsene und Kinder ab 14 Jahren erhalten das Gewicht 0,5, Kinder unter 14 Jahren das Gewicht 0,3. Das verfügbare Haushaltseinkommen wird nun durch die Summe der Gewichte dividiert. Der ermittelte Quotient wird als Äquivalenzeinkommen bzw. bedarfsgewichtetes Pro-Kopf-Einkommen je Haushaltsmitglied bezeichnet. Anschließend wird die Armutsgefährdungsschwelle bestimmt, die bei 60% des Medians der Äquivalenzeinkommen liegt. Die Armutsgefährdungsquote beschreibt den Anteil der Personen mit einem Äquivalenzeinkommen unterhalb dieser Armutsgefährdungsschwelle.

Detailliertere Informationen dazu sind auf der Homepage des Statistischen Bundesamts zu finden.