Anonymität

Pfadnavigation

Anonymität

Grundsätzlich unterliegen Einzelangaben der amtlichen Statistik der strikten Geheimhaltung. Verschiedene Sonderregelungen des Bundesstatistikgesetzes (BStatG) ermöglichen jedoch unter bestimmten Voraussetzungen eine Weitergabe von Einzelangaben zu Zwecken der Datenanalyse.

  • Sind die Einzelangaben den Befragten oder Betroffenen nicht zuzuordnen, aus den Daten also keine Rückschlüsse auf die auskunftgebenden Stellen oder Personen mehr möglich, können diese Einzelangaben auch außerhalb der amtlichen Statistik genutzt werden (§16 Abs. 1 Nr. 4 BStatG). Die Daten erfüllen dann das Kriterium der absoluten Anonymität.
  • Für die Zwecke wissenschaftlicher Forschung gestattet das Bundesstatistikgesetz die Bereitstellung von Einzelangaben, welche den Auskunftgebenden bzw. Merkmalsträgerinnen und -trägern nur mit einem "unverhältnismäßig großen Aufwand an Zeit, Kosten und Arbeitskraft zugeordnet werden können". Hierbei wird von einer faktischen Anonymität der Daten ausgegangen. „Innerhalb speziell abgesicherter Bereiche des Statistischen Bundesamtes und der statistischen Ämter der Länder“ darf unter bestimmten Voraussetzungen auch Zugang zu formal anonymen Daten gewährt werden. In beiden Fällen dürfen die Daten nur an „Einrichtungen mit der Aufgabe unabhängiger wissenschaftlicher Forschung“ bereitgestellt werden. Die Daten empfangenden Personen müssen zudem Amtsträgerinnen oder Amtsträger oder besonders Verpflichtete sein (§16 Abs. 6 BStatG).

Die Bereitstellung anonymisierter Daten in den Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder basiert auf diesen Regelungen. Die beschriebenen Grade der Anonymität werden im Folgenden dargestellt.

Absolute Anonymität

Absolut anonyme Daten werden durch Vergröberungen und die Entfernung von Merkmalen so weit verändert, dass eine Identifizierung der Auskunftgebenden unmöglich gemacht wird. Die amtliche Statistik bietet absolut anonymisierte Mikrodaten in Form von Public Use Files (PUF) an. Diese können allen interessierten Personen zur Verfügung gestellt werden. Für die methodische Lehre stehen außerdem absolut anonyme Campus Files zur Verfügung.

Faktische Anonymität

Mikrodaten werden als faktisch anonym bezeichnet, wenn eine Deanonymisierung zwar nicht gänzlich ausgeschlossen werden kann, die Angaben jedoch „nur mit einem unverhältnismäßig großen Aufwand an Zeit, Kosten und Arbeitskraft“ der jeweiligen Merkmalsträgerin bzw. dem jeweiligen Merkmalsträger zugeordnet werden können (§16 Abs. 6 BStatG). Nach Maßgabe des Bundesstatistikgesetzes dürfen faktisch anonyme Daten allerdings nur von wissenschaftlichen Einrichtungen und nur zur Durchführung wissenschaftlicher Vorhaben genutzt werden.

Bei der Herstellung der faktischen Anonymität besteht das Ziel darin, die Wahrscheinlichkeit einer korrekten Zuordnung von Angaben zu Auskunftgebenden nahezu auszuschließen, dabei jedoch den statistischen Informationsgehalt möglichst weitgehend zu erhalten. Dabei können unterschiedliche Anonymisierungsverfahren zur Anwendung kommen. Gängig sind Verfahren zur Informationsreduktion (z. B. Aggregation, Klassenbildung) bzw. zur Informationsveränderung (z. B. Swapping-Verfahren). Für die Bestimmung der faktischen Anonymität müssen der Aufwand und der Nutzen einer Deanonymisierung bewertet werden.

In den Forschungsdatenzentren resultiert die faktische Anonymität allerdings nicht allein aus dem verbleibenden Informationsgehalt der Daten, sondern auch aus den Rahmenbedingungen der Datennutzung und den damit einhergehenden Möglichkeiten zur Deanonymisierung. Wann ein Mikrodatensatz als faktisch anonym bezeichnet werden kann, hängt nämlich auch von den Zugangsbedingungen ab. Dabei ist von entscheidender Bedeutung, welches Zusatzwissen über die Merkmalsträgerinnen und -träger verfügbar ist und wo die Datennutzung stattfindet. Abhängig davon, ob die Mikrodaten außerhalb oder innerhalb der Statistischen Ämter genutzt werden, kann die faktische Anonymität mit mehr (Scientific Use Files) oder weniger (Gastwissenschaftsarbeitsplätze) starken Informationseinbußen erreicht werden.

Formale Anonymität

Insbesondere für fachlich oder regional tief gegliederte Auswertungen bieten die Forschungsdatenzentren der amtlichen Statistik im Rahmen der kontrollierten Datenfernverarbeitung und am Gastwissenschaftsarbeitsplatz die Möglichkeit, formal anonyme Mikrodaten auszuwerten. Für die Herstellung der formalen Anonymität werden die direkten Identifikatoren und Hilfsmerkmale aus dem Datenmaterial entfernt, der weitere Merkmalsumfang und die fachlichen und regionalen Gliederungen bleiben dagegen erhalten.