Navigation überspringen


Datenzugang | Anonymität von Mikrodaten

 

Absolute Anonymisierung | Faktische Anonymisierung |
Projektbezogene Anonymisierung | Formal anonymisierte Mikrodaten

 

Grundsätzlich unterliegen Einzelangaben der amtlichen Statistik der strikten Geheimhaltung. Zwei Sonderregelungen des Bundesstatistikgesetzes (BStatG) ermöglichen jedoch unter bestimmten Voraussetzungen eine Weitergabe von Einzelangaben zu Zwecken der Datenanalyse.

Auf diese Regelungen gründet sich die Bereitstellung anonymisierter Daten in den Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder. Die verschiedenen Grade der Datenanonymisierung werden im Folgenden dargestellt.

 

Absolute Anonymisierung

Absolut anonymisierte Daten werden durch Vergröberung oder die Entfernung einzelner Merkmale so weit verändert, dass eine Identifizierung der Auskunftgebenden unmöglich gemacht wird. Die amtliche Statistik bietet absolut anonymisierte Mikrodaten in Form von Public Use Files (PUF) an. Diese können allen interessierten Personen zur Verfügung gestellt werden.

Bislang wurden solche Datensätze beispielsweise für die Sozialhilfestatistik sowie für die Zeitbudgeterhebung erstellt. Die Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder arbeiten verstärkt an einer Ausweitung dieses Angebotes.

Seitenanfang

 

Faktische Anonymisierung

Mikrodaten werden als faktisch anonym bezeichnet, wenn die Deanonymisierung zwar nicht gänzlich ausgeschlossen werden kann, die Angaben jedoch nur mit einem unverhältnismäßig hohen Aufwand an Zeit, Kosten und Arbeitskraft dem jeweiligen Merkmalsträger zugeordnet werden können (§16(6) BStatG). Nach Maßgabe des Bundesstatistikgesetzes dürfen faktisch anonymisierte Daten allerdings nur wissenschaftlichen Einrichtungen und nur zur Durchführung wissenschaftlicher Vorhaben zugänglich gemacht werden.

Die Hauptzielrichtung der faktischen Anonymisierung besteht darin, durch behutsame Informationsreduktion und Informationsveränderungen die Zuordnungsmöglichkeiten von Merkmalsausprägungen zu den entsprechenden Merkmalsträgern zu verringern, dabei jedoch den statistischen Informationsgehalt zu erhalten. Hierfür müssen für jede einzelne Erhebung der Aufwand und der Nutzen einer Deanonymisierung analysiert werden. Dabei können unterschiedliche Anonymisierungsverfahren zur Anwendung kommen (Aggregation, Klassenbildung von Merkmalsausprägungen, etc.). [Literatur]

Faktische Anonymität resultiert allerdings nicht allein aus dem verbleibenden Informationsgehalt der Daten, sondern auch aus den gegebenen Möglichkeiten zur Deanonymisierung. Wann ein Mikrodatensatz als faktisch anonym bezeichnet werden kann, hängt daher insbesondere davon ab, in welchem Rahmen die Daten zugänglich sind. So ist von entscheidender Bedeutung, welches Zusatzwissen über die Merkmalsträger verwendet werden kann und wo die Datennutzung stattfindet. Abhängig davon, ob die Mikrodaten extern oder in den Statistischen Ämtern genutzt werden, kann die faktische Anonymität mit mehr (Off-Site-Nutzung, Scientific-Use-Files) oder minder starken Informationseinbußen (On-Site-Nutzung, Gastwissenschaftlerarbeitsplätze in den Statistischen Ämtern) erreicht werden.

Seitenanfang

 

Projektbezogene (faktische) Anonymisierung

Die projektbezogene Anonymisierung von Mikrodaten führt im Ergebnis ebenfalls zu einer faktischen Anonymität im Sinne des §16 BStatG. Anders als bei der Erstellung von Scientific-Use-Files werden aber nur die im Rahmen eines konkreten Forschungsprojektes benötigten Merkmale bereitgestellt und anonymisiert. Da die Mikrodaten zudem nur in den Räumen der amtlichen Statistik an speziellen Gastwissenschaftlerarbeitsplätzen genutzt werden können, bleiben bei der projektbezogenen (faktischen) Anonymisiserung oftmals mehr Informationen erhalten als bei der faktischen Anonymisierung standardisierter Scientific-Use-Files.

Seitenanfang

 

Formal anonymisierte Mikrodaten

Obwohl faktisch anonymisierte Daten für viele Bereiche der wissenschaftlichen Forschung geeignet sind, sind den Analysemöglichkeiten auch durch die faktische Anonymität Grenzen gesetzt. Dies ist insbesondere dann der Fall, wenn regional und fachlich tief gegliederte Auswertungen vorgenommen werden sollen. Auch eignen sich nicht alle Mikrodaten der amtlichen Statistik zur faktischen Anonymisierung oder sind nur bedingt anonymisierbar.

Daher bieten die Forschungsdatenzentren der amtlichen Statistik den Datennutzern im Rahmen der kontrollierten Datenfernverarbeitung die Möglichkeit, formal anonymisierte Mikrodaten auszuwerten. Die formale Anonymisierung beinhaltet die Entfernung der direkten Identifikatoren. Der Merkmalsumfang und die fachlichen und regionalen Gliederungen bleiben dagegen erhalten. Erst die Auswertungsergebnisse werden vor der Rückübermittlung an die Datennutzer auf geheim zu haltende Fälle überprüft.

Seitenanfang