Datenzugang | Anonymität von Mikrodaten
Absolute Anonymisierung |
Faktische Anonymisierung |
Projektbezogene Anonymisierung |
Formal anonymisierte Mikrodaten
Grundsätzlich unterliegen Einzelangaben der amtlichen Statistik der strikten Geheimhaltung. Zwei Sonderregelungen des Bundesstatistikgesetzes (BStatG) ermöglichen jedoch unter bestimmten Voraussetzungen eine Weitergabe von Einzelangaben zu Zwecken der Datenanalyse.
- Sind die Einzelangaben dem Befragten oder Betroffenen nicht zuzuordnen, aus den Daten also keine Rückschlüsse auf die auskunftgebene Stelle oder Person mehr möglich (absolute Anonymität), können diese Einzelangaben auch außerhalb der amtlichen Statistik genutzt werden (§16 Abs. Nr. 4 BStatG).
- Für die Zwecke wissenschaftlicher Forschung gestattet das Bundesstatistikgesetz die Bereitstellung von Einzelangaben, welche den Auskunftgebenden bzw. Merkmalsträgern nur mit einem "unverhältnismäßig großen Aufwand an Zeit, Kosten und Arbeitskraft zugeordnet werden können". Hierbei wird von einer faktischen Anonymität der Daten ausgegangen. Die Daten dürfen in dieser Form allerdings nur "Einrichtungen mit der Aufgabe unabhängiger wssenschaftlicher Forschung" bereitgestellt werden, die Datenempfänger müssen zudem Amtsträger oder besonders verpflichtet sein (§16 Abs. 6 BStatG).
Auf diese Regelungen gründet sich die Bereitstellung anonymisierter Daten in den Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder. Die verschiedenen Grade der Datenanonymisierung werden im Folgenden dargestellt.
Absolute Anonymisierung
Absolut anonymisierte Daten werden durch Vergröberung oder die Entfernung einzelner Merkmale so weit verändert, dass eine Identifizierung der Auskunftgebenden unmöglich gemacht wird. Die amtliche Statistik bietet absolut anonymisierte Mikrodaten in Form von Public Use Files (PUF) an. Diese können allen interessierten Personen zur Verfügung gestellt werden.
Bislang wurden solche Datensätze beispielsweise für die Sozialhilfestatistik sowie für die Zeitbudgeterhebung erstellt. Die Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder arbeiten verstärkt an einer Ausweitung dieses Angebotes.
Faktische Anonymisierung
Mikrodaten werden als faktisch anonym bezeichnet, wenn die Deanonymisierung zwar nicht gänzlich ausgeschlossen werden kann, die Angaben jedoch nur mit einem unverhältnismäßig hohen Aufwand an Zeit, Kosten und Arbeitskraft dem jeweiligen Merkmalsträger zugeordnet werden können (§16(6) BStatG). Nach Maßgabe des Bundesstatistikgesetzes dürfen faktisch anonymisierte Daten allerdings nur wissenschaftlichen Einrichtungen und nur zur Durchführung wissenschaftlicher Vorhaben zugänglich gemacht werden.
Die Hauptzielrichtung der faktischen Anonymisierung besteht darin, durch behutsame Informationsreduktion und Informationsveränderungen die Zuordnungsmöglichkeiten von Merkmalsausprägungen zu den entsprechenden Merkmalsträgern zu verringern, dabei jedoch den statistischen Informationsgehalt zu erhalten. Hierfür müssen für jede einzelne Erhebung der Aufwand und der Nutzen einer Deanonymisierung analysiert werden. Dabei können unterschiedliche Anonymisierungsverfahren zur Anwendung kommen (Aggregation, Klassenbildung von Merkmalsausprägungen, etc.). [Literatur]
Faktische Anonymität resultiert allerdings nicht allein aus dem verbleibenden Informationsgehalt der Daten, sondern auch aus den gegebenen Möglichkeiten zur Deanonymisierung. Wann ein Mikrodatensatz als faktisch anonym bezeichnet werden kann, hängt daher insbesondere davon ab, in welchem Rahmen die Daten zugänglich sind. So ist von entscheidender Bedeutung, welches Zusatzwissen über die Merkmalsträger verwendet werden kann und wo die Datennutzung stattfindet. Abhängig davon, ob die Mikrodaten extern oder in den Statistischen Ämtern genutzt werden, kann die faktische Anonymität mit mehr (Off-Site-Nutzung, Scientific-Use-Files) oder minder starken Informationseinbußen (On-Site-Nutzung, Gastwissenschaftlerarbeitsplätze in den Statistischen Ämtern) erreicht werden.
Projektbezogene (faktische) Anonymisierung
Die projektbezogene Anonymisierung von Mikrodaten führt im Ergebnis ebenfalls zu einer faktischen Anonymität im Sinne des §16 BStatG. Anders als bei der Erstellung von Scientific-Use-Files werden aber nur die im Rahmen eines konkreten Forschungsprojektes benötigten Merkmale bereitgestellt und anonymisiert. Da die Mikrodaten zudem nur in den Räumen der amtlichen Statistik an speziellen Gastwissenschaftlerarbeitsplätzen genutzt werden können, bleiben bei der projektbezogenen (faktischen) Anonymisiserung oftmals mehr Informationen erhalten als bei der faktischen Anonymisierung standardisierter Scientific-Use-Files.
Formal anonymisierte Mikrodaten
Obwohl faktisch anonymisierte Daten für viele Bereiche der wissenschaftlichen Forschung geeignet sind, sind den Analysemöglichkeiten auch durch die faktische Anonymität Grenzen gesetzt. Dies ist insbesondere dann der Fall, wenn regional und fachlich tief gegliederte Auswertungen vorgenommen werden sollen. Auch eignen sich nicht alle Mikrodaten der amtlichen Statistik zur faktischen Anonymisierung oder sind nur bedingt anonymisierbar.
Daher bieten die Forschungsdatenzentren der amtlichen Statistik den Datennutzern im Rahmen der kontrollierten Datenfernverarbeitung die Möglichkeit, formal anonymisierte Mikrodaten auszuwerten. Die formale Anonymisierung beinhaltet die Entfernung der direkten Identifikatoren. Der Merkmalsumfang und die fachlichen und regionalen Gliederungen bleiben dagegen erhalten. Erst die Auswertungsergebnisse werden vor der Rückübermittlung an die Datennutzer auf geheim zu haltende Fälle überprüft.
© Statistische Ämter des Bundes und der Länder
Letzte Änderung am 10.07.2007.
