Zugang

Pfadnavigation

Zugang zu den Mikrodaten

Die Forschungsdatenzentren bieten unterschiedliche Möglichkeiten für die Nutzung amtlicher Mikrodaten. Sie unterscheiden zwischen On-Site-, Remote- und Off-Site-Zugangswegen.

Die im Folgenden vorgestellten Zugangswege unterscheiden sich sowohl hinsichtlich der Anonymität der nutzbaren Mikrodaten als auch in der Art der Datenbereitstellung. Der Datenzugang ist an bestimmte Bedingungen geknüpft. In den Nutzungsbedingungen können Sie sich näher informieren. Um Mikrodaten nutzen zu können, müssen Sie außerdem über Kenntnisse zu einem der über die FDZ angebotenen Auswertungsprogramme verfügen (SAS, SPSS, Stata oder R). Für die Nutzung der On-Site Zugangswege und des Remote-Zugangs muss die Arbeit mit den Auswertungsprogrammen syntaxbasiert erfolgen.

Hinweis: Informationen zu den Zugangswegen finden Sie auch im E-Learning-Angebot der FDZ: Einen Überblick bietet die Lernkarte 1 "FDZ allgemein", eine detaillierte Beschreibung der Zugangswege und eine Entscheidungshilfe für den passenden Zugangsweg finden Sie in Lernkarte 3 "Zugangswege".

On-Site-Zugang:

Gastwissenschaftsarbeitsplätze

In allen Standorten der beiden Forschungsdatenzentren stehen Gastwissenschaftsarbeitsplätze (GWAP) bereit, an denen die Mikrodaten in den geschützten Räumen der amtlichen Statistik durch Wissenschaftler und Wissenschaftlerinnen analysiert werden können. Da die Einzeldaten bereits durch die Regulierung des Datenzugangs und die Ausstattung des PC-Arbeitsplatzes geschützt werden, können am GWAP – je nach Sensibilität der Daten – faktisch oder formal anonyme Mikrodaten bereitgestellt werden. Voraussetzung für die Nutzung des GWAP ist eine Verpflichtung auf die statistische Geheimhaltung nach §16 Abs. 7 BStatG.

Die Gastwissenschaftsarbeitsplätze, an denen die Mikrodaten ausgewertet werden können, sind mit gängigen Analyseprogrammen (SPSS, SAS, Stata und teilw. R) ausgestattet und nach außen vollständig abgeschottet. Für E-Mail-Kommunikation und Internet-Recherchen steht ein separater PC-Arbeitsplatz mit Internetanbindung zur Verfügung. Innerhalb einer Datennutzung können mehrere Gastwissenschaftsaufenthalte stattfinden. Die Termine müssen vorab mit dem betreuenden FDZ-Standort abgestimmt werden.

Für die Nutzung des GWAP wird vorausgesetzt, dass die Nutzenden mit mindestens einem der in den FDZ angebotenen Auswertungsprogramme syntaxbasiert arbeiten können. Der Aufbau des Programmcodes ist den Mustersyntaxen zu entnehmen.

Kontrollierte Datenfernverarbeitung

Remote-Zugang:

Remote Scientific Use Files

Bei Remote Scientific Use Files (Remote-SUF) handelt es sich um faktisch anonyme Datensätze der amtlichen Statistik, die über das Remote Access-System der FDZ genutzt werden können. Die Nutzung setzt voraus, dass die antragstellende Institution ihren Sitz in Deutschland hat und spezifische technische und organisatorische Anforderungen umsetzt. Der Zugriff auf das Remote Access-System ist zudem ausschließlich in den Räumlichkeiten der beantragenden wissenschaftlichen Einrichtung innerhalb Deutschlands gestattet. Alle Datennutzenden müssen auf die statistische Geheimhaltung nach § 16 Abs. 7 BStatG verpflichtet werden. 
Analysen im Remote Access-System sind entweder mit der Analysesoftware Stata oder R möglich. Aus der gewählten Analysesoftware können sich Einschränkungen bei der Anzahl der Datennutzenden ergeben.
Weitere Informationen rund um den Remote-SUF inklusive eines FAQs finden Sie hier.

Off-Site-Zugang:

Scientific Use Files

Scientific Use Files (SUF) sind standardisierte Datensätze, die von den Forschungsdatenzentren für gängige Statistiken erstellt werden. SUF bieten im Vergleich zu den On-Site-Zugangswegen ein geringeres Analysepotenzial, sind jedoch so konzipiert, dass sie sich für einen großen Teil der wissenschaftlichen Forschungsvorhaben eignen. Durch die faktische Anonymisierung der Mikrodaten dürfen sie außerhalb der geschützten Räume der amtlichen Statistik verwendet werden. Voraussetzung hierfür ist, dass die beantragende Institution ihren Sitz in der Europäischen Union hat und dass die bereitgestellten Daten nur in den Räumen der beantragenden wissenschaftlichen Einrichtungen innerhalb der EU genutzt werden. Zudem müssen alle Datennutzenden auf die statistische Geheimhaltung nach § 16 Abs. 7 BStatG verpflichtet werden. 

SUF werden für die Analyseprogramme SAS, SPSS und Stata angeboten oder mit entsprechenden Einleseroutinen bereitgestellt.

Public Use Files
Campus Files

Kombination der Datenzugangswege

Die dargestellten Zugangswege können beliebig miteinander kombiniert werden. So können beispielsweise Teile der Analyse eines Datensatzes an einem Gastwissenschaftsarbeitsplatz erfolgen, während andere Analysen mit dem Scientific Use File in der wissenschaftlichen Einrichtung durchgeführt werden. Auch die Kombination von Gastwissenschaftsaufenthalt und kontrollierter Datenfernverarbeitung bietet sich in vielen Fällen an. Insbesondere bei längeren Forschungsprojekten sind solche Aufteilungen oft sinnvoll. Bei der kombinierten Nutzung der Zugangswege fallen in der Regel gesonderte Entgelte an.

Nicht-wissenschaftliche Datennutzung

Gemäß § 16 (6) des Bundesstatistikgesetzes (BStatG) dürfen die Forschungsdatenzentren nur „Hochschulen oder sonstigen Einrichtungen mit der Aufgabe unabhängiger wissenschaftlicher Forschung“ einen Zugang zu amtlichen Mikrodaten gewähren. Personen oder Einrichtungen, die nicht unter diese Definition fallen, können sich für die benötigten Informationen an die jeweiligen Auskunftsdienste der Statistischen Ämter des Bundes und der Länder wenden. Die entsprechenden Kontaktinformationen finden Sie hier.

Fragen zum Datenzugang

Welche Daten bieten die FDZ an?

Die FDZ der amtlichen Statistik bieten Daten aus den folgenden Bereichen an:

  • Soziales
  • Wirtschaft
  • Agrar, Energie, Umwelt
  • Finanzen, Recht, Steuern
  • Firmendaten

Eine detaillierte Übersicht aller verfügbaren Statistiken finden Sie hier. Durch Anklicken der Sie interessierenden Statistik werden Ihnen die jeweils verfügbaren Wellen und Zugangswege angezeigt.

Ich habe eine Frage zu einer angebotenen Statistik. An wen kann ich mich wenden?

Die FDZ der amtlichen Statistik haben etwa 100 Statistiken in ihrem Datenangebot. Um Nutzende bestmöglich zu beraten, haben die einzelnen FDZ-Standorte fachliche Zuständigkeiten für bestimmte Statistiken, in denen sie sich besonders auskennen und zu denen sie Nutzende beraten können.

Welcher Standort für eine Statistik zuständig ist, können Sie auf unserer Homepage sehen: Wenn Sie eine Statistik unseres Datenangebots anklicken, kommen Sie auf die entsprechende Informationsseite. Am rechten Rand und unter der Tabelle mit den verfügbaren Produkten finden Sie einen Link zu den Kontaktdaten des jeweils fachlich zuständigen Standorts.

Was ist der Unterschied zwischen On-Site-, Off-Site- und Remote-Nutzung?

Die FDZ der amtlichen Statistik bieten unterschiedliche Möglichkeiten für die Nutzung amtlicher Mikrodaten. Dabei unterscheiden sie zwischen On-Site- und Off-Site-Zugangswegen, die sich wiederum sowohl in der Anonymität der nutzbaren Mikrodaten als auch in der Art der Datenbereitstellung unterscheiden.

Bei der On-Site-Nutzung von Daten verbleiben die Mikrodaten in den geschützten Räumen der amtlichen Statistik. Erzeugte Ergebnisse werden vor der Weitergabe an die Nutzenden von den FDZ-Mitarbeitenden auf mögliche Geheimhaltungsrisiken geprüft und bei Bedarf gesperrt. Durch die so entstehende Schutzwirkung können formal anonyme Daten angeboten werden, bei denen die direkten Identifikatoren der Erhebungseinheiten entfernt sind. Zu den Zugangswegen der On-Site-Nutzung zählen der Gastwissenschaftsarbeitsplatz und die kontrollierte Datenfernverarbeitung.

Bei der Off-Site-Nutzung werden die Mikrodaten an die beantragenden Einrichtungen übermittelt und können dort innerhalb der Räumlichkeiten von den Nutzenden direkt ausgewertet werden. Auf diese Weise können faktisch anonyme Daten bereitgestellt werden, wobei die Sicherstellung der Geheimhaltung den Datennutzenden obliegt. Off-Site können Scientific Use Files genutzt werden. Darüber hinaus sind als absolut anonyme Daten Public Use Files und Campus Files verfügbar.

Zusätzlich gibt es die Möglichkeit, Daten über ein Remote Access-System auszuwerten. Hierbei verbleiben die Daten ebenfalls in den geschützten, virtuellen Räumen der amtlichen Statistik, können aber über eine gesicherte Datenfernverarbeitung in den wissenschaftlichen Einrichtungen ausgewertet werden. Bereitgestellt werden faktisch anonyme Daten, die Ergebnisfreigabe erfolgt erst nach der Prüfung auf mögliche Geheimhaltungsrisiken. Über den Remote Access ist die Nutzung von Remote Scientific Use Files möglich.

Kann ich mehrere Zugangswege kombinieren?

Ja, das ist möglich. Auf den Seiten der Statistiken des Datenangebots finden Sie eine Übersicht über die jeweils angebotenen Zugangswege. Diese können Sie den Bedürfnissen Ihres Projekts entsprechend kombinieren.

Bitte beachten Sie dabei, dass die entsprechenden Entgelte in der Regel für jeden Zugangsweg anfallen. Ausnahmen sind hier lediglich Statistiken, bei denen die FDZ grundsätzlich die Kombination von Gastwissenschaftsarbeitsplatz (GWAP) und kontrollierter Datenfernverarbeitung (KDFV) anbieten (z.B. AFiD-Produkte, Taxpayer-Panel), bei denen nur der KDFV-Preis berechnet wird.

Ich möchte eine Statistik am GWAP nutzen, der fachlich zuständige Standort ist für mich aber schlecht erreichbar. Muss ich dorthin reisen?

Die FDZ der amtlichen Statistik bieten ein gemeinsames Daten- und Dienstleistungsangebot. Das hat für Sie als Nutzende/n auch den Vorteil, dass Sie an jedem unserer Standorte für Gastwissenschaftsarbeitsplätze alle Statistiken nutzen können. Sie können Ihre Auswertungen also an dem Standort durchführen, der für Sie am besten gelegen ist.

Beachten Sie dabei bitte, dass nicht alle Auswertungsprogramme an allen GWAP-Standorten angeboten werden. Die Information, welcher Standort welche Programme anbietet, finden Sie auf der Kontaktseite der FDZ nach einem Klick auf den Sie interessierenden Standort.

Welche Software steht zur Verfügung?

Die Statistikprogramme Stata und R werden, sofern es bei einer Statistik keine technischen Einschränkungen gibt, grundsätzlich an allen FDZ-Standorten angeboten. Darüber hinaus ist bei einzelnen Standorten die Nutzung weiterer Auswertungsprogramme möglich. Die Information, welcher Standort welche Programme anbietet, finden Sie auf der Kontaktseite der FDZ nach einem Klick auf den Sie interessierenden Standort.

Kann ich eigene Programmcodes verwenden?

Ja, für die Auswertung der Daten der FDZ werden von den Nutzenden grundsätzlich eigene Skripte erstellt. Das Vorgehen dazu unterscheidet sich je nach Zugangsweg: Für die Nutzung der kontrollierten Datenfernverarbeitung senden Sie uns diese Skripte zu, woraufhin die FDZ-Mitarbeitenden sie auf die formal anonymen Daten anwenden. Bei Nutzung des Gastwissenschaftsarbeitsplatzes (GWAP) können Sie die Programmcodes direkt am GWAP erstellen oder sie vorab vorbereiten. In diesem Fall senden Sie uns Ihre vorbereiteten Programmcodes bitte spätestens 3 Tage vor ihrem GWAP-Besuch zu. Voraussetzung für die Anwendung oder Bereitstellung der Programmcodes ist, dass sie den datenschutzrechtlichen Vorgaben entsprechen, damit also bspw. keine externen Informationen angespielt werden, die im Vorfeld nicht beantragt wurden.

Programmcodes für Scientific Use Files und Remote Scientific Use Files können Sie direkt in der jeweiligen Arbeitsumgebung in Ihrer Einrichtung erstellen und laufen lassen.

Kann ich meine Ergebnisse direkt speichern oder exportieren?

Ergebnisse können bei jedem Zugangsweg gespeichert werden.

Bei den On-Site- und Remote-Nutzungen erfolgt der Export der Ergebnisse, also die Übermittlung aus der sicheren Arbeitsumgebung, jedoch ausschließlich nach einer Geheimhaltungsprüfung der Ergebnisse durch die FDZ-Mitarbeitenden per E-Mail an die Nutzenden.

Ich arbeite an einer ausländischen Einrichtung. Kann ich Zugang zu den Daten im FDZ erhalten?

Hier gelten je nach gewünschtem Zugangsweg unterschiedliche Regelungen. Zusätzlich muss zwischen Einrichtungen aus EU-Ländern und Einrichtungen aus Ländern außerhalb der EU unterschieden werden:

  • Scientific Use Files und Remote Scientific Use Files dürfen nur von Einrichtungen innerhalb der EU genutzt werden.
  • Gastwissenschaftsarbeitsplätze und kontrollierte Datenfernverarbeitung dürfen von allen nutzungsberechtigten Einrichtungen genutzt werden.
  • Public Use Files und Campus Files können ohne Einschränkungen genutzt werden.

Auch für ausländische Einrichtungen muss die Zugangsberechtigung geprüft werden. Für Hochschulen gilt dabei, dass eine Einrichtung zugangsberechtigt ist, wenn sie in der Anabin-Datenbank mit H+ bewertet wird. Die Zugangsberechtigung von sonstigen Einrichtungen muss im Einzelfall geprüft werden. Diese Prüfung wird analog zu den inländischen Einrichtungen gestartet, wenn ein Nutzungsantrag von einer bisher nicht geprüften Einrichtung eingeht, und dauert mehrere Wochen.

Die Einrichtung, an der ich arbeite, ist nicht zugangsberechtigt. Gibt es weitere Möglichkeiten, benötigte Ergebnisse zu erhalten?

Wenn Ihre Einrichtung nicht zum FDZ-Nutzerkreis gehört, kommen folgende Vorgehensweisen für Sie in Frage:

1) Sonderauswertungen 
Sie können in den Statistischen Ämtern eine Sonderauswertung anfragen. Dafür kontaktieren Sie in der Regel den Auskunftsdienst des entsprechenden Statistischen (Landes-)Amts in dessen Bundesland ihre Einrichtung beheimatet ist. Die Kontaktdaten der Statistischen Ämter finden Sie auf dem gemeinsamen Statistikportal des Bundes und der Länder. Sie können aber auch das gemeinsame Kontaktformular nutzen. Bitte beachten Sie, dass diese Alternative kostenpflichtig ist und nur durchgeführt werden kann, wenn in der Fachabteilung genügend Kapazitäten frei sind.

2) Eurostat 
Eurostat hat aufgrund der Anwendung europäischen Rechts etwas andere Kriterien für den Datenzugang. Diese sind in der EU-Verordnung 557/2013 geregelt. Aufgrund der unterschiedlichen Rechtsgrundlagen unterscheiden sich die Kriterien für einen Datenzugang. Informationen zum Datenzugang bei Eurostat finden Sie hier. Auf der gleichen Seite finden Sie auch Informationen zu den über Eurostat verfügbaren Statistiken.