Offene Daten in der EU: Studie zu »High Value Datasets«

01. Juni 2020 bis 30. Sept. 2020

Im Auftrag des Bundesministeriums für Wirtschaft und Energie (BMWi) hat Fraunhofer FOKUS gemeinsam mit dem Institut der deutschen Wirtschaft Köln e.V. und dem iRights.Lab die Studie »Hochwertige Datensätze in Deutschland« erstellt – als Grundlage zur Identifikation, Bewertung und Klassifizierung von im öffentlichen Sektor vorhandenen Datensätzen als »High Value Datasets«, die künftig als offene Daten kostenfrei und einfach zugänglich sowohl der Gesellschaft als auch der Privatwirtschaft zur Verfügung stehen sollen.


Aufgabe / Problemstellung

Der öffentliche Sektor verfügt über zahlreiche Informationen – z.B. Statistiken, Satellitenbilder sowie Umwelt- und Mobilitätsdaten – die für das Gemeinwohl und/oder für die Wirtschaft von Nutzen sein können. Um das gesamtgesellschaftliche und ökonomische Potenzial besonders relevanter Daten auszuschöpfen und gleichzeitig deren Nutzung zu regeln, hat die Europäische Kommission 2013 die EU-Richtinie über offene Daten und die Weiterverwendung des öffentlichen Sektors, kurz: PSI-Richtlinie (nach dem englischen Titel »Re-use of Public Sector Information«), erlassen. Ziel ist die Vereinfachung der Zugänglichkeit von Daten des öffentlichen Sektors.

Im Jahr 2019 wurde die PSI-Richtlinie überarbeitet: Die novellierte Richtlinie sieht u.a. die Bestimmung sogenannter hochwertiger Datensätze, der »High Value Datasets« (HVD), vor. Als HVD klassifizierte Datensätze sollen künftig von Behörden oder öffentlichen Unternehmen als offene Daten kostenfrei, maschinenlesbar und über Schnittstellen zur Verfügung gestellt werden.

Um die Verhandlungen der EU-Mitgliedsstaaten und der EU-Kommission zur Bestimmung der HVD-Datensätze vorzubereiten, beauftragte das Bundesministerium für Wirtschaft und Energie Fraunhofer FOKUS mit der Studie »Hochwertige Datensätze in Deutschland«. 


Lösungsansatz / Umsetzung

Die Studie identifiziert rund 60 potenziell hochwertige Datensätze in Deutschland und betrachtet diese jeweils aus drei Perspektiven: Untersucht werden die (1) technischen, (2) rechtlichen und (3) ökonomischen Rahmenbedingungen, Potenziale sowie etwaige Anpassungsbedarfe in Folge einer Klassifizierung. Die exemplarisch untersuchten Datensätze decken sechs Themenbereiche ab: Georaum, Erdbeobachtung und Umwelt, Mobilität, Meteorologie, Statistik sowie Unternehmen und Eigentümerschaft von Unternehmen.

Der Geschäftsbereich Digital Public Services am Fraunhofer FOKUS hat neben der Studien-Projektleitung die Analyse der technischen Ebene (1) übernommen: Untersucht wurde u.a., ob die in der PSI-RL geforderten Bedingungen hinsichtlich Maschinenlesbarkeit und Verfügbarkeit der Daten über Schnittstellen bereits gegeben sind.

Zur Identifikation geeigneter Datensätze führte das Wissenschafts-Team eine Online-Umfrage zur ersten Einschätzung des Weiterverwendungspotenzials unterschiedlicher Datenkategorien durch. Anhand der Ergebnisse benannte das Studien-Team konkrete Datensätze aus Deutschland. Die Auswahl der Datensätze sowie damit verbundene Potenziale und Herausforderungen wurden durch einen Projektbeirat sowie Stakeholder-Workshops evaluiert. Dabei flossen die Sichtweisen von Datenbereitstellern und -nutzern ein. 


Ergebnisse

Ob Datensätze hochwertig sind, entscheidet sich nach der Logik der PSI-RL primär danach, wie hoch deren Mehrwertpotenzial im Falle einer offen lizenzierten und technisch guten Bereitstellung ist. Hierbei zeigt die Studie zahlreiche positive Effekte einer HVD-Klassifizierung auf, wie beispielsweise die Schaffung neuer Dienstleistungen und Geschäftsmodelle oder mehr Wettbewerb. Demgegenüber stehen bei einigen Datensätzen Herausforderungen, wie Einnahmeverluste und zusätzliche Arbeitsaufwände für Datenbereitsteller. Aus rechtlicher Sicht ist die PSI-Richtlinie auf nahezu alle untersuchten Datensätze anwendbar. Aus technischer Perspektive erfüllt ein Großteil der untersuchten Datensätze bereits die Anforderungen der PSI-Richtlinie – bei einigen Datensätzen muss jedoch sowohl in Hinblick auf die Formatauswahl als auch bei der Bereitstellung per Programmierschnittstelle nachgebessert werden.

Welche Datensätze künftig als HVD klassifiziert werden, wird Ergebnis der Verhandlungen zwischen der EU-Kommission und den EU-Mitgliedsstaaten sein. Wichtig ist, dass im Durchführungsrechtsakt klare Definitionen der Datensätze enthalten sind und technische Modalitäten für die Bereitstellung, beispielsweise hinsichtlich der Datenqualität und zu verwendenden Datenformate, festgelegt werden.