NDFI4DS – Infrastruktur für Forschungsdaten der Data Science

01. Jan. 2021 bis 31. Dez. 2026

Problem / Aufgabenstellung

In den letzten Jahren hat sich ein Paradigmenwechsel vollzogen: Berechnungsmethoden stützen sich zunehmend auf datengesteuerte und häufig auch Deep-Learning-basierte Ansätze. In diesem Zuge haben sich die Datenwissenschaften als Disziplin etabliert, die durch Fortschritte im Bereich der Informatik angetrieben wird.

Transparenz, Reproduzierbarkeit und Fairness sind aufgrund der Komplexität der datenwissenschaftlichen Methoden – die oft auf einer Kombination aus Code, Modellen und Daten beruhen – zu entscheidenden Herausforderungen für Datenwissenschaften und Künstliche Intelligenz geworden. NFDI4DS fördert FAIRe und offene Forschungsdateninfrastrukturen, die alle beteiligten digitalen Artefakte wie Code, Modelle, Daten oder Publikationen durch einen integrierten Ansatz unterstützen.

Lösung / Umsetzung

NFDI4DataScience (NFDI4DS) ist ein interdisziplinär arbeitendes Konsortium der Nationalen Forschungsdateninfrastruktur (NFDI). Das übergeordnete Ziel von NFDI4DS ist die Entwicklung, der Aufbau und die Etablierung einer nationalen Forschungsdateninfrastruktur für die Forschungsgemeinschaft der Datenwissenschaften und Künstlichen Intelligenz. Die daraus entstehenden Lösungen rund um das Datenmanagement werden zugleich für eine größere Gemeinschaft von Nutzen sein – auch über die NFDI hinaus.

Der Kerngedanke von NFDI4DataScience besteht darin, die Transparenz, Reproduzierbarkeit und Fairness von Projekten in den Bereichen Datenwissenschaften und Künstliche Intelligenz zu verbessern, indem alle digitalen Artefakte verfügbar gemacht, miteinander verknüpft sowie innovative Werkzeuge und Dienste angeboten werden. Basierend auf der Wiederverwendung dieser digitalen Objekte wird so innovative Forschung möglich gemacht.

In der Anfangsphase wird sich NFDI4DS auf vier Anwendungsbereiche konzentrieren: Sprachtechnologie, Lebenswissenschaften, Informationswissenschaften und Sozialwissenschaften.

Sonja Schimmler, Forschungsgruppenleiterin bei Fraunhofer FOKUS und Gastprofessorin an der TU Berlin, ist Sprecherin des Konsortiums. Fraunhofer FOKUS zeichnet insbesondere dafür verantwortlich, ein Metaportal umzusetzen, welches als Einstiegspunkt für die Wissenschaftler und Wissenschaftlerinnen dient.

NFDI: Nationale Forschungsdateninfrastruktur

NFDI4DataScience ist Teil der Nationalen Forschungsdateninfrastruktur (NFDI). Dort werden wertvolle Datenbestände von Wissenschaft und Forschung für das gesamte deutsche Wissenschaftssystem systematisch erschlossen, vernetzt und nachhaltig sowie qualitativ nutzbar gemacht. Bislang sind diese zumeist dezentral, projektbezogen oder auf Zeit verfügbar. Mit der NFDI soll ein dauerhafter digitaler Wissensspeicher als unverzichtbare Voraussetzung für neue Forschungsfragen, Erkenntnisse und Innovationen geschaffen werden.

NFDI-Konsortien sind Zusammenschlüsse verschiedener Einrichtungen innerhalb eines Forschungsfeldes und arbeiten zusammen interdisziplinär an der Zielumsetzung. Um die Aktivitäten zum Aufbau einer Nationalen Forschungsdateninfrastruktur zu koordinieren, wurde der gemeinnützige Verein Nationale Forschungsdateninfrastruktur (NFDI) e.V. mit Sitz in Karlsruhe gegründet. Gemeinsam gestalten Verein und NFDI-Konsortien die Zukunft des Forschungsdatenmanagements in Deutschland.