Wissen vernetzen, Datenkompetenz stärken
Base4NFDI im Bereich Data Science and Services
Die Basisdienste für die Nationale Forschungsdateninfrastruktur (NFDI) entstehen bei ZB MED in verschiedenen Teams. Der Bereich Data Science and Services ist an zwei Diensten beteiligt: KGI4NFDI läuft seit dem 1. Juni 2024, RDMTraining4NFDI, startet im Jahr 2025. Bei beiden Diensten hat Prof. Dr. Konrad Förstner die Rolle als Sprecher übernommen.
Knowledge-Graph-Infrastruktur für die Nationale Forschungsdateninfrastruktur
Was ist ein Knowledge Graph?
Kurz gesagt: eine strukturierte Wissensrepräsentation, die Informationen in Form von sogenannten Entitäten – also Dingen, Personen oder Konzepten – und deren Beziehungen zueinander darstellt. Der Graph lässt sich als Netzwerk darstellen, in dem Knoten die Entitäten sind und die Verbindungen zwischen diesen die Beziehungen darstellen.
Die Informationen im Knowledge Graph werden in semantischen Beziehungen gespeichert als Subjekt, Prädikat und Objekt, zum Beispiel „Berlin – ist Hauptstadt von – Deutschland“. Das Wissen wird also vernetzt und in einen Kontext gestellt. Und was den Graph besonders macht: Er ist maschinenlesbar, kann also automatisiert verarbeitet und analysiert werden.

Wo kommen Wissensgraphen zum Einsatz?
An sehr vielen unterschiedlichen Stellen: von Suchmaschinen – Google arbeitet zum Beispiel damit – über medizinische Diagnosen bis hin zu Finanzsystemen. Denn sie helfen dabei, komplexe Zusammenhänge zu verstehen und zu nutzen.
Knowledge Graphs spielen daher auch in der wissenschaftlichen Forschung eine immer wichtigere Rolle. Hier sind einige Anwendungsbereiche:
- Wissenschaftliche Literaturanalyse: Knowledge Graphs helfen dabei, wissenschaftliche Publikationen, Autor:innen, Institutionen und deren Beziehungen zu analysieren. Sie können Verbindungen zwischen Forschungsarbeiten aufzeigen und neue Forschungsrichtungen identifizieren.
- Interdisziplinäre Forschung: Knowledge Graphs können Verbindungen zwischen verschiedenen wissenschaftlichen Disziplinen aufzeigen und so interdisziplinäre Ansätze fördern.
- Wissensextraktion: Aus wissenschaftlichen Texten können automatisch Entitäten und Beziehungen extrahiert und in Knowledge Graphs integriert werden.
Knowledge Graphs in der Nationalen Forschungsdateninfrastruktur
Auch beim Management wissenschaftlicher Daten kommen Knowledge Graphs zum Einsatz. Sie helfen dabei, große Mengen wissenschaftlicher Daten zu organisieren und zugänglich zu machen, was besonders im Kontext von Open Science wichtig ist. Daher spielen sie auch in der NFDI eine Rolle.
Und hier kommt KGI4NFDI zum Einsatz! Obwohl bereits mehrere Konsortien eigene Lösungen mit Wissensgraphen entwickeln, fehlt es bislang an einer zentralen, wiederverwendbaren KG-Infrastruktur. Der geplante Basisdienst schließt diese Lücke. Das verbessert die Interoperabilität in der Forschung und zahlt damit auf die Ziele der NFDI ein.

Der Basisdienst KGI4NFDI
KGI4NFDI befindet sich derzeit in der Initialisierungsphase, der ersten von drei Phasen der Entwicklung. Der Antrag für die zweite Phase läuft bereits und soll eine erfolgreiche Integrationsphase gewährleisten. Der Basisdienst wird die Forschenden mit verschiedenen Funktionen und Tools unterstützen:
- Ein KG-Register, das Informationen über alle Wissensgraphen der NFDI-Konsortien und ihrer Forschungsgemeinschaften bündelt.
- Einen Zugangsservice, der den Austausch und die Nutzung von Wissensgraphen zwischen verschiedenen NFDI-Projekten erleichtert.
- Bereitstellung von standardisierten Ansätzen, Technologien und Fachwissen, um die einzelnen Forschungsgemeinschaften zu befähigen, dezentrale KG-Instanzen zu erstellen.
Durch Umfragen in den Fachcommunitys, eine umfassende Dokumentation, spezialisierte Beratungsangebote und die Harmonisierung von Ontologien wird KGI4NFDI zur Vision „One NFDI“ beitragen und die FAIR-Data-Prinzipien über verschiedene Disziplinen und internationale Rahmenwerke hinweg fördern. ZB MED übernimmt dabei die Koordination des Dienstes sowie – in enger Zusammenarbeit mit den anderen Kooperationspartnern – die Entwicklung des KG-Registers.
Datenkompetenzen für die Forschung
Datenmanagementplanung, Metadatenmanagement, Versionskontrolle, Datenorganisation, Datenbereinigung – all das und noch einiges mehr sind gefragte Skills beim Management von Forschungsdaten. Wissenschaftler:innen stellt das Forschungsdatenmanagement also vor vielfältige Aufgaben. Außerdem sorgt beispielsweise die technische Komplexität mit einer rasanten Entwicklung von Tools, Standards und Plattformen für einen kaum zu überblickenden Werkzeugkasten. Hinzu kommen rechtliche Unsicherheiten rund um Datenschutz, Urheberrecht und Nutzungslizenzen, die komplexe Fragen aufwerfen und spezifisches Wissen erfordern.
Klingt alles kompliziert? Das muss es nicht sein, denn es gibt zahlreiche Trainings, um Forschende und Data Stewards bestmöglich auf all diese Anforderungen vorzubereiten. Und solche Trainings sind natürlich auch Bestandteil der NFDI. Ein neuer Basisdienst soll dafür eine Infrastruktur zur Verfügung stellen.
Der Basisdienst RDMTraining4NFDI
Ziel des Dienstes ist der Aufbau einer nachhaltigen und qualitativ hochwertigen Trainingsinfrastruktur für das Forschungsdatenmanagement. Gemeinsam mit Partnern aus der NFDI entwickelt ZB MED ein vielfältiges Schulungsangebot, das praxisnah und flexibel gestaltet ist. Ob in Summer Schools, Online-Workshops oder mit Open Educational Resources (OER) – die Trainingsmodule vermitteln essentielle Kompetenzen für den professionellen Umgang mit Forschungsdaten.

Ein Schwerpunkt liegt auf der Förderung der FAIR-Prinzipien (Findable, Accessible, Interoperable, Reusable), um Forschungsdaten nachhaltig nutzbar zu machen. Die Schulungen richten sich an Wissenschaftler:innen, Informationsspezialist:innen und andere Akteur:innen, die mit Forschungsdaten arbeiten.

Bewährte Methoden und starke Partnerschaften
RDMTraining4NFDI baut auf bestehenden Trainingsinitiativen auf und integriert bewährte Lehrmethoden, darunter interaktive Lernformate und praxisorientierte Ansätze. ZB MED bringt seine langjährige Erfahrung im Bereich Data Science Trainings ein und nutzt didaktische Konzepte aus den Train-the-Trainer-Formaten wie The Carpentries, um die Vermittlung von Forschungsdatenmanagement-Methoden noch effektiver zu gestalten.
Die enge Zusammenarbeit mit Fachgesellschaften und anderen NFDI-Konsortien stellt sicher, dass die Schulungsinhalte an aktuelle Bedarfe angepasst werden. Erste Einblicke in das Projekt wurden auf der Base4NFDI-Roadshow vorgestellt, um wertvolle Rückmeldungen aus der Community zu erhalten. Ein weiteres Ziel ist die Etablierung einer starken RDM-Trainingsgemeinschaft, die Wissenstransfer und Vernetzung fördert. Mit RDMTraining4NFDI stärkt ZB MED die Datenkompetenzen in den Lebenswissenschaften und darüber hinaus.