DATA SCIENCE AND SERVICES

Wissen vernetzen, Datenkompetenz stärken

Base4NFDI im Bereich Data Science and Services

Die Basisdienste für die Nationale Forschungsdateninfrastruktur (NFDI) entstehen bei ZB MED in verschiedenen Teams. Der Bereich Data Science and Services ist an zwei Diensten beteiligt: KGI4NFDI läuft seit dem 1. Juni 2024, RDMTraining4NFDI, startet im Jahr 2025. Bei beiden Diensten hat Prof. Dr. Konrad Förstner die Rolle als Sprecher übernommen.  

Knowledge-Graph-Infrastruktur für die Nationale Forschungsdateninfrastruktur

Was ist ein Knowledge Graph?

Kurz gesagt: eine strukturierte Wissensrepräsentation, die Informationen in Form von sogenannten Entitäten – also Dingen, Personen oder Konzepten – und deren Beziehungen zueinander darstellt. Der Graph lässt sich als Netzwerk darstellen, in dem Knoten die Entitäten sind und die Verbindungen zwischen diesen die Beziehungen darstellen.

Die Informationen im Knowledge Graph werden in semantischen Beziehungen gespeichert als Subjekt, Prädikat und Objekt, zum Beispiel „Berlin – ist Hauptstadt von – Deutschland“. Das  Wissen wird also vernetzt und in einen Kontext gestellt. Und was den Graph besonders macht: Er ist maschinenlesbar, kann also automatisiert  verarbeitet und analysiert werden.

Logo des Basisdienstes KGI4nfdi Text: Knowledge Graph Infrastructure for the German National Research Data Infrastructure

Wo kommen Wissensgraphen zum Einsatz?

An sehr vielen unterschiedlichen Stellen: von Suchmaschinen – Google arbeitet zum Beispiel damit – über medizinische Diagnosen bis hin zu Finanzsystemen. Denn sie helfen dabei, komplexe Zusammenhänge zu verstehen und zu nutzen. 

Knowledge Graphs spielen daher auch in der wissenschaftlichen Forschung eine immer wichtigere Rolle. Hier sind einige Anwendungsbereiche:

  • Wissenschaftliche Literaturanalyse: Knowledge Graphs helfen dabei, wissenschaftliche Publikationen, Autor:innen, Institutionen und deren Beziehungen zu analysieren. Sie können Verbindungen zwischen Forschungsarbeiten aufzeigen und neue Forschungsrichtungen identifizieren.
  • Interdisziplinäre Forschung: Knowledge Graphs können Verbindungen zwischen verschiedenen wissenschaftlichen Disziplinen aufzeigen und so interdisziplinäre Ansätze fördern.
  • Wissensextraktion: Aus wissenschaftlichen Texten können automatisch Entitäten und Beziehungen extrahiert und in Knowledge Graphs integriert werden.

Knowledge Graphs in der Nationalen Forschungsdateninfrastruktur

Auch beim Management wissenschaftlicher Daten kommen Knowledge Graphs zum Einsatz. Sie helfen dabei, große Mengen wissenschaftlicher Daten zu organisieren und zugänglich zu machen, was besonders im Kontext von Open Science wichtig ist. Daher spielen sie auch in der NFDI eine Rolle. 

Und hier kommt KGI4NFDI zum Einsatz! Obwohl bereits mehrere Konsortien eigene Lösungen mit Wissensgraphen entwickeln, fehlt es bislang an einer zentralen, wiederverwendbaren KG-Infrastruktur. Der geplante Basisdienst schließt diese Lücke. Das verbessert die Interoperabilität in der Forschung und zahlt damit auf die Ziele der NFDI ein. 

Der Basisdienst KGI4NFDI

KGI4NFDI befindet sich derzeit in der Initialisierungsphase, der ersten von drei Phasen der Entwicklung. Der Antrag für die zweite Phase läuft bereits und soll eine erfolgreiche Integrationsphase gewährleisten. Der Basisdienst wird die Forschenden mit verschiedenen Funktionen und Tools unterstützen:

  • Ein KG-Register, das Informationen über alle Wissensgraphen der NFDI-Konsortien und ihrer Forschungsgemeinschaften bündelt.
  • Einen Zugangsservice, der den Austausch und die Nutzung von Wissensgraphen zwischen verschiedenen NFDI-Projekten erleichtert.
  • Bereitstellung von standardisierten Ansätzen, Technologien und Fachwissen, um die einzelnen Forschungsgemeinschaften zu befähigen, dezentrale KG-Instanzen zu erstellen. 

Durch Umfragen in den Fachcommunitys, eine umfassende Dokumentation, spezialisierte Beratungsangebote und die Harmonisierung von Ontologien wird KGI4NFDI zur Vision „One NFDI“ beitragen und die FAIR-Data-Prinzipien über verschiedene Disziplinen und internationale Rahmenwerke hinweg fördern. ZB MED übernimmt dabei die Koordination des Dienstes sowie – in enger Zusammenarbeit mit den anderen Kooperationspartnern – die Entwicklung des KG-Registers. 

Datenkompetenzen für die Forschung

Datenmanagementplanung, Metadatenmanagement, Versionskontrolle, Datenorganisation, Datenbereinigung – all das und noch einiges mehr sind gefragte Skills beim Management von Forschungsdaten. Wissenschaftler:innen stellt das Forschungsdatenmanagement also vor vielfältige Aufgaben. Außerdem sorgt beispielsweise die technische Komplexität mit einer rasanten Entwicklung von Tools, Standards und Plattformen für einen kaum zu überblickenden Werkzeugkasten. Hinzu kommen rechtliche Unsicherheiten rund um Datenschutz, Urheberrecht und Nutzungslizenzen, die komplexe Fragen aufwerfen und spezifisches Wissen erfordern. 

Klingt alles kompliziert? Das muss es nicht sein, denn es gibt zahlreiche Trainings, um Forschende und Data Stewards bestmöglich auf all diese Anforderungen vorzubereiten. Und solche Trainings sind natürlich auch Bestandteil der NFDI. Ein neuer Basisdienst soll dafür eine Infrastruktur zur Verfügung stellen.

Der Basisdienst RDMTraining4NFDI

Ziel des Dienstes ist der Aufbau einer nachhaltigen und qualitativ hochwertigen Trainingsinfrastruktur für das Forschungsdatenmanagement. Gemeinsam mit Partnern aus der NFDI entwickelt ZB MED ein vielfältiges Schulungsangebot, das praxisnah und flexibel gestaltet ist. Ob in Summer Schools, Online-Workshops oder mit Open Educational Resources (OER) – die Trainingsmodule vermitteln essentielle Kompetenzen für den professionellen Umgang mit Forschungsdaten.

Logo des Basisdienstes RDMT4nfdi Text: Research Data Management Training for the German National Research Data Infrastructure

Ein Schwerpunkt liegt auf der Förderung der FAIR-Prinzipien (Findable, Accessible, Interoperable, Reusable), um Forschungsdaten nachhaltig nutzbar zu machen. Die Schulungen richten sich an Wissenschaftler:innen, Informationsspezialist:innen und andere Akteur:innen, die mit Forschungsdaten arbeiten.

Auf dem Foto schauen Drei Koleg:innen nachdenklich auf den Bildschirm eines Laptops.

Bewährte Methoden und starke Partnerschaften

RDMTraining4NFDI baut auf bestehenden Trainingsinitiativen auf und integriert bewährte Lehrmethoden, darunter interaktive Lernformate und praxisorientierte Ansätze. ZB MED bringt seine langjährige Erfahrung im Bereich Data Science Trainings ein und nutzt didaktische Konzepte aus den Train-the-Trainer-Formaten wie The Carpentries, um die Vermittlung von Forschungsdatenmanagement-Methoden noch effektiver zu gestalten.

Die enge Zusammenarbeit mit Fachgesellschaften und anderen NFDI-Konsortien stellt sicher, dass die Schulungsinhalte an aktuelle Bedarfe angepasst werden. Erste Einblicke in das Projekt wurden auf der Base4NFDI-Roadshow vorgestellt, um wertvolle Rückmeldungen aus der Community zu erhalten. Ein weiteres Ziel ist die Etablierung einer starken RDM-Trainingsgemeinschaft, die Wissenstransfer und Vernetzung fördert. Mit RDMTraining4NFDI stärkt ZB MED die Datenkompetenzen in den Lebenswissenschaften und darüber hinaus. 

Der Programmbereich
Data Science & Services

Der Programmbereich Data Science and Services hat drei eng verzahnte Aufgabenfelder:

  • Entwicklung innovativer Werkzeuge und Dienste zum Auffinden und Verarbeiten von Literatur und Daten – dazu zählt LIVIVO und die NFDI-Aktivitäten, unter anderem die Sprecherrolle im Konsortium NFDI4Microbiota.
  • Forschung, die unter anderem die Anwendung maschineller Lernverfahren zur Extraktion von Informationen aus wissenschaftlicher Literatur, Erstellung und Erweiterung von Wissensgraphen und die bioinformatischen Analysen von Hoch- durchsatzdaten umfasst.
  • Vermittlung von Daten- und Informationskompetenz sowie Data-Science-Fähigkeiten.

Projekte

Drittelmittelprojekte und Dienstleistung MAK Collection

01.12.2022 – 30.11.2025

AQUAS

Automatic Quality Assessment: NLP-Verfahren zur semantischen Kartierung von lebenswissenschaftlichen Texten

01.01.2023 – 30.06.2026

BioNT

BIO Network for Training

01.10.2023 – 30.09.2026

Digital Bioethics

01.07.2019 – 30.06.2025

MAK Collection

The MAK Collection for Occupational Health and Safety

01.06.2024 – 31.05.2025

Neues Projekt: KGI4NFDI

Knowledge-Graph-Infrastruktur für die Nationale Forschungsdateninfrastruktur in Deutschland

01.10.2021 – 30.09.2026

NFDI4Microbiota

Nationale Forschungsdateninfrastruktur für Mikrobiota-Forschung

01.01.2023 – 31.12.2025

PIXLS

Preprint Information eXtraction for Life Sciences

01.09.2020 – 28.02.2025

sRNARegNet

Vergleichende Analyse der regulatorischen Netzwerke kleiner RNA in Gammaproteobacteria
Nach oben scrollen