Wissensmanagement

Gemeinsam forschen:
mit dem Health Study Hub zu effizienterer Gesundheitsforschung

Pinnwand mit Begriffen bezüglich Metadaten.
Bildrechte: ZB MED / Eric Lichtenscheidt

Daten aus der Studie XY liegen im Repository der Universität Z, die Studie A bearbeitet eine ähnliche Forschungsfrage am Klinikum B und die Daten werden im Repositorium C gespeichert. Für die Studie XY wurde ein Datenschema entwickelt, für die Studie A ein ganz anderes. Wäre doch sinnvoll, wenn die Forschenden ihre Daten miteinander teilen könnten. Das Problem: Wie finden sie die Daten? Und können sie sie dann überhaupt nachnutzen? Die Lösung liefert der German Central Health Study Hub – oder kurz Health Study Hub.

Der Health Study Hub ist eine Plattform zum Finden und Veröffentlichen von Daten aus der Gesundheitsforschung. Er hilft Forschenden aus diesem Bereich dabei, ihre Arbeit zu vernetzen. Auf der einen Seite können sie Dokumente und (Meta-)Daten zu ihren Forschungsprojekten nach den FAIR-Prinzipien veröffentlichen; sie machen sie also auffindbar (findable), verfügbar (acessible), interoperabel und wiederverwendbar (reusable). Auf der anderen Seite können Forschungsgruppen dann Informationen über vergangene und laufende Studien einfach finden und nachnutzen. Die Anzahl der registrierten Datensätze wächst kontinuierlich an, im Moment sind es fast 2.000 [1]. Der Health Study Hub ist einer der zentralen Dienste, die im Projekt NFDI4Health, der Nationalen Forschungsdateninfrastruktur für personenbezogene Gesundheitsdaten, entwickelt wurden.

Bildrechte: ZB MED / Eric Lichtenscheidt

Datenschutz für Gesundheitsdaten

Natürlich können die personenbezogenen Daten auf Patientenebene nicht öffentlich zugänglich gemacht werden. Aber die Metadaten! Diese Daten beschreiben die ursprünglichen geschützten Daten und helfen Forschenden in ihren Projekten oft schon einen Schritt weiter. Der Health Study Hub enthält solche Metadaten und auch Informationen über den Datenzugang, um gegebenenfalls mit den vorhandenen Daten weiterarbeiten zu können. Der Hub leitet Forschende direkt zu den entsprechenden Beantragungsstellen für den Datenzugang weiter. Dies ermöglicht die bessere Nachnutzbarkeit der Forschungsdaten. Dadurch dass Daten nicht mehrfach erhoben werden müssen, wird im besten Fall die Forschung beschleunigt und verbessert. Und das unter Wahrung des Datenschutzes.

Sharing is caring

Forschende möchten durch ihre Arbeit Lösungen für ihre Forschungsfragen finden. Das Teilen von Daten wird dabei oft als lästig oder beschwerlich empfunden. Also muss der Prozess so einfach und unkompliziert wie möglich sein. Folglich sollten die Informationen einmal und nicht mehrmals an unterschiedlichen Stellen erhoben werden. Für den Health Study Hub stehen daher APIs zur Verfügung, um Informationen aus bestehenden – auch internen – Systemen zu übertragen. Softwareberater:innen helfen bei der Entwicklung der erforderlichen Umwandlungsprozesse. Für die Fälle, in denen Informationen nicht wiederverwendet werden können, steht ein grafisches Datenerfassungsformular zur Verfügung. Dort können die Daten manuell eingegeben werden. Geschulte Data Stewards sind bei der Datenerfassung behilflich.

Mehr als ein Repository

Viele Studien sind bereits in verschiedene öffentlichen Repositorien wie DRKS, clinicaltrials.gov, WHO ICTRP und dem MDM-Portal eingegeben worden. Der Health Study Hub aggregiert und harmonisiert diese Informationen, um einen ganzheitlichen Blick auf die deutsche Gesundheitsforschung zu ermöglichen. Darüber hinaus sammeln die Data Stewards aktiv verfügbare Informationen aus öffentlichen Ressourcen wie Websites, die nicht automatisch integriert werden können.

Datenharmonie

Grundvoraussetzung, um (Meta-)Daten auch wirklich nachnutzen zu können, ist die einheitliche Erfassung. Im Health Study Hub werden die Daten daher harmonisiert. Basis dafür sind feste Leitlinien und ein einheitliches Metadatenschema. Die Leitlinien geben vor, wie die Daten veröffentlicht werden. Das maßgeschneiderte und interoperable Metadatenschema orientiert sich an etablierten Standards wie HL7 FHIR und bereichsspezifischen Ontologien wie SNOMED CT. Falls nötig wurden diese Standards angepasst an den speziellen Bedarf. Beide Tools sind ebenfalls ein Ergebnis aus NFDI4Health.

Eine Frau zeigt einem Mann auf einem großen Bildschirm etwas auf einer Grafik.
Bildrechte: ZB MED / Sima Deghani

Mit der Forschung – für die Forschung

Um den Anforderungen und Bedürfnissen der Forschungscommunity zu entsprechen, wählte das Entwicklungsteam einen agilen und iterativen Entwicklungsansatz. Er ermöglicht es, flexibel auf die Anforderungen der Nutzenden und die technischen Herausforderungen zu reagieren. Das kontinuierliche Feedback von Nutzenden des Portals hilft dabei, Probleme zu identifizieren und Lösungen zu finden.

Im Projekt NFDI4Health gibt es verschiedene Use Cases. In vier dieser Use Cases ist die Zielgruppe der Forschenden direkt eingebunden. Die enge Zusammenarbeit innerhalb der NFDI4Health über alle Use Cases hinweg ermöglicht es, den Health Study Hub bedarfsgerecht zu entwickeln und auf die jeweiligen Nutzungsbedürfnisse abzustimmen.

Open & FAIR

Der Health Study Hub orientiert sich an den FAIR-Prinzipien. Über einen Webbrowser ist er frei zugänglich. Ein umfangreiches Glossar liefert Erklärungen zu den gesammelten Informationen. Das macht es auch Forschenden anderer Disziplinen möglich, ihn zu nutzen.

Der Health Study Hub basiert auf der Open Source Software Dataverse, die speziell auf das Forschungsdatenmanagement ausgerichtet ist. Das Entwicklungsteam im NFDI4Health-Konsortium arbeitete eng mit der Community der Dataverse-Entwickler:innen und -Nutzer:innen zusammen. Vernetzung und Erfahrungsaustausch findet etwa im Rahmen der Interessensgruppe Dataverse der Landesinitiative für Forschungsdatenmanagement in NRW (fdm.nrw) sowie innerhalb der Dataverse Community Meetings statt. Einige der Weiterentwicklungen der Dataverse-Software, die aus der Entwicklung des Study Hubs hervorgingen, wurden während des Dataverse Community Meetings im Juni 2023 in Braga, Portugal vorgestellt. Die Vernetzung treibt die Softwareentwicklung voran und kommt so der gesamten Forschung zugute.

Weiterführende Links

[1] Stand März 2024

Der Programmbereich
Wissensmanagement

Der Programmbereich Wissensmanagement arbeitet an der Schnittstelle zwischen Forschung und Forschungsdatenmanagement. Eine zentrale Aufgabe sind die zahlreichen Aktivitäten rund um die NFDI: die Leitung des Konsortiums NFDI4Health und die Beteiligung an NFDI4DataScience sowie den beiden Vorhaben Base4NFDI und FAIRagro, die 2023 angelaufen sind. Die Forscher:innen des Programmbereichs bauen neue Datenportale auf und erweitern das Methodenspektrum für FAIRes Datemanagement. Zudem entwickeln sie Text- und Datamining-Methoden weiter.

Projekte

01.03.2023 – 28.02.2028

Base4NFDI

Basic Services for NFDI

01.10.2022 – 31.12.2023

BfR-Ontologie

Ontologieentwicklung Food & Feed – Nahrungs- und Futtermittel-Ontologie

01.04.2023 – 31.03.2028

FAIRagro

Nationale Forschungsdateninfrastruktur für die Agrosystemforschung

01.09.2023 – 30.09.2023

FAIRImpact

Workshop fair-impact.eu

01.12.2022 – 31.05.2023

MaSMP

Machine-actionable Software Management Plans

01.10.2021 – 30.09.2026

NFDI4DataScience

Nationale Forschungsdateninfrastruktur für Datenwissenschaften und Künstliche Intelligenz

01.10.2020 – 30.09.2025

NFDI4Health

Nationale Forschungsdateninfrastruktur für personenbezogene Gesundheitsdaten

01.08.2023 – 31.07.2026

STELLA II

InfraSTructurEs for Living LAbs II

01.07.2020 – 30.06.2023

Task Force COVID-19

NFDI4Health – Task Force COVID-19: Integration und Harmonisierung von Forschungsanstrengungen zum besseren Verständnis von COVID-19 und seinen Folgen

01.11.2023 – 31.01.2027

TS4NFDI

Terminologie-Dienste für die Nationale Forschungsdateninfrastruktur in Deutschland
Nach oben scrollen