Gemeinsam forschen:
mit dem Health Study Hub zu effizienterer Gesundheitsforschung
Daten aus der Studie XY liegen im Repository der Universität Z, die Studie A bearbeitet eine ähnliche Forschungsfrage am Klinikum B und die Daten werden im Repositorium C gespeichert. Für die Studie XY wurde ein Datenschema entwickelt, für die Studie A ein ganz anderes. Wäre doch sinnvoll, wenn die Forschenden ihre Daten miteinander teilen könnten. Das Problem: Wie finden sie die Daten? Und können sie sie dann überhaupt nachnutzen? Die Lösung liefert der German Central Health Study Hub – oder kurz Health Study Hub.
Der Health Study Hub ist eine Plattform zum Finden und Veröffentlichen von Daten aus der Gesundheitsforschung. Er hilft Forschenden aus diesem Bereich dabei, ihre Arbeit zu vernetzen. Auf der einen Seite können sie Dokumente und (Meta-)Daten zu ihren Forschungsprojekten nach den FAIR-Prinzipien veröffentlichen; sie machen sie also auffindbar (findable), verfügbar (acessible), interoperabel und wiederverwendbar (reusable). Auf der anderen Seite können Forschungsgruppen dann Informationen über vergangene und laufende Studien einfach finden und nachnutzen. Die Anzahl der registrierten Datensätze wächst kontinuierlich an, im Moment sind es fast 2.000 [1]. Der Health Study Hub ist einer der zentralen Dienste, die im Projekt NFDI4Health, der Nationalen Forschungsdateninfrastruktur für personenbezogene Gesundheitsdaten, entwickelt wurden.
Datenschutz für Gesundheitsdaten
Natürlich können die personenbezogenen Daten auf Patientenebene nicht öffentlich zugänglich gemacht werden. Aber die Metadaten! Diese Daten beschreiben die ursprünglichen geschützten Daten und helfen Forschenden in ihren Projekten oft schon einen Schritt weiter. Der Health Study Hub enthält solche Metadaten und auch Informationen über den Datenzugang, um gegebenenfalls mit den vorhandenen Daten weiterarbeiten zu können. Der Hub leitet Forschende direkt zu den entsprechenden Beantragungsstellen für den Datenzugang weiter. Dies ermöglicht die bessere Nachnutzbarkeit der Forschungsdaten. Dadurch dass Daten nicht mehrfach erhoben werden müssen, wird im besten Fall die Forschung beschleunigt und verbessert. Und das unter Wahrung des Datenschutzes.
Sharing is caring
Forschende möchten durch ihre Arbeit Lösungen für ihre Forschungsfragen finden. Das Teilen von Daten wird dabei oft als lästig oder beschwerlich empfunden. Also muss der Prozess so einfach und unkompliziert wie möglich sein. Folglich sollten die Informationen einmal und nicht mehrmals an unterschiedlichen Stellen erhoben werden. Für den Health Study Hub stehen daher APIs zur Verfügung, um Informationen aus bestehenden – auch internen – Systemen zu übertragen. Softwareberater:innen helfen bei der Entwicklung der erforderlichen Umwandlungsprozesse. Für die Fälle, in denen Informationen nicht wiederverwendet werden können, steht ein grafisches Datenerfassungsformular zur Verfügung. Dort können die Daten manuell eingegeben werden. Geschulte Data Stewards sind bei der Datenerfassung behilflich.
Mehr als ein Repository
Viele Studien sind bereits in verschiedene öffentlichen Repositorien wie DRKS, clinicaltrials.gov, WHO ICTRP und dem MDM-Portal eingegeben worden. Der Health Study Hub aggregiert und harmonisiert diese Informationen, um einen ganzheitlichen Blick auf die deutsche Gesundheitsforschung zu ermöglichen. Darüber hinaus sammeln die Data Stewards aktiv verfügbare Informationen aus öffentlichen Ressourcen wie Websites, die nicht automatisch integriert werden können.
Datenharmonie
Grundvoraussetzung, um (Meta-)Daten auch wirklich nachnutzen zu können, ist die einheitliche Erfassung. Im Health Study Hub werden die Daten daher harmonisiert. Basis dafür sind feste Leitlinien und ein einheitliches Metadatenschema. Die Leitlinien geben vor, wie die Daten veröffentlicht werden. Das maßgeschneiderte und interoperable Metadatenschema orientiert sich an etablierten Standards wie HL7 FHIR und bereichsspezifischen Ontologien wie SNOMED CT. Falls nötig wurden diese Standards angepasst an den speziellen Bedarf. Beide Tools sind ebenfalls ein Ergebnis aus NFDI4Health.
Mit der Forschung – für die Forschung
Um den Anforderungen und Bedürfnissen der Forschungscommunity zu entsprechen, wählte das Entwicklungsteam einen agilen und iterativen Entwicklungsansatz. Er ermöglicht es, flexibel auf die Anforderungen der Nutzenden und die technischen Herausforderungen zu reagieren. Das kontinuierliche Feedback von Nutzenden des Portals hilft dabei, Probleme zu identifizieren und Lösungen zu finden.
Im Projekt NFDI4Health gibt es verschiedene Use Cases. In vier dieser Use Cases ist die Zielgruppe der Forschenden direkt eingebunden. Die enge Zusammenarbeit innerhalb der NFDI4Health über alle Use Cases hinweg ermöglicht es, den Health Study Hub bedarfsgerecht zu entwickeln und auf die jeweiligen Nutzungsbedürfnisse abzustimmen.
Open & FAIR
Der Health Study Hub orientiert sich an den FAIR-Prinzipien. Über einen Webbrowser ist er frei zugänglich. Ein umfangreiches Glossar liefert Erklärungen zu den gesammelten Informationen. Das macht es auch Forschenden anderer Disziplinen möglich, ihn zu nutzen.
Der Health Study Hub basiert auf der Open Source Software Dataverse, die speziell auf das Forschungsdatenmanagement ausgerichtet ist. Das Entwicklungsteam im NFDI4Health-Konsortium arbeitete eng mit der Community der Dataverse-Entwickler:innen und -Nutzer:innen zusammen. Vernetzung und Erfahrungsaustausch findet etwa im Rahmen der Interessensgruppe Dataverse der Landesinitiative für Forschungsdatenmanagement in NRW (fdm.nrw) sowie innerhalb der Dataverse Community Meetings statt. Einige der Weiterentwicklungen der Dataverse-Software, die aus der Entwicklung des Study Hubs hervorgingen, wurden während des Dataverse Community Meetings im Juni 2023 in Braga, Portugal vorgestellt. Die Vernetzung treibt die Softwareentwicklung voran und kommt so der gesamten Forschung zugute.
Weiterführende Links
- Leitlinien für die Datenveröffentlichung in NFDI4Health: Publication Policy of the National Research Data Infrastructure for Personal Health Data (NFDI4Health) and the NFDI4Health Task Force COVID-19
- Metadatenschema: The NFDI4Health Metadata Schema
- zu NFDI4Health
- zu Dataverse
- zu fdm.nrw
—
[1] Stand März 2024