Data Science

Die Welt der Daten entdecken:
Trainieren für mehr Datenkompetenzen

Foto von Gästen während eines Workshops
Bildrechte: ZB MED / Gaetan Bally

Die Arbeit von ZB MED orientiert sich an fünf strategischen Leitlinien. Eine davon lautet: Wir vermitteln aktiv Wissen, Kompetenzen und Fähigkeiten. Der Bereich Data Science and Services engagiert sich im Sinne dieser Leitlinie, seitdem er 2018 installiert wurde. Das Team bietet ein breites Spektrum an Trainings an, die Forschenden und Personen, die in informationsbezogenen Einrichtungen arbeiten, Werkzeuge zeigen und Kenntnisse vermitteln, um Daten effektiv zu nutzen: von Python, Git und Unix Shell über Wikidata und SQL bis zum Forschungskreislauf oder Machine Learning.

Bis heute hat das Team in über 100 Workshops circa 1.600 Menschen geschult. Besonders hervorzuheben sind die Zertifikatskurse für Data Librarians und Forschungsdatenmanagement. Die Module des Data-Librarian-Kurses decken verschiedene Aspekte des Datenmanagements ab, beginnend mit der Einführung in die Datenaufbereitung und -analyse, gefolgt von der Strukturierung und Beschreibung von Daten sowie deren Analyse und Visualisierung. Module für Fortgeschrittene befassen sich mit der Automatisierung datenintensiver Prozesse in der Bibliothek, nachhaltigem Datenmanagement und rechtlichen Aspekten. Abschließend wenden die Teilnehmer:innen ihr Wissen in einem praktischen Projekt an.

Beim Forschungsdatenmanagement (FDM) beginnen die Module mit den Grundlagen des FDM und gehen dann weiter mit Themen wie Open Science oder FDM in verschiedenen Fachgebieten. Schließlich greift der Kurs spezifische Aspekte wie Datenkuratierung und -management sowie Beratung und Schulung auf. Wie bei dem Data-Librarian-Kurs ermöglicht ein Abschlussprojekt die praktische Anwendung des Gelernten.

Im Jahr 2023 arbeitete das Team mit verschiedenen Kooperationspartnern zusammen, darunter Bibliosuisse, die Freie Universität Berlin, die Hochschule Anhalt oder die Max-Planck-Gesellschaft. Insbesondere im Bereich der Zertifikatskurse kooperiert ZB MED mit dem Zentrum für Bibliotheks- und Informationswissenschaftliche Weiterbildung an der TH Köln (ZBIW) und fdm.nrw, der Landesinitiative Forschungsdatenmanagement. Auch in der Nationalen Forschungsdateninfrastruktur spielt das Training eine zentrale Rolle. Das Konsortium NFDI4Microbiota, von ZB MED geleitet, bietet ein reichhaltiges Spektrum an Fortbildungen an. Diese Kooperationen sind wertvoll und fruchtbar. Wir werden auch in Zukunft eng mit unseren Partner:innen zusammenarbeiten, um innovative Schulungsprogramme anzubieten. Gemeinsam bauen wir unsere Angebote weiter aus und verbessern sie, um die Teilnehmenden dabei zu unterstützen, ihre Fähigkeiten im Umgang mit Daten zu verbessern.

Foto von Rabea Müller
Bildrechte: ZB MED / Eric Lichtenscheidt

The Carpentries mit Rabea Müller

Seit 2018 sind die Workshops im Carpentry Style ein fester Bestandteil in unserem Schulungsangebot. Wir bieten ein breites Spektrum von Kursen an, darunter Inhalte aus dem Programm von Library Carpentry und Software Carpentry: Python, Git, Unix Shell, Wikidata, SQL etc. Ein besonderer Fokus liegt auf der Vermittlung von grundlegenden Fähigkeiten für das Datenmanagement und die Datenanalyse.

Derzeit haben wir bei ZB MED zehn zertifizierte Carpentries-Instruktor:innen, die die Workshop-Inhalte vermitteln, sowie zwei Carpentries-Trainer:innen, die die Instruktor:innen ausbilden. Außerdem sind wir an der Weiterentwicklung der Lehrmaterialien beteiligt, die international in der gesamten Community eingesetzt werden. Als Maintainer haben wir beispielsweise unsere eigene Lesson zu der Plattform Wikidata entwickelt:

Lehrmethodik und Themen

Die Lehrmethoden in Carpentries-Kursen sind vielfältig und immer interaktiv gestaltet, um effektives Lernen zu ermöglichen. Die Teilnehmenden bearbeiten Praxisbeispiele, diskutieren über relevante Themen, arbeiten sowohl individuell als auch in Gruppen, tauschen ihre Erfahrungen aus und geben sich gegenseitig Feedback. Wir wenden in den Workshops die Live-Coding-Lehrmethode an, bei der die Dozent:innen in Echtzeit programmieren und dabei den Prozess Schritt für Schritt erklären. Das bietet den Teilnehmenden die Möglichkeit, den Code direkt zu verfolgen und zu verstehen, wie bestimmte Programmierkonzepte angewendet werden.

Community Coordinator für The Carpentries

Ich selbst fungiere als Community Coordinator für die DACH-Region bei The Carpentries. In dieser Rolle unterstütze ich die Carpentries-Community in Deutschland, Österreich und der Schweiz, indem ich Fragen beantworte, Ressourcen bereitstelle und Veranstaltungen organisiere. Im Jahr 2023 führten wir mehrere Online-Community-Diskussionen durch, die es den Mitgliedern ermöglichten, sich auszutauschen und voneinander zu lernen. Ein Highlight: ein Event in Paderborn im Februar 2023, das ich gemeinsam mit Toby Hodges moderiert habe. Die Veranstaltung bot Gelegenheit für persönliche Interaktionen und den Austausch bewährter Praktiken innerhalb der Community.

Logo von The Carpenters
Dr. Till Sauerwein beim Vortrag
Bildrechte: ZB MED / Michael Wodak

Schulungen für die mikrobiologische Forschungsgemeinschaft mit Dr. Till Sauerwein

Das NFDI-Konsortium verfolgt das Ziel, die Forschungsdaten aus der Mikrobiologie FAIR und Open zu gestalten. Ein wichtiger Teil davon: Bewusstseinsschaffung und Vermittlung von nötigen Kompetenzen. Hierzu bieten wir zusammen mit den insgesamt zehn beteiligten Partnerorganisationen verschiedene Trainings an. Sie beinhalten spezifische Themen für das Forschungsdatenmanagement, wie Elektronic Lab Notebooks, biologische Metadaten oder Grundlagen des FDM.

NFDI4Microbiota

Das NFDI-Konsortium verfolgt das Ziel, die Forschungsdaten aus der Mikrobiologie FAIR und Open zu gestalten. Ein wichtiger Teil davon: Bewusstseinsschaffung und Vermittlung von nötigen Kompetenzen. Hierzu bieten wir zusammen mit den insgesamt zehn beteiligten Partnerorganisationen verschiedene Trainings an. Sie beinhalten spezifische Themen für das Forschungsdatenmanagement, wie Elektronic Lab Notebooks, biologische Metadaten oder Grundlagen des FDM.

Logo NFDI Four Microbiota

EBI Systems Biology workshop

Seit 2019 organisieren wir den Kurs “Systems Biology: From Large Datasets to Biological Insight”. Der Workshop, bei dem wir auch als Trainer:innen mitarbeiten, findet am EMBL-EBI – dem European Bioinformatics Institute, Teil des European Molecular Biology Laboratory – in Hinxton, UK statt. Wir behandeln im Kurs den Einsatz von Software-Werkzeugen und selbstgeschriebenen Python-Scripten zur Extraktion biologischer Erkenntnisse aus Omics-Datensätzen.

Der Kurs richtet sich zum einen an Promovierende und Postdocs, zum anderen an nicht-akademische Wissenschaftler:innen, die mit groß angelegten Omics-Datensätzen arbeiten und daraus biologische Funktionen und Prozesse ableiten möchten.

Vortrag während eines Workshops, links: Vortragender, rechts: Bildschirmpräsentation
Bildrechte: privat
Foto von Silvia Di Giorgio
Bildrechte: ZB MED / Gaetan Bally

Bio Network for Training mit Silvia Di Giorgio

Wir sind Teil des 2023 gestarteten EU-Projektes BioNT. Das internationale Konsortium setzt sich zusammen aus akademischen Einrichtungen sowie kleinen und mittelständischen Unternehmen. Unser Ziel ist es, ein qualitativ hochwertiges Schulungsprogramm und eine Community für digitale Kompetenzen aufzubauen, die sowohl für die Biotechnologieindustrie als auch für den biomedizinischen Sektor relevant sind.

Logo BioNT

BioNT hat bereits vier Online-Workshops ausgerichtet, die unser Team mitorganisiert hat und bei denen wir als Trainer:innen mitgearbeitet haben:

  • A practical introduction to bioinformatics and RNA-seq using Galaxy
  • From Hero to Zero with Python
  • An introduction to High Performance Computing
  • Awareness in Data Management and Analysis for Industry and Research

Unser Highlight fürs kommende Jahr: Die CarpentryConnect 2024 – CCHD2024. Die Community-Veranstaltung findet vom 12. bis 14. November 2024 in Heidelberg statt. Wir von BioNT hosten die CCHD2024 gemeinsam mit The Carpentries. Mit diesem Event wollen wir eine Plattform schaffen, auf der Mitglieder der Communitys aus Deutschland und darüber hinaus zusammenkommen, um gemeinschaftsbasiert Software- und Datenschulungen zu entwickeln, zu erkunden und zu diskutieren.

Für die CCHD2024 planen wir ein breites Spektrum an Formaten: Breakouts, Poster, Lightning Talks, Workshops und Curriculum Co-Working Sessions, die sich alle um das Thema “Community-led training beyond academia” drehen.

Wer Lust hat, dabei zu sein, findet alle Infos im Blog.

Immer up to date bleiben über unsere Trainingsanagebote? Melden Sie sich an für unseren Newsletter Trainings!

Der Programmbereich
Data Science & Services

Der Programmbereich Data Science and Services hat drei eng verzahnte Aufgabenfelder:

  • Entwicklung innovativer Werkzeuge und Dienste zum Auffinden und Verarbeiten von Literatur und Daten – dazu zählt LIVIVO und die NFDI-Aktivitäten, unter anderem die Sprecherrolle im Konsortium NFDI4Microbiota.
  • Forschung, die unter anderem die Anwendung maschineller Lernverfahren zur Extraktion von Informationen aus wissenschaftlicher Literatur, Erstellung und Erweiterung von Wissensgraphen und die bioinformatischen Analysen von Hoch- durchsatzdaten umfasst.
  • Vermittlung von Daten- und Informationskompetenz sowie Data-Science-Fähigkeiten.

Projekte

Drittelmittelprojekte und Dienstleistung MAK Collection

01.12.2022 – 30.11.2025

AQUAS

Automatic Quality Assessment: NLP-Verfahren zur semantischen Kartierung von lebenswissenschaftlichen Texten

01.03.2023 – 30.06.2026

BioNT

BIO Network for Training

01.05.2020 – 31.08.2023

DiASPora

Digital Approaches for the Synthesis of Poorly Accessible Biodiversity Information

01.10.2023 – 30.09.2026

Digital Bioethics

01.12.2022 – 30.04.2023

LSData.NET

Datenkompetenzzentrum für Lebenswissenschaften

01.07.2019 – 30.06.2025

MAK Collection

The MAK Collection for Occupational Health and Safety

01.10.2021 – 30.09.2026

NFDI4Microbiota

Nationale Forschungsdateninfrastruktur für Mikrobiota-Forschung

01.01.2023 – 31.12.2025

PIXLS

Preprint Information eXtraction for Life Sciences

01.09.2020 – 28.02.2025

sRNARegNet

Vergleichende Analyse der regulatorischen Netzwerke kleiner RNA in Gammaproteobacteria
Nach oben scrollen