IT-Infrastruktur des BioDataHub

Vernetzte Systeme für eine datenschutzkonforme Forschung

Die IT-Infrastruktur des DKTK BioDataHub bildet das technische Rückgrat für den sicheren, standardisierten und effizienten Zugang zu Bioprobeninformationen und zugehörigen klinischen Daten aus der Onkologie.

Ziel ist es, Forschenden eine einheitliche und effiziente Nutzung von Daten aus Klinik und Forschung zu ermöglichen – stets unter Wahrung höchster Datenschutzstandards.

Föderierte Datenhaltung

Jeder Standort betreibt einen sogenannten Brückenkopf, der als lokale Datendrehscheibe dient.

Dieses föderierte Konzept erlaubt es, dezentral gespeicherte Informationen (z. B. aus Tumordokumentation, Biobanken oder Forschungsprojekten) für das Konsortium nutzbar zu machen, ohne dass Daten physisch übertragen werden müssen.

Technologien und Tools für die Forschung

Zur Unterstützung der Forschung entwickelt der BioDataHub praxisnahe Softwarelösungen:

Tools für Forschende

  • Föderierte Suche: Webanwendung zur explorativen, standortübergreifenden Abfrage von Patientendaten und Bioproben – ideal für Machbarkeitsanalysen BioDataHub Explorer
  • Kohorten-Dashboards: Übersicht und Monitoring laufender Bioprobensammlungen, z. B. in Projekten wie EXLIQUID und DKTK Organoid-Plattform
  • Föderierte Analyse: Sichere, datenschutzkonforme Auswertungen mit DataSHIELD, bei denen die Analysealgorithmen zu den Daten gebracht werden – nicht umgekehrt.

Datenschutz und Sicherheit

  • Mainzelliste: Pseudonymisierung und Record-Linkage für den sicheren Umgang mit personenbezogenen Daten.
  • Authentifizierungsdienst: Einheitlicher, sicherer Zugang (Single Sign-On) zu allen Anwendungen.

Datenintegration und Interoperabilität 

  • Samply.Bridgehead: lokale Datendrehscheibe an den Standorten.
  • Samply.Blaze: FHIR-basierter Datenspeicher zur strukturierten und interoperablen Datenhaltung.
  • Samply.Beam: Sichere Datenkommunikation zwischen Standorten.
  • Samply.TransFair und oBDS2FHIR-Pipeline: Werkzeuge für Datenintegration und Qualitätssicherung durch zentrale, standardisierte Mappings.

Alle Softwarekomponenten sind unter Open-Source-Lizenzen veröffentlicht, um Transparenz, Nachnutzbarkeit und Nachhaltigkeit zu gewährleisten (https://github.com/samply/). 


Kontakt: Bei Fragen zu den IT-Aktivitäten des BioDataHub wenden Sie sich bitte an Prof. Dr. Martin Lablans (Heidelberg).


Dokumente & Datenschutzkonzepte: