Datenmanagement im Datenkreis "Interdisziplinäres Forschungsprojekt"

Lösung zur Challenge: Softwarelösung für Datenkreise
Aktuelle Phase:
Bekanntgabe der Gewinner
  1. Aufruf und Einreichungen abgeschlossen am 26.04.2021
  2. Rückfragen abgeschlossen am 05.05.2021
  3. Jury-Bewertung abgeschlossen am 01.06.2021
  4. Gewinner bekannt gegeben ab 02.06.2021
Challenge beendet

Datenmanagement im Datenkreis "Interdisziplinäres Forschungsprojekt"

Mit der gesteigerten Bedeutung von digitalen Daten in der Wissenschaft bilden sich auch neue Formen der wissenschaftlichen Zusammenarbeit. Software-, Hardware-, und Cloudengineers arbeiten eng mit Data Scientists, Statistikern und Domänenexperten zusammen um neuartige, datenintensive Forschung zu betreiben. Der Datenkreis „Interdisziplinäres Forschungsprojekt“ kennzeichnet sich vor allem durch seine Schnelllebigkeit. Neue Erkenntnisse aus der Datenanalyse fließen laufend in den Datengewinnungsprozess zurück und passen ihn an. Vor allem in der frühen Projektphase führt dies dazu, dass sich Datenmodelle, Verarbeitungsprozesse und Schnittstellen laufend ändern. Bestehende Datenmanagementplattformen können diese Schnelllebigkeit kaum abbilden. Entweder sind sie zu domänenspezifisch – es werden bekannte Datenmodelle vorausgesetzt und diese sind schwer anpassbar – oder zu generell und dienen primär als Ablageort für Dateien, ohne dabei den Kontext (= Metadaten) zu erhalten.

Mit der Human Motion Data Platform (HMDP) geht Salzburg Research einen Mittelweg. Sie ermöglicht es, Forschungsdaten aus unterschiedlichen Datenquellen schnell zu planen, einfach in das Projekt zu integrieren, nachvollziehbar zu analysieren, und nachhaltig zu archivieren. Erreicht wird dies, indem Datenqualität über den gesamten Forschungsdatenlebenszyklus gemanagt wird. Im Fokus steht das Data Wrangling. Dabei werden gerade gewonnene Daten von den verschiedenen Messinstrumenten (z.B. IoT Sensoren, Laborgeräte, Fragebögen, etc.) heruntergeladen, dokumentiert und organisiert, bevor sie mit dem Projektkonsortium geteilt werden können. Fehler in dieser Phase führen zu irreparablem Verlust der Datenqualität, was sich negativ auf den darauffolgenden Datenanalyseprozess auswirkt.

Ein projektweiter Datenkatalog macht alle Datenobjekte und deren Metadaten auffindbar. Katalogeinträge sind verknüpft mit Studienprotokollen und den Metadaten der benutzten Messinstrumente. Damit ist eine Interpretation der Daten auch Monate nach der Studie möglich. Ein zentrales Rechtemanagement regelt Nutzungsrechte auf Studien- oder Datensatzebene. Datenzugriffe werden dokumentiert und auf Bedarf per E-Mail gemeldet. Zusätzlich ist die HMDP mit einer Workflow Engine verknüpft, wo Abläufe zur Datenverarbeitung zentral und wiederverwendbar definiert werden können. Die Installation auf eigenen oder cloudbasierten Server erfolgt einfach über Docker. Neben Installations- und Schulungskosten fallen laufende Kosten an, die jedoch stark von der gewählten Infrastruktur und der Datenmenge abhängen.

Das Design der HDMP basiert auf den Erfahrungen aus über 15 Jahren organisationsübergreifender, interdisziplinärer und datenintensiver Forschung und wird bereits in mehreren Projekten eingesetzt. Eine Skalierung des Projektes auf Landes- oder Bundesebene wäre der nächste Schritt, um das Tool für das F&E-Management von interdisziplinären AI-Innovationen auf breiter Basis zur Verfügung zu stellen.

Mehrwert

Benefits für das BMK:
(1) Stärkung des Forschungsstandorts Österreich und Wettbewerbsvorteil im Bereich Forschungsdatenmanagement sowie F&E-Management von AI-Innovationen
(2) Empfehlung für Datenkreise eines DGSVO-konformen Forschungsdatenmanagements für interdisziplinäre Forschungsprojekte
(3) Nationale Forschungsdateninfrastruktur
(4) Förderung der interdisziplinären Forschungsarbeit und Umgang mit Forschungsdaten

Benefits für Datenanbieter (Forschungsorganisationen und Unternehmen):
(1) Integrierte rechtliche Vereinbarung und Regelung zur gemeinsamen Nutzung von Daten
(2) Kontrolle über Datenveröffentlichung und Datenverwendung
(3) Digitale Langzeitarchivierung
(4) Möglichkeit der Abhaltung von Datathons oder Hackathons durch automatisierte Data-Pipelines

Benefits für Datensuchende (Forschungsorganisationen und Unternehmen):
(1) Nachvollziehbare Datendokumentation
(2) Kontaktierung der an Datensammlung beteiligten Personen
(3) Nutzung von bereits genierten (Referenz-)Datensätze für Innovationsvorhaben/Forschungsvorhaben

Dateien & Infos

Rückfragen & Kommentare

Bitte melden Sie sich an, wenn Sie ein Feedback hinterlassen möchten.

Bereits eingereichte Lösungen

Hinter der IÖB-Servicestelle stehen starke Partner

Eine Initiative von:
In Kooperation mit: