zum Inhalt springen

Forschungsdatenmanagement

Da das Global South Studies Center eine öffentlich finanzierte Einrichtung ist, müssen die erarbeiteten Forschungsdaten öffentlich zugänglich sein, es sei denn, das Recht auf Publizität ist anwendbar. Zu diesem Zweck wird eine zweistufige Forschungsdatenarchivierungsinfrastruktur implementiert.

Zum einen gibt es eine GSSC-verwaltete Cloud-Storage-Lösung auf Basis von OwnCloud mit einem erprobtem Backup-System, das vom Regionalen Rechenzentrum der Universität zu Köln (RRZK) betrieben wird. Dies ermöglicht es allen Mitgliedern des GSSC, ihre Forschungsdaten sicher und privat zu speichern und auszutauschen sowie gemeinsam Förderanträge oder Forschungspapiere zu verfassen. Die Struktur dieser Speicherlösung wird von den einzelnen Forscher*innen selbst verwaltet und ist nur für den internen Gebrauch bestimmt. Der Cloud-Storage basiert auf OwnCloud und läuft auf einem Ubuntu LTS-Server auf der VM-Lösung des RRZK.

Zum anderen wurde als Backend ein vollständig OAIS-konformes Archivierungssystems eingerichtet. Dieses System ermöglicht nicht nur eine hochmoderne Archivierung, sondern auch die umfassende Darstellung der Verbreitungspakete gemäß den festgelegten Rechten der Archivpakete. Die Metadaten werden in Dublin Core gespeichert. Außerdem besteht die Möglichkeit, dass Forscher*innen ihre eigenen Metadaten in einem bevorzugten Format hinzufügen können.

Das Archivierungssystem ist Archivematica. Das Verbreitungssystem basiert auf  Access to Memory (AtoM). Beide laufen auf dedizierten VMs. Das Deep-Storage-Backend ist das IBM Tivoli TSM-Bandrobotersystem der Universität zu Köln.

Die Entscheidung, ausschließlich freie, quelloffene Software zu verwenden, geht auf die Idee zurück, dass nur Free Open Source Software (FOSS) in der Lage ist, wirklich langfristige Speicher- und Archivierungslösungen anzubieten, da ein proprietärer Software-Lebenszyklus immer vom Lebenszyklus des Unternehmens abhängt. Die Ausnahme ist die Band-Bibliothek, da es keine FOSS-Alternative gibt.

Die Hauptaufgabe des Forschungsdatenmanagements besteht weiterhin darin, die Kontinuität der Datenpflege über den Förderzeitraum hinaus zu gewährleisten.

Schaubild der digitalen Infrastruktur des GSSC

vergrößern: