Keeping Research Data Safe 2

May 19th, 2010 by Jens Klump

Der erste Bericht zum Thema “Keeping Research Data Safe” von Neal Beagrie et al. (2008) war bereits eine sehr gute Zusammenfassung der bis dahin bekannten Studien zu den Kosten der Langzeitarchivierung digitaler Objekte. Mit mehreren Fallstudien haben Beagrie et al. jetzt noch einmal nachlegen können und im Auftrag des JISC die Studie “Keeping Research Data Safe 2” veröffentlicht. Die wichtigsten Ergebnisse der Studie sind:

  • Kosten für die Langzeitarchivierung von Forschungsdaten betragen nur einen Bruchteil dessen, was die Erhebung der Daten und deren Überführung in ein Archiv (Ingest) kostet.
  • Forschungsdaten zu bewahren und bereitzustellen bringt bereits kurzfristig Vorteile für die Forschung.

Darüber hinaus enthält der Bericht eine Menge Material zur Kostenstruktur der Langzeitarchivierung von Forschungsdaten. Weitere Arbeiten in dieser Richtung sind jedoch noch notwendig, da mit elf Fallstudien zwar schon eine Menge geleistet wurde, aber eben doch nur ein kleiner Ausschnitt aus dem Spektrum der Forschungslandschaft abgedeckt wurde.

Wie bereits von mir vermutet, wird ein großes Potenzial für Verbesserungen und zur Senkung der Gesamtkosten des Managements von Forschungsdaten in der Ingest- und auch in der Access-Phase gesehen. Den Wissenschaftsorganisationen wird empfohlen, hier entsprechende Förderprogramme aufzulegen. Zusätzlich wird empfohlen, die Prozesse, die der Archivierung vorgelagert sind, auch aus der Perspektive der Forscher zu untersuchen.

Da immer mehr Forschungsorganisationen von ihren Zuwendungsempfängern Datenmanagementpläne verlangen ist es wichtig, hier den Forschern passende Angebote zu machen. die Probleme in der Praxis beschreibt zum Beispiel Dorothea Salo in ihrem Blog “Book of Trogol” in ihrem Beitrag “On NSF Data Plans“.

So if you think you might be affected by this rule if it comes to pass, what should you do? Here’s what I think.

  • Do not try to revamp every single process and procedure you have. Do not try to “rescue” all your old data all at once. You will swamp yourself and get discouraged. Seriously, don’t. Panic won’t help you here.
  • Instead, look back at your last funded project, since it will be freshest in your mind. What data did it produce?
  • What happened to that dataset in the course of your research? Did you run programs against it? Be prepared to archive and document that code.
  • Who handled your data? Did they document it? Where? If there is any part of the process you’re fuzzy on, be aware that this fuzziness will need to go away for your next project.
  • Ask yourself the famous ten questions (PDF) about your data. The answers will inform your data-management plan.
  • What can’t you do for your data that you think should be done? Need partners? Go find them now. Depending on your needs, the right partners may be in your campus library or IT organization, or they may exist at your funder or in a research center near you.

That should keep you out of trouble for a while! It will also mean that you are prepared come the next funding cycle, where many would-be grantees won’t be. In today’s cutthroat funding environment, that can only help.

Übrigens verlangt die DFG seit dem 30.04.2010 von ihren Antragstellern einen Datenmanagementplan. Im “Leitfaden für Antragsteller” heißt es:

3.7 Umgang mit den im Projekt erzielten Forschungsdaten

Die Verbesserung des Umgangs mit Forschungsdaten hat sowohl bei nationalen und internationalen Forschungsorganisationen, als auch in der Wissenschaft eine hohe Bedeutung. Die DFG ist daher bestrebt, durch ihre Förderung auch zur Sicherung, Aufbewahrung und nachhaltigen Verfügbarkeit der Forschungsdaten beizutragen.

Wenn aus Projektmitteln systematisch (Mess-)Daten erhoben werden, die für die Nachnutzung geeignet sind, legen Sie bitte dar, welche Maßnahmen ergriffen wurden bzw. während der Laufzeit des Projektes getroffen werden, um die Daten nachhaltig zu sichern und ggf. für eine erneute Nutzung bereit zu stellen. Bitte berücksichtigen Sie dabei auch – sofern vorhanden – die in Ihrer Fachdisziplin existierenden Standards und die Angebote bestehender Datenrepositorien.

Es ist zu erwarten, dass an die Geowissenschaften hier besonders hohe Anforderungen gestellt werden.

Tags: , , ,

Leave a Reply