Benutzer-Werkzeuge

Webseiten-Werkzeuge


docuteam:preservation_330

Dies ist eine alte Version des Dokuments!


Preservation Planning, Preservation Actions

1. Definition der Archivformate

Die Definition der Archivformate geschieht in der Konfigurationsdatei „migration-config.xml“ von docuteam feeder. In dieser umfangreichen Datei wird für jedes Ausgangsformat ein Archivformat hinterlegt. Diese Konfiguration kommt zur Anwendung unabhängig davon, ob es sich um einen initialen Ingest oder um die Migration von Dateien handelt, die bereits im Archiv liegen. Die folgende Abbildung zeigt einen Ausschnitt aus dieser Konfigurationsdatei. Für jedes Quellformat wird sowohl ein Zielformat definiert, wie auch die für die Migration verantwortliche Applikation hinterlegt.

2. Grundlagen für das Preservation Planning ermitteln

Die Grundlage für das Preservation Planning im Cockpit von docuteam feeder über den Bericht „Dateiformate“ ermittelt. Der Bericht listet – geordnet nach Häufigkeit – alle im Archiv vorhandenen Dateiformate auf und zeigtauch ihren Pronom-Identifier (PUID) an. Pronom ist die Fileregistry des britischen Nationalarchivs und erlaubt es, Dateiformate und Unterversionen davon eindeutig zu identifizieren und zu referenzieren. Aufgrund dieses Berichts wird der Entscheid gefällt, ob und welche Dateiformate in neue Zielformate migriert werden sollen.

3. Extraktion der zu migrierenden Dateien

Preservation Actions werden immer pro Dateiformat durchgeführt. Beispiel: Im Archiv liegt verschiedene JPEG-Dateien, die im Rahmen einer Preservation Action nach Tiff migriert werden sollen. in migration.config.xml ist Tiff als Archivformat von JPEG hinterlegt.

JPEG (Pronom fmt/43) –> Tiff (Pronom fmt/353)

In docuteam feeder werden mit Hilfe des Workflows „Preservation: Deliver DIP by PUID“ alle JPEG-Dateien extrahiert. Der Workflow wird gestartet und als Parameter wird im Feld „Manuelle Eingabe“ der PUID des zu migrierenden Dateiformats angegeben. Wichtig: der PUID muss in Anführungszeichen gesetzt werden, also „fmt/43“ und nicht nur fmt/43.

Die JPEG-Dateien werden je als eigene Informationspakete im Ordner 1_hotfolder_preservation auf der Workbench gespeichert:

3. Durchführung der Migration

Die Preservation Action kann für Einzeldateien manuell über den Workflow „Update Fedora Objects“ durchgeführt werden. In der manuellen Eingabe wird dem Workflow der Name des zu migrierenden Pakets angegeben. Die manuell ausgeführte Preservation Action dient primär dem Testbetrieb, bei einer grösseren Menge von zu migrierenden Dateien wird der Workspace-Ordner „1_hotfolder_preservation“ durch einen observer überwacht und sobald dort neue Pakete eintreffen werden sie automatisiert in das neue Zielformat migriert.

Das Objektmodell von Fedora Commons sieht vor, dass Datastreams versioniert werden können. Wenn nun eine Datei – beispielsweise Datastream 1 – in ein neues Format migriert wird, dann wird eine neue Version genau dieses Datastreams angelegt, um die Datei zu speichern. Die Datei ist weiterhin unter dem gleichen PID auffindbar und über die weiterhin gültigen RELS-EXT mit ihrer Umgebung verbunden. Die Ausgangsdatei wird bei einer Preservation Action nicht gelöscht. Falls also im Migrationsprozess ein Fehler auftaucht, kann weiterhin auf die Ursprungsdatei zurückgegriffen werden – auch wenn dieser erst viel später entdeckt werden sollte. Während der Preservation Action werden auch PREMIS-Metadaten geschrieben, um den Vorgang zu dokumentieren. Die PREMIS-Metadaten liegen in Fedora in einem eigenen Data-Stream, von diesem wird ebenfalls eine neue Version angelegt.

docuteam/preservation_330.1468475400.txt.gz · Zuletzt geändert: 2019/01/07 11:16 (Externe Bearbeitung)

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki