Benutzer-Werkzeuge

Webseiten-Werkzeuge


docuteam:preservation_330

Preservation Planning, Preservation Actions

1. Definition der Archivformate

Die Definition der Archivformate geschieht in der Konfigurationsdatei „migration-config.xml“ von docuteam feeder. In dieser umfangreichen Datei wird für jedes Ausgangsformat ein Archivformat hinterlegt. Diese Konfiguration kommt zur Anwendung unabhängig davon, ob es sich um einen initialen Ingest oder um die Migration von Dateien handelt, die bereits im Archiv liegen. Die folgende Abbildung zeigt einen Ausschnitt aus dieser Konfigurationsdatei. Für jedes Quellformat wird sowohl ein Zielformat definiert, wie auch die für die Migration verantwortliche Applikation hinterlegt.

2. Grundlagen für das Preservation Planning ermitteln

Die Grundlagen für das Preservation Planning werden im Cockpit von docuteam feeder über den Bericht „Dateiformate“ ermittelt. Der Bericht listet – geordnet nach Häufigkeit – alle im Archiv vorhandenen Dateiformate auf und zeigtauch ihren Pronom-Identifier (PUID) an. Pronom ist die Fileregistry des britischen Nationalarchivs und erlaubt es, Dateiformate und Unterversionen davon eindeutig zu identifizieren und zu referenzieren. Aufgrund dieses Berichts wird der Entscheid gefällt, ob und welche Dateiformate in neue Zielformate migriert werden sollen.

3. Extraktion der zu migrierenden Dateien

Preservation Actions werden immer pro Dateiformat durchgeführt. Beispiel: Im Archiv liegt verschiedene JPEG-Dateien, die im Rahmen einer Preservation Action nach Tiff migriert werden sollen. in migration.config.xml ist Tiff als Archivformat von JPEG hinterlegt.

JPEG (Pronom fmt/43) –> Tiff (Pronom fmt/353)

In docuteam feeder werden mit Hilfe des Workflows „Preservation: Deliver DIP by PUID“ alle JPEG-Dateien extrahiert. Der Workflow wird gestartet und als Parameter wird im Feld „Manuelle Eingabe“ der PUID des zu migrierenden Dateiformats angegeben. Wichtig: der PUID muss in Anführungszeichen gesetzt werden, also „fmt/43“ und nicht nur fmt/43.

Die JPEG-Dateien werden je als eigene Informationspakete im Ordner 1_hotfolder_preservation auf der Workbench gespeichert:

3. Durchführung der Preservation Action

Die Preservation Action kann für Einzeldateien manuell über den Workflow „Update Fedora Objects“ durchgeführt werden. In der manuellen Eingabe wird dem Workflow der Name des zu migrierenden Pakets angegeben. Die manuell ausgeführte Preservation Action dient primär dem Testbetrieb, bei einer grösseren Menge von zu migrierenden Dateien wird der Workspace-Ordner „1_hotfolder_preservation“ durch einen observer überwacht und sobald dort neue Pakete eintreffen werden sie automatisiert in das neue Zielformat migriert.

Das Objektmodell von Fedora Commons sieht vor, dass Dateien in sogenannten „Datastreams“ gespeichert werden und dass diese Datastreams versioniert werden können. Docuteam legt für jede Datei ein eigenes Fedora-Objekt an und verknüpft die Objekte über Relationen (beschrieben im RELS-EXT Datastream). Wenn nun eine Datei in ein neues Format migriert wird, dann wird der entsprechende Datastream nicht einfach überschrieben, sondern es wird eine neue Version davon angelegt. Dadurch bleibt der PID der Datei weiterhin gültig. Die Ausgangsdatei wird bei einer Preservation Action nicht gelöscht. Falls also im Migrationsprozess ein Fehler auftritt, kann auch zukünftig jederzeit auf die Ursprungsdatei zurückgegriffen werden. Während der Preservation Action werden zur Vorgangsdokumentation auch neue PREMIS-Metadaten geschrieben. Diese liegen in Fedora ebenfalls in einem eigenen Datastream und auch dieser wird versioniert.

docuteam/preservation_330.txt · Zuletzt geändert: 2017/09/05 16:21 (Externe Bearbeitung)