Benutzer-Werkzeuge

Webseiten-Werkzeuge


docuteam:preservation_330

Dies ist eine alte Version des Dokuments!


Preservation Planning, Preservation Actions

1. Definition der Archivformate

Die Definition der Archivformate geschieht in der Konfigurationsdatei „migration-config.xml“ von docuteam feeder. In dieser umfangreichen Datei wird für jedes Ausgangsformat ein Archivformat hinterlegt. Diese Konfiguration kommt zur Anwendung unabhängig davon, ob es sich um einen initialen Ingest oder um die Migration von Dateien handelt, die bereits im Archiv liegen. Die folgende Abbildung zeigt einen Ausschnitt aus dieser Konfigurationsdatei. Für jedes Quellformat wird sowohl ein Zielformat definiert, wie auch die für die Migration verantwortliche Applikation hinterlegt.

2. Grundlagen für das Preservation Planning ermitteln

Die Grundlage für das Preservation Planning im Cockpit von docuteam feeder über den Bericht „Dateiformate“ ermittelt. Der Bericht listet – geordnet nach Häufigkeit – alle im Archiv vorhandenen Dateiformate auf und zeigtauch ihren Pronom-Identifier (PUID) an. Pronom ist die Fileregistry des britischen Nationalarchivs und erlaubt es, Dateiformate und Unterversionen davon eindeutig zu identifizieren und zu referenzieren. Aufgrund dieses Berichts wird der Entscheid gefällt, ob und welche Dateiformate in neue Zielformate migriert werden sollen.

3. Extraktion der zu migrierenden Dateien

Preservation Actions werden immer pro Dateiformat durchgeführt. Beispiel: Im Archiv liegt verschiedene JPEG-Dateien, die im Rahmen einer Preservation Action nach Tiff migriert werden sollen. in migration.config.xml ist Tiff als Archivformat von JPEG hinterlegt.

JPEG (Pronom fmt/43) –> Tiff (Pronom fmt/353)

In docuteam feeder werden mit Hilfe des Workflows „Preservation: Deliver DIP by PUID“ alle JPEG-Dateien extrahiert. Der Workflow wird gestartet und als Parameter wird im Feld „Manuelle Eingabe“ der PUID des zu migrierenden Dateiformats angegeben. Wichtig: der PUID muss in Anführungszeichen gesetzt werden, also „fmt/43“ und nicht nur fmt/43.

Die JPEG-Dateien werden je als eigene Informationspakete im Ordner 1_hotfolder_preservation auf der Workbench gespeichert:

3. Durchführung der Migration

Die Preservation Action kann für Einzeldateien manuell über den Workflow „Update Fedora Objects“ durchgeführt werden. In der manuellen Eingabe wird dem Workflow der Name des zu migrierenden Pakets angegeben. Die manuell ausgeführte Preservation Action dient primär dem Testbetrieb, bei einer grösseren Menge von zu migrierenden Dateien wird der Workspace-Ordner „1_hotfolder_preservation“ durch einen observer überwacht und sobald dort neue Pakete eintreffen werden sie automatisiert in das neue Zielformat migriert.

Das Datenmodell von Fedora Commons sieht vor, dass Datastreams versioniert werden können. Wenn nun eine Datei (beispielsweise Datastream 1) in ein neues Format migriert wird, dann wird eine neue Version von Datastream 1 angelegt, um die Datei zu speichern. Die Datei ist weiterhin unter dem gleichen PID auffindbar und über die gleichen RELS-EXT mit ihrer Umgebung verbunden. Die Originaldatei wird auch nicht gelöscht. Falls also bei einer Preservation Action ein Fehler auftaucht, kann weiterhin auf die Ursprungsdatei zurückgegriffen werden.

docuteam/preservation_330.1468475027.txt.gz · Zuletzt geändert: 2019/01/07 11:16 (Externe Bearbeitung)

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki