Benutzer-Werkzeuge

Webseiten-Werkzeuge


docuteam:preservation_330

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen RevisionVorhergehende Überarbeitung
Nächste Überarbeitung
Vorhergehende Überarbeitung
Letzte ÜberarbeitungBeide Seiten der Revision
docuteam:preservation_330 [2016/07/14 07:45] – [3. Durchführung der Migration] Tobias Wildidocuteam:preservation_330 [2019/01/07 11:24] – Externe Bearbeitung 127.0.0.1
Zeile 5: Zeile 5:
 Die Definition der Archivformate geschieht in der Konfigurationsdatei "migration-config.xml" von docuteam feeder. In dieser umfangreichen Datei wird für jedes Ausgangsformat ein Archivformat hinterlegt. Diese Konfiguration kommt zur Anwendung unabhängig davon, ob es sich um einen initialen Ingest oder um die Migration von Dateien handelt, die bereits im Archiv liegen. Die folgende Abbildung zeigt einen Ausschnitt aus dieser Konfigurationsdatei. Für jedes Quellformat wird sowohl ein Zielformat definiert, wie auch die für die Migration verantwortliche Applikation hinterlegt. Die Definition der Archivformate geschieht in der Konfigurationsdatei "migration-config.xml" von docuteam feeder. In dieser umfangreichen Datei wird für jedes Ausgangsformat ein Archivformat hinterlegt. Diese Konfiguration kommt zur Anwendung unabhängig davon, ob es sich um einen initialen Ingest oder um die Migration von Dateien handelt, die bereits im Archiv liegen. Die folgende Abbildung zeigt einen Ausschnitt aus dieser Konfigurationsdatei. Für jedes Quellformat wird sowohl ein Zielformat definiert, wie auch die für die Migration verantwortliche Applikation hinterlegt.
  
-{{:oais:2016_migration-config.xml.png?600|}} +{{:docuteam:1_definition_archivformate.jpg?800|}}
 ==== 2. Grundlagen für das Preservation Planning ermitteln==== ==== 2. Grundlagen für das Preservation Planning ermitteln====
-Die Grundlage für das Preservation Planning im Cockpit von docuteam feeder über den Bericht "Dateiformate" ermittelt. Der Bericht listet -- geordnet nach Häufigkeit -- alle im Archiv vorhandenen Dateiformate auf und zeigtauch ihren Pronom-Identifier (PUID) an. [[http://www.nationalarchives.gov.uk/PRONOM/Default.aspx|Pronom]] ist die Fileregistry des britischen Nationalarchivs und erlaubt es, Dateiformate und Unterversionen davon eindeutig zu identifizieren und zu referenzieren.+Die Grundlagen für das Preservation Planning werden im Cockpit von docuteam feeder über den Bericht "Dateiformate" ermittelt. Der Bericht listet -- geordnet nach Häufigkeit -- alle im Archiv vorhandenen Dateiformate auf und zeigtauch ihren Pronom-Identifier (PUID) an. [[http://www.nationalarchives.gov.uk/PRONOM/Default.aspx|Pronom]] ist die Fileregistry des britischen Nationalarchivs und erlaubt es, Dateiformate und Unterversionen davon eindeutig zu identifizieren und zu referenzieren.
 Aufgrund dieses Berichts wird der Entscheid gefällt, ob und welche Dateiformate in neue Zielformate migriert werden sollen. Aufgrund dieses Berichts wird der Entscheid gefällt, ob und welche Dateiformate in neue Zielformate migriert werden sollen.
  
-{{:oais:2016_bericht-dateiformate.png?600|}} +{{:docuteam:2_grundlagen_preservation_planning.jpg?600|}}
  
 ==== 3. Extraktion der zu migrierenden Dateien ==== ==== 3. Extraktion der zu migrierenden Dateien ====
Zeile 21: Zeile 19:
 In docuteam feeder werden mit Hilfe des Workflows "Preservation: Deliver DIP by PUID" alle JPEG-Dateien extrahiert. Der Workflow wird gestartet und als Parameter wird im Feld "Manuelle Eingabe" der PUID des zu migrierenden Dateiformats angegeben. **Wichtig:** der PUID muss in Anführungszeichen gesetzt werden, also **"fmt/43" und nicht nur fmt/43.**  In docuteam feeder werden mit Hilfe des Workflows "Preservation: Deliver DIP by PUID" alle JPEG-Dateien extrahiert. Der Workflow wird gestartet und als Parameter wird im Feld "Manuelle Eingabe" der PUID des zu migrierenden Dateiformats angegeben. **Wichtig:** der PUID muss in Anführungszeichen gesetzt werden, also **"fmt/43" und nicht nur fmt/43.** 
  
-{{:oais:2016_deliver_by_puid.png?600|}}+{{:docuteam:3_extraktion_zu_migrierende_daten.jpg?600|}}
  
 Die JPEG-Dateien werden je als eigene Informationspakete im Ordner 1_hotfolder_preservation auf der Workbench gespeichert: Die JPEG-Dateien werden je als eigene Informationspakete im Ordner 1_hotfolder_preservation auf der Workbench gespeichert:
  
-{{:oais:2016_zwischenspeichern_dateien.png?600|}}+{{:docuteam:4_hotfolder_preservation.jpg?600|}} 
  
-==== 3. Durchführung der Migration ====+==== 3. Durchführung der Preservation Action====
 Die Preservation Action kann für Einzeldateien manuell über den Workflow "Update Fedora Objects" durchgeführt werden. In der manuellen Eingabe wird dem Workflow der Name des zu migrierenden Pakets angegeben. Die manuell ausgeführte Preservation Action dient primär dem Testbetrieb, bei einer grösseren Menge von zu migrierenden Dateien wird der Workspace-Ordner "1_hotfolder_preservation" durch einen observer überwacht und sobald dort neue Pakete eintreffen werden sie automatisiert in das neue Zielformat migriert. Die Preservation Action kann für Einzeldateien manuell über den Workflow "Update Fedora Objects" durchgeführt werden. In der manuellen Eingabe wird dem Workflow der Name des zu migrierenden Pakets angegeben. Die manuell ausgeführte Preservation Action dient primär dem Testbetrieb, bei einer grösseren Menge von zu migrierenden Dateien wird der Workspace-Ordner "1_hotfolder_preservation" durch einen observer überwacht und sobald dort neue Pakete eintreffen werden sie automatisiert in das neue Zielformat migriert.
  
-{{:oais:2016_update_fedora_objects.png?600|}}+{{:docuteam:5_neue_ausfuehrung_fuer_preservation.jpg?600|}}
  
-Das [[https://wiki.duraspace.org/display/FEDORA38/Fedora+Digital+Object+Model|Objektmodell]] von Fedora Commons sieht vor, dass Datastreams versioniert werden können. Wenn nun eine Datei -- beispielsweise Datastream 1 -- in ein neues Format migriert wird, dann wird eine neue Version genau dieses Datastreams angelegt, um die Datei zu speichernDie Datei ist weiterhin unter dem gleichen PID auffindbar und über die gleichen RELS-EXT mit ihrer Umgebung verbunden. Die Originaldatei wird auch nicht gelöscht. Falls also bei einer Preservation Action ein Fehler auftaucht, kann weiterhin auf die Ursprungsdatei zurückgegriffen werden.+Das [[https://wiki.duraspace.org/display/FEDORA38/Fedora+Digital+Object+Model|Objektmodell]] von Fedora Commons sieht vor, dass Dateien in sogenannten "Datastreams" gespeichert werden und dass diese Datastreams versioniert werden können. Docuteam legt für jede Datei ein eigenes Fedora-Objekt an und verknüpft die Objekte über Relationen (beschrieben im RELS-EXT Datastream). Wenn nun eine Datei in ein neues Format migriert wird, dann wird der entsprechende Datastream nicht einfach überschrieben, sondern es wird eine neue Version davon angelegt. Dadurch bleibt der PID der Datei weiterhin gültig. Die Ausgangsdatei wird bei einer Preservation Action nicht gelöscht. Falls also im Migrationsprozess ein Fehler auftritt, kann auch zukünftig jederzeit auf die Ursprungsdatei zurückgegriffen werden. Während der Preservation Action werden zur Vorgangsdokumentation auch neue PREMIS-Metadaten geschrieben. Diese liegen in Fedora ebenfalls in einem eigenen Datastream und auch dieser wird versioniert.  
  
 {{:oais:fedora_38_doexample.png?nolink|}} {{:oais:fedora_38_doexample.png?nolink|}}

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki