Benutzer-Werkzeuge

Webseiten-Werkzeuge


docuteam:format

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen Revision Vorhergehende Überarbeitung
Nächste Überarbeitung
Vorhergehende Überarbeitung
docuteam:format [2018/10/04 08:53]
Tobias Wildi [Fileformate, die wir für die Langzeitarchivierung verwenden]
docuteam:format [2022/01/28 08:20] (aktuell)
Tobias Haudenschild [Ungeeignete Fileformate]
Zeile 1: Zeile 1:
 ====== Docuteam-Migrationspfade für Dateiformate  ====== ====== Docuteam-Migrationspfade für Dateiformate  ======
  
-Im digitalen Archiv werden in aller Regel nur einige wenige Dateiformate aktiv gepflegt. Digitale Akten müssen – sollen sie langfristig aufbewahrt, migriert und auch genutzt werden können – in diese Formate überführt werden. Diese File-Registry zeigt einerseits auf, welche Formate wir für die Archivierung verwenden. Andererseits sind auch Hinweise enthalten, mit welchen Werkzeugen für die Langzeitarchivierung ungeeignete Formate migriert werden können.\\ +Im digitalen Archiv werden in aller Regel nur einige wenige Dateiformate aktiv gepflegt. Digitale Akten müssen – sollen sie langfristig aufbewahrt, migriert und auch genutzt werden können – in diese Formate überführt werden. Diese File-Registry zeigt auf, welche Formate wir für die Archivierung verwenden.\\ 
-Generell verweisen wir in unseren Projekten auf den [[https://www.bar.admin.ch/dam/bar/de/dokumente/konzepte_und_weisungen/archivtaugliche_dateiformate.1.pdf.download.pdf/archivtaugliche_dateiformate.pdf|Katalog archivtaugliche Dateiformate]] des Schweizerischen Bundesarchivs. Die neuste Version ist im April 2018 erschienen und wurde unter anderem ergänzt um JPEG 2000 als Archivformat.+Generell verweisen wir in unseren Projekten auf den [[https://www.bar.admin.ch/dam/bar/de/dokumente/konzepte_und_weisungen/archivtaugliche_dateiformate.1.pdf.download.pdf/archivtaugliche_dateiformate.pdf|Katalog archivtaugliche Dateiformate]] des Schweizerischen Bundesarchivs.
  
-===== Fileformate, die wir für die Langzeitarchivierung verwenden=====+===== Die wichtigsten Archivformate=====
 ^Art der Daten^Offizielles Archivformat^vorläufig akzeptiert^wird durch docuteam feeder automatisch migriert^ ^Art der Daten^Offizielles Archivformat^vorläufig akzeptiert^wird durch docuteam feeder automatisch migriert^
-|Text|PDF/A, TXT (Plaintext)|DOCX|Ja, nach PDF/A| +|Text (Office)|PDF/A|DOCX|Ja, nach PDF/A
-|Tabellen|PDF/A|XLSX|Ja, nach PDF/A| +|Text|TXT (Plaintext)| |Nein
-|Rasterbilder|TIFF, JPEG2000| |Ja| +|Tabellen|PDF/A|XLSX (CSV bringt keinen Mehrnutzen gegenüber dem XML-basierten XSLX)|Ja, nach PDF/A, XLSX wird nicht konvertiert
-|Video|FFV1 | für SD: Digital Video Encoding (DV, DVCAM, DVCPRO)||Nein|+|Rasterbilder|TIFF, JPEG2000| |Ja, nach TIFF
 +|Video|FFV1 | für SD: Digital Video Encoding (DV, DVCAM, DVCPRO)|Nein|
 |Audio| WAVE| |Ja, nach WAVE| |Audio| WAVE| |Ja, nach WAVE|
 |Markup|XML| |Nein| |Markup|XML| |Nein|
-|E-Mail|EML oder PDAF/A| |Ja, nach PDF/A|+|E-Mail|EML oder PDF/A| |Ja, nach PDF/A
 +|Webseiten| |WARC|Nein|
  
 ===== Ungeeignete Fileformate ===== ===== Ungeeignete Fileformate =====
 Unter dieser Rubrik finden sich Fileformate, die nicht für die Langzeitarchivierung geeignet sind und die wir nicht in ein Langzeit-Repository übernehmen. Aufgrund ihrer weiten Verbreitung müssen wir jedoch in der Lage sein, sie in Formate umzuwandeln, die langfristig archivierbar sind. Unter dieser Rubrik finden sich Fileformate, die nicht für die Langzeitarchivierung geeignet sind und die wir nicht in ein Langzeit-Repository übernehmen. Aufgrund ihrer weiten Verbreitung müssen wir jedoch in der Lage sein, sie in Formate umzuwandeln, die langfristig archivierbar sind.
  
-  * doc (binäre Formate aus Textverarbeitung+  * doc, xls, ppt (binäre Microsoft Office-Formate vor Office 2007. Die neuen Office-Formate sind XML-basiert, daher ist ihr Inhalt auch ohne Office-Applikationen zugänglich
-  * [[e-archive:rtf]] (Binäres, MS-kontrolliertes Format für Textverarbeitung) +  * rtf (Binäres, MS-kontrolliertes Format für Textverarbeitung, welches für den Austausch zwischen verschiedenen Applikationen entwickelt wurde, heute aber kaum noch Verbreitet ist
-  * xls (Excel+  * zip (Format nur als SIP archivwürdig; ZIP müssen immer entpackt und nur die darin enthaltenene Dateien sollen archiviert werden
-  * ppt (Powerpoint-Präsentationen)+  * dxf, dwg, ifc (Formate aus Computer Aided Design CAD. Getrennt gespeicherte CAD-Modelle („Einzelteile“können durch Referenzieren zu einem ganzheitlichen Modell („Baugruppe“) zusammengebaut werden, wobei die so erzeugte Datei nur Verweise zu den Modellen enthält. Referenzen werden auf Dateiebene mit File Links gelöst, die sich eventuell sogar in einer separaten Datei befinden.) 
 + 
 =====Die Standardkonfiguration für Formatmigrationen durch docuteam feeder===== =====Die Standardkonfiguration für Formatmigrationen durch docuteam feeder=====
 Die Standardkonfiguration für Formatmigrationen, wie sie in Feeder vorliegt (spezifiziert im migration-config.xml), ist wie in den folgenden Tabellen definiert. Bei der Dateimigration geht Feeder zunächst nach der PUID einer Datei. Kann diese nicht bestimmt werden, wird der Mimetype gesucht. Liegt auch dieser nicht vor, berücksichtigt Feeder schliesslich die Dateiendung. Im Folgenden sind die drei Tabellen (Konvertierung nach PUID, Mimetype oder Dateiendung) eingefügt, welche die spezifizierten Migrationen enthalten. Alle anderen Formate werden NICHT migriert. Diese Standardkonfiguration kann angepasst werden. Die Standardkonfiguration für Formatmigrationen, wie sie in Feeder vorliegt (spezifiziert im migration-config.xml), ist wie in den folgenden Tabellen definiert. Bei der Dateimigration geht Feeder zunächst nach der PUID einer Datei. Kann diese nicht bestimmt werden, wird der Mimetype gesucht. Liegt auch dieser nicht vor, berücksichtigt Feeder schliesslich die Dateiendung. Im Folgenden sind die drei Tabellen (Konvertierung nach PUID, Mimetype oder Dateiendung) eingefügt, welche die spezifizierten Migrationen enthalten. Alle anderen Formate werden NICHT migriert. Diese Standardkonfiguration kann angepasst werden.
Zeile 33: Zeile 37:
 Die Tabellen enthalten jeweils in der ersten Spalte die PUID der Quelldatei, in der zweiten Spalte deren Name. Die dritte, vierte und fünfte Spalte zeigen, in welches Format die Quelldatei migriert wird (PUID, Name und Dateiendung). Die Tabellen enthalten jeweils in der ersten Spalte die PUID der Quelldatei, in der zweiten Spalte deren Name. Die dritte, vierte und fünfte Spalte zeigen, in welches Format die Quelldatei migriert wird (PUID, Name und Dateiendung).
  
-(Stand: 24.09.2018)+(Stand: 29.06.2021)
 ===Anhand PUID (1. Priorität)=== ===Anhand PUID (1. Priorität)===
 <sortable 1> <sortable 1>
Zeile 71: Zeile 75:
 |[[http://www.nationalarchives.gov.uk/PRONOM/fmt/597|fmt/597]]|Microsoft Word Template|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf| |[[http://www.nationalarchives.gov.uk/PRONOM/fmt/597|fmt/597]]|Microsoft Word Template|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf|
 |[[http://www.nationalarchives.gov.uk/PRONOM/fmt/599|fmt/599]]|Microsoft Word Macro-Enabled Document Template|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf| |[[http://www.nationalarchives.gov.uk/PRONOM/fmt/599|fmt/599]]|Microsoft Word Macro-Enabled Document Template|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf|
 +|[[http://www.nationalarchives.gov.uk/PRONOM/fmt/609|fmt/609]]|Microsoft Word (Generic)|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf|
 |[[http://www.nationalarchives.gov.uk/PRONOM/x-fmt/273|x-fmt/273]]|Microsoft Word for MS-DOS Document|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf| |[[http://www.nationalarchives.gov.uk/PRONOM/x-fmt/273|x-fmt/273]]|Microsoft Word for MS-DOS Document|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf|
 |[[http://www.nationalarchives.gov.uk/PRONOM/x-fmt/274|x-fmt/274]]|Microsoft Word for MS-DOS Document|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf| |[[http://www.nationalarchives.gov.uk/PRONOM/x-fmt/274|x-fmt/274]]|Microsoft Word for MS-DOS Document|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf|
Zeile 83: Zeile 88:
 |[[http://www.nationalarchives.gov.uk/PRONOM/x-fmt/393|x-fmt/393]]|WordPerfect for MS-DOS Document|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf| |[[http://www.nationalarchives.gov.uk/PRONOM/x-fmt/393|x-fmt/393]]|WordPerfect for MS-DOS Document|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf|
 |[[http://www.nationalarchives.gov.uk/PRONOM/x-fmt/394|x-fmt/394]]|WordPerfect for MS-DOS/Windows Document|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf| |[[http://www.nationalarchives.gov.uk/PRONOM/x-fmt/394|x-fmt/394]]|WordPerfect for MS-DOS/Windows Document|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf|
-|[[http://www.nationalarchives.gov.uk/PRONOM/x-fmt/609|x-fmt/609]]||fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf| 
 |[[http://www.nationalarchives.gov.uk/PRONOM/fmt/45|fmt/45]]|Rich Text Format|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf| |[[http://www.nationalarchives.gov.uk/PRONOM/fmt/45|fmt/45]]|Rich Text Format|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf|
 |[[http://www.nationalarchives.gov.uk/PRONOM/fmt/46|fmt/46]]|Rich Text Format|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf| |[[http://www.nationalarchives.gov.uk/PRONOM/fmt/46|fmt/46]]|Rich Text Format|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf|
Zeile 116: Zeile 120:
 |[[http://www.nationalarchives.gov.uk/PRONOM/fmt/126|fmt/126]]|Microsoft Powerpoint Presentation|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf| |[[http://www.nationalarchives.gov.uk/PRONOM/fmt/126|fmt/126]]|Microsoft Powerpoint Presentation|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf|
 |[[http://www.nationalarchives.gov.uk/PRONOM/fmt/215|fmt/215]]|Microsoft Powerpoint for Windows|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf| |[[http://www.nationalarchives.gov.uk/PRONOM/fmt/215|fmt/215]]|Microsoft Powerpoint for Windows|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf|
 +|[[http://www.nationalarchives.gov.uk/PRONOM/fmt/487|fmt/487]]|Macro Enabled Microsoft Powerpoint|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf|
 |[[http://www.nationalarchives.gov.uk/PRONOM/fmt/629|fmt/629]]|Microsoft PowerPoint Show|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf| |[[http://www.nationalarchives.gov.uk/PRONOM/fmt/629|fmt/629]]|Microsoft PowerPoint Show|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf|
 |[[http://www.nationalarchives.gov.uk/PRONOM/fmt/630|fmt/630]]|Microsoft PowerPoint Macro-Enabled Show|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf| |[[http://www.nationalarchives.gov.uk/PRONOM/fmt/630|fmt/630]]|Microsoft PowerPoint Macro-Enabled Show|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf|
Zeile 148: Zeile 153:
 |[[http://www.nationalarchives.gov.uk/PRONOM/fmt/119|fmt/119]]|Windows Bitmap|fmt/353|Tagged Image File Format|.tif| |[[http://www.nationalarchives.gov.uk/PRONOM/fmt/119|fmt/119]]|Windows Bitmap|fmt/353|Tagged Image File Format|.tif|
 |[[http://www.nationalarchives.gov.uk/PRONOM/x-fmt/92|x-fmt/92]]|Adobe Photoshop|fmt/353|Tagged Image File Format|.tif| |[[http://www.nationalarchives.gov.uk/PRONOM/x-fmt/92|x-fmt/92]]|Adobe Photoshop|fmt/353|Tagged Image File Format|.tif|
-|[[http://www.nationalarchives.gov.uk/PRONOM/fmt/122|fmt/122]]|Encapsulated PostScript File Format|fmt/353|Tagged Image File Format|.tif| 
-|[[http://www.nationalarchives.gov.uk/PRONOM/fmt/123|fmt/123]]|Encapsulated PostScript File Format|fmt/353|Tagged Image File Format|.tif| 
-|[[http://www.nationalarchives.gov.uk/PRONOM/fmt/124|fmt/124]]|Encapsulated PostScript File Format|fmt/353|Tagged Image File Format|.tif| 
 |[[http://www.nationalarchives.gov.uk/PRONOM/fmt/211|fmt/211]]|Kodak Photo CD Image|fmt/353|Tagged Image File Format|.tif| |[[http://www.nationalarchives.gov.uk/PRONOM/fmt/211|fmt/211]]|Kodak Photo CD Image|fmt/353|Tagged Image File Format|.tif|
 </sortable>===Anhand Mimetype (2. Priorität)=== </sortable>===Anhand Mimetype (2. Priorität)===
Zeile 166: Zeile 168:
 ^Quelle (PUID)^Quelle (Namen)^Ziel (PUID)^Ziel (Name)^Ziel (Dateiendung)^ ^Quelle (PUID)^Quelle (Namen)^Ziel (PUID)^Ziel (Name)^Ziel (Dateiendung)^
 |.mp3|MPEG 1/2 Audio Layer 3|fmt/142|Waveform Audio (WAVEFORMATEX)|.wav| |.mp3|MPEG 1/2 Audio Layer 3|fmt/142|Waveform Audio (WAVEFORMATEX)|.wav|
-|.doc|Wordperfect Secondary File, WordPerfect for MS-DOS/Windows Document, Stationery for Mac OS X, Microsoft Word for MS-DOS Document, Interleaf Document, Microsoft Word Document, Microsoft Word for Windows Document, Microsoft Office Owner File, Microsoft Word (Generic), Microsoft Word Document (Password Protected), Compound WordPerfect for Windows Document|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf| +|.doc|Wordperfect Secondary File, WordPerfect for MS-DOS/Windows Document, Stationery for Mac OS X, Microsoft Word for MS-DOS Document, Interleaf Document, Microsoft Word Document, Microsoft Word for Windows Document, Microsoft Office Owner File, Microsoft Word (Generic), Microsoft Word Document (Password Protected), Compound WordPerfect for Windows Document, PFS:First Choice Document|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf| 
-|.docx|Microsoft Word for Windows, Microsoft Office Encrypted Document|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf|+|.docx|Microsoft Word for Windows, Microsoft Office Owner File, Microsoft Office Encrypted Document|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf|
 |.docm|Macro enabled Microsoft Word Document OOXML|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf| |.docm|Macro enabled Microsoft Word Document OOXML|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf|
-|.rtf|Rich Text Format,  Rich Text Format|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf|+|.rtf|Rich Text Format|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf|
 |.xls|Microsoft Excel 2.x Worksheet (xls), Microsoft Excel 3.0 Worksheet (xls), Microsoft Excel 4.0 Worksheet (xls), Microsoft Excel 5.0/95 Workbook (xls), Microsoft Excel 97 Workbook (xls), Microsoft Excel 2000-2003 Workbook (xls)|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf| |.xls|Microsoft Excel 2.x Worksheet (xls), Microsoft Excel 3.0 Worksheet (xls), Microsoft Excel 4.0 Worksheet (xls), Microsoft Excel 5.0/95 Workbook (xls), Microsoft Excel 97 Workbook (xls), Microsoft Excel 2000-2003 Workbook (xls)|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf|
 |.xlc|Microsoft Excel Chart|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf| |.xlc|Microsoft Excel Chart|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf|
Zeile 179: Zeile 181:
 |.pptx|Microsoft Powerpoint for Windows, Microsoft Office Encrypted Document|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf| |.pptx|Microsoft Powerpoint for Windows, Microsoft Office Encrypted Document|fmt/476,fmt/477,fmt/478|Acrobat PDF/A - Portable Document Format|.pdf|
 |.jpg|JPEG File Interchange Format, Raw JPEG Stream, Still Picture Interchange File Format, Exchangeable Image File Format (Compressed)|fmt/353|Tagged Image File Format|.tif| |.jpg|JPEG File Interchange Format, Raw JPEG Stream, Still Picture Interchange File Format, Exchangeable Image File Format (Compressed)|fmt/353|Tagged Image File Format|.tif|
-|.jpeg|JPEG File Interchange Format, Raw JPEG Stream|fmt/353|Tagged Image File Format|.tif|+|.jpeg|JPEG File Interchange Format, Raw JPEG Stream, Exchangeable Image File Format (Compressed)|fmt/353|Tagged Image File Format|.tif|
 |.png|Portable Network Graphics, Animated Portable Network Graphics|fmt/353|Tagged Image File Format|.tif| |.png|Portable Network Graphics, Animated Portable Network Graphics|fmt/353|Tagged Image File Format|.tif|
 |.gif|Graphics Interchange Format|fmt/353|Tagged Image File Format|.tif| |.gif|Graphics Interchange Format|fmt/353|Tagged Image File Format|.tif|
 |.bmp|OS/2 Bitmap, Windows Bitmap|fmt/353|Tagged Image File Format|.tif| |.bmp|OS/2 Bitmap, Windows Bitmap|fmt/353|Tagged Image File Format|.tif|
 |.psd|Adobe Photoshop|fmt/353|Tagged Image File Format|.tif| |.psd|Adobe Photoshop|fmt/353|Tagged Image File Format|.tif|
-|.eps|Encapsulated PostScript File Format|fmt/353|Tagged Image File Format|.tif| 
 </sortable> </sortable>
- 
- 
-Diese Tabellen wurden mit dem Stylesheet "S:\B  Docu\2_Entw\21_Produktentwicklung\000 Übergreifendes\migrationconfig2wiki_20180906_Schu.xslt" erstellt. 
- 
docuteam/format.1538636008.txt.gz · Zuletzt geändert: 2019/01/07 11:15 (Externe Bearbeitung)