Benutzer-Werkzeuge

Webseiten-Werkzeuge


docuteam:webgate

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen RevisionVorhergehende Überarbeitung
Nächste Überarbeitung
Vorhergehende Überarbeitung
docuteam:webgate [2020/03/10 12:43] – [5 Frequently asked questions (FAQ)] penelopedocuteam:webgate [2020/03/11 09:39] (aktuell) – [5 Frequently asked questions (FAQ)] penelope
Zeile 122: Zeile 122:
 =====5 Frequently asked questions (FAQ)===== =====5 Frequently asked questions (FAQ)=====
  
-===5.1 Webharvest und WARC-Dateien=== +===5.1 Archivieren von Websites, Webharvest===
-- Was sind WARC-Dateien? +
-WARC = "Web ARChive", ein standardisiertes Datenformat zur Web-Archivierung. Die WARC-Datei kombiniert mehrerer digitale Ressourcen sowie die dazugehörenden Metadaten (Dateiendung .warc).+
  
-Wie funktioniert der Harvest einer Webseite bei docuteam?  +1) Was sind WARC-Dateien?\\ 
- +WARC = "Web ARChive"ein standardisiertes Datenformat zur Web-Archivierung. Die WARC-Datei kombiniert mehrerer digitale Ressourcen sowie die dazugehörenden Metadaten (Dateiendung .warc). WARC-Dateien enthalten somit die Inhalte und Dokumentewelche von einer Website geharvested wurden
-Der Harvest einer Website wird mit der Netarchivesuite-Software durchgeführt, welche um den Heritrix-Webcrawler aufgebaut ist. Der Webcrawler sucht dabei die vorgegebenen Web-Adressen (URLs) nach erreichbaren Inhalten/Dokumenten ab und speichert diese auf dem vordefinierten Webharvest-Server ab. Bei den abgespeicherten Dateien handelt es sich um WARC-Dateien. Es können mehrere Warc-Dateien aus einem Harvest entstehenwelche gemeinsam in einem SIP ingestiert und danach ins digitale Langzeitarchiv überführt werden.  +
-Für mehr Informationen zur Web-Archivierung siehe auch [[https://de.wikipedia.org/wiki/Web-Archivierung |Wikipedia]] +
- +
-- Wie kann ich die Website, wenn sie im digitalen Langzeitarchiv liegt, betrachten? +
-WARC-DAtein können nicht einfach geöffnet werden, es braucht dazu eine Software. Es gibt mehrere Optionen, wobei bei docuteam aktuell die open-source Desktop-Applikation [[https://rhizome.org/software/|Webrecorder-player]] (Projekt von Rhizomedafür eingesetzt wirdDiese kann gratis [[https://github.com/webrecorder/webrecorder-player|auf github]] heruntergeladen werden. Es kann jeweils nur ein Warc-File nach dem anderen betrachtet werden. Es ist gut möglichdass das Resultat von der originalen Website abweicht.+
  
 +2) Wie kann ich die Website, wenn sie im digitalen Langzeitarchiv liegt, betrachten?\\
 +WARC-Dateien können nicht einfach mit Doppelklick geöffnet werden, es braucht dazu eine spezielle Software. Es gibt mehrere Optionen dafür, beispielsweise die open-source Desktop-Applikation [[https://rhizome.org/software/|Webrecorder-player]]. Diese kann [[https://github.com/webrecorder/webrecorder-player|hier]] heruntergeladen werden. Es kann jeweils nur ein WARC-File aufs Mal betrachtet werden. Für ein besseres Erlebnis von Harvests, die von docuteam erstellt worden sind, stellt docuteam eine Openwayback-Instanz zur Verfügung. Diese kann nach vorgängiger Anmeldung in Baden vor Ort genutzt werden.
docuteam/webgate.1583840588.txt.gz · Zuletzt geändert: 2020/03/10 12:43 von penelope

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki