Service

Zielgruppe des Digital Preservation System EWIG

Zielgruppe von EWIG sind öffentlich-rechtlich organisierte Institutionen mit einem Schwerpunkt auf der Region Berlin-Brandenburg.

EWIG wird in erster Linie eingesetzt für die Bewahrung des digitalen Kulturerbes Berlins und Brandenburgs, insbesondere von Beständen der im Kooperativen Bibliotheksverbund Berlin Brandenburg (KOBV) zusammengeschlossenen Bibliotheken und der vom Land Berlin geförderten Partner des Forschungs- und Kompetenzzentrums Berlin (digiS).

Sonstige Institutionen aus Wissenschaft und Forschung können ebenfalls ihre wissenschaftlichen Sammlungen oder Forschungsdaten mit EWIG im ZIB langzeitarchivieren. Es werden Leistungsvereinbarungen über die digitale Langzeitverfügbarkeit mit befristeter Laufzeit oder unbefristet geschlossen. Vertragspartner können ausschließlich juristische Personen sein.

Es werden keine zusätzlichen, detaillierten Übernahmevereinbarungen geschlossen. Für Mitgliedseinrichtungen bzw. Partnerinstitutionen von KOBV und digiS gelten gesonderte Bedingungen zur Teilnahme am Service. Alle anderen Interessenten können individuelle Vereinbarungen mit dem ZIB schließen.

Eigenschaften von EWIG

Alle Daten von EWIG werden vor Ort im ZIB verarbeitet und physisch gespeichert. Eine möglichst flexible, modulare Architektur aus freier und Open-Source-Software (FOSS) dient dazu, die sehr unterschiedlichen Quellsysteme und Lieferwege von Bibliotheken, Museen und Archiven adressieren zu können.

Beim Ingest gibt es keine Beschränkung auf bestimmte Datenformate. Transferwege ins Archiv und Ordnerstruktur von Daten-Lieferungen können flexibel gehandhabt werden.

Die Langzeitarchivierungsstrategie von EWIG ist Migration, Emulation wird derzeit nicht als Service angeboten.

EWIG arbeitet als „Dark Archive“ im Hintergrund – für Endnutzer ist es nicht möglich, direkten Einblick ins Archiv zu erhalten. Es gibt keine Zugriffe auf Nutzungskopien, der Zugriff für die Partner (Access) erfolgt durch Rücklieferung von Archivpaketen. Nutzungskopien für das erneute Einspielen in eigene Präsentationssysteme muss der Vertragspartner selbst erstellen.

EWIG sichert Masterdaten und zugehörige Metadaten = Objekte. Komplexe Web-Anwendungen, archivische Fachverfahren oder Datenbanken werden derzeit nicht übernommen.

Je nach (technischer) Kompetenz beim Vertragspartner gehört eine umfangreiche Unterstützung und Beratung zum Service. Die Leistung des ZIB ist dabei auch abhängig von der Qualität gelieferter Daten und Metadaten. Bei hoher Qualität und umfangreichen Metadaten kommt das Konzept der Active Preservation zum Tragen: Das Langzeitarchiv kann sich intensiv um die Erhaltung kümmern. Bei geringer Qualität kann nur passive Speicherung angeboten werden mit höherem Risiko eines zukünftigen Datenverlust (Passive Preservation).

Das Speichermedium ist Magnetband, alle Daten werden vor Ort am ZIB gespeichert.

Magnetbandarchiv im Keller des ZIB
Magnetbandarchiv im Keller des ZIB

Archivpakete werden in EWIG nicht logisch sondern physisch in Form von Dateien vorgehalten, was den Export aller Daten im Sinn einer Exitstrategie weniger fehleranfällig macht. Die Informationspakete enthalten alle Daten, sind also selbsterklärend. Eine besondere Abhängigkeit von einzelnen Softwareanbietern (Vendor-Lockin) kann durch Einsatz mehrerer Komponenten von Open-Source und freier Software vermieden werden. Ein Export des archivierten Bestands in EWIG sind in nicht-proprietärer Form möglich. Exportierte Archivpakete können auf Grundlage der offenen Paketstruktur in Fremdsysteme übernommen werden.

Architektur des Systems

EWIG ist kein monolithisches System sondern besteht aus mehreren modular miteinander verknüpften Komponenten von freier und Open-Source-Software (FOSS). Diese Anwendungsarchitektur folgt der Open-Science Policy des ZIB. Ergänzt werden die FOSS-Komponenten um Bausteine und Schnittstellen in Eigenentwicklung für die Vorverarbeitung (Pre-Ingest), Kommunikation zwischen den Komponenten und zur Verwaltung der Daten.

Datenflüsse innerhalb des Langzeitarchivs EWIG
Schematische Übersicht der EWIG-Architektur mit Datenflüssen im System


Software-Komponenten von EWIG:

  • Archivematica (Ingestworkflow)
  • iRODS (Speicherverwaltung)
  • Fedora (Repository für Zugriffsderivate)
  • Verwaltungsdatenbank mit Reporting-Funktion (Eigenentwicklung)
Logo-Archivematica

Archivematica wird vom Hersteller artefactual in Kanada in Zusammenarbeit mit einer weltweiten Community weiterentwickelt. Es steht unter einer freien Lizenz zur Nutzung zur Verfügung (GNU Affero General Public License AGPL 3). Archivematica ist ursprünglich mit Schwerpunkt auf Einzelplatznutzer entwickelt worden und ist nicht mandantenfähig. Das EWIG verwendet nicht die grafische Benutzerschnittstelle von Archivematica.

Logo iRODS

iRODS (Integrated Rule-Oriented Data System, unter BSD-Lizenz) ist eine zusätzliche Datenmanagementschicht, die in der logischen Verarbeitungspipeline zwischen Archivematica und dem ZIB-Archivspeicher positioniert ist. iRODS ist in Archivematica als Speicherort (Archival Storage) definiert und verteilt die Archivpakete an physischen Speicherorten (Storage Tiering) – derzeit ausschließlich das Storage Area Network mit dem Magnetbandarchiv des ZIB. Weitere externe Speicherorte können bei Bedarf flexibel angesteuert werden.

Logo Fedora

Fedora ist eine weitverbreitete Repositorysoftware, die als Teil von EWIG für die interne Verwaltung von Dissemination Information Packages genutzt wird. Zwar spielt EWIG diese DIPs nicht an Nutzer aus, die enthaltenen Derivate zu den archivierten Masterdateien sind aber für administrative Zwecke geeignet. Daten aus Fedora werden auch für die Erstellung des Submission Reports beim Abschluss jeder Lieferung verwendet.

Logo Reporting Dashboard

Für die Speicherung aller Informationen über Archivinhalte und Lieferungen inklusive Vertragsdaten, Paketidentifikatoren und Ansprechpartner bei den Datengebern wird Linked Data Technologie eingesetzt: Eine auf Apache Jena Fuseki basierende Triplestore-Datenbank. Zur Abfrage von Metainformationen im Triplestore dient ein in Eigenentwicklung entstandenes Reporting Dashboard, welches derzeit nur interne Abfragen zulässt – zukünftig aber auch direkte externe Zugriffe mit Anfragen über Archivinhalte durch die Datengeber erlauben soll. Als Schnittstelle zwischen allen Komponenten bzw. nach außen dient die EWIG-API, die gleichsam den Kern der Eigenentwicklung in EWIG ausmacht.