Übersicht: Empfohlene Dateiformate für die Digitalisierung von Archiven

Hier ist eine Übersicht über empfohlene Dateiformate für die Digitalisierung von Archiven, basierend auf bewährten Archivierungsstandards.


Bei der Langzeitarchivierung digitaler Inhalte sind stabile, weit verbreitete und nicht-proprietäre Formate entscheidend. Diese Formate sind besonders gut für die Archivierung geeignet, weil sie: ✅ Langfristig lesbar bleiben
Offen dokumentiert sind
Keine verlustbehaftete Komprimierung verwenden (wo sinnvoll)


1. Textdokumente & Schriftgut

Format Erklärung Bemerkung
PDF/A Langzeitarchivierungsstandard für Dokumente Eingebettete Schriften, keine externen Abhängigkeiten
TIFF (für gescannte Dokumente) Bildformat für gescannte Textseiten Verlustfrei, aber große Dateigröße
TXT (UTF-8) Reiner Text ohne Formatierungen Gut für Rohtexte & maschinenlesbare Daten
XML (mit METS/ALTO) Strukturiertes Datenformat Für maschinenlesbare Dokumente, OCR-Text
DOCX (eingeschränkt) Microsoft Word-Format Keine Empfehlung für Langzeitarchivierung, sollte in PDF/A konvertiert werden

Empfohlen: PDF/A für alle finalen digitalen Dokumente, TIFF/XML für digitalisierte Akten mit OCR-Erkennung.


2. Bilder & Digitalisate

Format Erklärung Bemerkung
TIFF (Tagged Image File Format) Verlustfreies Format mit hoher Qualität Standard für Scans von Fotos und Dokumenten
PNG (Portable Network Graphics) Verlustfreies komprimiertes Format Gut für Web und Archiv, aber weniger Metadaten als TIFF
JPEG 2000 Bessere Qualität als klassisches JPEG Verbreitet im Kulturbereich (z. B. Bibliotheken)
DNG (Digital Negative Format) Offenes RAW-Format für Fotos Archivstandard für digitale Fotografie

Empfohlen: TIFF für Scans, DNG oder JPEG 2000 für Archivierung von digitalen Fotos.


3. Audioformate

Format Erklärung Bemerkung
WAV (Waveform Audio Format) Unkomprimiertes Audioformat Hohe Qualität, große Dateien
FLAC (Free Lossless Audio Codec) Verlustfreie Komprimierung Reduziert Dateigröße ohne Qualitätsverlust
MP3 (eingeschränkt) Verlustbehaftetes Format Nur für Nutzerzugriff, nicht für Langzeitarchivierung
BWF (Broadcast Wave Format) Erweiterung von WAV mit Metadaten Standard für Rundfunk- und Archivnutzung

Empfohlen: BWF oder WAV für Originalaufnahmen, FLAC für platzsparende Archivierung.


4. Videoformate

Format Erklärung Bemerkung
MKV (Matroska Video) Containerformat für Video, Audio & Untertitel Unterstützt viele Codecs, gut für Archivierung
MOV (QuickTime Movie Format) Apple-Standard, oft für Rohvideos Kann mit verlustfreien Codecs genutzt werden
MXF (Material Exchange Format) Professionelles Archivierungsformat Wird in Rundfunkarchiven genutzt
MP4 (H.264 / H.265 für Nutzerzugriff) Weit verbreitetes Format Gut für Bereitstellung, nicht für Archivierung
ProRes (Apple ProRes) Hochwertiger Video-Codec Oft genutzt in Filmproduktionen

Empfohlen: MKV oder MXF für Langzeitarchivierung, MP4 nur für Bereitstellung.


5. Datenbanken & Tabellen

Format Erklärung Bemerkung
CSV (Comma-Separated Values) Einfaches Format für strukturierte Daten Sehr langlebig, aber ohne Formatierungen
JSON (JavaScript Object Notation) Flexibles Format für strukturierte Daten Gut für moderne Datenbanken & APIs
XML Standardisiertes Metadatenformat Oft genutzt für archivierte Dokumente
SQL-Dumps Gespeicherte Datenbankabfragen Für relationale Datenbanken
SIARD (Software-Independent Archiving of Relational Databases) Speziell für Datenbank-Archivierung Langzeitarchivierungsstandard für SQL-Daten

Empfohlen: SIARD für Datenbanken, CSV oder JSON für tabellarische Daten.


Zusätzliche Archivierungsprinzipien

  1. Redundanz: Mehrere Kopien an unterschiedlichen Standorten speichern.
  2. Checksummen & Hashwerte: Prüfen die Integrität der Dateien (z. B. SHA-256).
  3. Langfristige Lesbarkeit: Alle Formate sollten offen dokumentiert und unabhängig von spezieller Software lesbar sein.
  4. Migration & Emulation: Dateien in neue Formate überführen oder alte Systeme simulieren.
  5. Metadaten (z. B. PREMIS, METS, Dublin Core): Dokumentation zur Nachvollziehbarkeit jeder Datei.

Fazit

Für eine erfolgreiche Digitalisierung von Archiven sollten stabile, offene und verlustfreie Formate verwendet werden. Jedes Medium (Dokumente, Bilder, Audio, Video) hat spezifische empfohlene Formate, die sich langfristig bewährt haben.

Schreibe einen Kommentar