Hier ist eine Übersicht über empfohlene Dateiformate für die Digitalisierung von Archiven, basierend auf bewährten Archivierungsstandards.
Bei der Langzeitarchivierung digitaler Inhalte sind stabile, weit verbreitete und nicht-proprietäre Formate entscheidend. Diese Formate sind besonders gut für die Archivierung geeignet, weil sie: ✅ Langfristig lesbar bleiben
✅ Offen dokumentiert sind
✅ Keine verlustbehaftete Komprimierung verwenden (wo sinnvoll)
1. Textdokumente & Schriftgut
Format | Erklärung | Bemerkung |
---|---|---|
PDF/A | Langzeitarchivierungsstandard für Dokumente | Eingebettete Schriften, keine externen Abhängigkeiten |
TIFF (für gescannte Dokumente) | Bildformat für gescannte Textseiten | Verlustfrei, aber große Dateigröße |
TXT (UTF-8) | Reiner Text ohne Formatierungen | Gut für Rohtexte & maschinenlesbare Daten |
XML (mit METS/ALTO) | Strukturiertes Datenformat | Für maschinenlesbare Dokumente, OCR-Text |
DOCX (eingeschränkt) | Microsoft Word-Format | Keine Empfehlung für Langzeitarchivierung, sollte in PDF/A konvertiert werden |
Empfohlen: PDF/A für alle finalen digitalen Dokumente, TIFF/XML für digitalisierte Akten mit OCR-Erkennung.
2. Bilder & Digitalisate
Format | Erklärung | Bemerkung |
---|---|---|
TIFF (Tagged Image File Format) | Verlustfreies Format mit hoher Qualität | Standard für Scans von Fotos und Dokumenten |
PNG (Portable Network Graphics) | Verlustfreies komprimiertes Format | Gut für Web und Archiv, aber weniger Metadaten als TIFF |
JPEG 2000 | Bessere Qualität als klassisches JPEG | Verbreitet im Kulturbereich (z. B. Bibliotheken) |
DNG (Digital Negative Format) | Offenes RAW-Format für Fotos | Archivstandard für digitale Fotografie |
Empfohlen: TIFF für Scans, DNG oder JPEG 2000 für Archivierung von digitalen Fotos.
3. Audioformate
Format | Erklärung | Bemerkung |
---|---|---|
WAV (Waveform Audio Format) | Unkomprimiertes Audioformat | Hohe Qualität, große Dateien |
FLAC (Free Lossless Audio Codec) | Verlustfreie Komprimierung | Reduziert Dateigröße ohne Qualitätsverlust |
MP3 (eingeschränkt) | Verlustbehaftetes Format | Nur für Nutzerzugriff, nicht für Langzeitarchivierung |
BWF (Broadcast Wave Format) | Erweiterung von WAV mit Metadaten | Standard für Rundfunk- und Archivnutzung |
Empfohlen: BWF oder WAV für Originalaufnahmen, FLAC für platzsparende Archivierung.
4. Videoformate
Format | Erklärung | Bemerkung |
---|---|---|
MKV (Matroska Video) | Containerformat für Video, Audio & Untertitel | Unterstützt viele Codecs, gut für Archivierung |
MOV (QuickTime Movie Format) | Apple-Standard, oft für Rohvideos | Kann mit verlustfreien Codecs genutzt werden |
MXF (Material Exchange Format) | Professionelles Archivierungsformat | Wird in Rundfunkarchiven genutzt |
MP4 (H.264 / H.265 für Nutzerzugriff) | Weit verbreitetes Format | Gut für Bereitstellung, nicht für Archivierung |
ProRes (Apple ProRes) | Hochwertiger Video-Codec | Oft genutzt in Filmproduktionen |
Empfohlen: MKV oder MXF für Langzeitarchivierung, MP4 nur für Bereitstellung.
5. Datenbanken & Tabellen
Format | Erklärung | Bemerkung |
---|---|---|
CSV (Comma-Separated Values) | Einfaches Format für strukturierte Daten | Sehr langlebig, aber ohne Formatierungen |
JSON (JavaScript Object Notation) | Flexibles Format für strukturierte Daten | Gut für moderne Datenbanken & APIs |
XML | Standardisiertes Metadatenformat | Oft genutzt für archivierte Dokumente |
SQL-Dumps | Gespeicherte Datenbankabfragen | Für relationale Datenbanken |
SIARD (Software-Independent Archiving of Relational Databases) | Speziell für Datenbank-Archivierung | Langzeitarchivierungsstandard für SQL-Daten |
Empfohlen: SIARD für Datenbanken, CSV oder JSON für tabellarische Daten.
Zusätzliche Archivierungsprinzipien
- Redundanz: Mehrere Kopien an unterschiedlichen Standorten speichern.
- Checksummen & Hashwerte: Prüfen die Integrität der Dateien (z. B. SHA-256).
- Langfristige Lesbarkeit: Alle Formate sollten offen dokumentiert und unabhängig von spezieller Software lesbar sein.
- Migration & Emulation: Dateien in neue Formate überführen oder alte Systeme simulieren.
- Metadaten (z. B. PREMIS, METS, Dublin Core): Dokumentation zur Nachvollziehbarkeit jeder Datei.
Fazit
Für eine erfolgreiche Digitalisierung von Archiven sollten stabile, offene und verlustfreie Formate verwendet werden. Jedes Medium (Dokumente, Bilder, Audio, Video) hat spezifische empfohlene Formate, die sich langfristig bewährt haben.