Glossar Digitale Langzeitarchivierung

A
Archiv
Ein Archiv ist eine Organisationseinheit die der langfristigen Aufbewahrung von Dokumenten oder Medien dient. In einem Archiv werden z.B. Papierdokumente (Unternehmensunterlagen, Bücher, Zeitungen, Zeitschriften), digitale Dokumente, Bilder, Filme, Musikdateien und andere Inhalte, die in unveränderbarer Form sortiert und thematisch selektiert sicher aufbewahrt werden sollen, eingelagert und abgelegt.
Archivierung
Unter Archivierung versteht man die unbefristete oder nach gesetzlichen Aufbewahrungsfristen zeitlich begrenzte, systematische Ablage von Dokumenten oder Medien in einem Archiv. Hierbei ist die Archivierung an Vorgaben gebunden wie z.B. Unveränderbarkeit, langfristiges Wiederauffinden der Dokumenten und deren Reproduzierbarkeit.
Archivierungssoftware
Software zur Archivierung und Verwaltung von digitalen Dokumenten oder Medien. Eine Archivierungssoftware umfasst häufig verschiedene Funktionen wie z.B. die revisionssichere Ablage von Dokumenten, umfangreiche Such- bzw. Recherchemöglichkeiten, automatische Löschungsfunktionen, Anlage und Verwaltung vom Zugriffsberechtigungen.
Archivsystem
Gesamtsystem zur Archivierung von Dokumenten oder Medien. Meist bestehend aus einer datenbankbasierten Softwarekomponente, Hardware sowie geeigneten Speichermedien.
Aufbewahrungsfristen
Aufbewahrungsfristen bezeichnen festgelegte Zeiträume, in denen aufbewahrungpflichtige Schriftstücke geordnet archiviert werden müssen. Hierbei gibt es verschiedene gesetzliche Regelungen und Fristen. Unterlagen mit kaufmännischem Charakter müssen beispielsweise gem. Handelsgesetzbuch bzw. Abgabenordnung zwischen sechs und zehn Jahren aufbewahrt werden. Im medizinischen Bereich müssen z.B. Patientenunterlagen, der der Röntgenordnung unterliegen, bis zu 30 Jahren archiviert werden.

B
Backup
Backup – oder auch Datensicherung – bezeichnet das Kopieren und Sichern von Daten mit dem Ziel diese über festgelegte Zeiträume im Falle eines unabsichtlichen Datenverlustes wiederherstellen zu können.
Belegerfassung
Erfassung von Dokumenten für die Archivierung z.B. durch Scannen.

Belegrecherche
Recherche nach bestimmten Dokumenten mit Hilfe von Suchkriterien.
Belegvernichtung
Die Vernichtung von Dokumenten nach erfolgter Übernahme in ein digitales Archiv z.B. durch ersetzendes Scannen.

C
Capturing-Software
Software zur Steuerung von Scannern (auch Scansoftware genannt).
CD-Archvierung
Die Archivierung von Dokumenten oder Medien auf CD-ROM oder DVD.

D
Dateiformate
Ein Dateiformat definiert die Syntax und Semantik von Daten innerhalb einer Datei. Dateiformate werden in der Regel durch Software-Hersteller (proprietäre Dateiformate) oder durch ein Standardisierungsgremium (Standardformate) festgelegt. Standardformate ermöglichen, dass Daten aus verschiedenen Softwaresystemen ausgetauscht und unabhängig von der Entstehungssoftware weiterverarbeitet werden können.
Datenbank
Eine Datenbank ist ein System zur elektronischen Datenverwaltung. Datenbanken ermögliche es, große Datenmengen widerspruchsfrei, dauerhaft und effizient zu speichern und Teilmengen davon bedarfsgerecht bereitzustellen.
Datensicherung
Datensicher – oder auch Backup– bezeichnet das Kopieren und Sichern von Daten mit dem Ziel diese über festgelegte Zeiträume im Falle eines unabsichtlichen Datenverlustes wiederherstellen zu können.
DBMS
Datenbankmanagementsystem
Digitale Archivierung
Oder auch elektronische Archivierung. Unter der digitalen Archivierung versteht man die strukturierte, unveränderbare und langzeitige Aufbewahrung von Daten in digitaler Form.
Digitale, elektronische Signatur
Bei einer digitalen Signatur handelt es sich um eine elektronische Signatur, mit deren Hilfe der Unterzeichner eines Dokuments seine Identität und somit auch die Echtheit seines Dokumentes nachweisen kann. Bei Einhaltung bestimmter Vorgaben lässt sich damit auch sicherstellen, dass der originäre Inhalt eines Dokuments nicht verändert wurde. Die elektronische Signatur erfüllt somit den gleichen Zweck wie eine eigenhändige Unterschrift auf einem Papierdokument. Es gibt verschiedene Ausprägungen der Elektronischen Signatur: Einfache Signatur, fortgeschrittene Signatur und qualifizierte Signatur.
Digitalisat
Ein Dokument, das für die elektronische Verbreitung (z. B. als PDF) aufbereitet wurde. Endprodukt der Digitalisierung.
Digitalisierung
Der Begriff Digitalisierung bezeichnet die Überführung von analogen Vorlagen z.B. Rechnungen in digitale Informationen z.B. durch Scannen zu dem Zweck, sie elektronisch zu speichern oder zu verarbeiten. Das Endprodukt oder Ergebnis der Digitalisierung wird auch als Digitalisat bezeichnet
DMS, Dokumentenmanagement
Unter Dokumentenmanagement wird die datenbankgestützte Verwaltung elektronischer Dokumente, meist unter Zuhilfenahme eines Dokumentenmanagementsystems als Software, verstanden.

G
GoBD
GoBD steht für "Grundsätze zur ordnungsmäßigen Führung und Aufbewahrung von Büchern, Aufzeichnungen und Unterlagen in elektronischer Form sowie zum Datenzugriff". Die GoBD wurden durch das BMBF im November 2014 veröffentlicht und gelten für alle Veranlagungszeiträume ab dem 31.12.2014. Mit den GoBD stellt die Finanzverwaltung klar, welche Vorgaben aus ihrer Sicht für IT-gestützte, steuerrelevante Prozesse zu gelten haben. Darüber hinaus wird beschrieben, in welcher Form und in welchem Umfang Unternehmen Betriebsprüfern Zugriff auf ihren digital erfassten und archivierten Daten zu ermöglichen haben.

H
Hybride Archivierung
Unter hybrider Archivierung verstehe man die das gleichzeitige digitale und analoge Vorhalten von Daten bzw. ein Archivierungssystem, das zwei Speichermöglichkeiten gleichzeitig nutzt.

I
Indexieren
Das Indexieren umfasst die Vor- oder Nacherfassen der Suchkriterien von digitalisierten Dokumenten.

J
JPG
Das Format JPEG (entwickelt von der Joint Photographic Experts Group) eignet sich für Farb- und Grauwertbilder. Es kann anhand einiger Parameter unterschiedlich konfiguriert werden und ist für die Langzeitarchivierung geeignet. Um eine revisionssichere Archivierung zu gewährleisten, wird empfohlen eine verlustfreie Kompressionsstufe zu wählen.

L
Langzeitarchivierung
Unter Langzeitarchivierung versteht man die Erfassung und langfristige Aufbewahrung sowie Erhaltung von Informationen (Akten, Unterlagen, Medien) und die Erhaltung deren dauerhafter Verfügbarkeit.
LTA (Long Term Archiving)
LTA bezeichnet die Symbiose aus technischen Lösungen und Services zur langfristigen Aufbewahrung (Langzeitarchivierung) digitaler Daten.

M
Metadaten (auch Metainformationen)
Metadaten oder auch Metainformationen sind Daten über Daten. Es sind „beschreibende“ Informationen, die wesentliche Informationen z.B. zu einem abgespeicherten Dokument enthalten. Mit Hilfe der Metainformationen lassen sich Daten in Dokumentenmanagement- oder Archivsystemen verwalten und auffinden.
Mikrofilm
Eine Archivierungstechnik, in der Dokumente nach genormten Verkleinerungsfaktoren auf Film aufgenommen werden. Der Mikrofilm ist ein besonders für die Langzeitarchivierung geeignetes Medium, da seine Haltbarkeit mit mehr als 100 Jahren angegeben ist.
Mikroverfilmung
Unter Mikroverfilmung versteht man den Prozess der Abbildung analoger Daten oder Informationen auf speziellen Film z.B. zum Zwecke der Archivierung.

O
OCR
OCR (Optical Character Recognition) ist ein Begriff aus der Informationstechnik und steht für die automatische Texterkennung innerhalb von Bildern oder digitalen Dokumente durch entsprechende Software. Die erkannten Zeichen können für die Verarbeitung z.B. in einem DMS-System verwendet werden und erzeugen so durchsuchbare Dokumente.

P
PDF
Beim PDF (Portable Document Format) werden neben der Strukturinformation von elektronischen Dokumenten auch wesentliche Layout-Informationen mitgespeichert. Das Format wurde auf Basis des Datenformats PostScript entwickelt mit der Zielsetzung, das Erscheinungsbild eines elektronischen Dokuments unabhängig von der zur Erstellung benutzten Anwendungs-Software, der Hardware-Plattform oder dem Betriebssystem zu bewahren.
PDF/A
Für die Langzeitarchivierung wurde eine spezielle PDF-Version, das PDF/A genormt. Bei der Nutzung des Formats ist allerdings die Konformität der Dokumente zur PDF/A-Spezifikation zu überprüfen.

R
Revisionssicherheit
Der Begriff Revisionssicherheit bezieht sich auf elektronische Archivsysteme, die in Deutschland den Anforderungen des Handelsgesetzbuches (§§ 239, 257 HGB), der Abgabenordnung (§§ 146, 147 AO), der Grundsätze ordnungsmäßiger DV-gestützter Buchführungssysteme (GoBS) und weiteren steuerrechtlichen und handelsrechtlichen Vorgaben entsprechen. Der Begriff Revision bezieht sich hierbei auf die Prüfung von Dokumenten in wirtschaftlich-, steuerrechtlicher Sicht. Relevanz hat die Revisionssicherheit für alle aufbewahrungspflichtigen Dokumente.

S
Scan-Software
Software zur Steuerung von Scannern (auch Capturing-Software).
Scannen
Scannen bezeichnet den Prozess der Digitalisierung von analogen Dokumenten (Papier, Film) in digitale Informationen durch verschiedene Scansysteme. Im Rahmen der Archivierung wird das „ersetzende Scannen“ häufig zur Digitalisierung von Dokumenten unter anschließenden Vernichtung des Originalbelegs eingesetzt.
SGML
SGML (Standard Generalized Markup Language) ist eine Dokumentenbeschreibungssprache, welche die logische Struktur und den Inhalt von elektronischen Dokumenten beschreibt. Sie ist lt. BIS zur Archivierung geeignet. Allerdings sollte bei der Archivierung auch die Semantikspezifikation (DTD, Document Type Definitions) archiviert werden. Es wird darüber hinaus auch empfohlen, zusätzlich zu SGML-Dokumenten eine graphische Repräsentation des Ursprungsdokuments zu archivieren, z. B. im Format TIFF, da das Format SGML selbst keine Layout-Informationen enthält.

T
TIFF
Zur Speicherung gerasteter Bilder wird das TIFF (Tagged Image File Format) verwendet. Eine TIFF-Datei besteht aus einem Datei-Header und der Bildinformation. Im Header werden Eigenschaften des Bildes, die so genannten Tags, gespeichert. Hierbei kann es sich beispielsweise um die Auflösung oder das verwendete Kompressionsverfahren handeln. In komprimierter Form ist TIFF ein für die Langzeitarchivierung geeignetes Format. Hierbei wird allerdings empfohlen ein verlustfreies Kompressionsverfahren zur Minimierung des Speicherbedarfs zu verwenden.

U
Unveränderbarkeit
Bei der Archivierung versteht man unter Unveränderbarkeit, dass die z.B. in einem DMS-System erfassten Dokumente keine nachträglich Veränderung zulassen. Die Unveränderbarkeit von digitalen Dokumenten ist ein Merkmal der revisionssicheren Archivierung..

W
WORM
WORM ist die Abkürzung für „write once read many“ oder „write once read multiple“ (engl. „schreibe einmal, lese vielfach“). Die Abkürzung bezeichnet Vorkehrungen, die das Löschen, Überschreiben und Ändern von Daten auf einem Speichermedium dauerhaft ausschließen, so dass die erfassten Daten auf dem verwendeten Speicher nach dem Beschreiben nur noch gelesen werden können.

X
XML
Extensible Markup Language abgekürzt XML, ist eine Auszeichnungssprache zur Darstellung hierarchisch strukturierter Daten in Form von Textdateien. XML wird u. a. für den Austausch von Daten zwischen Computersystemen eingesetzt, insbesondere über das Internet. XML kann aufgrund einer geringeren Komplexität als Format für die Langzeitarchivierung genutzt werden. Jedoch sollten bei der Archivierung auf alle Fälle auch die Semantikspezifikation (DTD - Document Type Definition) und ggf. auch die Layout-Informationen, in XSL beschrieben, mit archiviert werden.

Z
Zeitstempel
Zeitstempel bescheinigen, dass ein elektronisches Dokument zu der angegebenen Zeit dem Aussteller des Zeitstempels vorgelegen hat. Sie ergänzen den Einsatz der elektronischen Signaturen im Rechtsverkehr.