Von Christian Keitel
Datenbanken sind Softwareprogramme, die es ermöglichen, eine große Zahl unterschiedlicher Informationen sicher und widerspruchsfrei zu verwalten. Diese Informationen können in immer neuen Konstellationen zusammengestellt und ausgegeben werden. Dabei sind die internen Gestaltungsregeln der Datenbank zu beachten.
Die Grundlagen in der Datenbanktechnologie wurden in den 1960er Jahren gelegt (hierarchische Datenbanken). Anfang der 1970er Jahre entwickelte Edgar F. Codd die relationalen Datenbanken, die heute die mit Abstand weiteste Verbreitung haben. Daneben gibt es noch netzwerkbasierte, objektorientierte und dokumentbasierte Datenbanken und zahlreiche Übergänge zwischen diesen Formen.
Relationale Datenbanken speichern Inhalte in Tabellen. Jeder einzelne Wert ist eindeutig und unveränderbar einer Spalte und einem Datensatz zugeordnet. Zu den Gestaltungsregeln der Datenbank gehören auch die Charakteristika der einzelnen Spalten (z.B. Feldtypen wie Text, Datum oder Zahl) und der Verknüpfungen.
Bislang standen eigenständige Datenbanken, die nicht Teil eines ganzen Programmpakets waren, nicht oft zur Bewertung an. Entsprechend selten finden diese sich daher auch unter den Archivalien. Häufig besaßen diese Datenbanken schon bei der abgebenden Behörde die Funktion eines Findmittels.[1] Viel häufiger kommt es vor, dass andere Softwareprogramme Informationen durch Datenbanken verwalten lassen:
Die in den ersten beiden Fällen aus diesen Unterlagen exportierten Archivierungspakete basieren nicht mehr auf Datenbanktechnologie. Nur bei den im dritten Spiegelstrich genannten Gattungen liegen auch nach dem Export aus dem laufenden System und der Abgabe ans Archiv noch Dateien vor, die sich am besten in einer Datenbank auswerten lassen.
Einerseits ermöglichen Datenbanken immer wieder neue Sichten auf das verfügbare Datenmaterial. Zum anderen sind die Nutzer dabei nach wie vor an die Gestaltungsregeln der Datenbank gebunden. Jeder Tabellenwert ist so eindeutig seinem Datensatz und seiner Spalte zugeordnet. Ebenso sind auch Feldwerte, Feldlängen, Verknüpfungen usw. zu berücksichtigen.[2]
Für die Nutzung müssen die zumeist in CSV, XML oder SIARD abgelegte Tabelleninhalte in eine Datenbank überführt werden, die zum Zeitpunkt der Nutzung aktuell ist.
Datenbanken unterliegen in aller Regel noch den allgemeinen, häufig auch den personenbezogenen Sperrfristen. In manchen Fällen ist es denkbar, zur Vorbereitung der Nutzung aus kopierten Daten die Spalten mit Personenbezug zu löschen. Die so erstellten Nutzungspakete (DIPs) unterliegen dann nur noch der allgemeinen Sperrfrist. Ob dieser Weg auch praktisch umsetzbar ist, hängt sowohl von der Fragestellung des Nutzers als auch von den Ressourcen des verwahrenden Archivs ab.
[1] Beispiele: Eine von der Deutschen Bahn übernommene Datenbank zur Übersicht über die ebenfalls übernommenen Hochbaupläne, StAL K 412 IV DO 16388 oder auch eine Datenbank der Akademie Solitude zur Verwaltung des Künstlerarchivs, StAL EL 237 II DO 1 und EL 237 II DO 7. [2] Unterschiedliche Einschätzungen hierzu bei Bischoff, Bewertung und bei Keitel, Unterlagen.
Zitierhinweis: Christian Keitel, Datenbanken, in: Südwestdeutsche Archivalienkunde, URL: […], Stand: 20.11.2017.