Von Christian Keitel
Nach Hans Kellerer ist Statistik eine Methode zur „Sammlung, Aufbereitung, Analyse und Interpretation nummerischer Daten, um die Strukturen von Massenerscheinungen zu erkennen.“[1] Die in südwestdeutschen Archiven liegenden Statistiken dürften in den meisten Fällen der amtlichen Statistik entstammen. Sie bilden mit Worten und vor allem auch Zahlen Informationen zu einzelnen Bereichen wie Bevölkerung, Umwelt, Politik und Wirtschaft ab. Statistiken können als eine verhältnismäßig einfache Form von Fachverfahren verstanden werden.
Zu den ältesten Statistiken zählen die bereits im Altertum bekannten Volkszählungen. Sofern wir Volkszählungen als Erfassung aller Einwohner verstehen, lassen sie sich 1449 in Nürnberg, 1468 in Konstanz und 1470 sowie 1530 in Speyer nachweisen.[2] Volkszählungen im Sinne der modernen Statistik wurden in Württemberg erstmals 1835 und in Baden 1836 durchgeführt.[3] Beide Zählungen wurden nach Vorgaben des Deutschen Zollvereins umgesetzt. Während diese frühen Volkszählungen noch summarische Angaben für jeden einzelnen Ort ermittelten, waren die nach der Gründung des Deutschen Reichs ab 1871 durchgeführten Volkszählungen auf die einzelnen Bewohner bezogen. Erhoben wurden Name, Stellung im Haushalt, Geschlecht, Geburtsjahr, Geburtsort, Familienstand, Konfession, Beruf oder Erwerbszweig, Staatsangehörigkeit, Wohnort sowie Name und Stellung der Personen, die zum Stichtag abwesend waren. Auch die Volkszählungen 1970 und 1987 enthalten noch diese Angaben. Heute erfassen Statistiken alle Bereiche von Gesellschaft und Umwelt. Das „Einheitliche Verzeichnis aller Statistiken der Statistischen Ämter des Bundes und der Länder“ (EVAS) nennt als Großgruppen:
Ältere Statistiken liegen oft in Listenform vor, im 20. Jahrhundert überwiegt die tabellarische Darstellung. Dabei umfassen die meisten Statistiken nur eine einzige Tabelle. In der Regel liegen die Inhalte in digital gespeicherten Statistiken in codierter, d.h. verschlüsselter Form vor. Im Feld „Geschlecht“ stehen dann 1, 2 und 9 für männlich, weiblich und unbekannt.
Statistiken haben die Archive in sehr unterschiedlichen Überlieferungsformen erreicht. Ältere Statistiken sind in der Regel aggregierte Ergebnisse von durchgeführten Zählungen. Im 20. Jahrhundert haben Archive teilweise auch die originalen Erhebungsbögen übernommen, die allerdings aufgrund ihres säurehaltigen Papiers zumeist schon aus Erhaltungsgründen kaum benutzt werden können. In den 1950er Jahren diskutierten daher die Leiter der staatlichen Archivverwaltung des Bundes und der Länder in der Archivreferentenkonferenz (ARK) mögliche Maßnahmen zur Sicherung der Volkszählung von 1950, die jedoch aufgrund fehlender Ressourcen nicht umsetzbar waren. Erst vor wenigen Jahren wurden erste Projekte zur Mikroverfilmung und Digitalisierung in Angriff genommen, die noch eine lange Laufzeit haben werden.
Seit 1910 setzten die Statistischen Ämter in Stuttgart und Karlsruhe auch Lochkarten zur Auswertung der Statistiken ein, ein Überlieferungsstrang, der offenbar vollständig verloren ging. Seit 1961 kommen im Statistischen Landesamt Baden-Württemberg auch Computer zum Einsatz. Das älteste digitale Archivale entstammt der Volkszählung 1961 und enthält die Ergebnisse der Auswertungsläufe der Lochkarten. Zur Volkszählung 1970 und 1987 liegen im Landesarchiv die nicht aggregierten und weitgehend plausibilisierten Mikrodaten vor.[5] In den letzten Jahren konnten außerdem Auszüge der Struktur- und Regionaldatenbank übernommen werden, in die die zumeist auf Ortsebene aggregierten Ergebnisse zahlreicher Statistiken eingeflossen sind.[6]
Die gerade für die älteren Statistiken unbefriedigende Überlieferungslage ist nicht zuletzt darauf zurückzuführen, dass die tabellarisch erfassten Ausgangsdaten in der ersten Hälfte des 20. Jahrhunderts in der archivischen Fachdiskussion als nicht auf Dauer aufbewahrenswert eingestuft wurden. Trotz einiger weniger mahnender früherer Stimmen werden sie erst seit den 1970er Jahren als potentielles Archivgut angesehen; Rainer Stahlschmidt hat hierzu 1977 einen bahnbrechenden Beitrag veröffentlicht.[7] Für den Südwesten ist dennoch eine insgesamt positive Überlieferungslage zu konstatieren, da das Landesarchiv Baden-Württemberg ebenso wie viele andere Archive seine ersten Schritte in die digitale Archivierung anhand von Statistiken vollzogen hat. Zum gegenwärtigen Zeitpunkt (2017) liegen daher bereits 15 Jahre Erfahrung mit der Archivierung von Statistiken vor.[8] Perspektivisch sollen beim Landesarchiv von den 580 Statistiken des EVAS auf Empfehlung einer Arbeitsgruppe der Konferenz der Leiterinnen und Leiter der Archivverwaltungen des Bundes und der Länder (KLA) 77 Statistiken als archivwürdig bewertet werden.[9]
Die zunächst auf Großrechnern geführten Statistiken liegen zunächst im Zeichenformat EBCDIC vor. Sie werden vom Statistischen Amt ins ASCII-Format überführt und im Archiv in CSV-codierten Tabellen abgelegt. Es kann sinnvoll sein, Dateien, die mehrere Datensatztypen enthalten, dabei aufzuteilen. Die weitere archivische Aufbereitung konzentriert sich auf das Zusammenstellen erläuternder Metadaten und weitergehender Dokumentation.
Statistiken fallen nicht nur in der staatlichen, sondern auch in der kommunalen Verwaltung an. So hat das Stadtarchiv Stuttgart bereits die Statistiken Kleinräumige Gliederung, KFZ-Daten, Einwohnerdaten, Flächennutzung, Baudaten, Wahldaten, Volksabstimmung und Bürgerumfragen übernommen.
Systematisch können bei modernen Statistiken mehrere Formen unterschieden werden:
Die erstgenannte Form eignet sich vor allem für Nutzungsanfragen, die auf eine einzelne Information abzielen. In England zählen beispielsweise die Bögen zu den im 19. Jahrhundert durchgeführten Volkszählungen zu den beliebtesten genealogischen Quellen überhaupt. Dagegen würde eine computergestützte Auswertung einen sehr aufwändigen Erhebungsprozess erfordern, was den meisten Nutzern nicht möglich sein dürfte.[10]
Die erhobenen Rohdaten dürfen nach dem gegenwärtigen Stand der Datenschutzgesetze nicht an die Archive abgegeben werden.
Die plausibilisierten Rohdaten ermöglichen es, mehrere Felder zugleich abzufragen. Für die Volkszählung 1970 könnte so die Zahl der Fernpendler mit Schulabschluss X und Beruf Y abgefragt werden. Wobei auch eine vom Statistischen Amt vorgenommene Plausibilisierung keine Sicherheit dafür bietet, dass sämtliche internen Widersprüche der Daten aufgelöst werden konnten. Ein Beispiel: Ebenfalls bei der Volkszählung 1970 behaupteten über 2900 Personen, keine Zweitwohnung zu besitzen, um auf die nächste Frage hin konkrete Eigenschaften der angeblich nicht vorhandenen Zweitwohnung zu beschreiben.[11]
Aggregierte Daten besitzen den Nachteil, nicht Feld übergreifend abfragbar zu sein. Auf der anderen Seite ermöglichen es große, auf Ortsebene aggregierte Informationssysteme wie die Struktur- und Regionaldatenbank SRDB, Daten statistikübergreifend abzufragen.[12]
Sofern die Informationen nur in codierter Form vorliegen, müssen diese mit Hilfe von Codelisten aufgelöst werden. Gerade bei Statistiken, die in längeren Reihen vorliegen (z.B. die Geburtenstatistik von 1968 bis 1999) muss darauf geachtet werden, dass sich in diesem Zeitraum die heranzuziehenden Codelisten ändern können. Ändern können sich beispielsweise die Gemeindekennziffern im Zuge von Zusammenlegungen und (seltener) Aufspaltungen der einzelnen Gemeinden.
Statistiken, die personenbezogene Informationen enthalten, sind sechzig Jahre unverkürzbar gesperrt. Es gibt daher keine Möglichkeit, eine Sperrfristverkürzung zu beantragen. Manchmal besteht jedoch die Möglichkeit, dass das Archiv aus den archivierten Daten in Kopie die Spalten löscht, die personenbezogen sind. Im Anschluss fallen diese Kopien nur noch unter die allgemeinen Sperrfristen, eine Möglichkeit zur Sperrfristenverkürzung eröffnet sich dann wieder.
Die meisten Forschungsbeiträge beschäftigen sich mit der Bewertung und Archivierung der Statistiken. Bei der Nutzung dominieren die statistisch ausgerichteten Beiträge. Die Internet-Informationssysteme der Statistischen Ämter können als eine Form der Edition aggregierter Daten verstanden werden.[13] Ältere Statistiken wurden in aggregierter Form in den Publikationsreihen der Statistischen Ämter veröffentlicht.
Zitierhinweis: Christian Keitel, Statistiken, in: Südwestdeutsche Archivalienkunde, URL: […], Stand: 20.11.2017.