Statistiken
Von Christian Keitel
Definition der Quellengattung
Nach Hans Kellerer ist Statistik eine Methode zur „Sammlung, Aufbereitung, Analyse und Interpretation nummerischer Daten, um die Strukturen von Massenerscheinungen zu erkennen.“[1] Die in südwestdeutschen Archiven liegenden Statistiken dürften in den meisten Fällen der amtlichen Statistik entstammen. Sie bilden mit Worten und vor allem auch Zahlen Informationen zu einzelnen Bereichen wie Bevölkerung, Umwelt, Politik und Wirtschaft ab. Statistiken können als eine verhältnismäßig einfache Form von Fachverfahren verstanden werden.
Historische Entwicklung
Zu den ältesten Statistiken zählen die bereits im Altertum bekannten Volkszählungen. Sofern wir Volkszählungen als Erfassung aller Einwohner verstehen, lassen sie sich 1449 in Nürnberg, 1468 in Konstanz und 1470 sowie 1530 in Speyer nachweisen.[2] Volkszählungen im Sinne der modernen Statistik wurden in Württemberg erstmals 1835 und in Baden 1836 durchgeführt.[3] Beide Zählungen wurden nach Vorgaben des Deutschen Zollvereins umgesetzt. Während diese frühen Volkszählungen noch summarische Angaben für jeden einzelnen Ort ermittelten, waren die nach der Gründung des Deutschen Reichs ab 1871 durchgeführten Volkszählungen auf die einzelnen Bewohner bezogen. Erhoben wurden Name, Stellung im Haushalt, Geschlecht, Geburtsjahr, Geburtsort, Familienstand, Konfession, Beruf oder Erwerbszweig, Staatsangehörigkeit, Wohnort sowie Name und Stellung der Personen, die zum Stichtag abwesend waren. Auch die Volkszählungen 1970 und 1987 enthalten noch diese Angaben. Heute erfassen Statistiken alle Bereiche von Gesellschaft und Umwelt. Das „Einheitliche Verzeichnis aller Statistiken der Statistischen Ämter des Bundes und der Länder“ (EVAS) nennt als Großgruppen:
- Gebiet, Bevölkerung, Arbeitsmarkt, Wahlen
- Bildung, Sozialleistungen, Gesundheit, Rechtspflege
- Wohnen, Umwelt
- Wirtschaftsbereiche
- Außenhandel, Unternehmen, Handwerk
- Preise, Verdienste, Einkommen und Verbrauch
- Öffentliche Finanzen, Steuern und Personal im öffentlichen Dienst
- Gesamtrechnungen
- Sonderbereiche.[4]
Aufbau und Inhalt
Ältere Statistiken liegen oft in Listenform vor, im 20. Jahrhundert überwiegt die tabellarische Darstellung. Dabei umfassen die meisten Statistiken nur eine einzige Tabelle. In der Regel liegen die Inhalte in digital gespeicherten Statistiken in codierter, d.h. verschlüsselter Form vor. Im Feld „Geschlecht“ stehen dann 1, 2 und 9 für männlich, weiblich und unbekannt.
Überlieferungslage und ggf. vorarchivische/archivische Bearbeitungsschritte
Statistiken haben die Archive in sehr unterschiedlichen Überlieferungsformen erreicht. Ältere Statistiken sind in der Regel aggregierte Ergebnisse von durchgeführten Zählungen. Im 20. Jahrhundert haben Archive teilweise auch die originalen Erhebungsbögen übernommen, die allerdings aufgrund ihres säurehaltigen Papiers zumeist schon aus Erhaltungsgründen kaum benutzt werden können. In den 1950er Jahren diskutierten daher die Leiter der staatlichen Archivverwaltung des Bundes und der Länder in der Archivreferentenkonferenz (ARK) mögliche Maßnahmen zur Sicherung der Volkszählung von 1950, die jedoch aufgrund fehlender Ressourcen nicht umsetzbar waren. Erst vor wenigen Jahren wurden erste Projekte zur Mikroverfilmung und Digitalisierung in Angriff genommen, die noch eine lange Laufzeit haben werden.
Seit 1910 setzten die Statistischen Ämter in Stuttgart und Karlsruhe auch Lochkarten zur Auswertung der Statistiken ein, ein Überlieferungsstrang, der offenbar vollständig verloren ging. Seit 1961 kommen im Statistischen Landesamt Baden-Württemberg auch Computer zum Einsatz. Das älteste digitale Archivale entstammt der Volkszählung 1961 und enthält die Ergebnisse der Auswertungsläufe der Lochkarten. Zur Volkszählung 1970 und 1987 liegen im Landesarchiv die nicht aggregierten und weitgehend plausibilisierten Mikrodaten vor.[5] In den letzten Jahren konnten außerdem Auszüge der Struktur- und Regionaldatenbank übernommen werden, in die die zumeist auf Ortsebene aggregierten Ergebnisse zahlreicher Statistiken eingeflossen sind.[6]
Die gerade für die älteren Statistiken unbefriedigende Überlieferungslage ist nicht zuletzt darauf zurückzuführen, dass die tabellarisch erfassten Ausgangsdaten in der ersten Hälfte des 20. Jahrhunderts in der archivischen Fachdiskussion als nicht auf Dauer aufbewahrenswert eingestuft wurden. Trotz einiger weniger mahnender früherer Stimmen werden sie erst seit den 1970er Jahren als potentielles Archivgut angesehen; Rainer Stahlschmidt hat hierzu 1977 einen bahnbrechenden Beitrag veröffentlicht.[7] Für den Südwesten ist dennoch eine insgesamt positive Überlieferungslage zu konstatieren, da das Landesarchiv Baden-Württemberg ebenso wie viele andere Archive seine ersten Schritte in die digitale Archivierung anhand von Statistiken vollzogen hat. Zum gegenwärtigen Zeitpunkt (2017) liegen daher bereits 15 Jahre Erfahrung mit der Archivierung von Statistiken vor.[8] Perspektivisch sollen beim Landesarchiv von den 580 Statistiken des EVAS auf Empfehlung einer Arbeitsgruppe der Konferenz der Leiterinnen und Leiter der Archivverwaltungen des Bundes und der Länder (KLA) 77 Statistiken als archivwürdig bewertet werden.[9]
Die zunächst auf Großrechnern geführten Statistiken liegen zunächst im Zeichenformat EBCDIC vor. Sie werden vom Statistischen Amt ins ASCII-Format überführt und im Archiv in CSV-codierten Tabellen abgelegt. Es kann sinnvoll sein, Dateien, die mehrere Datensatztypen enthalten, dabei aufzuteilen. Die weitere archivische Aufbereitung konzentriert sich auf das Zusammenstellen erläuternder Metadaten und weitergehender Dokumentation.
Statistiken fallen nicht nur in der staatlichen, sondern auch in der kommunalen Verwaltung an. So hat das Stadtarchiv Stuttgart bereits die Statistiken Kleinräumige Gliederung, KFZ-Daten, Einwohnerdaten, Flächennutzung, Baudaten, Wahldaten, Volksabstimmung und Bürgerumfragen übernommen.
Quellenkritik und Auswertungsmöglichkeiten
Systematisch können bei modernen Statistiken mehrere Formen unterschieden werden:
- Erhebungsbögen auf Papier
- Erhobene Rohdaten bzw. Mikrodaten
- Plausibilisierte Rohdaten bzw. Mikrodaten
- Aggregierte Daten (unterschiedliche Aggregationsstufen denkbar)
- Publikation (analog oder in einem digitalen Informationsportal)
Die erstgenannte Form eignet sich vor allem für Nutzungsanfragen, die auf eine einzelne Information abzielen. In England zählen beispielsweise die Bögen zu den im 19. Jahrhundert durchgeführten Volkszählungen zu den beliebtesten genealogischen Quellen überhaupt. Dagegen würde eine computergestützte Auswertung einen sehr aufwändigen Erhebungsprozess erfordern, was den meisten Nutzern nicht möglich sein dürfte.[10]
Die erhobenen Rohdaten dürfen nach dem gegenwärtigen Stand der Datenschutzgesetze nicht an die Archive abgegeben werden.
Die plausibilisierten Rohdaten ermöglichen es, mehrere Felder zugleich abzufragen. Für die Volkszählung 1970 könnte so die Zahl der Fernpendler mit Schulabschluss X und Beruf Y abgefragt werden. Wobei auch eine vom Statistischen Amt vorgenommene Plausibilisierung keine Sicherheit dafür bietet, dass sämtliche internen Widersprüche der Daten aufgelöst werden konnten. Ein Beispiel: Ebenfalls bei der Volkszählung 1970 behaupteten über 2900 Personen, keine Zweitwohnung zu besitzen, um auf die nächste Frage hin konkrete Eigenschaften der angeblich nicht vorhandenen Zweitwohnung zu beschreiben.[11]
Aggregierte Daten besitzen den Nachteil, nicht Feld übergreifend abfragbar zu sein. Auf der anderen Seite ermöglichen es große, auf Ortsebene aggregierte Informationssysteme wie die Struktur- und Regionaldatenbank SRDB, Daten statistikübergreifend abzufragen.[12]
Sofern die Informationen nur in codierter Form vorliegen, müssen diese mit Hilfe von Codelisten aufgelöst werden. Gerade bei Statistiken, die in längeren Reihen vorliegen (z.B. die Geburtenstatistik von 1968 bis 1999) muss darauf geachtet werden, dass sich in diesem Zeitraum die heranzuziehenden Codelisten ändern können. Ändern können sich beispielsweise die Gemeindekennziffern im Zuge von Zusammenlegungen und (seltener) Aufspaltungen der einzelnen Gemeinden.
Hinweise zur Benutzung
Statistiken, die personenbezogene Informationen enthalten, sind sechzig Jahre unverkürzbar gesperrt. Es gibt daher keine Möglichkeit, eine Sperrfristverkürzung zu beantragen. Manchmal besteht jedoch die Möglichkeit, dass das Archiv aus den archivierten Daten in Kopie die Spalten löscht, die personenbezogen sind. Im Anschluss fallen diese Kopien nur noch unter die allgemeinen Sperrfristen, eine Möglichkeit zur Sperrfristenverkürzung eröffnet sich dann wieder.
Forschungs- und Editionsgeschichte
Die meisten Forschungsbeiträge beschäftigen sich mit der Bewertung und Archivierung der Statistiken. Bei der Nutzung dominieren die statistisch ausgerichteten Beiträge. Die Internet-Informationssysteme der Statistischen Ämter können als eine Form der Edition aggregierter Daten verstanden werden.[13] Ältere Statistiken wurden in aggregierter Form in den Publikationsreihen der Statistischen Ämter veröffentlicht.
Anmerkungen
[1] Kellerer, Statistik, S. 13, zitiert nach Reininghaus, Statistik, S. 13.[2] Bevölkerungsstatistik.
[3] Scholz, Zählung, S. 50.
[4] EVAS.
[5] StAL EL 413/4_DO 1 (1961), EL 413/6_DO 1(1970) und EL 413/9 DO 1 (1987).
[6] StAL EL 415/13.
[7] Stahlschmidt, Archivierung.
[8] Neben den bereits erwähnten Volkszählungen werden in dem für das Statistische Landesamt zuständigen Staatsarchiv Ludwigsburg auch Zählungen und Erhebungen zu Arbeitsstätten, Handwerk, Produktion, Schulen, Strafverfolgung und Strafvollzug, Eheschließungen, Geburten und Sterbefällen, Lohn- und Einkommenssteuer, Dienstleistungen, Handel und Gaststätten archiviert (StAL EL 413 und EL 414; Stand: August 2017).
[9] Das Landesarchiv Baden-Württemberg orientiert sich an diesen Empfehlungen, es steht den einzelnen Landesarchivverwaltungen jedoch frei, bei der Bewertung eigenständige Wege einzuschlagen. Bewertung von Statistikunterlagen (15.08.2017).
[10] Edward Higgs beschreibt ein solches Vorhaben mit den britischen Census-Erhebungen aus dem 19. Jahrhundert als „cumbersome“, Higgs, British Censuses, S. 39.
[11] Keitel, Erfahrungen. Jetzt auch unter http://www.staatsarchiv.sg.ch/home/auds/08/_jcr_content/Par/downloadlist_2/DownloadListPar/download_9.ocFile/Text%20Keitel.pdf (30.1.2016).
[12] Ders., Bewertung; auch unter http://www.staatsarchiv.sg.ch/home/auds/05/_jcr_content/Par/downloadlist_0/DownloadListPar/download_3.ocFile/Text%20Keitel.pdf (30.1.2016).
[13] https://www.statistik-bw.de/SRDB/?E=GS (Baden-Württemberg) und https://www.destatis.de (Deutschland).
Literatur
- Andermann, Kurt, Die sogenannte „Speyrer Volkszählung“ von 1530. Territorialpolitische und administrative Aspekte einer frühneuzeitlichen Bevölkerungsaufnahme, in: Regionale Amts- und Verwaltungsstrukturen im rheinhessisch-pfälzischen Raum, 14. bis 18. Jahrhundert, hg. von Alois Gerlich (Geschichtliche Landeskunde 25), Wiesbaden 1984, S. 107–130.
- Archive und Statistik. Zur Archivierung von Unterlagen der Volkszählung 1950 und elektronischer Statistiken, hg. von Jens Niederhut/Uwe Zuber, Essen 2014.
- Bevölkerungsstatistik an der Wende vom Mittelalter zur Neuzeit. Quellen und methodische Probleme im überregionalen Vergleich, hg. von Kurt Andermann/Hermann Ehmer (Oberrheinische Studien 8), Sigmaringen 1990.
- Bewertung von Statistikunterlagen. Abschlussbericht Juni 2016, hg. von KLA-Arbeitsgruppe Bewertung von Statistikunterlagen http://www.bundesarchiv.de/imperia/md/content/bundesarchiv_de/fachinformation/ark/abschlussbericht-bewertung-2016.pdf (15.8.2017).
- EVAS. Einheitliches Verzeichnis aller Statistiken der Statistischen Ämter des Bundes und der Länder, hg. von Statistisches Bundesamt, Wiesbaden (26.2.2016).
- Higgs, Edward, British Censuses 1801–2011, in: Archive und Statistik, S. 31–41.
- Keitel, Christian, Die Archivierung elektronischer Statistiken durch das Landesarchiv Baden-Württemberg, in: Statistisches Monatsheft Baden-Württemberg 6 (2008), S. 52–55.
- Keitel, Christian, Die archivische Bewertung elektronischer Statistiken, in: Virtuelle Welten im Magazin. Aussonderung, Aufbewahrung, Sicherung und Nutzung, hg. von Karl-Ernst Lupprian (Sonderveröffentlichungen der Staatlichen Archive Bayerns 2), München 2003, S. 63–68; auch unter http://www.staatsarchiv.sg.ch/home/auds/05/_jcr_content/Par/downloadlist_0/DownloadListPar/download_3.ocFile/Text%20Keitel.pdf (30.1.2016).
- Keitel, Christian, Baden-württembergische Archivverwaltung beginnt mit der elektronischen Archivierung. Volkszählung 1970 als erstes digitales Archivale im Staatsarchiv Ludwigsburg archiviert, in: Der Archivar 57 (2004), S. 315; auch in: Archivnachrichten 28 (2004), S. 13.
- Keitel, Christian, Erste Erfahrungen mit der Langzeitarchivierung von Datenbanken, in: Digitales Verwalten – digitales Publizieren, hg. von Rainer Hering/Udo Schäfer, Hamburg 2004, S. 71–81. Jetzt auch unter http://www.staatsarchiv.sg.ch/home/auds/08/_jcr_content/Par/downloadlist_2/DownloadListPar/download_9.ocFile/Text%20Keitel.pdf (30.1.2016).
- Kellerer, Hans, Statistik im modernen Wirtschafts- und Sozialleben, Reinbek 1960.
- Kretzschmar, Robert/Rehm, Clemens, Die Volkszählungen des 20. Jahrhunderts und die Staatliche Archivverwaltung Baden-Württemberg, in: Archive und Statistik, S. 81–94.
- Naumann, Kai, Archivierung digitaler statistischer Mikrodaten in Baden-Württemberg, in: Archive und Statistik, S. 171–182.
- Reininghaus, Wilfried, Statistik, Archive und Forschung. Eine Einführung, in: Archive und Statistik, S. 13–27.
- Scholz, Volker, Die Zählung und die Erfassung der Bevölkerung in ihrer historischen Entwicklung. Vom Römischen Imperium bis zur Reichsgründung 1871, in: Statistisches Monatsheft Baden-Württemberg 2 (2014), S. 45–53.
- Stahlschmidt, Rainer, Zur Archivierung des Datenmaterials der amtlichen Statistik in Nordrhein-Westfalen (Veröffentlichungen der staatlichen Archive des Landes Nordrhein-Westfalen Reihe E: Beiträge zur Archivpraxis 3), Siegburg 1980.
Zitierhinweis: Christian Keitel, Statistiken, in: Südwestdeutsche Archivalienkunde, URL: […], Stand: 20.11.2017.