Dateiaufbau
Nachfolgend ist der aktuelle Stand der Beschreibung vereinbarter Datensätze dokumentiert, die für alle Dateien allgemein gültig sind:
- Als Dateiformat wird aus Gründen der höheren Kompatibilität und Verbreitung CSV verwendet
- Als Trennzeichen wird das Semikolon verwendet
- Encoding ist UTF-8 (ohne BOM)
- Es gibt genau eine Header-Zeile.
- Es gibt keine Kommentarzeilen.
- Leerzeilen sollen vermieden werden.
- Beim Einlesen sollte nicht der Spalten-Index, sondern nur der Spalten-Name verwendet werden, da der Spalten-Index sich verschieben kann
- Sonderzeichen sind in „Freitextfeldern“ wie Wahlraum-Bezeichnungen erlaubt (Semikolon, einfache und doppelte Anführungszeichen, Accents, Zeilenumbrüche(!), etc.), und werden entsprechend den geltenden Regeln (siehe auch „https://tools.ietf.org/html/rfc4180“, häufig als „SQL-Style“ bezeichnet) encodiert.
- Datums-Formatierung erfolgt in deutschem Format („dd.mm.yyyy“), Zeitstempel werden ebenfalls in deutschem Format „dd.mm.yyyy hh:mm:ss“ ausgegeben.
- Zahlen werden ohne führende Nullen und ohne Tausender-Trennzeichen ausgegeben.
- Vermeintliche „Zahlen“ sind nicht tatsächlich numerisch (Bezirks-Nummern, Gemeindeschlüssel, …). Sie werden so ausgegeben, wie sie erfasst wurden, also ggf. mit führenden Nullen (also nicht Excel-verarbeitbar). Einige (wie z.B. die “bezirks-nummer”) können Zeichen enthalten (z. B. „01.1“, „01.2“, „01.3“, „B-001“, …). Nachträglich darauf sinnvoll sortieren zu wollen ist herausfordernd.
Jede Datei enthält folgenden Spalten:
version = Version des offenen Wahldatenstandards
wahl-behoerde-gs = eindeutiger Gemeindeschlüssel der Behörde, Ist entweder der 8-stellige “amtliche Gemeindeschlüssel” (AGS; https://de.wikipedia.org/wiki/Amtlicher_Gemeindeschl%C3%BCssel) oder der 12-stellige “amtliche Regionalschlüssel” (ARS; https://de.wikipedia.org/wiki/Amtlicher_Gemeindeschl%C3%BCssel#Regionalschl%C3%BCssel)
wahl-datum = Wahltag
wahl-name = Wahlart, eindeutiger Wahlname, welcher für jede Behörde einheitlich ist
Mit diesem Schaubild wollen wir aufzeigen, in welcher Beziehungen die einzelnen Dateien stehen:
Dateiname
Der Dateiname setzt sich wie folgt zusammen:
05362028_20140525_Buergermeisterwahl-NRW_Wahlparameter_V0-1_20140415T132552.csv
Gemeindeschlüssel der Behörde _ Wahltag (YYYYMMDD) _ Wahlname _ Datensatzbeschreibung _ Version _ Zeitstempel (YYYYMMDD T HHMMSS) . Dateiendung
Versionen
Unterhalb der allgemeinen Infos zu den einzelnen Datensätzen sind Versionen abgelegt. In diesem Bereich ist die aktuelle Datensatzbeschreibung und Bespieldateien als CSV und XLSX abgelegt. Desweiteren werden Änderungen zur Vorversion angezeigt. Die aktuellste Version steht immer an erster Stelle.
Damit man später noch nachvollziehen kann, ob man Tests mit den aktuellen Datensätzen gemacht hat, ist bei den allgemeinen Spalten, die in jeder Datei vorhanden sind, auch die Versionsnummer enthalten.
Noch keine Versionen in diesem Datentyp vorhanden!