Unser Analysetool zur Bundestagswahl 2013

Video: Wie funktioniert die Wahlanalyse von Offenes Köln?.

Bei der Veranstaltung Wahl.Daten.Helfer stand am vergangenen Wochenende das Ausdenken und Umsetzen von Anwendungen auf Basis von Offenen Daten zur Wahl auf dem Programm. Im “Wahllokal Köln“, dem Coworking Cologne Büro an der Bottmühle in der Kölner Südstadt, waren eine Handvoll aktive versammelt und schraubten an diversen Visualisierungen und Werkzeugen.

Die Stadt Köln hat die Kölner Community schon im Vorfeld darüber informiert, in welcher Form die Wahlergebnisse am Wahlabend zur Verfügung gestellt würden und einige zusätzliche Daten zur Verfügung gestellt. So sind beispielsweise die Geodaten der 800 Kölner Stimmbezirke und die Ergebnisse der Bundestagswahl 2009 (Erststimmen, Zweitstimmen) verfügbar. Passend dazu wurde auch das Ergebnis der Stimmenauszählung auf Ebene der Stimmbezirke veröffentlicht. Ein Novum, denn derart detaillierte Daten über das Wahlverhalten hat die Öffentlichkeit bis dato nie bekommen.

Dass ich ein Faible für die Suche nach Korrelation habe, kann man hier im Blog schon an dem einen oder anderen Beitrag sehen. So wollte ich das Hack-Event am Wahlwochenende auch dafür nutzen, eine Anwendung zu bauen, mit der die feinräumigen Wahldaten auf Ebene der Stimmbezirke nach Korrelationen durchsucht werden können. Zugegeben ist die dabei entstandene Anwendung vielleicht nicht für jeden interessant. Die Analysen, die man damit erstellen kann, könnten jedoch von allgemeinem Interesse sein. Und vielleicht kommt ja der eine oder andere nicht-Statistiker so auf den Geschmack und vertieft sich ein bisschen in die Materie.

Ein Beispiel: Wählt man in der Anwendung für die horizontale Achse den Erststimmenanteil der FDP und für die vertikale Achse den Zweitstimmenanteil der FDP, jeweils von den aktuellen Wahlergebnissen, dann zeigt das resultierende Streudiagramm, wo jedes einzelne Ergebnis eines Stimmbezirks gelegen hat. Punkte, die weit oben liegen, stehen für Stimmbezirke mit den höchsten Zweitstimmenanteilen der FDP. Entsprechend stehen Punkte, die weit rechts liegen, für die Stimmbezirke mit den höchsten Erststimmenanteilen. Folglich stehen Punkte, die oben rechts liegen, für die Stimmbezirke, wo die FDP sowohl viele Erst- als auch Zweitstimmen bekommen hat. Und so sieht das dann aus:

Screenshot 1

 

Der fett hervorgehobene Punkt steht übrigens für einen der beiden Stimmbezirke in Köln-Hahnwald. Es scheint fast, als hätten sich die Wahlberechtigten von Hahnwald verabredet, um uns zu erklären, welche Zielgruppe die FDP (immer) noch anspricht.

Nutzer können selbst entscheiden, welche Kennzahlen in dem Streudiagramm gegenübergestellt werden. Möchte man beispielsweise die Gewinne und Verluste zwischen den Bundestagswahlen von 2009 und 2013 für eine Partei, selbstverständlich wie immer aufgeschlüsselt nach Stimmbezirk, auswerten, geht das ebenfalls. Und so sieht es aus:

Screenshot 2

 

Auch hier ist wieder der Stimmbezirk 20701 in Hahnwald hervorgehoben. Wie man nun sehen kann, hat die FDP praktisch in allen Stimmbezirken verloren, auch in ihrem besten. Während hier 2009 noch über 40 Prozent der Zweitstimmen an die FDP gingen, waren es nun nur noch knapp über 21. Die Punkt aller Stimmbezirke formen dabei eine recht deutliche Diagonale, die anzeigt, dass es hier beinahe so etwas wie eine Gesetzmäßigkeit gibt. Punkte (Stimmbezirke), die von der Diagonale nach oben abweichen, haben gemeinsam, dass hier der Stimmenanteil besonders stark zurück gegangen ist.

Und noch ein drittes Beispiel. Hier stellen wir die Wahlbeteiligung der beiden Bundestagswahlen 2009 und 2013 – je Stimmbezirk – gegenüber.

Screenshot 3

 

Der fette Punkte am unteren Rand, Stimmbezirk 80907, fällt hier unmittelbar ins Auge, und nicht nur, weil er aktuell hervorgehoben ist. Es ist der Stimmbezirk mit der niedrigsten Wahlbeteiligung bei der gestrigen Wahl. Auffällig ist aber auch, dass der Punkt so weit außerhalb der diagonalen Punktwolke liegt, die dadurch entsteht, dass Stimmbezirke mit geringer Wahlbeteiligung 2009 auch bei dieser Wahl wieder zu einer ähnlich geringen Wahlbeteiligung tendiert haben. Nicht so aber Stimmbezirk 80907, denn hier lag die Wahlbeteiligung vor vier Jahren eher im Mittelfeld, bei 64 Prozent. Was ist da passiert, dass der Wert nun bei knapp über 25 Prozent liegt?

Übrigens ist wissenswert, dass Briefwähler aus der Darstellung komplett ausgenommen sind. Briefwähler werden in eigens dafür geführten Stimmbezirken erfasst. Eine Abweichung wie die oben beschriebene bei der Wahlbeteiligung könnte also durch eine hohe Briefwahlbeteiligung zu erklären sein. Leider lässt sich das aber anhand der Daten, die uns vorliegen, nicht nachvollziehen.

Zum Stichwort “Daten”: neben den amtlichen Wahlergebnissen habe ich für die Anwendung wieder mal Daten, die die Stadt Köln bislang nur in Form von PDFs veröffentlicht, zusammen getragen. Die Einwohnerzahlen der Stimmbezirke und die Angaben zum Frauenanteil sowie zum Anteil der verschiedenen Altersgruppen sind aus insgesamt 5 dicken Dokumenten der Stadt (1, 2, 3, 4) in einer CSV-Datei mit den historischen Wahlergebnissen und weiteren Strukturdaten zusammen geflossen.

Jetzt seid Ihr dran. Welche spannenden Gegenüberstellungen und Korrelationen findet Ihr mit dem Analysetool?

Probiert es aus!

Datendienstag: Die 157.415 Adressen Kölns

Endlich wieder ein Datendienstag! Das Problem ist übrigens nicht, dass es in letzter Zeit keine interessanten Daten gegeben hätte. Im Gegenteil. Es liegt an der lieben Zeit… doch zur Sache:

Die Stadt Köln hat Ende Juni in einem Schwung mit einigen anderen Geodatensätzen auch ihre Adressdatenbestände geöffnet. Das sind alle erfassten Hausnummern im Kölner Stadtgebiet, geocodiert. Einhundertsiebenundfünfzigtausenvierhundertfünfzehn Stück. So sieht das aus, wenn man die einfach als Punkte auf ein weißes Blatt Papier malt:

Adressen Köln Vorschau

Ein Tipp: Unbedingt auf das Bild klicken, um das 4 MB PDF-Dokument zu laden und dann schön weit hinein zoomen!

Diese Daten sehen nicht nur interessant aus. Mit ihnen kann man auch einiges sinnvolles anstellen. Beispielsweise kann man damit einen ziemlich genauen Geocoding-Dienst realisieren. Zu jeder genauen Adressangabe steht damit eine exakte Position zur Verfügung. Umgekehrt ließe sich zu einer exakten Position auch die nächst gelegene Adresse oder eine Anzahl von Adressen im definierten Umkreis ausgeben.

Eine andere Anwendungsmöglicheit wäre, aus den Adressdaten die Umrisse bewohnter bzw. bebauter Gebiete abzuleiten. Dazu müsste man eine Fläche um jeden Punkt legen, sagen wir mit einem Radius von 100 Meter. Geodaten-Spezialisten nennen das “Buffer”. Die Schnittmenge all dieser Flächen wäre dann eine ziemlich gute Antwort auf die Frage: Welche Flächen in Köln sind bebaut und welche sind es nicht.

Wer jetzt noch nicht überzeugt ist, dass es sich hier um einen echten Datenschatz handelt, der kann einen Blick auf die Liste der Attribute werfen, die zu jeder einzelnen Adressposition angeboten werden:

  • AD_NR: eindeutige numerische ID des Eintrags
  • STRASSE: Name der Straße, kurze Schreibweise
  • HAUSNR: Hausnummer
  • NUTZUNG: Art der Nutzung des Gebäudes, einer von 133 verschiedenen Werten von “1000 – Wohngebäude” bis “3281 – Schutzhütte”
  • STT_NR: Stadttteil-Nummer von 101 bis 909
  • STT_NAME: Stadtteil-Name
  • STV_NR: Stadtviertel-Nummer von 10101 bis 90904, insgeamt 370 Viertel
  • STV_NAME: Stadtviertel-Name
  • PLZ: Postleitzahl, 45 verschiedene Werte
  • ADRESSE: Kombination aus Straße und Hausnummer
  • X_KOORD, Y_KOORD: Rechts- und Hochwert der Position, vermutlich in UTM Zone 32N Koordinaten.
  • STR_LANG: lange Schreibweise des Straßennamens
  • STR_AMTL: amtliche Schreibweise der Straße
  • NAME: ggf. Name des Gebäudes, z.B. “AXA-Hochhaus”.

Damit kann man doch was machen. Ideen? Du kennst ja unsere Kommentarfunktion. ;-)

Zu den Daten

Die Stadt bietet zu diesem Datenangebot mehrere Downloads, jeweils auf einer eigenen Seite beschrieben, an.

Und damit man mit den Daten ganz schnell loslegen kann, gibt es von uns als Service-Dreingabe noch eine GeoJSON-Version der Daten. Die Punktkoordinaten sind hier in WGS-84 (d.h. Längen- und Breitengrad) konvertiert, so dass die Daten direkt mit Google Maps oder Leaflet genutzt werden können.

Achtung: Die GeoJSON-Version wird zukünftig nicht aktualisiert. Für aktuelle Daten bitte die offiziellen Download-Seiten der Stadt nutzen.

Hallo Bochum, hallo Moers!

Das sind fantastische Neuigkeiten: Ab sofort gibt es sowohl in Bochum als auch in Moers eine Plattform wie Offenes Köln. Beide Plattformen, die von der Initiative OpenRuhr betrieben werden, wurden gestern der Öffentlichkeit vorgestellt.

OpenRuhrLogo

Damit stehen nun auch den über 100.000 Bürgerinnen und Bürgern von Moers und den über 360.000 von Bochum Informationen über die Lokalpolitik übersichtlich und als Open Data zur Verfügung.

Ernesto Ruge, der bei OpenRuhr für das Projekt verantwortlich ist, hat hierzu die Software, die Grundlage von Offenes Köln ist, auf die Anforderungen der beiden Städte angepasst. Hilfreich war für ihn dabei, dass sowohl Köln als auch Moers und Bochum ein Ratsinformationssystem des selben Anbieters (Firma Somacos) einsetzen. Die Software, mit der Offenes Köln die Ratsinformationen aus dem Kölner System abruft, haben wir erst kürzlich so weiter entwickelt, dass sie sich auch einfacher in anderen Städten einsetzen lässt. Ernesto von OpenRuhr ist nun der erste, der weitere Portale auf dieser Basis in Betrieb nimmt.

Erwähnens- und lobenswert ist auch die Unterstützung, die er dabei von Seiten der Stadtverwaltung von Moers erhalten hat. Vor dem Hintergrund der Urheberrechtsproblematik, die einzelne Dokumente betreffen kann, arbeitet die Stadt Moers daran, eventuell problematische Dokumente zu identifizieren. Zusätzlich hat man sich im Vorhinein bereit erklärt, im Fall einer Abmahnung die Verantwortung zu übernehmen und vorsorglich die Haftpflichtversicherung der Stadt Moers auf das Angebot von OpenRuhr ausgeweitet.

Wir sind gespannt, wie Bürger und Presse im Ruhrgebiet das neue Angebot aufnehmen, welche Erweiterungen Ernesto auf Basis der Erfahrungen mit dem Code der Plattform beisteuern wird, und welche Städte als nächstes folgen. :)

Zu den beiden neuen Plattformen:

Und im Blog von OpenRuhr gibt es natürlich auch einen Artikel zum Start der beiden Sites.

Offenes Köln auf der Re:publica

 

Vom 6. bis 8. Mai ist in Berlin wieder Re:publica. Diesmal ist Offenes Köln auch im Programm vertreten.rp13_banner_299x250_DIn der Session am Mittwoch, dem 8. Mai um 16:45 Uhr mit dem Titel “Offene API für die Lokalpolitik” wird es um eine rosige Zukunft gehen, in der lokalpolitische Inhalte praktisch universell zugänglich sind.

Dieser Version der Zukunft kommen wir gerade ein gutes Stück näher, denn unter dem Namen OParl entsteht in diesem Moment eine Standard-Schnittstelle für den Zugriff auf parlamentarische Informationssysteme – oder genauer: Ratsinformationssysteme. (Um die Informationslücke seit dem letzen Blog-Beitrag vom 15. April zu schließen: OParl ist das unmittelbare Ergebnis des darin angekündigten Workshops in Köln.)

Was sollte eine solche API können? Und was könnte die breite Verfügbarkeit einer solchen API für die Transparenz der Lokalpolitik bedeuteten? Welche Anwendungen wären damit denkbar?

Alle Re:publica-Teilnehmerinnen und -Teilnehmer lade ich herzlich dazu ein, die Session durch Fragen und eigene Ideen zu bereichern. Auch außerhalb des Programms freue ich mich über jede Möglichkeit am Rande zum Austausch. Bis nächste Woche!

Ein Schritt in Richtung Standardisierung

Wie schön wäre es, wenn es so etwas wie Offenes Köln und Frankfurt Gestalten in jeder Stadt in Deutschland gäbe!

Weil das momentan eine ferne Utopie ist, ist es höchste Zeit, daran zu arbeiten, dass sie ein wenig näher rückt. Deshalb treffen sich am Mittwoch erstmals Vertreter von Software-Herstellern, Kommunen, IT-Dienstleistern und zivilgesellschaftlichen Organisationen (hier ist die Liste der eingeladenen Organisationen und Firmen) zu einem gemeinsamen Workshop in Köln. Das Thema: Eine Standard-Schnittstelle für Ratsinformationssysteme (RIS).

Veranstalter des Treffens sind Jens Klessmann vom Fraunhofer-Institut FOKUS, Christine Siegfried von der Bundes-Arbeitsgemeinschaft der Kommunalen IT-Dienstleister VITAKO und meine Wenigkeit. Die Stadt Köln stellt die Räumlichkeiten zur Verfügung und ist selbst als Teilnehmer auch daran interessiert, die Entwicklung mit eigenen Anforderungen zu begleiten und möglichst selbst von den Ergebnissen der Initiative zu profitieren.

Erstes Ziel des Treffens ist es, herauszufinden, ob die RIS-Hersteller daran interessiert sind, einen offenen Standard zu unterstützen und ihre Produkte im Sinne der gemeinsamen Schnittstelle anzugleichen. Mir persönlich geht es bei der Initiative wohl gemerkt nur um den lesenden Zugriff auf öffentliche RIS-Daten, damit diese möglichst einfach und einheitlich für weitere Anwendungen genutzt werden können. Die Funktionen der RISe gehen normalerweise weit darüber hinaus. So werden damit beispielsweise die Sitzungsgelder verwaltet und die fristgerechte Einreichung von Anträgen, Anfragen etc. geprüft. All das sind Funktionen, die für die Öffentlichkeit, die vor allem die lokalpolitischen Inhalte verfolgen möchte, nur von geringer Bedeutung sind.

Die langfristige Vision ist die, dass Kommunen auf der Suche nach einem RIS-Produkt die Unterstützung des offenen Schnittstellen-Standards als Auswahlkriterium nutzen können. Indem sie auf ein Produkt setzen, dass diesen Standard unterstützt, können Sie davon ausgehen, dass ihre RIS-Inhalte für ein wachsendes Ökosystem von freien Software-Produkten offen stehen. Open-Source-Software wie Offenes Köln sollte dann im Handumdrehen für eine solche Kommune einsetzbar sein. Spezielle Anwendungen wie beispielsweise für mobile Endgereäte oder hundert Prozent barriefefreie Such-Oberflächen wären dann denkbar. Denn der Aufwand, der in die Entwicklung solcher Werkzeuge fließen würde, würde sich in vielen Kommunen auszahlen.

Das wird noch ein spannender Weg. Was denkt Ihr, muss passieren, um diesen Weg erfolgreich zu gehen?

Update: Aus dem ersten Treffen, das in diesem Beitrag angekündigt wurde, ist die Initiative OParl hervorgegangen. Weitere Infos auf oparl.de.

Ortseingabe auf der Startseite funktioniert aktuell nicht

Wer aktuell auf der Startseite eine Adresse eingibt, wird leider kein Glück haben. Nach dem Absenden erscheint eine Anzeige, dass sich etwas tut. Aber tatsächlich tut sich nichts.

ortseingabe

Es wird länger dauern, bis dieses Problem behoben ist. So lange ist die Umfeldsuche mit Kartendarstellung leider nicht benutzbar. Wer Dokumente zu einer bestimmten Straße finden möchte, ist daher auf die ganz normale Stichwortsuche (unterhalb der Karte auf der Startseite) angewiesen. Dort gibt man dann die Namen der Straßen und Plätze ein, zu denen man Inhalte finden möchte.

Die Ursache des Problems: Yahoo hat seinen Placefinder Dienst abgeschaltet und gegen einen kostenpflichtigen Service ersetzt. Mit Placefinder haben wir bisher relativ erfolgreich Eure Eingaben zu einem Ort in Köln aufgelöst – das nennt man “Geocoding”. Das ist bei Adresseingaben übrigens nicht immer ganz einfach, denn Nutzer verwenden unterschiedlichste Schreibweisen, und einige Straßennamen existieren mehrfach in Köln.

Hätte man davon nicht früher erfahren können? Ja, ich denke schon. Aber offensichtlich habe ich bei Yahoo dafür keine passende E-Mail-Adresse hinterlegt. Mein Fehler.

Nun war es vielleicht ohnehin keine so gute Idee, Yahoo Placefinder hierfür zu verwenden. Aber der Dienst hat vor über einem Jahr, als ich Offenes Köln veröffentlicht habe, gut funktioniert und kam mit einer Reihe von verschiedenen Eingaben gut klar.

Eine Umstellung auf einen anderen Geocoding-Dienst dauer leider eine gewisse Zeit (deutlich länger als das Schreiben dieses Blog-Beitrags!), denn jeder Dienst funktioniert auf seine Weise. Die Logik unserer Startseiten-Funktion war eben recht genau an die Möglichkeiten von Yahoo Placefinder angepasst.

Überhaupt stellt sich die Frage nach der richtigen Alternative. Eine naheliegende Möglichkeit ist der Umstieg auf den Nominatim-Dienst von OpenStreetMap. Allerdings ist der nicht unbedingt performant. Gut, es gibt noch die von MapQuest gehostete Version. Aber dann wiederum habe ich ein wenig das Vertrauen in die kommerziellen Anbieter verloren.

Da wir ohnehin schon die Geodaten zu Kölns Straßen aus OpenStreetMap vorhalten, wäre es eine Möglichkeit, einen eigenen Geocoding-Dienst anzubieten. Tatsächlich bietet unsere API schon eine Funktion, die dem sehr nahe kommt. Zwei Dinge fehlen aber noch, um die Funktionen des bisher genutzten Dienstes zu ersetzen:

  • Ein Verständnis von nicht exakt passenden Eingaben. Wer “aachener” oder “aachenerstraße” eingibt, möchte in jedem Fall die “Aachener Straße” finden.
  • Die Zuordnung von Straßen zu “Gebieten”. Da die Aachener Straße nicht nur mehrmals existiert, sondern sie auch noch sehr lang ist, haben wir bislang bei solchen Straßen alle PLZ-Gebiete, die diese Straße durchquert, zur Auswahl gestellt. Damit konnten Nutzer die Positionierung für die Umfeldsuche besser eingrenzen.

Und noch ein Problemchen: Momentan sind wir ohnehin damit beschäftigt, Offenes Köln hinter den Kulissen komplett umzubauen.

Es sieht daher nach einer Schnelllösung, wahrscheinlich auf Basis von MapQuest Nominatim, aus. Ihr erfahrt natürlich hier und auf Twitter, wenn das Problem behoben ist. Vielen Dank für das Verständnis!

Neue Vorschaubilder

Momentan wird wieder viel hinter den Kulissen am Code von Offenes Köln geschraubt. Anlass ist die Umstellung des Kölner Ratsinformationssystems auf eine neue Software-Version. Aus diesem Grund müssen einige wichtige Bestandteile der Software hinter Offenes Köln verändert werden, was wir zum Anlass nehmen, vieles aufzuräumen. Und hier, für die technisch interessierte Zielgruppe, darüber zu schreiben. Weiterlesen

Die APIs von Straßen.NRW

Ja, Daten zum Verkehr sind spannend. Weil Mobilität ein wichtiges Thema ist, gibt der Staat immense Steuermittel für die Verkehrsinfrastruktur aus. Ein Teil davon fließt in Anlagen, die Daten über die Auslastung der Verkehrswege ermitteln, situationsabhängig den Verkehr steuern und sogar Prognosen über die Auslastung liefern sollen. (Hier gibt es in letzter Zeit gehäuft Beiträge zu dem Thema, z.B diesen, diesen und diesen.)

Für Bürger Nordrhein-Westfalens ist ein Teil dieser Daten auf den Online-Angeboten von Straßen.NRW sichtbar, Betreiber ist der “Landesbetrieb Straßenbau Nordrhein-Westfalen”. Die Anwendung autobahn.nrw.de beispielsweise bietet eine Anzeige der aktuellen Auslastung der Autobahnen im Bundesland. Die nachstehende Abbildung zeigt den Ausschnitt einer Kartendarstellung der Anwendung. Weiterlesen