Offene Daten für Deutschland

Parteispender als Wortwolke bei blog.kooptech.de
Parteispender als Wortwolke bei blog.kooptech.de
Als die Obama-Administration vor einem Jahr die Website data.gov startete, um einen zentralen Veröffentlichungs-Ort von Daten der Regierung und der Ministerien zu schaffen, frohlockten die Anhänger einer freien Informationspolitik. Irgendwo zwischen Anerkennung und Skepsis bloggte die New York Times, es sei wohl leichter, das Gesundheitssystem zu reformieren, als die Regierungsbürokratie zu öffnen. Inzwischen hat Obama nicht nur seine Gesundheitsreform durchbekommen; auf data.gov lassen sich auch über 900 Datenbanken erreichen.

Von solchen Verhältnissen ist Deutschland noch weit entfernt. Ändern möchte das eine Website namens Offenedaten.de, die sich der Katalogisierung von vornehmlich staatlichen Datensammlungen verschrieben hat. Dahinter steht der im letzten Oktober in Berlin im Dunstkreis von Netzpolitik.org, der Publikations-Plattform des Vorzeige-Bloggers und Politikberaters Markus Beckedahl, gegründete Verein Open Data Network, der "die Themen Opendata, Openaccess, Opengovernment, Transparenz und Partizipation auf die politische Agenda" setzen will.

Gute Hacker, offene Daten
Beckedahl ist auch Mitinitiator des Blogger-Kongresses Re:Publica, der das Thema Open Data letzte Woche kräftig featurte. Im Anschluss wurde zum Open Hackday gerufen - aber keine Sorge: Bei diesen Hackern handelt es sich (anders als vielleicht vermutet) nicht um Eindringlinge in fremde Datenbanken, sondern um brave Staatsbürger, die von der Idee getrieben sind, sogenannte open data für die Öffentlichkeit nutzbar zu machen. Hacks4Democracy lautete denn auch das Motto.

Zuerst müssen Daten allerdings offen und als solche auch auffindbar sein. Daram kümmert sich eben Offenedaten.de; mit gut 50 Einträgen wirkt der Katalog noch recht überschaubar. Vor allem Datensammlungen der Statistischen Bundes- und Landesämter sind verzeichnet. Nach Angaben der Macher sollen jedoch auch andere Daten - etwa solche mit Open Access aus der Wissenschaft - hinzukommen. Zudem können Nutzer der Website selbst Datenbanken eintragen, um das Verzeichnis zu erweitern. Auch ein Formular, um Daten im Sinne des Informationsfreiheitsgesetzes anzufragen, existiert, wobei die Anfrage an die Behörde weitergeleitet und deren Reaktion protokolliert wird, wie es auf der Website heißt.

Mashups und CAR
Spannend wird es jedoch erst dann, wenn die Daten auch nutzbar sind und in einem Format vorliegen, das die Weiterverarbeitung ermöglicht. Durch die Verknüpfung verschiedener Datenquellen lassen sich neue Erkenntnisse ableiten. Programmierer sprechen dann von Mashups; für die journalistische Nutzung von Datenbanken haben sich die Bezeichnung Data driven journalism und das Kürzel CAR, Computer Assisted Reporting, eingebürgert. An praktischen Umsetzungen, die zumindest in komplexeren Fällen eine Koproduktion zwischen Journalisten und Programmierern voraussetzen, hapert es allerdings noch.

Ein Beispiel lieferte gerade die in Internet- und Bürgerrechts-Dingen ohnehin bewanderte Journalisten Christiane Schulzki-Haddouti ab: Mit Hilfe der auf die Analyse sozialer Netzwerke spezialisierten Mangement-Beratung Eliqos untersuchte sie die Parteispenden-Praxis auf der Basis der vom Bundestag bereitgestellten Daten - zu sehen im zweiten Teil einer Artikelserie auf Zeit Online. Herausgekommen ist zwar keine Enthüllungsgeschichte, aber ein dank intelligenter Auswertung und Visualisierung von Daten bislang nicht existierender Überblick über die Parteienfinanzierung in Deutschland.

Gadgets, Crawler, Wortwolken
Für die anderen Teile der Serie verwendet Schulzki-Haddouti zur interaktiven Darstellung Googles Ablaufdiagramm-Gadget und lässt unerschrocken einen Suchmaschinen-Crawler auf die Websites von Großspendern los. In ihrem Blog Kooptech erklärt die Journalistin die genutzten Technologien und hält noch eine kleine Spielerei bereit: Sie fütterte den Häufigkeits-Visualisierer Wordle mit den Namen der Spender; ein Ausschnitt der resultierenden Grafik illustriert auch diesen Artikel.

Doch aller Offenheit zum Trotz gibt es auch Anlass zur Skepsis: Weil die Veröffentlichungs-Vorschriften in Deutschland zeitliche Spielräume lassen, gebe es "verzerrte Ergebnisse", heißt es zum Schluss des Artikels. Und wer amtlichen Daten ohnehin nicht traut, wird deren Analyse von vornherein ablehnen, egal wie offen sie liegen.

Mit der sogenannten Deutschland-API hält auch der Open Data Network so etwas wie eine Referenz-Umsetzung bereit. Dabei handelt es sich um eine Schnittstelle (API steht für Application Programming Interface) zu einer ursprünglich für das Portal Wahl.de aufgebauten Parlamentarier-Datenbank. Hinter der Entwickung der Deutschland-API steht die Medienagentur Compuccino, die ebenfalls im Vorstand des Open Data Network vertreten ist. So gehen Bürgerrechts-Aktivismus und Geschäftszweck miteinander einher.

Offenes Wissen, seit 2004
Wenn es so etwas wie ein Copyright für die Propagierung offener Daten gibt, dann gebührt es der Open Knowledge Foundation, deren Katalog-Software CKAN (Comprehensive Knowledge Archive Network) auch die im Januar gestartete britische Regierungs-Website data.gov.uk antreibt. Offenedaten.de hat CKAN ebenfalls als Unterbau. Auf ihrer eigenen Website ckan.net hält die 2004 in der britischen Universitätsstadt Cambridge gegründete Stiftung - nach eigenen Angaben in ihrem Feld "national und international führend" - einen eigenen Katalog mit über 900 Einträgen bereit.

Von solchen Verhältnissen ist Deutschland noch weit entfernt. Das weiß auch Daniel Dietrich, Vorsitzender des Open Data Network und zugleich Deutschland-Repräsentant jener Open Knowledge Foundation. In einem Gastbeitrag für deren Blog schrieb Dietrich kürzlich: "Der einfache Grund, warum wir noch weit entfernt sind von 'data.gov.de', besteht darin, dass sich die politische Situation, die Verwaltungsstrukturen und Rechtsvorschriften hier sehr stark von Großbritannien oder den USA unterscheiden". In Deutschland gebe es keine dem britischen Office of Public Sector Information vergleichbare Zentralstelle für offene Daten, so Dietrich, und das hiesige Informationsfreiheitsgesetz sei wegen der darin vorgesehenen Ausnahmen nur ein "zahnloser Tiger".