Glückwunsch, Sie sind bereits überzeugt, eine Open Data-Strategie für Ihr Unternehmen/Ihre Behörde einzuführen. Nun liegt es daran, die Weichen zu stellen, damit dies zu einem Erfolg wird. Viele scheitern oder erreichen nicht die gewünschten Ziele, da sie einige elementare Grundsätze für eine fruchtbare Veröffentlichung von Daten nicht beachten.
Diese Seite soll helfen, Fallstricke zu identifizieren und Maßnahmen auflisten, um diese frühzeitig zu vermeiden.
Open Data beginnt bei der Offenheit. Damit diese gegeben ist, wird normalerweise ein geeigneter Lizenzvertrag definiert, der festlegt, in welcher Art Daten genutzt, verändert und weitergegeben werden können. Untersagt man die Veränderung oder Weitergabe der Daten oder verbietet bestimmten Gruppen eine Nutzung, ist dies kein Open Data.
Handlungsempfehlung: Wählen Sie eine gängige Standardlizenz, die den potenziellen Nutzern ein Begriff ist und klar kommuniziert, was erlaubt ist. Dies spart Ihnen Zeit und Geld und gibt den Nutzern eine Rechtssicherheit. Gute Lizenzen sind z.B. CC0 oder die Open Data Commons Attribution License. Vermeiden Sie die “Datenlizenz Deutschland”.
Damit Daten sinnvoll nutzbar werden, ist es meist notwendig, diese mit anderen Datensätzen oder Referenzdaten zu kombinieren. Dies ist eine zentrale Stärke von Open Data. Daten, die nicht von einem selbst erhoben wurden, können eingesetzt werden, um neue Erkentnisse zu erlangen. Früher wurden Daten mit Karten abgeglichen, heute ist es möglich, Daten in Geoinformationssysteme zu laden und diese miteinander zu betrachten und zu verarbeiten. Hierzu ist es notwendig, dass verbreitete Standards eingesetzt werden.
Einige Anbieter versuchen, Datenformate mit Druck auf den Markt zu bringen, um dann entsprechende Software verkaufen zu können. Jedoch gibt es häufig seit Jahrzehnten definierte offene Standardformate, die einen ähnlichen Funktionsumfang haben und die zu bevorzugen sind.
Handlungsempfehlung: Versuchen Sie die Daten mittels Software in gängige Formate zu wandeln, falls noch nicht geschehen. Nutzen Sie z.B. GTFS statt VDV 451. Ersteres ist äußerst funktional und weit verbreitet. Textbasierte Formate sind meist handlicher. Dokumentieren Sie die Datenstrukturen, listen Sie mögliche Kombinationen/Werte.
Historische Datensätze sind für manche Nutzungsfälle Gold wert, aber meist ist es viel nützlicher, einen möglichst aktuellen Datensatz zu verarbeiten.
Handlungsempfehlung: Legen Sie einen Zyklus fest, in dem ein Datensatz veröffentlicht wird, z.B. monatlich oder vierteljährlich. Geben Sie den Aktualisierungszyklus bekannt und benennen Ihre Dateien entsprechend, z.B. datensatz-2018-02-01.text
. Stellen Sie die zuvor veröffentlichten, historischen Daten auch nach Aktualisierung weiter zur Verfügung.
Auch offizielle Daten sind nicht ohne Fehler, das ist aber kein Beinbruch. Häufig finden Aktive diese Fehler und wären auch bereit, diese zu berichtigen. Davon können Sie profitieren, indem Sie diese Korrekturen selbst aufnehmen.
Handlungsempfehlung: Richten Sie eine E-Mail-Adresse, ein Kommentarfeld, eine Mailingliste o.ä. ein, an die sich Interessierte melden können, um Fehlermeldungen abzugeben. Lassen Sie diese berichtigen und in aktualisierte Datensätze einfließen.
Häufig werden Daten nur durch eine Schnittstelle angeboten. Diese muss gepflegt und betrieben werden, außerdem können einzelne Nutzer versehentlich Dienste lahmlegen, wenn sie zu viele Anfragen stellen, die sie ggf. für Ihre Anwendung benötigen. Schnittstellen sind z.B. für Echtzeitdaten essenziell, für statische Daten (z.B. Fahrplandaten) eher unsinnig. Es existiert zahlreiche freie Software, mit der verschiedenste Daten verarbeitet werden können, sodass Nutzer die Rechenlast selbst übernehmen können.
Handlungsempfehlung: Investieren Sie nicht in ein Open Data-Portal und neue Server, die eine Schnittstelle zur Verfügung stellen. Veröffentlichen Sie einen Datensatz auf einer statischen Seite, wie z.B. das Blattspinat OpenData Portal.
Letzte Aktualisierung: 2. Februar 2018
Bei Fragen stehe ich Ihnen gerne zur Verfügung.