Machen sie die Daten verfügbar (technische Offenheit)

Open data needs to be technically open as well as legally open. Specifically, the data needs to be available in bulk in a machine-readable format.

Available
Verfügbar - zu einem höchstens geringen Kostenaufwand, der die Reproduktionskosten deckt, bevorzugt als kostenloser Download über das Intenet. Grundsätzlich gilt: Veröffentlichen sie ihre Daten im Internet, wenn immer möglich.
In bulk
Machen sie die Daten verfügbar - als Massen-Download und in nützlichen Formaten. Bedenken sie auch die Veröffentlichung auf alternativen Wegen wie z.B. über eine API.
In an open, machine-readable format
Eine Weiterverarbeitung von Daten des öffentlichen Sektors sollte keinen Patentschutz oder anderen Schutzrechten unterliegen. Ebenso wichtig: stellen Sie sicher, dass die maschinenlesbare Formate verwenden um die bestmögliche Weiterverwendung zu gewährleisten. Statistiken die als ‘PDF (Portable Document Format’) veröffentlicht werden sind meistens auf eine gute Druckqualität hin optimiert. Diese Dateien können von Menschen sehr gut gelesen werden, doch Computer können in der Regel nur wenig damit anfangen. Dies schränkt die Möglichkeiten der Weiterverwendung deutlich ein.

Die Hauptsache sollte sein:

  • Halten SIe es einfach!
  • Seien Sie schnell!
  • Seien Sie pragmatisch!

Es ist besser, heute Rohdaten zu veröffentlichen, als perfekte Daten erst in sechs Monaten.

Es gibt viele Möglichkeiten, um Daten verfügbar zu machen. Im Zeitalter des Internets ist es naheliegend, das Internet als Weg für die Verteilung zu wählen. Je nachdem, wie umfangreich die Daten sind, die sie zur Verfügung stellen wollen, könnten jedoch auch andere Wege wie DVDs oder USB-Speicher eine Rolle spielen.

Bei besonders großen Datensätzen oder schlechten Internetverbindungen sollte über alternative Verteilungsformen nachgedacht werden, um die Kosten niedrig zu halten und gleichzeitig eine große Verbreitung sicherzustellen.

Downloads in einfachen, universell maschinenlesbaren Formaten wie XML und CSV stellen sicher, dass eine möglichst breite Nutzergruppe die Daten weiterverwenden kann.

Über die bestehende Website

Genau wie herkömliche Dokumente können Sie auch größere Dateien zum einfachen Download auf ihrer Seite anbieten.

Das einzige Problem bei dieser Vorgehensweise: für ‘Outsider’ kann es schwierig sein an neue Informationen zu gelangen.

Über Seiten dritter

Viele Verzeichnisse haben sich zu ‘Datenhubs’ in ihrem Bereich entwickelt. Pachube.com verbindet Menschen mit Senoren mit solchen die Daten von ihnen haben wollen. Seiten wir Infochimps.com oder Talis.com erlauben es öffentlichen Verwaltungen große Mengen an Daten kostenlos zu hosten.

Solche Seiten können sehr sinnvoll sein. Insbesondere wenn sich dort schon Communities zu bestimmten Themen gebildet haben, sollten Sie darüber nachdenken Ihre Daten dort zur Verfügung zu stellen.

Umfassende Datenplattformen stellen eine Infrastruktur bereit die dem Bedarf gerecht werden kann. Oftmals werden auch Statistiken und Hilfen für die Nutzung der Daten bereit gestellt.

Plattformen anderer können, gerade für Ministerien, Probleme bergen. Es wird ein Stückweit die eigene Kompetenz bzw. Handlungsfähigkeit aufgegeben, was gerade bei Ministerien zu Problemen führen kann. Es sollte immer Sichergestellte werden, dass die Plattform auf offenen Standards basiert, damit möglichst viele Menschen darauf zugreifen können.

Über FTP-Server

Eine weniger moderen Art der Bereitstellung von Daten ist das ‘File-Transfer-Protocol (FTP)’. FTP ist geeignet für die bedürfnisse technisch versierter Nutzer wie Software-Entwickler und Wissenschaftler.

Aber FTP ist nicht beliebt. Statt Informationen auf einer Website abzurufen, müssen Nutzer sich durch Daten- und Ordnerwüsten kämpfen - wie auf ihrem alten PC. Auch wenn es also technisch durchaus geeignet ist hat FTP nicht das Potenzial zu einer beliebten Datenplattform zu werden.

als Torrents

BitTorrent is a system which has become familiar to policy makers because of its association with copyright infringement. BitTorrent uses files called torrents, which work by splitting the cost of distributing files between all of the people accessing those files. Instead of servers becoming overloaded, the supply increases with the demand increases. This is the reason that this system is so successful for sharing movies. It is a wonderfully efficient way to distribute very large volumes of data.

Als API

Daten können über eine API veröffentlicht werden. APIs sindSchnittstellen, die es Programmierern erlauben gezielt auf bestimmte Datenbestände zuzugreifen. APIs sind in der Regel mit Datenbanken verbunden, die Informationen in echtzeit zur Verfügung stellen.

Offene Daten möglichst unverarbeitet zum Download anzubieten sollte die höchste Priorität aller Open Data Initiativen sein. Eine API ist interessant und nützlich, hat aber ihre eigenen Herausforderungen:

  1. Die Kosten: Eine API erfordert mehr Entwicklungsaufwand und regelmäßige Wartung und Pflege.
  2. Die Erwartungen: Um eine aktive Community zu pflegen ist es wichtig Sicherheit und Verlässlichkeit zu geben. Wenn etwas schief geht erwartet die Community, dass diese Probleme möglichst schnell behoben werden. In vielen Fällen werden Mitglieder der Community bereit sein zu helfen.

Zugang zu Datenrepositories stellt sicher, dass:

  1. es gibt keine Abhängigkeit zum ursprünglichen Bereitsteller der Daten, d.h. auch bei restrukturierungen oder finanzierungsengpässen bleiben die Daten weiterhin verfügbar.
  2. jeder sich eine Kopie der Daten beschaffen und weiterverteilen kann. Dies reduziert die Kosten der Weiterverteilung für die ausgebende Behörde, außerdem gibt es keinen “single point of failure” mehr.
  3. andere können neue Dienstleistungen mit den Daten entwickeln, da sichergestellt ist, dass die Daten nicht von heute auf morgen wieder verschwinden.

Daten als komplett Paket zum Download anzubieten erlaubt es anderen, diese Daten abseits ihrer ursprünglichen Zwecke zu nutzen. Daten können z.B. in ein anderes Format gebracht werden oder mit anderen Daten zusammengestellt werden.

Die Server von Eurostat <http://epp.eurostat.ec.europa.eu/portal/page/portal/eurostat/home/> bieten mehr als 4000 Dateien zum Download an. Diese werden zweimal täglich aktualisiert und bieten Daten im Tab-separated values (TSV) Format an. Außerdem ist eine umfangreiche Dokumentation beigefügt.

Ein anders Beispiel ist der Daten Katalog von Washington D.C. <http://octo.dc.gov/DC/OCTO/>, der die Daten neben CSV und XLS auch als Live-Feed zum Download anbietet.