Maak gegevens beschikbaar (Technische Openheid)

Open data needs to be technically open as well as legally open. Specifically, the data needs to be available in bulk in a machine-readable format.

Available
Gegevens moeten worden geprijsd op niet meer dan een redelijke kostprijs van de reproductie, bij voorkeur als een gratis download van het internet. Dit prijsmodel is bereikt doordat uw tussenkomst niets mag kosten wanneer het komt tot het verstrekken van data.
In bulk
De data moet beschikbaar zijn als een complete set. Als u een register heeft dat verzameld is onder statuut, moet eigenlijk het hele register beschikbaar zijn voor downloaden. Een web API of vergelijkbare service kan ook nuttig zijn, maar zijn geen vervanging voor bulk toegang.
In an open, machine-readable format
Hergebruik van data die gehouden wordt door de publieke sector zou niet onderworpen moeten zijn aan patentbeperkingen. Belangrijker nog, zorgt u er voor dat u machine-leesbare formats aanbiedt, om zo de grootst mogelijke herbruikbaarheid te creëren. Om dit te illustreren, beschouw statistieken gepubliceerd als :abbr: ` PDF (Portable Document Format) ` documenten, vaak gebruikt voor hoge kwaliteit printen. Hoewel deze statistieken gelezen kunnen worden door mensen, zijn ze erg moeilijk te gebruiken voor een computer. Dit beperkt de mogelijkheid voor anderen om deze data te hergebruiken enorm.

Hier zijn een aantal richtlijnen dat van groot nut zullen zijn:

  • Hou het simpel,
  • Werk snel
  • Wees pragmatisch.

In het bijzonder is het beter nu raw data te geven dan perfecte data binnen zes maanden.

Er zijn veel verschillende manieren waarop data beschikbaar kan worden gemaakt voor anderen. Het meest natuurlijk in het internettijdperk is online publicatie. Er zijn veel variaties op dit model. Op het meest basale niveau maken instanties hun data beschikbaar via hun websites en een centrale catalogus dirigeert bezoekers naar de juiste bron. Echter, er zijn alternatieven.

Als de :term: ` connectiviteit ` beperkt is of wanneer de data zeer groot is, kan verspreiding via andere formats gerechtvaardigd zijn. Deze sectie zal ook alternatieven bespreken die gebruikt kunnen worden om de prijzen zeer laag te houden.

Online methoden

Via uw bestaande website

Het systeem wat het meest vertrouwd zal zijn voor uw webinhoud-team is om bestanden voor downloaden aan te leveren vanaf webpagina’s. Net zoals u op dit moment toegang verschaft tot discussie-documenten, vinden databestanden het prima om op deze manier beschikbaar te worden gemaakt.

Een obstakel van deze aanpak is dat het erg lastig is voor een buitenstaander om uit te vinden waar geüpdate informatie te vinden is. Deze optie belast enigszins de mensen die tools maken met uw data.

Via websites van derden

Veel opslagplaatsen zijn knooppunten van data geworden op bepaalde gebieden. Bijvoorbeeld pachube.com, dat ontworpen is om mensen met sensoren te verbinden met degenen die bij de gegevens van deze sensoren willen.Websites als Infochimps.com en Talis.com staan overheidsbedrijven toe om enorme hoeveelheden data gratis op te slaan.

Websites van derden kunnen erg nuttig zijn. De voornaamste reden hiervoor is dat deze al een community van geïnteresseerde mensen en andere datasets bijeen hebben gebracht. Wanneer uw data deel uitmaakt van deze platformen, wordt er een soort positieve samengestelde interest gecreëerd.

Grote dataplatformen verstrekken al de infrastructuur die aan de vraag kan voldoen. Deze verschaffen vaak ook analyses en gebruiksinformatie. Voor overheidsbedrijven zijn deze platformen vaak gratis.

Deze platformen kunnen twee offers vergen. De eerste is onafhankelijkheid. Uw instituut moet controle kunnen bieden aan anderen. Dit is politiek, wettelijk of operationeel gezien vaak lastig. Het tweede offer kan openheid zijn. Verzeker dat uw dataplatform agnostisch is wat betreft wie er bij kan. Softwareontwikkelaars en wetenschappers gebruiken vele besturingssystemen, van smartphones tot supercomputers. Zij moeten allemaal de mogelijkheid hebben om bij de data te komen.

Via FTP servers

Een minder gebruikelijke methode om toegang te verstrekken tot bestanden is via het bestandsoverdracht-protocol, of File Transfer Protocol (FTP). Dit kan een geschikte manier zijn als uw publiek meer technisch is, bijvoorbeeld softwareontwikkelaars of wetenschappers. Het FTP systeem komt in de plaats voor HTTP, maar is specifiek ontworpen voor het ondersteunen van bestandsoverdracht.

FTP is uit de gratie geraakt. In plaats van een website te verstrekken, is het gebruik van een FTP-server net als het gebruik van mappen op een computer. Daarom, zelfs al is het geschikt voor dit doel, is er veel minder capaciteit voor web bedrijven om maatwerk aan te rekenen.

Als torrents

BitTorrent is a system which has become familiar to policy makers because of its association with copyright infringement. BitTorrent uses files called torrents, which work by splitting the cost of distributing files between all of the people accessing those files. Instead of servers becoming overloaded, the supply increases with the demand increases. This is the reason that this system is so successful for sharing movies. It is a wonderfully efficient way to distribute very large volumes of data.

Als een API

Data kan gepubliceerd worden via een :term: ` Application Programming Interface ` (API). Deze interfaces zijn zeer populair geworden. Ze staan programmeurs toe om specifieke porties van de data te selecteren, in plaats van de data in zijn geheel in bulk aan te bieden als bestand. APIs zijn normaal gesproken verbonden met een database die in real-time wordt bijgewerkt. Dit betekent dat informatie beschikbaar maken via een API kan verzekeren dat de data actueel is.

Het publiceren van ruwe data in bulk zou de eerste zorg moeten zijn van alle initiatieven rond open data. Er zijn een aantal kosten voor het verstrekken van een API:

  1. De prijs. Ze vereisen veel meer ontwikkeling en onderhoud dan het verstrekken van bestanden.
  2. De verwachtingen. Om een gebruikers-community achter het systeem te krijgen, is het belangrijk om zekerheid te bieden. Als er iets fout gaat wordt er verwacht dat men het herstel kosteloos vergoed.

Toegang tot bulkdata zorgt ervoor dat:

  1. er is geen afhankelijkheid van de oorspronkelijke aanbieder van de data, wat betekent dat, als een herstructurering of begrotingscyclus de situatie verandert, de data nog steeds beschikbaar blijven.
  2. iemand anders kan een kopie verkrijgen en deze herverdelen. Dit vermindert de kosten van de distributie van het initieel agentschap en dit betekent dat er geen single point of failure is.
  3. anderen kunnen eigen diensten ontwikkelen door het gebruik van de gegevens, omdat ze de zekerheid hebben dat de gegevens niet van hen kan worden weggenomen.

Data in bulk aanbieden staat anderen toe om de data te gebruiken buiten zijn oorspronkelijke doelen. Het staat bijvoorbeeld toe om de data om te zetten in een nieuw format, het te linken aan andere bronnen, het in meerdere versies te hebben en het op te slaan op meerdere plaatsen. Terwijl de meest recente versie van de data beschikbaar kan worden gesteld via een API, kan ruwe data beter beschikbaar worden gesteld in bulk via vaste intervallen.

Bijvoorbeeld, de ` Eurostat statistiekdienst` _ heeft een bulk-download faciliteit die meer dan 4000 databestanden aanbiedt. Deze wordt twee keer per dag bijgewerkt, biedt data aan in :term: ` Tab separated values ` (TSV) format, en heeft zowel documentatie over de downloadmogelijkheid alsook over de databestanden.

Een ander voorbeeld is de ‘ District of Columbia Data Catalog ` _, die toestaat dat data wordt gedownload in CSV en XLS format, naast de live-feeds van de data.