Rendre les données accessibles (ouverture technique)¶
Open data doit être ouvert aussi bien techniquement que juridiquement. Plus précisément les données doivent être disponible en vrac dans une format Lisible par les machines.
- Available
- Les données doivent être disponible dans leurs ensembles et pour un coût raisonnable de reproduction, de préférence téléchargeable sur internet. Le modèle de tarification est atteint parce que votre organisme ne devrait pas avoir de surcoût en fournissant des données pour utilisation.
- In bulk
- The data should be available as a complete set. If you have a register which is collected under statute, the entire register should be available for download. A web API or similar service may also be very useful, but they are not a substitutes for bulk access.
- In an open, machine-readable format
- Re-use of data held by the public sector should not be subject to patent restrictions. More importantly, making sure that you are providing machine-readable formats allows for greatest re-use. To illustrate this, consider statistics published as PDF documents, often used for high quality printing. While these statistics can be read by humans, they are very hard for a computer to use. This greatly limits the ability for others to re-use that data.
Voici quelques politiques qui seront d’une grande utilité:
- Faire simple
- Déplacement rapide
- Etre pragmatique.
En particulier, il vaut mieux fournir des données brutes immédiatement que des données parfaites dans un délai de six mois.
There are many different ways to make data available to others. The most natural in the Internet age is online publication. There are many variations to this model. At its most basic, agencies make their data available via their websites and a central catalog directs visitors to the appropriate source. However, there are alternatives.
Quand :term`la connectivité` est limité ou la taille des données est extrémement importante, la distribution depuis un autre format peut être justifié. Cette section examinera également des solutions de rechange, qui peuvent agir pour maintenir les prix très bas.
Méthode en ligne¶
Depuis un site tiers¶
Le système qui sera le plus approprié à votre équipe des contenus web est de fournir des fichiers téléchageables depuis une page web. Tout comme vous fournissent actuellement l’accès aux documents de discussion, les fichiers de données sont content d’être mis à la disposition de cette façon.
Une des difficulté avec cette approche est qu’il est difficile pour une personne extérieur de découvrir où se trouve les données à jour. Cette option reste cependant à la charges des personnes qui créent des outils avec vos données.
Depuis un site tiers¶
Beaucoup de référenciel sont devenus des plaques tournantes de données dans des domaines particuliers. Par exemple, pachube.com est conçu pour connecter les gens avec des capteurs pour ceux qui souhaitent accèder à leurs données. Des sites comme infochimps.com et talis.com permettent aux organisations du secteur public de stocker de grandes quantités de données gratuitement.
Third party sites can be very useful. The main reason for this is that they have already pooled together a community of interested people and other sets of data. When your data is part of these platforms, a type of positive compound interest is created.
Des plateformes de données brutes fournissent l’infrastructure qui peut répondre à la demande. Elle fournissent souvent des statistiques et des informations sur l’usage. Pour les agences du secteur public, elle sont généralement gratuites.
Ces plates-formes peuvent avoir deux types de coûts. La premier est l’indépendance. Votre organisation doit être en mesure de céder les contrôles à d’autres. C’est souvent politiquement, ou juridiquement difficile. Le second coût peut être l’ouverture. Assurez-vous que votre plate-forme de données de données est agnostique pour pouvoir y accèder. Les développeurs de logiciels et les scientifiques utilisent de nombreux systèmes d’exploitation, à partir de smartphones aux supercalculateurs. Ils doivent tous être en mesure d’accéder aux données.
Depuis un serveur FTP¶
Une méthode moins à la mode pour fournir l’accès aux fichiers se fait via le protocole de transfert de fichier (FTP). Cette approche est intéressante si votre publique est technique, telles que les développeurs de logiciels et les scientifiques.
FTP est tombé en disgrâce. Plutôt que de fournir un site web, la recherche depuis un serveur FTP ressemble un peu à la façon de rechercher des dossiers sur un ordinateur. Par conséquence, même si elle est adaptée à son objectif, il est moins pertient pour les entreprises de développement web qui souhaite se charger de la personnalisation.
comment torrents¶
BitTorrent is a system which has become familiar to policy makers because of its association with copyright infringement. BitTorrent uses files called torrents, which work by splitting the cost of distributing files between all of the people accessing those files. Instead of servers becoming overloaded, the supply increases with the demand increases. This is the reason that this system is so successful for sharing movies. It is a wonderfully efficient way to distribute very large volumes of data.
comme une API¶
Data can be published via an Application Programming Interface (API). These interfaces have become very popular. They allow programmers to select specific portions of the data, rather than providing all of the data in bulk as a large file. APIs are typically connected to a database which is being updated in real-time. This means that making information available via an API can ensure that it is up to date.
Publier de gros ensembles de données brutes devrait être la priorité numéro 1 de toute initiative de données ouvertes. Il y a des coûts associés à la fourniture d’une API:
- Le prix. Ils demandent beaucoup de développement et de maintenance que de fournir des fichiers.
- Les attentes. Afin de favoriser une communauté d’utilisateurs derrière le système, il est important de fournir une certitude. Lorsque les choses tournent mal, vous serez appelé à assumer les coûts de correction.
L’accès aux données en vrac veille à ce que:
- there is no dependency on the original provider of the data, meaning that if a restructure or budget cycle changes the situation, the data are still available.
- quelqu’un d’autre peut obtenir un exemplaire et le redistribuer. Cela réduit le coût de la distribution pour l’organisme source et qu’il n’y a pas de point unique de défaillance.
- d’autres peuvent développer leurs propres services utilisant les données car ils ont la certitude que les données ne leurs seront pas retirées.
Providing data in bulk allows others to use the data beyond its original purposes. For example, it allows it to be converted into a new format, linked with other resources, or versioned and archived in multiple places. While the latest version of the data may be made available via an API, raw data should be made available in bulk at regular intervals.
Par exemple, le service de statistiques Eurostat <http://epp.eurostat.ec.europa.eu/portal/page/portal/eurostat/home/> a un plate-forme de téléchargement groupé offrant plus de 4000 fichiers de données. Il est mis à jour deux fois par jour, présente les données dans le format Tab-separated values (TSV) et inclue une documentation sur la plate-forme de téléchargement, ainsi que sur les fichiers de données.
Another example is the District of Columbia Data Catalog, which allows data to be downloaded in CSV and XLS format in addition to live feeds of the data.