Pon los datos a disposición (Apertura Técnica)

Open data needs to be technically open as well as legally open. Specifically, the data needs to be available in bulk in a machine-readable format.

Available
La información no debe tener un precio mayor que un costo de reproducción razonable, preferentemente debe ser una descarga gratuita en Internet. El modelo de precios se consigue porque su agencia no debe entrar en costos al proveer la información para su uso.
In bulk
Los datos deberían estar disponibles como un conjunto completo. Si usted tiene un registro que se recoge en el estatuto, todo el registro debe estar disponible para su descarga. Una API web o servicio similar, también puede ser muy útil, pero no son sustitutos de acceso masivo.
In an open, machine-readable format
Re-uso de los datos en poder del sector público no debe estar sujeto a restricciones de patentes. Más importante aún, es asegurarse de que usted está proporcionando los formatos legibles que permitan una mayor reutilización. Para ilustrar esto, considere las estadísticas publicadas como :abbr: PDF (Portable Document Format) documentos, a menudo usados ​​para la impresión de alta calidad. Aunque estas estadísticas pueden ser leídas por los seres humanos, son muy difíciles para un ordenador usarlas. Esto limita enormemente la capacidad para que otros puedan volver a utilizar esos datos.

Aquí hay algunas políticas que serán de gran beneficio:

  • Manténgalo simple,
  • Muévete rápido.
  • Sea pragmático.

En particular es mejor brindar datos crudos ahora, que información perfecta en seis meses.

Hay muchas maneras de hacer que la información este disponible para terceros. La más natural en la era de Internet es la publicación en línea. Hay muchas variaciones para este modelo. En el más básico, las agencias disponibilizan la información a través de sus sitios web y un catálogo central direcciona a los visitantes a la fuente apropiada. Sin embargo, hay alternativas.

Cuando: término: la “conectividad” es limitada o el tamaño de los datos demasiado grande, la distribución en otros formatos puede ser justificada. Esta sección también discutirá alternativas, que podrán accionar para mantener los precios muy bajos.

Métodos en línea

A través de tu sitio web existente.

El sistema que será más familiar al equipo de contenidos de tu sitio web es el de proveer archivos para ser descargados desde páginas web. Así como provees acceso a documentos de discusión, archivos de datos serán muy felices de ser disponibilizados de esta manera.

Una dificultad propia de esta aproximación es que es muy dificil para terceros descubrir dónde encontrar información actualizada. Esta opción crea cierta carga para las personas que crean herramientas con tus datos.

A través de sitios de terceros partidos.

Muchos repositorios se han convertidos en centros de datos de campos específicos. Por ejemplo, pachube.com está diseñada para conectar personas con sensores, con aquellos que desean acceder a la información que producen. Sitios como Infochimps.com y Talis.com permiten a las agencias del sector público alojar grandes cantidades de datos gratuitamente.

Third party sites can be very useful. The main reason for this is that they have already pooled together a community of interested people and other sets of data. When your data is part of these platforms, a type of positive compound interest is created.

Las plataformas de datos ya proveen la infraestructura para soportar la demanda. Usualmente proveen análisis y usos de la información. Para las agencias del sector público suelen ser gratuitos.

Estas plataformas pueden tener dos tipos de costos. El primero es la independencia. Su agencia necesita ser capaz de ceder el control a otros. Esto es a menudo política y legalmente difícil. El segundo costo puede ser la apertura, es decir, que su plataforma de datos es independiente de quién puede acceder a él. Los desarrolladores de software y los científicos usan muchos sistemas operativos, desde teléfonos inteligentes hasta superordenadores. Todos ellos deben ser capaces de acceder a los datos.

A través de servidores FTP

Un método menos fashion es el de proveer el acceso a los archivos a través del FTP. Este puede ser un sistema adecuado si su audiencia es técnica, tanto como desarrolladores de software como científicos. El sistema FTP trabaja en lugar del HTTP, pero específicamente se utiliza para la transferencia de archivos.

FTP cayó en desgracia. En lugar de proveer un sitio web, mirar un FTP es como mirar entre carpetas de una computadora. Entonces, aunque esta en las condiciones para su fin, las compañías de desarrollo web tienen mucha menos capacidad para cobrar por personalización.

Como archivo Torrents

BitTorrent” es un sistema que se ha vuelto familiar para los encargados de crear políticas, y esto se debe a su asociación con las infracciones de copyright. BitTorrent utiliza archivos llamados Torrents, que funcionan separando el costo de distribución de los archivos entre toda la gente que accede a esos archivos. En lugar de servidores sobrecargados, el suministro se incrementa con un aumento de demandas. Esta es la razón por la que este sistema es tan existoso para compartir películas. Se trata de una eficiente manera de distribuir grandes volúmenes de datos.

Como un archivo API

Los datos pueden ser publicados a través de una :término: Interfaz de programación de aplicaciones (API). Estas interfaces se volvieron muy populares. Permiten a los programadores seleccionar porciones específicas de información, en lugar de proveerla toda en grandes cantidades en un archivo grande. Las APIs usualmente están conectadas a una base de datos que es actualizada en tiempo real. Esto significa que disponibilizar la información a través de una API garantiza que esté actualizada.

Publicar datos crudos en grandes cantidades debería ser la primera preocupación de todas las iniciativas de datos abiertos. Proveer de una API requiere cierto costo.

  1. El precio. Ellos requieren mucho más desarrollo y mantenimiento que ofreciendo archivos.
  2. Las espectativas. Con el fin de fomentar una comunidad de usuarios detrás del sistema, es importante proporcionar seguridad. Cuando las cosas van mal, se espera que absorbas los costos para solucionarlo.

El acceso a datos en grandes cantidades asegura que:

  1. No hay dependencia del proveedor original de la información, es decir, si la situación cambia por una reestructuración o una modificación presupuestaria, la información todavía estará disponible.
  2. Cualquiera puede obtener una copia y redistribuirla. Esto reduce los costos de distribución desde la agencia y significa que no hay ningún punto librado al azar.
  3. Otros pueden desarrollar sus servicios usando los datos, porque tiene seguridad que los datos no van a ser robados.

Proveer datos en masa permite a otros usar esa información para propósitos distintos de sus originales. Por ejemplo permite que los datos sean convertidos a nuevos formatos, enlazados con otros recursos o versionados y archivados en múltiples lugares. Mientras que la última versión de la información puede ser disponibilizada a través de una API, datos crudos pueden ser disponibilizados en masa durante intervalos de tiempo regulares.

Por ejemplo, el servicio estadístico Eurostat <http://epp.eurostat.ec.europa.eu/portal/page/portal/eurostat/home/> tiene un sitio de descargas por volumen que ofrece más de 4000 archivos. Lo actualizan dos veces al día, ofrece datos en formato {Valores separados por Tabulador} {Tab-separated values} (TSV), e incluye documentación sobre el sitio de descarga, así como los archivos archivos de datos.

Otro ejemplo es el Distrito de Columbia Catálogo de Datos <http://octo.dc.gov/DC/OCTO/>, que permite que los datos sea descargados en formato CSV y XLS, además de las transmisiones en vivo de los datos.