Menjadikan Data Tersedia (Teknis Keterbukaan)

Data terbuka membutuhkan keterbukaan secara teknis sebagaimana keterbukaan yang resmi secara hukum. Khususnya, data harus bisa tersedia secara masal dalam format yang dapat dibaca mesin.

Available
Data seharusnya dihargai tidak lebih dari biaya reproduksi yang wajar, sebaiknya dijadikan sebagai unduhan gratis dari internet. Model penghargaan ini dapat dicapai karena lembaga anda tidak perlu menangani biaya apapun saat menyediakan data untuk digunakan.
In bulk
Data harus tersedia dalam kumpulan yang lengkap. Jika anda memiliki daftar yang dikoleksi di bawah aturan undang-undang, seluruh daftar tersebut harus tersedia untuk diunduh. Sebuah API web atau layanan serupa juga dapat menjadi sangat berguna, tetapi peran mereka bukan sebagai sebuah pengganti untuk akses masal.
In an open, machine-readable format
Penggunaan-ulang data yang disediakan oleh sektor publik tidak seharusnya tunduk pada pembatasan paten. Lebih penting lagi, pastikan bahwa anda telah menyediakan format yang dapat dibaca mesin yang memungkinkan untuk penggunaan-ulang yang lebih luas lagi. Untuk mengilustrasikannya, anggaplah statistik yang dipublikasikan sebagai dokumen PDF, daripada digunakan untuk kepentingan pencetakan yang berkualitas tinggi. Sementara statistik ini dapat dibaca oleh manusia, namun sangat sulit bagi komputer untuk menggunakannya. Hal ini akan sangat membatasi kemampuan yang lainnya untuk menggunakan ulang data.

Berikut ini beberapa kebijakan yang akan sangat menguntungkan:

  • Buat seringkas mungkin,
  • Bergerak cepat
  • Jadilah pragmatis.

Secara khusus akan lebih baik memberikan data mentah sekarang daripada data yang sempurna dalam waktu enam bulan.

Terdapat banyak cara yang berbeda untuk menjadikan data tersedia bagi yang lain. Yang paling alami di era internet adalah publikasi secara daring. Terdapat banyak variasi dari model ini. Yang paling mendasar, lembaga-lembaga telah membuat data mereka tersedia melalui situs web mereka sendiri dan sebuah katalog sentral mengarahkan pengunjung ke sumber yang tepat. Namun, terdapat pula alternatifnya.

Ketika konektivitas menjadi terbatas atau ukuran data menjadi sangat besar, maka pendistribusian dengan menggunakan format lain dapatlah dibenarkan. Bagian ini juga mendiskusikan beberapa alternatif, yang dapat dilakukan untuk menjaga beban biaya tetap kecil.

Metode daring

Melalui situs anda yang telah ada

Sistem yang paling mudah dikenali tim konten web anda adalah dengan menyediakan beberapa file untuk diunduh dari halaman web. Sama seperti anda saat ini yang menyediakan akses ke dokumen diskusi, file-file data lebih disukai menjadi tersedia dengan cara ini.

Salah satu kesulitan dalam pendekatan ini adalah sangat sulit bagi orang luar untuk menemukan keberadaan informasi yang telah diperbarui. Pilihan ini menambah beban pada orang-orang untuk menciptakan perangkat tambahan pada data Anda.

Melalui situs pihak ke-3

Banyak repositori telah menjadi pusat data dalam bidang tertentu. Sebagai contoh, pachube.com didesain untuk menghubungkan orang-orang dengan sensor bagi mereka yang berharap untuk mengakses data darinya. Situs seperti Infochimps.com dan Talis.com memperkenankan lembaga sektor publik untuk menyimpan data raksasa untuk digratiskan.

Situs pihak ketiga bisa sangat berguna. Alasan utama untuk hal ini adalah mereka telah dikumpulkan bersama-sama dengan sebuah komunitas dari orang-orang yang berminat dan bersama kumpulan-kumpulan data lainnya. Ketika data anda menjadi bagian dari platform ini, bentuk ketertarikan yang positif diciptakan.

Platform grosir data sudah menyediakan infrastruktur yang dapat mendukung kebutuhan. Mereka bahkan menyediakan informasi analisis dan penggunaannya. Untuk lembaga sektor publik, mereka secara umum gratis.

Platform ini dapat mempunyai dua beban. Yang pertama adalah kebebasan. Lembaga anda harus mampu menghasilkan kendali kepada orang lain. Hal ini seringkali membuat sulit secara politik, hukum atau operasionalnya. Beban kedua mungkin adalah keterbukaan. Pastikan bahwa platform data anda tidak mempedulikan tentang siapa yang dapat mengaksesnya. Para pengembang perangkat lunak dan para ilmuwan menggunakan banyak sistem operasi, mulai dari ponsel pintar hingga superkomputer. Mereka semuanya harus dapat mengakses data tersebut.

Melalui server FTP

Sebuah metode yang kurang modis dalam penyediaan akses adalah melalui File Transfer Protocol (FTP). Ini mungkin cocok bila pemirsa anda adalah teknisi, seperti pengembang perangkat lunak dan ilmuwan. Sistem FTP berjalan dalam kerangka HTTP, tetapi ia secara khusus didesain untuk mendukung transfer file.

FTP jauh dari kenikmatan. Daripada menyediakan sebuah situs, melihat melalui sebuah server FTP mirip seperti melihat folder pada komputer. Oleh karena itu, meskipun itu sesuai dengan tujuan, ada kapasitas yang jauh lebih sedikit bagi perusahaan pengembang web untuk membebankan biaya penyesuaian.

Sebagai torrent

BitTorrent adalah sebuah sistem yang telah menjadi akrab bagi para pembuat kebijakan karena korelasinya dengan isu pelanggaran hak cipta. BitTorrent menggunakan file-file yang disebut torrent, yang bekerja dengan memisahkan biaya distribusi file-file di antara orang-orang yang mengakses file-file tersebut. Alih-alih, server menjadi kelebihan beban, pasokan menjadi meningkat seiring dengan meningkatnya permintaan. Hal inilah yang menjadi alasan sistem ini menjadi sangat sukses dalam berbagi film. Ini adalah cara yang luar biasa efisiennya untuk mendistribusikan volume data yang sangat besar.

Sebagai sebuah API

Data dapat dipublikasikan melalui Application Programming Interface (API). Antarmuka ini telah menjadi sangat populer. Ia memungkinkan para pemrogram untuk memilih secara spesifik jumlah datanya, daripa menyediakan semua data secara masal dengan sebuah file yang besar. API biasanya terhubung ke basisdata yang terus diperbarui secara aktual. Hal ini berarti membuat informasi menjadi tersedia melalui API dapat memastikan data itu selalu terperbarui.

Mempublikaskan data mentah secara masal harus menjadi perhatian khusus dari semua inisiatif data terbuka. Terdapat jumlah biaya untuk menyediakan sebuah API:

  1. Harga. Mereka membutuhkan lebih banyak pengembangan dan pemeliharaan daripada menyediakan file.
  2. Harapan. Dalam rangka mendorong komunitas pengguna di balik sistem, sangatlah penting untuk memberikan kepastian. Ketika terjadi sesuatu yang buruk, anda akan diharapkan menanggung biaya untuk memperbaikinya.

Akses ke data masal dapat memastikan bahwa:

  1. tidak ada ketergantungan dengan penyedia data orisinal, yang berarti sekalipun terjadi restrukturisasi atau siklus anggaran yang mengubah situasi, namun data masih tetap tersedia.
  2. Siapapun bisa mendapatkan sebuah salinannya dan mendistribusikannya. Hal ini akan menekan biaya distribusi pada lembaga sumber dan dapat memastikan tidak akan ada kegagalan sedikitpun.
  3. lainnya dapat membangun layanan mereka sendiri menggunakan data tersebut, karena mereka punya keyakinan bahwa data tersebut tidak akan diambil dari mereka.

Menyediakan data secara masal memungkinkan orang lain untuk menggunakan data di luar tujuan awalnya. Misalnya, hal itu dapat memungkinkan untuk diubah menjadi format baru, terkait dengan sumber daya lainnya, atau diversi dan arsiparis di banyak tempat. Sedangkan versi terbaru dari data dapat dibuat tersedia melalui API, data mentah harus disediakan dalam jumlah besar secara berkala.

Sebagai contoh, Eurostat statistical service mempunyai fasilitas pengunduhan masal yang menawarkan lebih dari 4000 file data. Selalu diperbarui dua hari sekali, menawarkan data dalam format Tab-separated values (TSV), dan termasuk dokumentasi mengenai fasilitas pengunduhan sebagaimana dokumentasi tentang file datanya.

Contoh lainnya adalah District of Columbia Data Catalog, yang memungkinkan data untuk diunduh dalam format CSV dan XLS dan sebagai tambahannya feeds langsung dari data.