データを発見してもらう¶
オープンデータ は、ユーザーなしでは存在し得ない。他の人たちがそのデータを発見できるようにする必要がある。このセクションでは、そのための様々な手法を取り上げる。
最も大切なことは、中立な場所で公開することだ。そうすれば、組織内の勢力争いや予算の都合などに振り回されずに済む。司法の管轄をまたがった協力は難しいことだろう。しかし、うまく協力すればかなりの恩恵を受けられる。他の人たちがデータを発見しやすくなればなるほど、新しい便利なツールが早く作られるようになる。
既存のツール¶
さまざまなツールがウェブ上に存在する。データを発見されやすくすることに特化したものである。
中でも突出するのが DataHub で、これは世界中のデータセットをまとめたカタログでありデータ格納庫でもある。このサイトを使えば、何かを公開したい個人や組織が自分の欲しいデータを見つけるのが容易になる。
さらに、さまざまな機関や場所に特化したカタログも数多く存在する。科学者のコミュニティの多くは個々の分野のカタログシステムを構築しており、公開用のデータを求めている。
政府の皆さんへ¶
ここまでで明らかになったとおり、正統な方法はその機関自身に政府のデータを扱うカタログを作らせることだ。カタログを構築する際には、各部署が自分の情報を最新に保ちやすいような仕組みを作るようにしよう。
カタログを支援するソフトウェアをゼロから作り上げるという誘惑には負けないように。フリーでオープンソースなソフトウェアによるソリューション (CKAN など) が数多く存在しており、何十カ国もの政府が既にそれを採用している。わざわざ新たなプラットフォームに投資する必要はない。
多くのオープンデータカタログが見落としている点をいくつか取り上げる。プログラムを作る場合にはこれらを検討しよう。
- 個人やコミュニティがデータを追加できるような手段を提供する。地域政府のカタログというよりはむしろ、その地域のカタログととらえたほうが有益だろう。
- データの改良を促すために、データセットの派生物の掲載を許可する。たとえば、誰かが住所データにジオコーディングを施してその結果を共有してくれるかもしれない。データセットの派生物を禁止してしまうと、こういった改良が表に出なくなる。
- データが他の場所に転載されることに対して寛容になる。そうすれば、興味を持つ人たちの間でデータが複製されることになる。河川の水位観測データを公開すれば、そのデータは水文学者のカタログにも掲載されるだろう。
- 誰でも公平にアクセスできるようにする。職員や終身在職権を持つ研究員だけに特別な権限を与えるなどということがあってはならない。これは、コミュニティへの帰属意識を低下させてしまう元となる。
市民の皆さんへ¶
別のカタログを作って、非公式なデータをそこにまとめるようにしよう。
政府にとって、非公式なソースや非公認のソースと連携することは希である。役人たちは、多額の費用をかけてでも、データの誤用や過度の依存にもとづく政治的な問題が起こらないようにするものだ。
さらに政府は、自ら保持する情報に対して営利企業からの情報の影響が及ぶことになるような活動を支援しないだろう。政府は営利活動に懐疑的になるのももっともだ。したがって、コミュニティや業界団体などによる独自のカタログも必要になるはずだ。