如何将数据开放?

作为全书的核心,这一节将对如何将数据开放给出翔实的建议。我们将会从基础开始,但也会提及一些需要特别注意的地方。最后,我们将会讨论一些可能出现的微妙问题。

在把数据开放时,有三条我们推荐的关键准则:

  • **尽量保持简单:**从小的,简单的,快捷的数据开始开放。并没有要求说所有的数据都应该立刻开放。从一个数据集,甚至一个大数据集的一部分开始是肯定没有问题的。当然,如果你能开放更多数据那就更好了。

    要记住这一切都事关创新。行动越快越好因为这说明你能够创造动力并且吸取经验教训——创新不只关乎于成功也包括失败,并且并不是每一个数据集都是有用的。

  • **尽早且频繁地让他人参与:**尽早且频繁地让现有的或潜在的用户使用或再利用那些数据,不管他们是普通民众,还是商人或是开发者。这将会确保你的服务能在下次迭代中变得更为有用。

    你有必要记得大部分数据不是直接服务于最终用户的,而往往是通过「信息中介商」。这群人将数据变形或者重新整合后再展现给用户。例如,大部分人并不需要大量的GPS座标数据而更期望一张地图。因此,让那些「信息中介商」先参与进来。这样他们能够开始重利用那些数据。

  • **回应常见的担忧和误解:**这一点在和大型组织(例如政府)的合作中尤为重要。当你把数据开放后,你会碰到许多问题和担忧。这就使得找出其中最关键的问题并且尽早回应他们成为关键。

把数据开放涉及到四个主要的步骤,我们将在下面逐一详细介绍。他们之间的顺序不定,甚至大多数时候可以同步执行。

  1. 选取数据集: 选取一个你想开放的数据集。记住当你在之后遇到问题的话,你可以(或者说也需要)回到这一步骤重新选择数据集。

  2. 应用一个开放许可协议:

    1. 确定数据的知识产权。
    2. 应用一个合适的开放协议来确保这些权利以及遵循「开放知识定义」(见「什么是开放数据」一节」)。
    3. 注意:如果你无法应用一个合适的协议,那么就退回到第一步重新选取一个数据集。
  3. 使得数据可获取:将数据提供在可用的、可整批获取的格式下。或者,你可以考虑提供一个API。

  4. **使得数据可发现:**将数据发布到网上或者建立一个中央化额数据目录来列举你所有的开放数据集。