어떻게 데이터를 공개할 것인가

본 섹션은 핸드북의 핵심으로 데이터 소유자가 데이터를 공개하는 방법에 대한 구체적인 조언을 제공한다. 기초에 대한 자세한 검토와 문제점을 동시에 살펴본다. 마지막으로 발생할 수 있는 미묘한 이슈들에 대해 논의할 것이다.

데이터를 공개할 때 따르도록 추천하는 세 가지 규칙이 있다:

  • 단순명료. 작고, 간단하고, 빠르게 시작한다. 모든 데이터셋이 지금 당장 공개될 필요는 없다. 하나의 데이터셋이나 규모가 큰 데이터의 일부를 공개하는 것으로 시작하는 것도 좋을 수 있다. – 물론 많은 데이터셋을 공개할 수 있다면 더욱 좋다.

    오픈 데이터는 혁신에 대한 것임을 기억해야 한다. 가능한 신속히 진행하는 것이 좋은데 이는 모멘텀을 만들고 경험을 통해 배울 수 있기 떄문이다. - 혁신은 성공만큼 실패가 있으며, 모든 데이터 집합이 항상 유용한 것도 아니다.

  • 초기에, 자주 참여. 시민들, 기업들 또는 개발자들가 되어 데이터를 적극적이며 잠재적으로 활용할 수 있는 사용자 및 재사용자로 참여한다. 이런 활동은 다음 버전의 서비스에서 관련이 있을 수 있는 가능성을 보장할 것이다.

    대다수의 데이터가 최종 사용자에게 직접 도착하기 보다 ‘정보-중개자’를 통해 전달된다는 것을 기억할 필요가 있다. 이런 사람들은 데이터를 보유하면서 표현된 데이터를 변환하거나 혼합한다. 예를 들어, 많은 사람들이 규모가 큰 GPS 데이터베이스가 필요하지 않을 수 있기 때문에 지도를 선호할 수 있다. 따라서, 우선 정보 중개자가 참여하여 자료를 재사용하고 재목적화할 것이다.

  • 일반적인 우려와 오해에 대한 설명. 정부와 같이 규모가 큰 조직과 함께 또는 조직내에서 일 할 때 매우 중요하다. 데이터를 공개할 때 수많은 질문과 우려에 마주치게 될 것이다. 이 때 (a) 가장 중요한 점을 구체화하고, (b) 가능한 빠른 단계에서 문제를 조정하는 것이 중요하다.

데이터를 공개하는 4 단계가 있으며 각 단계에 대해 아래에서 상세하게 설명할 것이다. 이것은 대략적인 순서이며 대부분의 단계는 동시에 이루어질 수 있다.

  1. 데이터셋 선택하기. 공개할 계획이 있는 데이터셋을 선택한다. 후속 단계에서 문제가 있을 때 이 단계로 복귀할 수 있거나 복귀할 필요가 있다는 것을 주의해야 한다.

  2. 공개 라이센스의 적용.

    1. 데이터에 어떤 지적재산권을 명시할 것인지 결정한다.
    2. 모든 지적재산권을 허용하는 적절한 ‘공개’ 라이센스를 적용하고, 위에 있던 ‘어떤 데이터를 오픈할 것인가’ 섹션에서 논의했던 공개성의 정의를 지원한다.
    3. NB: 첫번째 단계로 돌아갈 수 없다면 다른 데이터셋을 선택한다.
  3. 데이터를 이용할 수 있게 하기- 대량으로 유용한 형식으로. API를 이용하여 데이터를 이용하는 것도 대체 방법으로 고려할 수 있다.

  4. 데이터를 탐색할 수 있게 하기 - 웹에 게시하고, 공개 데이터의 목록을 중앙의 목록에 조직화한다.