어떻게 데이터를 공개할 것인가¶
본 섹션은 핸드북의 핵심으로 데이터 소유자가 데이터를 공개하는 방법에 대한 구체적인 조언을 제공한다. 기초에 대한 자세한 검토와 문제점을 동시에 살펴본다. 마지막으로 발생할 수 있는 미묘한 이슈들에 대해 논의할 것이다.
데이터를 공개할 때 따르도록 추천하는 세 가지 규칙이 있다:
단순명료. 작고, 간단하고, 빠르게 시작한다. 모든 데이터셋이 지금 당장 공개될 필요는 없다. 하나의 데이터셋이나 규모가 큰 데이터의 일부를 공개하는 것으로 시작하는 것도 좋을 수 있다. – 물론 많은 데이터셋을 공개할 수 있다면 더욱 좋다.
오픈 데이터는 혁신에 대한 것임을 기억해야 한다. 가능한 신속히 진행하는 것이 좋은데 이는 모멘텀을 만들고 경험을 통해 배울 수 있기 떄문이다. - 혁신은 성공만큼 실패가 있으며, 모든 데이터 집합이 항상 유용한 것도 아니다.
초기에, 자주 참여. 시민들, 기업들 또는 개발자들가 되어 데이터를 적극적이며 잠재적으로 활용할 수 있는 사용자 및 재사용자로 참여한다. 이런 활동은 다음 버전의 서비스에서 관련이 있을 수 있는 가능성을 보장할 것이다.
대다수의 데이터가 최종 사용자에게 직접 도착하기 보다 ‘정보-중개자’를 통해 전달된다는 것을 기억할 필요가 있다. 이런 사람들은 데이터를 보유하면서 표현된 데이터를 변환하거나 혼합한다. 예를 들어, 많은 사람들이 규모가 큰 GPS 데이터베이스가 필요하지 않을 수 있기 때문에 지도를 선호할 수 있다. 따라서, 우선 정보 중개자가 참여하여 자료를 재사용하고 재목적화할 것이다.
일반적인 우려와 오해에 대한 설명. 정부와 같이 규모가 큰 조직과 함께 또는 조직내에서 일 할 때 매우 중요하다. 데이터를 공개할 때 수많은 질문과 우려에 마주치게 될 것이다. 이 때 (a) 가장 중요한 점을 구체화하고, (b) 가능한 빠른 단계에서 문제를 조정하는 것이 중요하다.
데이터를 공개하는 4 단계가 있으며 각 단계에 대해 아래에서 상세하게 설명할 것이다. 이것은 대략적인 순서이며 대부분의 단계는 동시에 이루어질 수 있다.
데이터셋 선택하기. 공개할 계획이 있는 데이터셋을 선택한다. 후속 단계에서 문제가 있을 때 이 단계로 복귀할 수 있거나 복귀할 필요가 있다는 것을 주의해야 한다.
공개 라이센스의 적용.
- 데이터에 어떤 지적재산권을 명시할 것인지 결정한다.
- 모든 지적재산권을 허용하는 적절한 ‘공개’ 라이센스를 적용하고, 위에 있던 ‘어떤 데이터를 오픈할 것인가’ 섹션에서 논의했던 공개성의 정의를 지원한다.
- NB: 첫번째 단계로 돌아갈 수 없다면 다른 데이터셋을 선택한다.
데이터를 이용할 수 있게 하기- 대량으로 유용한 형식으로. API를 이용하여 데이터를 이용하는 것도 대체 방법으로 고려할 수 있다.
데이터를 탐색할 수 있게 하기 - 웹에 게시하고, 공개 데이터의 목록을 중앙의 목록에 조직화한다.