데이터셋 선택¶
첫번째 단계는 공개할 데이터셋을 선택하는 것이다 - 데이터 공개의 전체 프로세스가 반복적이기 때문에 문제가 발생하면 이 단계로 돌아올 수 있다.
공개할 데이터셋을 명확히 알고 있다면 다음 섹션으로 이동할 수 있다. 그러나, 대부분의 경우, 특히 규모가 큰 조직에서 공개할 데이터셋을 선택하는 것 자체가 어려운 문제이다. 이런 문제를 어떻게 처리할 것인가?
목록을 만드는 것은 공개할 데이터셋을 확인하기 위해 신속한 과정으로 진행되어야 한다. 후속 단계에서 개별 데이터셋이 적합한지 검토할 수 있는 기회가 있다.
보유하고 있는 모든 데이터셋의 목록을 만들어야 되는 **요구사항은 없다 **. 모든 데이터를 발행하는 것이 실현 가능한 것인지 판단하는 것이 중요하다 (공개적으로 또는 다른 방법으로) - 이전 섹션
커뮤니티에 묻기¶
먼저 커뮤니티에 문의하는 것을 추천한다. 커뮤니티에 있는 사람들은 데이터에 접근하여 사용할 수 있으며, 데이터의 가치에 대해 잘 이해할 수 있다.
- 피드백을 원하는 잠재적인 데이터셋의 목록을 준비한다. 목록이 기대치와 반드시 일치될 필요는 없으며, 데이터에 대한 수요를 파악하는 것이 목적이다. 다른 나라들의 열린 데이터 목록을 기반으로 만들 수 있다.
- 코멘트를 위한 요청 만들기
- 요청을 웹페이지를 통해 공개한다. 해당 요청은 고유한 URL을 통해 접근할 수 있어야 하며, 소셜 미디어를 통한 공유는 요청사항을 쉽게 발견할 수 있게 해준다.
- 응답을 쉽게 제출할 수 있는 방법을 제공한다. 등록을 요구하는 것은 응답 수를 감소시킬 수 있기 때문에 피하는 것이 좋다.
- 메인 페이지로 돌아올 수 있도록 요청사항을 관련있는 메일링 리스트, 포럼 및 개인에게 퍼트려라.
- 자문 이벤트를 운영하라. 이벤트는 일반적인 비즈니스 담당자, 데이터 wrangler (데이터를 돌보는 사람), 공무원이 참여할 수 있는 편한 시간에 운영하는 것이 필요하다.
- 기관을 대신할 수 있는 정치인에게 요청하라. 열린 데이터는 정부 정보에 접근을 확대할 수 있는 폭 넓은 정책의 일부분이 되어야 한다.
비용 근거¶
얼마나 많은 예산을 정부기관이 보유하고 있는 데이터의 수집과 유지관리를 위해 지출하는가? 특정한 데이터셋에 지출이 많다면, 사람들이 해당 데이터에 접근하고 싶은 가능성이 높을 수 있다.
이러한 논쟁은 무임승차에 대한 이해관계에 상당히 민감한 경향이 있다. “다른 사람들이 왜 비싼 정보를 무료로 얻어야 하는가?”라는 질문의 답은 해당 비용이 특정한 기능을 수행하기 위해 공공 부분에 의해 흡수되기 때문이다. 그러나 데이터가 한번 수집된 후, 해당 데이터를 제 3자에게 보내는 비용은 거의 없다. 따라서 공공기관은 비용을 청구하지 않아야 한다.
공개의 용이성¶
때론 가장 가치있는 데이터가 무엇인지 결정하는 것보다 대중에게 쉽게 줄 수 있는 데이터를 살펴보는 것이 유익할 수 있다. 작고, 쉬운 데이터 배포는 조직내의 큰 행동 변화를 이끌어내는 기폭제 역할을 할 수 있다.
그러나 소규모 공개 방식에서 주의할 것은 이러한 데이터를 통해 구축할 수 있는 없어 가치를 찾기 힘들 수 있다는 것이다. 이러한 일이 발생하면 전체 프로젝트의 신념이 약화될 수 있다.
동료 살피기¶
열린 데이터는 점점 확산되는 움직임이다. 다른 분야에서 하는 것을 이해하는 사람들이 당신의 분야에서 많을 수 있다. 정부 기관이 하는 일에 대한 기준 목록을 만들어야 한다.