데이터를 검색 가능하게 만들기

:term:’열린 데이터’는 사용자가 없다면 아무런 의미가 없다. 사람들이 소스 자료를 찾을 수 있도록 해야 한다. 이 섹션은 3가지 다른 방법을 소개한다.

가장 중요한 것은 정부기관 사이의 정치적 관계와 미래의 예산 사이클에 의존하지 않는 중립적인 공간을 제공하는 것이다. 구역별이든 지리학적이든 관할권에 대한 울타리는 협업을 어렵게 만든다. 그러나 세력을 만드는 중요한 장점은 있다. 제3자가 데이터를 탐색하는 것이 수월해 질수록, 새롭고 유용한 툴이 더 빠르게 만들어 질 것이다.

활용 가능한 도구

데이터를 더 쉽게 찾을 수 있게 만들어 주는 도구들이 웹에 많다.

가장 대표적인 예중에 하나인 DataHub_는 세계 각국의 데이터셋을 위한 목록이며 데이터 저장소이다. 데이터허브 사이트는 개인과 조직이 자료를 쉽게 발행하고, 데이터 사용자들이 필요한 자료를 찾을 수 있게 해 준다.

더불어, 서로 다른 분야와 장소를 위한 전문가 목록이 있다. 수 많은 과학 커뮤니티들은 해당 분야를 위한 목록 시스템을 개발하고 있으며, 데이터는 종종 발행을 위해 요구된다.

정부를 위한

전통적인 실천 방법은 주요 기관이 정부의 데이터를 위한 목록을 만드는 것이다. 목록을 만들 때, 많은 부서들이 정보를 쉽게 최신화할 수 있도록 일정한 구조를 만들어야 한다.

스크래치부터 목록을 지원하는 소프트웨어 개발에 반대한다. 다수의 정부에 의해 수용된 무료 및 오픈소스 소프트웨어 솔루션 (CKAN 같은)이 있으며, 별도의 플랫폼에 투자하는 것이 필요하지 않을 수 있다.

다수의 열린 데이터 목록이 놓치고 있는 몇 가지 이슈가 있다. 계획에 다음을 고려할 수 있다:

  • 개인 및 커뮤니티 부문에서 그들의 데이터를 추가할 수 있는 여지를 제공해라. 지역별 정부의 목록이 아닌 지역의 목록을 고려하는 것이 가치 있을 수 있다.
  • 목록화되는 데이터셋의 파생버전을 허용하여 데이터의 개선을 촉진시킨다. 예를 들어, 지역코드를 기록하고 모든 사람에게 결과를 공유하기 원할 수 있다. 데이터셋에 대해 한가지 버전을 허용하다면 데이터의 개선은 묻혀질 것이다.
  • 데이터가 퍼져 나가는 것에 인내심을 가져라. 즉, 콘텐트는 관심이 있는 커뮤니티에 의해 복제될 수 있다. 강의 수위 모니터링 데이터가 활용 가능하다면, 해당 ㄷ데이터는 수문학자를 위한 목록에 보여질 것이다.
  • 접근의 합리성을 보장한다. 공무원 또는 정년이 있는 연구자를 위한 특권이 있는 접근 권한을 만들는 것을 피해야 한다. 이것은 커뮤니티의 참여와 지원을 약화시킬 것이다.

시민 사회를 위한

비공식 데이터를 위한 부가적인 목록을 적극적으로 생성한다.

정부가 비공식적이거나 권위가 없는 자료와 관련이 있는 것은 매우 드물다. 공무원은 데이터의 오용과 균형없는 사용으로 인한 피해 또는 정치적 방해가 없다는 것을 확인시키기 위해 큰 비용을 지불한다.

더불어, 정부는 영리 목적으로 그들의 데이터를 결합하는 활동을 지지하는데 소극적이며, 명실공히 이익 추구에 회의적이다. 따라서 커뮤니티 그룹, 비즈니스, 다른 사용자의 독립적인 목록이 정당화될 수 있다.