왜 데이터를 공개해야 되는가?¶
열린 데이터, 특히 :term:`열린 정부 데이터`는 아직까지 손대지 않은 엄청난 자료원이다. 많은 개인과 조직들이 그들의 업무를 수행하기 위해 다양한 형식의 데이터를 광범위하게 수집한다. 정부는 수집된 데이터의 품질과 집중성과 더불어 정부 데이터의 대부분이 법적으로 공공 데이터라는 측면에서 매우 중요한 역할을 한다. 따라서 공공 데이터는 다른 사람이 사용하기 위해 공개되고 활용되게 만들어야 한다. 이것이 왜 관심일까?
우리가 기대할 수 있는 가치있는 열린 데이터가 다양한 분야에 있으며, 이런 데이터를 사용한 사례가 존재한다. 정부를 포함해 다양한 개인과 조직이 열린 데이터의 활용을 통해 혜택을 얻을 수 있다. 그러나, 동시에 미래의 가치가 어떻게 어디에서 나타날 수 있는지 예측하는 것은 불가능하다. 혁신의 본질적 특성은 진화는 예상하지 않은 곳으로부터 온다는 것이다.
열린 정부 데이터가 가치를 만들어내는 다양한 영역의 참조가 가능한데, 몇 개 분야는 다음과 같다:
- 투명성과 민주적인 통제
- 참여
- 자기 성장
- 개선 또는 새로운 개인 제품 및 서비스
- 혁신
- 정부 서비스의 향상된 효율성
- 정부 서비스의 향상된 효과성
- 정책의 임팩트 측정
- 결합된 데이터로부터 새로운 지식과 대용량 데이터에서의 패턴
이 분야의 대표적인 사례.
투명성 관점에서 핀란드의 ‘tax tree’, 영국의 ‘where does my money go’ 프로젝트는 정부의 세금이 어떻게 지출했는지 보여준다. 캐나다는 열린 데이터를 사용하여 자선금 비리에 있어 3.2억 달러를 절약한 사례를 갖고 있다. 덴마크의 olketsting.dk 사이트는 의회 활동, 법안 입법 과정을 추적함으로써 의회에서 정확히 어떤 일이 일어났는지, 어떤 정치인이 포함되는지 확인할 수 있다.
열린 정부 데이터는 개인의 삶에 있어 더 좋은 의사결정이나 사회에 조금 더 적극적으로 참여할 수 있게 도울 수 있다. 덴마트의 한 여성은 덴마트의 모든 공공 화장실을 보여주는 findtoilet.dk를 개발하여, 방광 문제를 갖고 있는 사람들이 더 많이 외출할 수 있는 신뢰를 만들어 주었다. 네덜란드의 vervuilingsalarm.nl 서비스는 사용자가 위치한 인근의 공기 품질이 미리 정해놓은 임계치에 도달할 경우 경고 메세지를 보내준다. 뉴욕에선 애완견과 함께 산책할 수 있는 곳, 같은 공원들을 사용하는 사람을 쉽게 찾을 수 있다. 영국의 ‘mapumental’나 독일의 ‘mapnificent’ 등의 서비스를 통해 사용자는 통근에 소요되는 시간 , 주택 가격 및 그 지역의 아름다움 등을 고려하여 거주하기 좋은 장소를 찾을 수 있다.
경제적 측면에서 열린 데이터는 매우 중요하다. 몇몇 연구에 의하면, 열린 데이터의 경제적 가치는 EU에서만 연간 수백억 유로로 평가되었다. 새로운 제품과 회사들이 열린 데이터를 재사용하고 있다. 예를 들어, 덴마크의 husetsweb.dk 사이트는 가정의 에너지 효율성을 향상시키기 위해 재정 계획과 더불어 일을 맡아 해줄 수 있는 건축업자의 탐색 기능을 제공한다. 이 서비스는 지적 정보, 정부 보조금와 지역 트레이드 등록부의 정보를 재활용한 것이다. 구글 번역은 번역 알고리즘을 학습시키기 위해 모든 유럽 언어들이 나타난 방대한 양의 EU 문서를 사용하며, 이를 통해 서비스 품질을 개선한다.
열린 데이터는 정부에게 가치가 있다. 예를 들어, 열린 데이터는 정부의 효율성을 증대시킬 수 있다. 네덜란드의 교육부는 교육과 관련된 모든 데이터를 재사용할 수 있도록 온라인에 배포하고 있다. 데이터의 공개 이후, 그들이 받았던 수많은 질문들이 해결되어 작업량과 비용을 줄였으며, 해결되지 않은 질문들도 관련 데이터를 찾는 곳이 명확해져 공무원이 답을 하기 수월해졌다. 궁극적으로 열린 데이터는 비용을 절감하는 측면에서 정부를 좀 더 효과적으로 만들어준다. 네덜란드의 문화재청은 데이터를 적극적으로 공개하고, 더불어 그들의 업무를 보다 효과적으로 추진하기 위해 아마추어 역사 회원과 위키미디아 파운데이션과 같은 그룹과 협업하고 있다. 이를 통해 데이터 품질의 향상을 이끌 수 있으며 동시에 작은 정부를 실현할 수 있을 것이다.
열린 데이터가 만드는 사회적/경제적 가치를 창출하는 많은 사례가 있지만, 미래에 가능할 수 있는 새로운 것에 대해 인지하지 못하고 있다. 새로운 데이터의 조합은 완전히 새로운 응용 분야를 이끌어낼 수 있는 지식과 통찰력을 만들 수 있다. 과거의 사례를 보듯이, Snow 박사는 19세기 런던에서 식수 오염과 콜레라의 상관 관계를 우물의 위치와 콜레라 사망자 데이터를 결합함으로써 발견했다. 이 발견은 런던의 하수처리 시스템의 구축을 이끌어냄으로써 시민의 전반적인 건강을 크게 개선시킬 수 있었다. 열린 데이터의 조합을 통해 기대하지 않은 통찰력으로부터 이와 같은 진보를 다시 볼 수 있을 것이다.
이와 같은 숨은 잠재력은 공공 정부 데이터를 열린 데이터로 변환함으로써 폭발시킬 수 있다. 그러나 이것은 데이터가 실제로 공개되었을 때만 실현 가능하다. 즉, 사용자가 데이터의 재사용함에 있어 (법적, 재정적 또는 기술적) 제약이 없어야 한다. 모든 제약조건은 공공 데이터를 재사용하는 사람들을 배제시킬 것이고, 데이터를 사용의 가치를 찾는 것을 어렵게 만든다. 잠재력을 실현하기 위해 공공 데이터는 열린 데이터가 되어야 한다.