Что такое Открытые данные?¶
Это руководство посвящено открытым данным, но что же это в точности такое? В частности, что делает открытые данные открытыми, и о каких именно данных мы говорим.
Что значит открытость?¶
Это руководство посвящено открытым данным — но что же в точности такое открытые данные? Открытые данные в нашем случае описывает `определение открытости`_:
Открытые данные - это информация, которую кто угодно может свободно использовать и распространять. Допустимы лишь требования указывать источник данных и распространять их на тех же условиях, что и исходные.
`Полное определение открытости`_ раскрывает в деталях, что это значит. Выделим самое важное:
- Доступность и читаемость: данные должны быть доступны целиком не дороже разумной стоимости их воспроизведения; желательно через интернет. Формат данных должен быть удобным для чтения и изменения.
- Повторное использование и распространение: данные должны предоставляться на условиях, которые разрешают их повторное использование и распространение, в том числе - в комбинации с другими наборами данных.
- Всеобщее участие: каждый должен иметь возможность использовать и распространять данные. Не должно быть дискриминации областей применения, людей или групп. Например, ограничение «только для некоммерческого использования», которое запрещает «коммерческое» применение, или ограничение возможных областей применения (к примеру, только в образовании), недопустимы.
Если у вас возник вопрос, почему так важно чётко определить, что значит открытость и почему используется такое определение, есть простой ответ: интероперабельность.
Интероперабельность означает способность различных систем и организаций работать совместно (англ. inter-operate). В данном случае, речь идёт о способность к взаимодействию — или «перемешиванию» различных наборов данных.
Интероперабельность важна, поскольку позволяет различным компонентам работать вместе. Возможность выделения компонентов и их «сборки» в единое целое — ключевая для построения больших и сложных систем. Без интероперабельности это практически невозможно - вспомним известную легенду о Вавилонской башне, когда (не)способность общаться (взаимодействовать) загубила строительство.
Что-то подобное происходит и с данными. Суть «общего» в данных или коде состоит в том, что «открытый» материал, содержащийся в них, можно беспрепятственно смешать с другим «открытым» материалом. Такое взаимодействие, безусловно, — ключевой фактор, позволяющий достичь основного практического преимущества «открытости»: значительных улучшений в части комбинирования различных наборов данных и, как следствие, возможность разрабатывать больше качественных продуктов и услуг (эти преимущества детально рассмотрены в разделе «Почему Открытые Данные»).
Благодарю чёткому определение открытости вы можете быть уверены, что получив два набора открытых данных из двух разных источников, вы сможете скомбинировать их. Это означает, что мы избегнем нашей «вавилонской башни»: множества наборов данных, которые невозможно (или почти невозможно) соединить в большую, по-настоящему полезную, систему.
О какой информации идет речь?¶
Читатели уже видели примеры всевозможных данных, которые уже открыты или могут стать открытыми — и ниже мы дадим ещё примеров. Однако, полезно будет остановиться ненадолго на том, какие данные являются или могут стать открытыми — и, что не менее важно, что открытым не будет.
Главное, что когда мы открываем данные, нас интересуют обезличенные данные, то есть не содержащие информацию об отдельных людях.
Использование правительственных данных порой также ограничено из соображений национальной безопасности.