Степан Осокин, DATA+, Географический факультет МГУ
Что такое локальная ИПД
В последнее время словосочетание Инфраструктура пространственных данных (ИПД) широко используется в географии, картографии, геоинформатике и в других дисциплинах, а также на разных уровнях управления, в том числе государственном. Определения ИПД приводились во многих научных, регламентирующих и прочих работах [1, 2, 4, 6, 7, 8, 9, 13]. В общем случае, ИПД можно определить как систему, обеспечивающую взаимодействие лиц, использующих в своей работе различные цифровые пространственные данные, а также как единую среду, обеспечивающую поиск, публикацию и обмен разнообразными географическими информационными ресурсами. ИПД – иерархически упорядоченная система, построенная с использованием информационных и геоинформационных технологий, основанная на общих стандартах пространственных данных и метаданных [3], а также сети географических информационных узлов – геопорталов и каталогов метаданных.
Зачем же нужна ИПД, если и без нее удается использовать в работе цифровые пространственные данные? Дело в том, что объем таких данных (географического знания) быстро растет. Наиболее доступные источники информации (Интернет) переполнены своеобразным «информационным шумом», затрудняющим поиск, в том числе и необходимых географических информационных ресурсов. Создание инфраструктуры пространственных данных помогает решить эту проблему за счет формирования особой поисковой и обменной среды со специфическими инструментами поиска информации по стандартизованным описаниям (метаданным), а также по карте путем указания на ней интересующей области. Стандарты метаданных для использования в ИПД разработаны как для международного, так и для национального уровней [16].
В соответствии с принимаемыми на государственном и международном уровне концепциями, ИПД представляет собой иерархическую систему, имеющую национальный, региональный и муниципальный уровни [9, 13]. Рассматриваются также возможности создания глобальной ИПД. Такая структура используется при формировании основной формы ИПД – национальной. Национальная ИПД (NSDI) позволяет сформировать систему для доступа к базовым пространственным данным, покрывающим территорию одной страны. Эта ИПД в полной мере встраивается в систему государственного управления и соответствует его вертикальной и горизонтальной структуре.
Однако набор задач, решаемых с использованием инфраструктуры пространственных данных, определяет недостаточность ее внедрения только в рамках системы государственного управления. Существует множество случаев, когда какой-либо организации нужна своя система для централизации доступа к ресурсам пространственных данных, или имеется некая локальная территория, нуждающаяся в обеспечении инфраструктурой пространственных данных. При этом требования, предъявляемые к такой системе, отличаются от требований, предъявляемых к государственной (национальной) ИПД. Примеров здесь может быть множество: крупная бизнес-корпорация, в рабочих процессах которой широко используются пространственные данные; территория национального парка или заповедника, для изучения которой применяются ГИС; образовательное учреждение, где ИПД необходима для обеспечения взаимодействия между подразделениями в сфере использования пространственных данных. Именно такую систему – ИПД, имеющую масштабный уровень ниже или примерно такой же, как у муниципального уровня национальной ИПД, но не являющуюся частью создаваемой на государственном уровне системы, и называют Локальной инфраструктурой пространственных данных (ЛИПД).
Возникает вопрос: нужна ли ИПД на локальном уровне, или достаточно просто использовать, к примеру, корпоративные ГИС, основанные на работе ГИС-серверов? Иногда действительно достаточно одной разветвленной геоинформационной системы. Но в том случае, когда в организации (или на локальную территорию) накапливается действительно большой объем пространственных данных, и/или в организации имеется несколько подразделений, каждое из которых может являться поставщиком или пользователем пространственных данных, либо когда становится очевидной необходимость присоединения к системе более высокого масштабного уровня с сохранением своих особенностей, – тогда уже назрела необходимость создания централизованных геоинформационных узлов, предоставляющих каталоги метаданных и географические сервисы. Именно тогда и целесообразен переход от ГИС к локальной ИПД.
Следует упомянуть о некоторых различиях в терминологии, применяемой в России и за рубежом. Так, в зарубежной практике региональной принято называть ИПД, покрывающую крупный географический регион или часть света: Азию, Европу, Ближний восток и т.п. В соответствии с Концепцией формирования ИПД Российской Федерации [9] в качестве регионального обозначен уровень ИПД, соответствующий Субъекту Федерации: Область, Край, Республика, Автономный округ и др. Что касается термина локальная ИПД, тоза рубежом он применяется, но тождествен термину муниципальная ИПД, что создает ряд трудностей при интерпретации некоторых документов. Например, в статье о развивающейся муниципальной ИПД китайского города Хучжоу [15] применение терминов local SDI (локальная ИПД) и municipal SDI (муниципальная ИПД) равнозначно. Об этом следует помнить при анализе зарубежных публикаций, касающихся тематики ИПД. В Концепции создания ИПД Российской Федерации применяется исключительно термин муниципальная ИПД, а словосочетание локальная ИПД не используется.
Особенности локальных ИПД
Локальные инфраструктуры пространственных данных имеют ряд особенностей, которые обусловлены, с одной стороны, необходимостью обеспечить их взаимодействие с ИПД более высокого уровня и, с другой стороны, особыми требованиями и задачами, предъявляемыми к каждой отдельно взятой ЛИПД.
Первая особенность локальной ИПД заключается в том, что она может создаваться не только как инфраструктура пространственных данных на определенную территорию, но и как система, предназначенная для использования в отдельно взятой организации. Эта особенность существенно расширяет потенциальный состав данных в ЛИПД – он может формироваться не только по территориальному, но и, к примеру, по тематическому принципу.
Вторая характерная особенность локальной ИПД – это возможность ее разделения на два сегмента – внешний и внутренний. Внутренний сегмент не выходит за пределы организации или сообщества, формирующего систему. А внешний сегмент предназначен для обеспечения необходимой открытости системы, ее взаимодействия с ИПД более высокого уровня. Такая схема облегчает решение множества проблем, связанных, например, с обеспечением конфиденциальности и ограничением доступа к данным. Так, внутренний сегмент может быть ограничен локальной компьютерной сетью одного учреждения, а внешний может представлять собой общедоступный веб-сайт или сеть сайтов в Интернете. Взаимодействие между внешним и внутренним сегментом осуществляется путем использования общих баз данных и метаданных, включения взаимных ссылок на ГИС-узлах внешнего и внутреннего сегмента и другими способами.
Еще одна особенность локальных ИПД заключается в отсутствии необходимости строго следовать национальным стандартам и регламентам при их формировании. Это облегчает создание системы, соответствующей предъявляемым именно к ней специфическим требованиям и решаемым ею конкретным задачам. Оптимальной является схема, при которой внешний сегмент ЛИПД полностью соответствует национальным или международным стандартам, а внутренний сегмент – только в необходимой степени или не соответствует вообще. Такой подход позволяет оптимизировать формы представления данных и метаданных, состав базовых пространственных данных и пространственных объектов, принципы взаимодействия между пользователями системы и поставщиками данных, помогает обойти ряд сложностей, возникающих при создании ИПД.
Следующая особенность локальных ИПД вытекает из трех предыдущих. Она заключается в учете специфики внедряющей ИПД организации или территории, для которой создается ИПД. Примером может служить ИПД, создаваемая на основе комплексного географического исследования локальной территории, когда состав базовых пространственных объектов и тематических разделов формируется в соответствии с направлениями ведущихся исследований, а не исходя из государственных регламентов. При этом система может взаимодействовать с национальной ИПД через внешний сегмент и совместимые стандарты метаданных.
Еще одной важной особенностью ЛИПД, отличающей ее от государственных ИПД (национальной, региональной, муниципальной), является то, что она возникает не «сверху», а «снизу». Государственная ИПД строится по программе, формируемой в высших эшелонах государственного управления, ее структура едина и обязательна для внедрения на всех уровнях системы. Локальная ИПД – это инициатива, идущая снизу, возникающая на основе потребностей отдельно взятой организации или для описания отдельно взятой территории. При ее формировании учитываются специфические требования, которые могут отсутствовать в структуре государственной ИПД. В то же время локальная ИПД может встраивается в государственную за счет использования совместимых стандартов и открытости внешнего сегмента ЛИПД.
Локальные ИПД и использование геоонтологий
В последнее время в ряде публикаций [5, 11, 14] говорится о целесообразности внедрения онтологий для поиска информации в Интернете. В данном случае используется понятие онтологии, применяемое в информатике и кибернетике. Оно означает своеобразно формализованное, иерархически упорядоченное собрание терминов, описывающих знание о действительности. В контексте задачи оптимизации поиска информации в Интернете онтология играет роль посредника между человеком и поисковой системой. Его миссия состоит в преобразовании пользовательских запросов в запросы, отправляемые поисковой системе, для лучшего соответствия полученных результатов целям пользователя. Преобразование происходит на основе терминологической базы знаний (онтологии) или автоматизированного интеллектуального механизма вычленения ключевых терминов [5].
При формировании инфраструктуры пространственных данных, по определению включающей в себя инструменты поиска географических информационных ресурсов, актуальным становится использование геоонтологий, выполняющих те же задачи, что и общие онтологии, но для поиска географической (пространственной) информации.
В данном случае может быть использовано два подхода: применение геоонтологий для поиска геоинформационных ресурсов в общем информационном пространстве Интернета, или для поиска в отдельном географическом информационном подпространстве, формируемом, главным образом, за счет создания баз геометаданных и сетей геопорталов. Первый подход может быть актуальным при формировании ИПД высокого уровня и в случае наличия соответствующих задач при создании государственных ИПД. Для локальных ИПД такой подход не актуален, так как в задачи создания ЛИПД не входит поиск геоинформационных ресурсов во всем информационном пространстве Интернета. Второй подход проще всего может быть реализован путем использования все тех же геометаданных, содержащих стандартизованные наборы терминологических описательных параметров. В данном случае использование онтологии может осуществляться путем преобразования пользовательских запросов к поисковой системе в возможные значения этих параметров или путем предоставления пользователю системы возможности выбирать параметры поиска из стандартных значений описательных параметров. Грубо говоря, система может «подсказывать» пользователю, что лучше указать в строке поиска.
В любом случае, использование геоонтологий при создании ЛИПД представляется менее актуальным, чем при создании систем более высокого уровня. Это объясняется самими задачами локальных ИПД. Для локальной территории или организации, для которой создается свое собственное географическое информационное подпространство, гораздо менее насыщенное информацией, чем весь Интернет, в меньшей степени требуется автоматизированный механизм преобразования запросов для отсечения информационного шума. Здесь будет достаточно и механизма использования ключевых слов и стандартных параметров геометаданных, реализация которого возможна с помощью предоставляемого для этих целей программного обеспечения.
Методика создания локальных ИПД
Методика проектирования локальной ИПД разработана на Географическом факультете МГУ им. М.В.Ломоносова с учетом определения и особенностей ЛИПД [1]. Ее основные принципы заключаются в определении уровней проектирования, а также в ряде технических и программных аспектов создания локальных ИПД. В настоящее время ведется разработка более общей методики, в которой будут учтены дополнительные факторы, влияющие на окончательный вид системы.
Для формирования общего подхода к проектированию и созданию локальной ИПД предлагается выделить три последовательных уровня ее построения: – концептуальный, содержательный и технологический.
На концептуальном уровне определяется общая структура создаваемой системы. Сюда входит выработка принципиальной организации инфраструктуры, выделение основных компонентов и сегментов системы, выбор методов взаимодействия пользователей с географическими информационными узлами и наборами данных. На этом этапе прорабатывается схематика самих узлов: их основные необходимые функции, их содержание и связь между ними. Формируется общий принцип работы с информационными ресурсами – например, за счет публикации метаданных на геопорталах или передачи данных по сети. Важной задачей, решаемой на концептуальном уровне проектирования локальной ИПД, является определение системы доступа пользователя к пространственным данным, распределенным по разным источникам. Все проектируемые компоненты и варианты доступа представляются на общей схеме системы.
Содержательный уровень проектирования заключается в выборе содержимого ИПД и используемых в ней стандартов. Здесь определяется состав и характер базовых пространственных данных и пространственных объектов, варианты состава ИПД: пространственные данные, карты, веб-сервисы, описания. Обычно эта система является централизованной или полицентрализованной. Поэтому на содержательном уровне определяются стандарты метаданных или используемых в ней данных в соответствии с результатами концептуального проектирования. На этом уровне более детально определяется, с чем будет работать система и на основе каких стандартов будет осуществлена ее универсальность и централизованность.
Наконец, на технологическом уровне определяются технологии, используемые для воплощения ИПД, и окончательный вид системы. В числе прочего, на данном этапе выбирается: какой язык веб-программирования будет применяться для создания геопорталов, какие имеющиеся технологии можно привлечь для реализации системы, на основе каких протоколов передачи данных будет осуществляться взаимодействие субъектов ИПД, в каком виде географические информационные узлы будут представлены пользователю.
Локальная ИПД УНС «Сатино»
На Географическом факультете МГУ накоплен большой объем пространственных данных по территории учебно-научной станции «Сатино», где исследования проводятся разными кафедрами факультета. В связи с потребностями в налаживании эффективного централизованного обмена имеющейся информацией было решено создать локальную ИПД УНС «Сатино» на основе разработанной методики проектирования ЛИПД.
Локальная ИПД УНС «Сатино» состоит из двух сегментов: внешнего и внутреннего. Внешний сегмент обеспечивает доступ к ИПД для всех пользователей Интернета, а внутренний сегмент предоставляет ряд дополнительных возможностей и доступ к данным по локальной компьютерной сети географического факультета.
Как показано на схеме (см. рис. 1), в ЛИПД УНС «Сатино» используются два географических информационных узла – геопортал с каталогом метаданных и интерфейс доступа к базе данных. В рамках внешнего сегмента можно обращаться лишь к базе метаданных через каталог геопортала, а пользователи внутреннего сегмента также имеют полный доступ ко всем ресурсам базы данных ГИС «Сатино».
Рис. 1. Схема локальной ИПД УНС «Сатино».
Источником базовых пространственных данных системы послужили слои учебной базы данных ГИС «Сатино», созданной на географическом факультете. В ней в качестве базовых пространственных объектов выбраны рельеф, пункты геодезической сети, леса, дороги и объекты гидрографии. В соответствии со структурой базы данных, пространственные данные системы были по тематическому принципу объединены в основные группы (Геоморфология, Микроклимат, Гидрология, Почвы, Биота, Ландшафты, Использование земель), а также в производные слои, фонд аэро-космических снимков и автономные БД.
В доступном через Интернет внешнем сегменте ЛИПД УНС «Сатино» используются общепризнанные мировые стандарты геометаданных, что позволяет присоединить его к ИПД более высокого уровня. Основным является новый стандарт ISO19139 Международной организацией по стандартизации. Он совместим со стандартом ISO19115, национальная версия которого была принята для формирования Инфраструктуры пространственных данных Российской Федерации.
Для внутреннего сегмента используется своя версия стандарта метаданных, что позволяет привести вид системы в максимальное соответствие с задачами пользователей.
На текущий момент, внешний сегмент представлен на геопортале «ДАТА+» (http://maps.dataplus.ru) в виде раздела, в котором собраны метаданные для всех слоев базы данных ГИС «Сатино» (рис. 2).
Рис. 2. Раздел «Сатино» на геопортале ДАТА+.
Общедоступный Геопортал «ДАТА+» – один из первых полнофункциональных ГИС-порталов в российском сегменте Интернета [12]. К опубликованным на этом геопортале метаданным слоев базы данных ГИС «Сатино» можно обращаться с помощью его инструментария, а также с других геопорталов, благодаря механизму предоставления веб-сервиса метаданных.
Географический информационный узел внутреннего сегмента ИПД УНС «Сатино» – интерфейс доступа к базе ГИС данных – также реализован с использованием веб-технологий. Интерфейс представлен в виде веб-страницы, доступной только из локальной сети географического факультета и предоставляющей функции картографического просмотра слоев базы данных, просмотра метаданных по каждому слою и создания локальной копии данных на своем компьютере (рис. 3).
Рис. 3. Интерфейс доступа к базе данных ГИС «Сатино».
В основе работы интерфейса лежит картографическое программное обеспечение, установленное на сервере факультета и позволяющее представить содержимое базы данных ГИС в виде разнообразных веб-карт.
В настоящее время на географическом факультете МГУ продолжаются работы по развитию методики проектирования локальных ИПД. Кроме этого, планируется создать геопортал географического факультета, который объединит в себе ресурсы ЛИПД УНС «Сатино» и другие базы пространственных данных, созданные на факультете. ЛИПД УНС «Сатино» станет основой для формирования локальной ИПД географического факультета МГУ им.М.В.Ломоносова.
Литература
- Аляутдинов А.Р., Лурье И.К., Осокин С.А. Проектирование и использование локальной инфраструктуры пространственных данных. // XIV Всероссийский форум «Рынок геоинформатики в России. Современное состояние и перспективы развития», М., ГИС-ассоциация, 2007. http://www.gisa.ru/38332.html
- Андрианов В.Ю. Инфраструктура пространственных данных. // ArcReview, №2, 2006. http://www.dataplus.ru/Arcrev/Number_37/1_SDI.html
- Андрианов В.Ю. Метаданные. // ArcReview, №2, 2006. http://www.dataplus.ru/Arcrev/Number_37/8_metadat.html
- Берлянт А.М. Картоведение. М., 2003.
- Загорулько Ю.А., Россеева О.И. Организация эффективного поиска на основе онтологий //Прикладные проблемы. Новосибирск, 2001.
- Капралов Е.Г., Кошкарев А.В., Тикунов В.С. и др. Под ред. В.С. Тикунова. Геоинформатика. М., Издательский центр «Академия», 2005.
- Кошкарев А.В. Инфраструктуры пространственных данных. // Геоинформатика. М., 2003.
- Кошкарев А.В.Инфраструктуры пространственных данных. — ГИС-Обозрение, 2000, No 3-4 (начало). — С. 5-10. — 2001, No 1. — С. 28-32 (продолжение).
- Концепция создания и развития инфраструктуры пространственных данных Российской Федерации. («Роскартография»). http://roskart.gov.ru/Texts/ripd.pdf
- Лурье И.К. Геоинформационное картографирование. Методы геоинформатики и цифровой обработки космических снимков (учебник с грифом УМО). — М.: КДУ, 2008.
- Майкевич Н.В. От информационного пространства к пространству знаний. Онтологии в Интернет. //Труды конференции КИИ-98, Пущино, Россия. — С.152-158.
- Осокин С.А. Геопортал ДАТА+ // ArcReview №2, 2007.
- Douglas D. Nebert. Developing Spatial Data Infrastructures: The SDI Cookbook. 2004. http://www.gsdi.org/docs2004/Cookbook/cookbookV2.0.pdf
- Khoroshevsky V.F. Knowledge v.s. data spaces: how an applied semiotics to work on web. //Proceedings of CAI-98, Pushchino, Russia, — С. 7-16.
- Zhigang Yan, PeiJun Du, HaiRong Zhang, GuoLiang Chen. Local Spatial Data Infrastructures for Medium Sized Developing Cities in China, Taking Xuzhou as an Example. //ISPRS Workshop on Service and Application of Spatial Data Infrastructure, XXXVI(4/W6), Oct.14-16, Hangzhou, China. http://www.commission4.isprs.org/workshop_hangzhou/papers/161-166%20Zhigang%20YAN-A061.pdf
- Список международных стандартов метаданных ISO. http://www.opengeospatial.org/standards/as
Abstract
Local Spatial Data Infrastructures
Stepan Osokin, e-mail: osokin@dataplus.ru
Spatial Data Infrastructure (SDI) is being gradually implemented in the practice of Russian business and scientific societies. Prototype of Russian national SDI is being developed. Research-and-development activities are being held in a field of SDI creation and implementation. Recently at the geographical faculty of Moscow State University a new meaning of the term local SDI (LSDI) has been offered. What is LSDI and how they may be created? This article describes the essence of LSDI as well as current activities in its architectural design.