Инфраструктура пространственных данных

Владимир Андрианов, DATA+

Этот выпуск ArcReview мы решили посвятить распределенным геоинформационным системам и инфраструктуре пространственных данных (ИПД). Распределенные ГИС – новый этап развития геоинформационных технологий. Они включают такие передовые достижения как распределенные базы данных, распределенные вычисления, стандарты взаимодействия открытых систем. Темы эти широкие, но они развиваются и обсуждаются сравнительно узким кругом специалистов. Довольно малая их известность среди массовой аудитории затрудняет понимание идеи в целом, отдельных концепций и тех огромных преимуществ, которые дает это направление.

В прошлом году была начата работа по созданию ИПД Российской федерации (РИПД), пока только на уровне разработки концепции. В США подобные работы начались 10-ю годами ранее, и сейчас национальная ИПД США (NSDI, National Spatial Data Infrastructure) может служить наглядным примером того, к чему имеет смысл стремиться.

Начиная любое новое дело, нужно всегда иметь ответ на вопрос «Зачем?». ИПД не является самоцелью, она нужна для решения двух задач – электронного обмена пространственными данными между организациями и компаниями разных профилей и видов собственности, а также для обеспечения массового доступа к картографическим продуктам на основе современных информационно-коммуникационных технологий (проще говоря, через Интернет). Выражаясь современным IT-жаргоном, ИПД реализует концепции B2B («бизнес для бизнеса») и B2C («бизнес для потребителя») в области геоинформации. Следствием развития этих двух направлений является снижение дублирования работ (за счет лучшей информированности и возможности автоматизации координации участников) и более широкое использование геоданных непрофессиональными пользователями, то есть повышение их КПД (читай – экономической эффективности).

Уже на этапе постановки задачи очевидно, что те же требования стоят перед распределенными корпоративными информационными системами, которые должны обеспечить обмен информацией между подразделениями компании и/или предприятиями холдинга, а также дать возможность доступа к ней большому числу сотрудников с минимальными затратами на обучение и поддержку. По этой причине мы рассматриваем создание ИПД как общую задачу как для государства, так и для крупных компаний.

Возникновение самой идеи ИПД обусловлено другим важным фактом – сменой географической парадигмы. Если еще несколько лет назад мы говорили «география» – подразумевали «карты», то теперь мы говорим «география» – подразумеваем «базы данных». Изменились методы представления географической информации, методы доступа к ней, методы ее обработки и визуализации, вообще всё. Раньше карты предназначались исключительно для восприятия человеком, а теперь в разработках геоинформационных систем на равных встречаются понятия human-readable и machine-readable. Даже тексты стандартов теперь готовятся в двух формах – обычный текст и UML-диаграммы, пригодные для прямого использования в автоматизированных системах проектирования.

Сейчас эти изменения продолжаются благодаря развитию технологии веб-служб. Теперь карта это уже даже не многослойная конструкция из шейп-файлов или слоев SDE, а динамичное изображение, собираемое на лету из различных источников, разбросанных по Интернету (и по всему миру). Очень простая, но надежная реализация Google Maps показала жизнеспособность и перспективность этого направления в области B2C. А ведущие разработчики ПО ГИС активно развивают его и в области B2B.

Как построить ИПД

Само слово «инфраструктура» вызывает у непосвященных некоторый трепет. Еще недавно такую же реакцию вызывало понятие Корпоративных ГИС. Теперь корпоративные ГИС стали делом обычным, их создание – рутинными, хотя порой и достаточно трудоемкими проектами. Инфраструктура пока в диковинку, но и к этому понятию мы скоро привыкнем.

На самом деле, ИПД это вовсе не монстр, ее развертывание не требует огромных вложений с неопределенной отдачей. Десятилетний опыт США и других стран дал свои плоды: состав ИПД определен и хорошо известен, необходимые стандарты разработаны, соответствующее программное обеспечение разработано. Иными словами, создание ИПД теперь не научная задача, а чисто практическая. И она отличается от создания той же корпоративной ГИС только теми принципами, которые будут положены в развитие геоинформационной технологии (а на уровне государства только инфраструктурные принципы и возможны). Для большинства инфраструктурных проектов основное препятствие – чисто психологическое: надо просто решиться перейти от решения частных задач к общему видению проблемы.

Дальнейшие действия не так уж и сложны. Во-первых, эту решимость надо оформить в виде некоторого документа, скажем, «Концепции ГИС (или ИПД) предприятия». Исходя из текущего уровня внедрения ГИС-технологий на предприятии, в этой концепции можно выстроить последовательность целей, ведущих к реализации инфраструктурных идей в целом. Не нужно стремиться сделать эту концепцию безупречной и возводить ее в догму (можно даже не утверждать официально, а использовать как рабочий документ группы ведущих специалистов). В ходе реализации инфраструктурных проектов может оказаться, что какие-то обстоятельства не учтены или не могли быть учтены заранее. Производители программного обеспечения тоже не сидят без дела и постоянно реализуют в своём ПО всё новые возможности. Почему бы их ни использовать, даже если концепция их не предусмотрела? В общем, ИПД – это не система и не проект. Это, прежде всего, принципы, на основе которых строятся конкретные системы и реализуются конкретные проекты. Как минимум, в концепции должно быть закреплено внедрение стандартов обмена геоданными и создание общедоступного каталога геоинформационных ресурсов и служб.

Во-вторых, надо ввести в общую практику документирование информационных ресурсов, то есть создание метаданных. Без них невозможно создать каталог и обеспечить эффективный поиск геоданных. О других полезных следствиях документирования вы может прочитать в статье о метаданных в этом номере. Создание метаданных – вопрос скорее организационный, чем технический. Когда создатели геоинформационных ресурсов поймут преимущества документирования – процесс пойдет сам собой. Весьма полезно модерирование каталога метаданных, то есть допуск к публикации только тех метаданных, которые соответствуют утвержденным правилам.

В-третьих, нужно создать веб-каталог геоинформационных ресурсов и связанный с ним портал, как общую «точку входа» в инфраструктуру. Подробнее о порталах можно также прочитать в статьях данного номера. Это, пожалуй, единственный случай полного проектного цикла в рамках создания инфраструктуры, на выходе которого – некая информационная система. Всё остальное – пропаганда идей ИПД, внедрение стандартов и передового опыта (best practices), обучение пользователей, учет принципов ИПД в прикладных проектах – составляющие деятельности предприятия в области информационных технологий вообще.

После того как каталог введен в эксплуатацию, должно пройти какое-то время, чтобы потенциальные пользователи геоданных смогли привыкнуть к новым возможностям и интегрировать их в свою ежедневную деятельность. Многие информационные системы бесславно скончались только потому, что ими было неудобно пользоваться, или пользователи не получали от них ожидаемых и полезных результатов. На этом этапе важно, чтобы у пользователей выработалось позитивное отношение к ИПД, чтобы они увидели в ней реального помощника. Задача непростая, так как здесь играют свою роль эргономические, психологические, политические и многие другие не столь легко формализуемые или измеримые факторы.

Наконец, еще одно важное мероприятие в рамках ИПД – создание веб-служб. О них в этом номере тоже есть отдельная статья. Здесь же отметим, что на сегодняшний день это самый пробивной метод внедрения новых информационных технологий (в том числе и геоинформационных) в условиях консерватизма, несогласованности участников и требований быстрой отдачи.

Слово ESRI

Мы много раз говорили, что для крупных территориально-распределенных компаний набор серверных продуктов ESRI позволяет выйти на новый уровень работы с пространственной информацией. Это не просто слова, а именно новый уровень. Здесь карты перестают быть «просто картами» и даже «просто ГИС». Легкость интеграции геоданных в самых разных видах с множеством других приложений на предприятии (системы учета ресурсов, управления производством, планирования и т.д.) ведет к массовому использованию карт и новому уровню понимания ресурсов компании как объекта управления. Универсальность, соответствие стандартам и масштабируемость решений ESRI позволяют применить продукты этой компании также и для создания государственных и региональных ИПД, примеры чему есть в США, Европе, Индии, других странах и регионах.

Сейчас в арсенале ESRI имеется полный комплекс продуктов для создания распределенных ГИС и ИПД. Прежде всего, это серверные продукты, образующие фундамент таких систем. Часть этих продуктов существует давно (ArcSDE, ArcIMS), другие появились недавно (ArcGIS Server, GIS Portal Toolkit). Чтобы не перегружать клиентов информацией при обсуждении вариантов решения их конкретных потребностей, мы в DATA+ часто сильно упрощаем позиционирование этих продуктов. И в этом заключается одно из препятствий в понимании их истинного потенциала и назначения. В этом номере мы «копнем» поглубже.

Например, ArcIMS чаще всего позиционируется как средство публикации карт в Интернете. Но сегодня просто картой в Интернете никого не удивишь, движков для их публикации тоже уже достаточно. И потенциальный пользователь этого нашего серверного продукта резонно спросит: «зачем платить такие деньги, когда есть более дешевые решения, вплоть до бесплатных (freeware)?». Очевидно, упрощенный стереотип может работать и против нас, и против этого продукта. В нескольких статьях этого номере мы попробуем опровергнуть его.

Другой пример – ArcGIS Server. Этот продукт появился недавно, и кратко мы его называем «серверной ГИС». Установив его на сервер, вы получаете возможность полноценной работы (почти как в настольных продуктах ArcGIS Desktop) через окно обычного веб-браузера. На место пользователя такой ГИС не нужно устанавливать какие-либо ГИС-приложения, вся функциональность реализована на сервере, а веб-браузер играет, по сути, роль терминала. Но когда называешь цену продукта, заказчик начинает сомневаться и, как бы про себя, говорить, что, может, лучше взять несколько обычных настольных приложений… Опять же, налицо непонимание (и в этом тоже наша недоработка) сути и назначения этого очень перспективного продукта.

GIS Portal Toolkit вообще нельзя назвать продуктом. Его даже в прайс-лист пока не поставишь, так как это конструктор, полуфабрикат для разработчиков ESRI и бизнес-партнеров. Из него можно создать полноценный геоинформационный портал (он же ГИС-портал или геопортал), каковых в мире пока еще немного. Например, в США – сейчас всего 6 действующих государственных порталов в составе NSDI, и каждый строится по-своему, в то время как корпоративных, городских и региональных ГИС уже сотни, если не тысячи. У нас есть эта технология, и мы можем предложить решения мирового уровня.

Любая ИПД – это система массового обслуживания, которая должна быть отказоустойчивой, масштабируемой и расширяемой функционально. Эти требования диктуют выбор известных сред разработки программных систем, использование стандартов взаимодействия компонент, модульную структуру приложений. Серверные компоненты ИПД являются «тяжелой артиллерией», способной справиться с большим потоком запросов, и именно на это направлены тяжеловесные, на первый взгляд, решения, принятые в предлагаемых ESRI серверных продуктах. Эти программные продукты обеспечивают надежный фундамент для поступательного развития, более массового внедрения и использования геоинформационных технологий на всех уровнях, всеми организациями и обычными людьми.

Тема этого номера очень обширна, всех вопросов здесь не охватить. Стандарты и технологии также весьма быстро развиваются. Чтобы не оставаться наедине со своими вопросами, приглашаем вас к их обсуждению на нашем форуме, специально посвященном инфраструктуре пространственных данных:
http://www.dataplus.ru/Forum/forum_topics.asp?FID=20.