О применении стандартов при организации геоданных

Митакович С.А., к.т.н., зав. лабораторией ГИС, Государственное унитарное предприятие Научно-исследовательский институт безопасности жизнедеятельности Республики Башкортостан (ГУП НИИ БЖД РБ), г. Уфа, Тел.: +7(347) 228-77-79, Факс: +7(347)228-75-90, E-mail: MiSeAn@mail.ru

 

Typical situation with chaotic storage of large volume of geospatial data is described. We propose a competent way and give some examples of how to organize the information using data models offered by ESRI.

 

Стремительное развитие технологий Географических информационных систем (ГИС) существенно расширяет круг пользователей, являющимися специалистами в различных предметных областях. И один из главных вопросов, связанных с успешной и грамотной реализацией ГИС проектов по проработанным и новым тематическим направлениям – как хранить данные?

Немного истории

Научно-исследовательский институт безопасности жизнедеятельности является проектной организацией, подведомственной МЧС. Руководство изначально сделало ставку на использование геоинформационных технологий, и уже более 10 лет институт является одной из ведущих организаций в Башкирии, использующих ГИС в решении различных задач. Кроме того, по заказу других министерств и крупных ведомств нашими специалистами были изготовлены специализированные тематические карты, реализовано множество информационно-справочных ГИС, собран огромный объем пространственных данных.

Специфика работы в сверхоперативном режиме, когда карту надо сделать «вчера», имеет ряд особенностей, в том числе и негативных. С одной стороны, собран уникальный картографический банк данных разных масштабов и тематической направленности. Но, с другой стороны, имеющиеся данные настолько разрозненны и неструктурированны, что на их поиск, разбор и понимание требуется значительное время.

Этапы большого пути

Большинство наших проектов выполняется для оценки, прогнозирования ЧС и анализа промышленной безопасности, и, чтобы исправить сложившуюся ситуацию, нами были разработаны собственные классификаторы и шаблоны на уровне персонального хранения, а именно определены базы геоданных с наборами данных и входящими в них покрытиями (или каталог с подкаталогами и хранящимися в них шейп-файлами). Например, при работе над отдельным опасным объектом или территорией набор/подкаталог «Результат» включал в себя покрытия, связанные с последствиями аварий: зоны поражения, изолинии риска и т.п. Стало значительно легче обмениваться информацией между специалистами, восстанавливать карты, но это не решило проблему хранения данных. Особенно ярко она себя проявляла, когда необходимо было работать сразу над группой опасных объектов. По сути, это был устаревший вариант листового хранения данных.

С картографическими данными в других предметных областях (энергетика, связь, муниципалитеты) ситуация была еще хуже. Данные поступали из разных источников и сильно различались по составу и содержанию. В некоторый момент времени были предприняты безуспешные попытки использовать всеобъемлющие классификаторы, способные «принять в себя» любые карты. Так, например, при формировании карты муниципалитета в набор «застройка» входило свыше 20 покрытий, хотя в действительности заполнены были 2-3 покрытия. Требовалось что-то предпринять.

Зачем изобретать велосипед?

К счастью для нас, мы работаем на программных продуктах ArcGIS от мирового лидера в области ГИС – компании ESRI, которая всегда уделяла большое внимание стандартам, в том числе вопросам моделирования и хранения данных. Посещая веб-страницу технической поддержки http://support.esri.com и ее раздел «Data Models» (рис. 1), мы не раз обращали внимание на перечень представленных там моделей данных (их более 30!). Но ложное ощущение, что это «не наши» стандарты, и скромное познание английского языка препятствовали их использованию.


Рис. 1.
Веб-страница ESRI, посвященная моделям данных.

 

Однако при реализации очередного муниципального проекта по созданию диспетчерского ситуационного центра мы решились сделать все «по правилам». Мы обратились к модели «Local Government», которая, с одной стороны, определяет необходимый и достаточный набор данных для описания территории населенного пункта и, с другой стороны, предполагает эффективное использование адресного плана и сети дорог, что было особенно важно в рамках этого проекта. Опыт оказался успешен, и уже в следующем проекте мы использовали модель «Hydro», затем «Basemap», «Environmental Regulated Facilities» и др. Сейчас мы активно применяем порядка 7-8 моделей данных, над которыми работали современные «умы» в области ГИС, а мы занимаемся сугубо профессиональными вопросами – информационным пополнением, расширением функциональности ГИС, реализацией проектов «под ключ».

А теперь конкретно

Очевидно, что ключевым достоинством использования готовых моделей является то, что они грамотно продуманы по структуре, составу и связям, логически и физически реализованы, документированы и готовы для заполнения. Но преимущества от их применения этим не ограничиваются. Перечислим некоторые наши «находки».

  1. Некоторые модели снабжены бесплатными многофункциональными инструментами. Так, модель «Hydro» поставляется совместно с «Arc Hydro Tools». Этот набор включает в себя более 70 инструментов по подготовке и обработке данных. Практически, имея цифровую модель рельефа, линейное и полигональное покрытие водных объектов, можно сформировать такие важные для гидрологии покрытия, как водоразделы, бассейны, связную гидрологическую сеть. Взяв данную модель за основу, наши коллеги из компании ООО «ИНТРО-ГИС» дополнили ее несколькими покрытиями и создали дополнительный набор инструментов по анализу весеннего половодья. Он позволяет за 15-20 минут в автоматизированном режиме сформировать информационный бюллетень, включающий в себя набор карт, диаграмм, таблиц и текстовое описание по оценке и прогнозу прохождения паводка (рис. 2).


Рис. 2. Пример работы с моделью данных «Hydro» для создания гидрологической сети и мониторинга паводка с использованием инструментов «ArcHydro Tools» и «Весеннее половодье».

 

  1. Совместно с моделями (например, BaseMap) поставляются проработанные стили и шаблоны оформления отдельных слоев, то есть полученные карты будут легки для понимания большим кругом пользователей.
  2. В документации приведено не только описание текущего состояния моделей, но и указаны приемы по их дальнейшему самостоятельному развитию. Так, в модели «Environmental Regulated Facilities» (она описывает источники воздействия на окружающую среду) приведен ограниченный состав покрытий. При этом даны конкретные рекомендации о том, как дополнять модель по мере появления новых типов источников, которые не вошли в первоначальный состав. Данный процесс проходит в два этапа. Сначала вносится ориентир объекта, а по мере появления более детальных данных формируется полноценное покрытие с учетом его геометрического представления.
  3. В моделях приведены оригинальные подходы к организации данных. Так, одна из частых проблем ненормализованной формы – связь «многие ко многим» – нередко решается введением нелогичной избыточной таблицы и появлением двух связей: «многие к одному» и «один ко многим». В области промышленной безопасности примером является случай, когда необходимо отследить связь от различных опасных объектов (резервуары, колонки…) к различным факторам поражения (пожары, взрывы…). После ознакомления с несколькими моделями было найдено удобное решение. В отдельной таблице указываются диапазоны индексов опасных объектов, которые не пересекаются между собой, и можно безболезненно указывать индекс любого опасного объекта в любом покрытии поражения (рис. 3), а специальный инструмент помогает в этом. Полезна и такая рекомендация: не пытайтесь указать в покрытии все атрибутивные характеристики, которыми может обладать объект на карте. Укажите только основные, а редко встречающиеся на практике атрибуты вынесите в отдельную таблицу. Таблицы не будут разряжены, плюс экономится дисковое пространство.


Рис. 3. Пример бесконфликтной реализации связи «многие ко многим».

 

  1. Комбинация и разделение покрытий. Ранее мы создавали топографическую карту (растительность, водные объекты, дорожная сеть, производственная зона, жилой квартал …) из отдельных слоев. Сейчас эти покрытия сведены в одно, что удобно и для формирования обзорных карт, и для анализа. В частности, при моделировании разлива нефтепродуктов достаточно работать с одним покрытием, чтобы оценивать просачиваемость или испарение.

Итак…

Теперь все наши геоданные разбиты на несколько тематических баз, которые с надстройкой или без нее переведены на сервер SDE. За счет изменения псевдонимов модели локализованы на русский язык. При выполнении очередного проекта, как правило, бывают задействованы 2-4 базы геоданных. Анализ бизнес-процессов, связанных с использованием карт, до и после этапов перехода на стандартизированные модели показал, что время на поиск и доступ к нужной информации сократилось минимум в 2 раза, а в отдельных случаях на 1-2 порядка. В ближайшее время нам предстоит выполнять проект по транспортным сетям, но мы уже заблаговременно ознакомились с моделью «UNETRANS». Кстати, в описании к этой модели приведен интересный теоретический экскурс о появлении и развитии различных транспортных моделей данных, а сама модель интегрирует преимущества каждой из них. Так что теперь, при подготовке к реализации новых проектов, первое, что мы сделаем, – это смотрим, какие модели данных у ESRI уже имеются и как их можно использовать.