Про базовые данные

Андрианов В.Ю., DATA+

 

Одной из составляющих инфраструктуры пространственных данных (ИПД) являются базовые пространственные данные (БПД). Хотя создатели инфраструктуры могут выбирать для нее любые компоненты, БПД включены в состав национальных и региональных ИПД в подавляющем большинстве стран и регионов. Состав же самих БПД различается более заметно, что обусловлено функциями, возлагаемыми на базовые данные.

Для чего же нужны и создаются БПД? Пространственные данные вообще используются в географических и близких к ним (например, навигационных) информационных системах. Практически в любом геоинформационном проекте данные делятся на две категории: тематические и базовые. Первые описывают те объекты, для управления которыми ГИС собственно и создается. Вторые образуют информационный фон, без которого довольно трудно ориентироваться в пространстве, заполненном лишь тематическими данными. Этот фон часто называют также картой-основой (а слово «база», как известно – синоним «основы»). Думаю, исходя из собственного опыта, вы согласитесь со мной, что для удобства работы с картой на ней обязательно должны присутствовать такие темы как населенные пункты (и их структура при крупном масштабе), дорожная сеть, гидрография и растительность.

Другие темы также могут быть полезны в различных ГИС, однако часто можно обойтись и без рельефа, и без фотоизображений, и уж тем более без кадастрового деления или земельных участков. Тем не менее, эти темы в некоторых ИПД также включаются в базовые. Всё зависит от положенного в основу принципа. Либо это «sine qua non» (лат. то, без чего нельзя), и тогда в базовые включаются только первые четыре темы. Либо это «больше – не хуже», и тогда к базовым могут относиться любые темы, полезные для многих или большинства задач, особенно если соответствующие источники данных уже имеются.

Очевидно, что всеобщую потребность в пространственных данных нескольких базовых тем можно лучше всего удовлетворить, если эти данные будут стандартизованы и будут распространяться из минимального числа источников. Самый лучший вариант – если функцию предоставления БПД возьмет на себя государство как единственный официальный источник. Именно поэтому базовые пространственные данные включаются в национальные ИПД как один из компонентов. Однако здесь мы сталкиваемся с новым аспектом данных – приданием им юридической значимости. Хорошо это ли плохо?

С одной стороны, хорошо иметь данные, за качество которых кто-то отвечает. Если из-за ошибки в этих данных вы примете неправильное решение, ответственность за него (по крайней мере, частично) может быть возложена на поставщика. Но это приводит к тому, что поставщику придется работать «с запасом»: более тщательно готовить данные и более часто их обновлять. Для этого понадобится больший объем труда более квалифицированного персонала, более дорогие методы сбора и проверки данных. В конечном итоге это приводит к удорожанию данных. Готовы ли потребители за это платить? Если данные используются в качестве информационного фона – вряд ли. Ведь эти данные нужны лишь для общей оценки обстановки и обычно не являются критическим компонентом в процессах принятия решений.

Здесь мы подходим к одному интересному соотношению базовых и тематических данных: в геоинформационных системах нет нужды связывать эти два массива данных жесткими логическими связями. Допустим, мы создали ГИС для управления дорожным хозяйством. Данные о дорожных объектах мы создаем сами в ходе своей основной деятельности, а карту-основу (без темы дорог) мы берем из внешнего источника. Для повышения общего качества данных системы мы связали топологическими правилами наши дорожные объекты с объектами основы. Ну хотя бы для того, чтобы мост размещался точно на пересечении дороги и реки, а не где-то рядом. Теперь допустим, что в результате уточнения данных (или просто новой оцифровки у поставщика) геометрия реки изменилась, и точка пересечения с дорогой несколько сместилась. Топология нарушена, нужно корректировать данные. Какие – основу или тематические? Нужно ли обращаться к поставщику за уточнением, или лучше создать собственную, исправленную копию карты-основы. Независимо от ответов на эти вопросы, нам приходится выполнять дополнительную работу, не связанную прямым образом с основным бизнес-процессом и, по большому счету, ему не нужную. Напрашивается резонный вопрос: а зачем вообще связывать топологией основу и тематические данные? Получается, не нужно это. То есть, основа вполне пригодна в качестве картинки, а небольшие расхождения тематики с ней всеми будут пониматься именно как таковые и не влияющие на основную деятельность.

Таким образом, базовые данные в прикладной ГИС вообще могут быть не данными, а просто географически привязанной картинкой. С развитием широкополосного доступа в Интернет можно вообще отказаться от приобретения БПД в пользу подписки на картографическую веб-службу, публикующую основу в виде картинки (стандарта WMS, ArcIMS Image Service, ArcGIS Server Image Service с кэшированием или аналогичной). Пусть поставщик службы заботится об актуальности и точности своих данных, а вопросы целостности данных мы будем отслеживать только в пределах нашего массива тематических ПД.

Кстати, такой же подход можно с успехом использовать и в крупных вертикально интегрированных компаниях, где основу может готовить и публиковать в интранете ГИС-подразделение центрального офиса, а пользователям (как в центральном офисе, так и в удаленных филиалах) останется только отображение своих тематических данных поверх нее.

При создании геоинформационной системы, начиная с подготовки ТЗ, к базовым и тематическим («специальным» или «прикладным», если угодно) данным экономически целесообразно предъявлять разные требования. Это позволит разделить и оптимизировать бизнес-процессы по каждому виду данных, вплоть до выделения процессов в модули и передачи в аутсорсинг, если это выгодно.

Резюмируя, хочу еще раз подчеркнуть: деление данных на базовые и тематические обусловлено не тематикой слоев или общепринятым соглашением, а их функцией в конкретной информационной системе. Одна и та же тема данных в одной системы может оказаться базовой, а в другой – прикладной. Такое понимание позволяет поставить точку в споре о том, какие данные считать базовыми, а какие – нет.