Савицкий Д.В., DATA+, e-mail: dsavitskiy@dataplus.ru
In the article different aspects of data exchange problem between GIS and non-GIS systems are considered. To resolve this problem on several levels of data management and workflow support it is recommended to use ESRI’s products: ArcSDE, ArcGIS Server, Image Server, Data Interoperability, PLTS, and Job Tracking for ArcGIS.
Сегодня любая организация, так или иначе работающая с пространственными данными или цифровыми картами, вынуждена в своей работе учитывать не только специфику собственной ГИС, но и регулярно решать одну простую и обыденную задачу. Звучит эта задача в устах сотрудника компании просто: «Мне нужно сохранить результаты моей работы для использования их другим специалистом». Под этой простой фразой может скрываться множество самых разнообразных задач, масса непохожих с технической точки зрения случаев, множество нюансов, способных полностью изменить постановку задачи. Действительно, зачем, к примеру, пытаться реализовать только средствами отдельной ГИС решения задач, свойственных CAD-системам или инженерным расчетам? В каждой из этих областей существуют собственные комплекты программного обеспечения (ПО) со своей идеологией не только работы, но и манипуляциями с данными. Более того, каждым из подобных направлений зачастую занимается отдельный штат сотрудников, которые максимально сконцентрированы на решении своих собственных задач.
Есть ли решения для командной работы разных специалистов с различной структурой данных? Да, подобные решения есть у многих производителей. Каждая из таких компаний имеет свои собственные предложения и схемы использования предлагаемого ПО. Цель данной статьи – дать краткий обзор тех инструментов и продуктов компании ESRI, которые могут помочь сделать более удобной и комфортной совместную работу как нескольких разных компаний, так и отдельных отделов внутри компании.
Конечно, проблема обмена данными существует с момента появления этих самих данных. Первый приходящий в голову пример – это хорошо знакомые по большинству программ пункты меню «импорт..» и «экспорт..». Но почему сегодня возможности сохранить что-то в формат другой программы часто бывает недостаточно? На то есть несколько факторов: логическая несовместимость структуры данных в разных ПО, требующая каждый раз участия оператора для выполнения конвертации; необходимость постоянной синхронизации разнородных форматов; развитие серверных технологий и перенос части вычислений с клиентских приложений на сервер; массовое внедрение систем электронного документооборота, подталкивающее к автоматизации учета подобных операций (например, при передаче данных ГИС в другой отдел компании); возможность одновременной работы с единым хранилищем данных из разных ГИС и CAD-систем. Все эти и подобные им проблемы станут еще более актуальными, если принять во внимание постоянно растущие объемы обрабатываемой информации. В IT-изданиях последних лет можно встретить подтверждения того факта, что закон Мура применим не только к вычислительной составляющей, но и к объему обрабатываемой посредствам ЭВМ информации. (Напомним, что Гордон Мур в 1965г. высказал эмпирическое наблюдение, согласно которому число транзисторов на кристалле микросхемы будет удваиваться каждые 24 месяца. Статистически это наблюдение подтверждается и сегодня). Чем больший объем данных требует обработки, тем больше на эту процедуру требуется времени, а значит и цена ошибки или излишних действий сотрудника высока. Если каждое используемое ПО требует хранить данные в своем формате, то организация вынуждена создавать многочисленные копии данных. Требования к объему хранилища данных начинают расти в прогрессии, и хорошо, если она окажется арифметической, ведь для некоторых операций приходится сохранять и все промежуточные данные.
Итак, вернемся к продуктам компании ESRI. При комплексном решении задачи взаимодействия различных ГИС и не-ГИС программ можно говорить о двух видах программного обеспечения: серверном (а также всех операциях, связанных с доступом к данным в режиме клиент-сервер) и настольном (когда у оператора в среде ГИС имеются инструменты, позволяющие выполнять специфические задачи по подготовке данных, доступу к «чужим» данным и манипулированию, в случае, когда необходимо выполнить дополнительные преобразования данных перед их конвертированием, к примеру, нарезку на листы). Несомненно, говоря о серверных технологиях, в первую очередь нужно упомянуть о технологии ArcSDE. Используя только ArcSDE, возможно решать сразу несколько из приведенных выше задач. К ним относятся: создание единого хранилища векторных и растровых данных, синхронизация изменений в разных базах геоданных (БГД), контроль доступа, протоколирования действий пользователей. ГИС-системы, не имеющие функции прямого подсоединения к ArcSDE, не оказываются в стороне от рабочего процесса. Они по-прежнему могут выполнять подсоединение напрямую к СУБД, где хранятся данные (например, к Oracle Spatial). Говоря о технологии ArcSDE, нельзя не упомянуть возможности ArcGISServer по поддержке открытых форматов обмена географическими данными, таких как KML, WMS, WCS, которые также востребованы для предоставления широкого доступа к данным как внутри организации, так и за ее пределами.
Серверное приложение ImageServer принято считать частью ArcGIS Server, в который он входит в качестве расширенияImage Extension, однако он может функционировать и как самостоятельный серверный продукт. Image Server – это не просто сетевое хранилище растровых данных. Его ключевыми свойствами являются возможность генерации на лету новых растровых данных на основе растровых преобразований уже имеющихся растров, прямая поддержка популярных ГИС-систем (помимо ArcGIS, это MapInfo, Microstation, AutoCad и GeoMedia), что позволяет эффективно решить проблемы накопления и дублирования данных, а также задачи централизации хранения и быстрого доступа к очень большим растровым массивам.
Дополнительный модуль Data Interoperability – это, пожалуй, главный продукт компании ESRI, на который стоит обратить пристальное внимание при работе в гетерогенной среде. Основное применение этого продукта, существующего как для настольных (ArcGIS Data Interoperability), так и для серверных (Data Interoperability Extension)продуктов, – преобразование данных в самые различные форматы. Для прямого чтения поддерживается порядка 75 распространенных форматов, для прямого экспорта – порядка 50 основных ГИС-форматов данных, их полный перечень в текущей версии ArcGIS 9.3 можно найти по ссылке http://esri.com/library/fliers/pdfs/data-interop-formats.pdf. С помощью этого модуля возможно, к примеру, внутри проекта ArcGIS организовать прямой доступ к данным другой ГИС-системы без выполнения конвертации этих данных в базу геоданных (БГД, формат хранения ArcGIS), а по окончании работы передать результаты обратно в формат этой ГИС. Но простым преобразованием данных из одного формата в другой возможности Data Interoperability далеко не ограничиваются. Главная его особенность – это возможность абстрагироваться от конкретных способов представления данных в том или ином формате и работать с ними на более высоком уровне. Вы можете задавать собственную логику преобразований, чтение наборов исходных данных сразу из нескольких форматов и их совместное преобразование (например, автоматически выполнить совместный анализ данных геодезической съемки, табличных данных в формате MS EXCEL и уже имеющихся данных, хранящихся в корпоративной базе геоданных, да еще и автоматически создать необходимые объекты в системе электронного документооборота). Благодаря такой логике довольно легко автоматизировать операции, прежде требовавшие участия оператора при импорте данных из «чужой» ГИС-системы. Различие форматов данных ведет к различию в логике хранения этих самых данных. К примеру, в одной ГИС данные о полигоне сложной формы, содержащем пустые области, хранятся в виде одной записи, в другой ГИС это фактически несколько отдельных объектов: сам полигон и отдельно по полигону на каждую «пустую» область. В реальной жизни разница в представлении одних и тех же данных в различных форматах может влиять на саму идеологию и рабочий процесс. Пример из жизни – редактирование рельефа, представленного в виде регулярной сетки (GRID), в виде триангуляции Делоне (TIN) или изолиний высот, даже для опытного оператора выглядит как несколько совершенно разных задач со своим набором инструментов под каждую из них! Используя средства моделирования Data Interoperability, можно на этапе чтения или записи проверять топологию данных, достраивать необходимые сложные элементы, создавать атрибутивные данные, содержащие новую, производную информацию, которой нет в исходных данных (рис. 1).
Рис. 1. Data Interoperability – это больше чем просто конвертер данных.
И, наконец, упомянем еще один продукт, который также может оказаться полезен для организации, постоянно работающей с большими объемами электронных карт и других пространственных данных. Это PLTS, аббревиатура от полного названия продукта «Production Line Tool Set».
PLTS – продукт весьма интересный, заслуживающий отдельного развернутого описания всех его возможностей. В контексте же данной статьи нужно упомянуть о его возможностях по организации командной работы внутри компании. Ведь, как мы помним, задача по обмену данными между различным ПО возникает именно при совместной работе нескольких специалистов, отделов компании или даже нескольких организаций. Как и другие продукты ESRI, PLTS имеет модульную структуру. Каждый из модулей может функционировать как самостоятельно, так и в рамках большой картографической системы. Остановимся более подробно на одном из них: JTX или «Job Tracking Extension».
JTX, как следует из его названия, используется для организации и управления рабочим процессом. С его помощью можно описывать и реализовывать достаточно сложные схемы, но для многих типичных задач хватает и функций, заданных по умолчанию.
Одну из таких схем рассмотрим применительно к организации, занимающейся составлением электронных карт и атласов (рис. 2). В системе существуют три типа пользователей: руководитель работ, технический специалист (в нашем случае это картограф), специалист отдела контроля качества. Создано описание рабочего процесса. Рабочий процесс разбит на этапы: подготовка данных, добавление новых данных в общую БГД, проверка целостности данных, редактирование, контроль качества данных, завершение работы. За каждый из этапов несет ответственность отдельный сотрудник. Как только завершена работа над отдельным этапом, данные будут автоматически преобразованы под нужды следующего специалиста. Таким образом, мы получаем инструмент для организации совместной работы над каждым из проектов. Каждый из специалистов может сосредоточиться на решении собственных задач, а преобразование данных можно спроектировать как некий промежуточный этап, который будет выполняться автоматически.
Рис. 2. Описание этапов рабочего процесса в Job Tracking для ArcGIS.
На этом примере видно, что задача по конвертированию данных возникает из задач совместной работы различных ГИС-специалистов.
Говоря о применении продуктов ESRI в контексте командной работы, особо стоит отметить тот факт, что по своим возможностям JTX является неким объединяющим элементом как серверных, так и клиентских приложений. К примеру, при совместном использовании с ArcSDE, JTX позволяет не просто «держать руку на пульсе» всех текущих проектов в компании, но и просматривать историю работы над уже законченными проектами, еще более упрощает поиск и повторное использование ранее полученных данных. Это дает дополнительную уверенность для всех участников процесса, т.к. используя архивирование и версионность всегда можно отменить ошибочные действия любого из исполнителей, либо получить доступ ко всем дополнительным материалам, применявшимся на каждом из этапов работы. Говоря о протоколировании, стоит вспомнить и об индивидуальной настройке оповещений после завершения каждого из этапов работы, либо когда отдельный вид работ переходит по цепочке к другому исполнителю. К примеру, настроив извещение о задержках и окончании работ по каждому из этапов на электронную почту, руководитель имеет возможность как постоянно координировать и отслеживать потребности сотрудников в новых данных, так и, напротив, не вмешиваться в работу сотрудников, оставаясь максимально информированным о ходе выполнения каждого из проектов.
В заключение, дадим краткое описание возможностей использования программных продуктов ESRI для налаживания обмена геоданными и поддержки совместной работы с ними на корпоративном уровне. Итак: Data Interoperability – средство для конвертирования геопространственных данных; ArcSDE – управление единым централизованным хранилищем данных; ArcGIS Server и его компоненты – доступ к пространственным (векторным и растровым) данным для сотрудников, непосредственно не работающих с ГИС-системами, но периодически нуждающихся в подобных данных; ArcGIS JTX из комплекта PLTS – налаживание централизованной поддержки совместной работы с единым массивом данных различных специалистов или целых отделов внутри компании в рамках общего рабочего процесса. И, конечно, в этом комплексном процессе не обойтись без настольных продуктов ArcGIS с их мощными средствами создания, обработки, анализа и представления ГИС-данных.