Интеграция разнородных данных для корпоративной ГИС

Бакланов А.В., Цеховский С.Ю., Морина И.А., Топоровский А.В., ООО «ИК СИБИНТЕК», г. Москва, e-mail: BaklanovAV@rambler.ru

 

Красивые, правильные и вовремя сказанные слова зачастую привлекают деньги в бизнес. У таких слов есть один маленький недостаток: сказавший их должен хорошо понимать смысл сказанного, чтобы затем выполнять заявленное. Немаловажно, чтобы и заказчик работы понимал эти слова так же, как и исполнитель. Иначе…

В последнее время такими «волшебными словами» стало устойчивое словосочетание «Интеграция данных». Компании разных уровней преуспели в генерации, сборе и накоплении разнородных данных, которые с определенного момента выходят из-под контроля, вступают в конфликт с аналогичными, но из другого источника. Крайним случаем информационного неповиновения становится введение в заблуждение самих владельцев информации.

Рассмотрим несколько путей интеграции, применяемых в практике российских предприятий.

Организация Хранилищ данных (Data Warehouse). Под хранилищем понимается проблемно/предметно-ориентированная информационная корпоративная база данных, предназначенная для сбора информации по единому для всей компании регламенту, анализа бизнес-процессов и подготовки отчётов для принятия управленческих решений. Загрузка данных в хранилище производится из учетных систем предприятия с периодичностью не чаще одного раза в сутки. Пользователи хранилища имеют доступ к данным на чтение. Достоинства Хранилищ заключаются в следующем:

  • регламентированность структуры данных;
  • однозначность значений данных;
  • структурирование данных в OLAP-кубах;
  • воспроизводимость результатов анализа информации;
  • использование для анализа данных собственных ресурсов Хранилища, не нарушающих стабильность работы учетных систем.

Недостаток Хранилищ – в дискретности обновления данных, что может сказываться на погрешности анализа информации.

Создание Корпоративных информационных порталов (Enterprise Information Portals). Это – не самостоятельный метод, а развитие и дополнение остальных способов интеграции. Порталы представляют из себя системное многоуровневое объединение различных ресурсов и сервисов. С их помощью через развитую систему допусков конечные пользователи могут обращаться как к информации хранилищ данных, так и непосредственно к данным учетных систем. При этом интеграция идет на интерфейсном уровне.

Управление потоками работ (Work-flow Management). Существует устойчивый термин – Управление бизнес-процессами, но употребленный здесь перевод-калька лучше отражает суть явления: в рамках бизнес-процесса обеспечивается автоматизация совместной работы сотрудников на основе единых данных. Этим методом не столько интегрируются данные различных учетных и информационных систем, сколько создается препятствие дублированию данных и созданию их версий.

Использование интеграционных платформ (Integration platform). Интеграционные платформы – программно-аппаратные системы, позволяющие маршрутизировать, преобразовывать и организовать обмен данными между распределёнными приложениями и информационными системами. Подробнее об этом методе интеграции будет сказано ниже.

Частным, но универсальным методом интеграции данных является использование геоинформационных систем (ГИС). Из всего многообразия программных продуктов этого профиля мы предпочитаем линейку ПО компании ESRI. Причина проста: правильная идеология, заложенная в основу как настольных, так и серверных продуктов этой компании, создает устойчивый положительный синергический эффект при совместном использовании сред ArcGIS и интегрированных внешних источников данных.

Центр ГИС компании СИБИНТЕК несколько лет занимается разработкой Системы паспортизации объектов нефтепродуктообеспечения нефтяной компании «РОСНЕФТЬ». В этой работе в той или иной степени использованы все перечисленные выше методы интеграции данных. Естественно то, что в работе применялся наиболее универсальный метод интеграции данных – использование ГИС.

При разработке Системы Паспортизации приходится интегрировать большие объемы статических и динамических (оперативных) данных, хранящихся как в автоматизированных учетных системах, поддерживающих бизнес-процесс, так и данные, которые традиционно хранятся в твердой копии (технические паспорта, регистрационные документы и т.д.). Различия в способах и скорости обработки данных порождают несложные правила синхронизации и сопровождения информации Системы.

Прежде всего, нами был разработан механизм синхронизации картографической и атрибутивной информации. Суть его заключается в том, что для любого объекта учета на карте ВСЕГДА в атрибутивном (учетном) блоке существует полный комплект заготовок табличной документации с минимальным количеством идентификационной информации. Процесс этот двусторонний: при текстовой регистрации объекта в учетном блоке происходит автоматическая генерация объекта на карте. Любое упоминание объекта нефтепродуктообеспечения, появляющееся в данных, поступающих из внешних учетных систем в Систему Паспортизации, вызывает функцию проверки наличия паспорта на этот объект и порождает, в случае необходимости, новый паспорт объекта и объект на карте.

Мы отдаем себе отчет в том, что большая часть информации в регионах деятельности Компании находится в состоянии далеком от использования в автоматическом режиме наполнения Хранилища. Потому в Системе Паспортизации разработаны Вэб-механизмы для управления потоками работ. Первоначальное наполнение Системы происходит через простые по структуре обменные файлы, позволяющие получить представление о количественном составе объектов учета, их идентификации, адресах расположения, статусе собственности и пр. Несложные скриптовые процедуры производят загрузку этих данных в базу Хранилища. При этом включается описанный выше механизм контроля синхронизации, в результате чего в Системе появляется картографическое и учетное представление объекта.

Все произведенные в Системе изменения немедленно становятся видны через Корпоративный Портал как в центральном офисе Компании, так и в его региональных отделениях. С этого момента система готова (естественно, через матрицу санкционированного доступа) к редактированию, дополнению и изменению на уровне региональных данных.

Нет никакого смысла создавать многоступенчатую систему передачи исходных данных с региональных объектов в объединение, а оттуда в центральный офис, если имеется возможность управления потоками работ через Вэб-интерфейс. Доверенные представители Компании в регионах успешно заполняют Хранилище данных в одну стадию, не забывая производить коррекцию местоположения объектов нефтепродуктообеспечения на карте.

Мы широко используем психологический прием воздействия на производительность труда доверенных представителей в регионе: они работают не с пустой системой, и даже не с «пустографкой»… Мы берем на себя труд по конвертации всевозможных отчетов, которые ранее поступали в центральный офис Компании. Править и дополнять предварительно заполненные таблицы психологически проще, чем создавать новые пустые таблицы и заполнять их «с нуля». Да и работа по коррекции карты сведена к элементарным действиям, напоминающим игру.

По результатам редактирования Системой создается отчет, экземпляр которого одинаково хорошо виден как в центральном офисе, так и в регионах, что также стимулирует работу на местах.

Такая организация работы позволила за короткое время создать актуальный атлас расположения объектов НПО Компании.

Все компании осуществляют свой бизнес в пространстве, которое по той или иной причине интересно их конкурентам. Не учитывать деятельность даже доброго соседа – значит обречь себя на неминуемый крах. Потому в нашей Системе существует раздел паспортизации объектов НПО конкурентных компаний.

Даже если бы нам удалось просто собрать сведения о пространственном распределении конкурирующих предприятий, это дало бы хорошую пищу для размышления стратегическим аналитикам, логистикам и маркетологам Компании. Но мы пошли дальше: для каждого конкурентного объекта в Системе имеется паспорт, формирующийся по тем же правилам, что и паспорта Компании. Естественно, что объем информации, помещаемой в него, значительно ниже. Но он достаточен для работ по стратегическому планированию, маркетингу, ценообразованию.

Интеграция данных по конкурентам значительно сложнее, так как не существует учетных или информационных систем, к которым могла бы подсоединиться наша Система. Интеграцию впору назвать простым словом Сбор информации по крупицам из открытых источников.

Крупные нефтяные компании могут себе позволить рекламные акции по своим автозаправкам через соответствующие страницы своих общедоступных сайтов. Но даже у лучших из них объекты представлены адресами и приблизительными точками на карте. У региональных предприятий НПО, не находящихся в холдингах, а, тем более, у мелких частных предпринимателей таких возможностей практически нет. Сбор списков АЗС с их идентификаторами и адресами производится по форумам, блогам и Желтым страницам Интернета. Мы берем на себя эту неблагодарную работу, так как у доверенных представителей Компании на местах и без того много основной работы. Кроме того, их совершенно не интересуют объекты, находящиеся на расстоянии большем, чем 25-30 км от АЗС Компании. В стратегическом плане такой подход проигрышный.

Еще совсем недавно единственным актуальным источником пространственных объектов был сайт Google maps. По нему с достаточной степенью точности можно было определить координаты интересующего Компанию объекта. Разрешение снимков для центральных регионов и большинства областных и краевых центров было таким, что позволяло распознать не только крыши АЗС, но и отдельные заправочные колонки. Приятной особенностью карт (в реализации Google Earth) было и есть то, что штатными средствами приложения Google можно создавать файлы KML, на основании которых можно строить собственные тематические слои карт объектов учета.

После появления в Интернете близких по содержанию (но не функционалу) карт Yandex эйфория от продуктов пионера всеобщей ГИСофикации поубавилась. Оказалось, что на фоне динамично развивающегося сектора нефтепродуктообеспечения карты Google неприлично быстро устаревают. Несмотря на слабое разрешение карт Yandex, на них нередко можно рассмотреть более актуальную обстановку.

Большую помощь в сборе информации по объектам НПО оказывает и сервис Wikimapia.org. Благодаря деятельности неравнодушных людей, на этом сервисе можно уточнить не только факт наличия объекта, но и получить сведения о принадлежности его той или иной компании.

Не следует легкомысленно относиться к тому, что мы называем «агентурными сведениями». Не секрет, что на большей части России космосъемка оставляет желать лучшего из-за отвратительного разрешения или некстати появившегося облачка. С помощью проклинаемого всеми компаниями ICQ можно экономить корпоративные командировочные деньги, поскольку практически в любом населенном пункте, который нас может интересовать, можно обнаружить доброжелательного человека, который даст вам сведения о находящихся в населенном пункте объектах НПО.

У доверенных лиц Компании после проведенной нами работы появляются карты и бланки, в которых они могут уточнить информацию о конкурентах.

Изредка обновляемая статическая информация об элементном составе объектов НПО может радовать только ее создателей. Через короткий промежуток времени такая система должна неминуемо умереть.

Продлить ее жизнь может только оперативная информация, непрерывно поступающая с объектов нефтепродуктообеспечения. Только она реально характеризует состояние, успешность или провальность управления бизнесом в каждом из отображенных объектов.

В этот момент на первый план выступают Интеграционные платформы. Подходы к их созданию различны. Если предприятие начинает свой бизнес «с нуля», то ему целесообразно весь учет проводить в непрерывном формате данных в рамках одной линейки продуктов, например, 1С или SAP R/3. Интеграция в таком случае происходит автоматически.

В реальности, такие предприятия скорее исключение, чем правило. Крупные компании имеют на своем балансе не один десяток узкоприкладных учетных и информационных систем: от 1С до ERP-систем SAP R/3 и Oracle E-Business Suite. Эти программы имеют различные форматы и протоколы обмена данными. Каждую из имеющихся систем есть смысл интегрировать с ГИС-приложениями. Но, по-хорошему, ГИС нужно освобождать от лишней, неспецифичной работы. Не царское это дело – разгребать форматы, разбираться в протоколах, группировать и анализировать исходные данные.

В таких случаях используются интеграционные платформы, разработанные компаниями i-Teco, ГазИнтех или (как в нашем случае) – платформа «ШЕРП» компании Formula BI.

Во всех случаях декларируются общие принципы построения системы. Это – готовое приложение для реализации сервисно-ориентированной архитектуры, имеющее модульное построение (исполнительное ядро, среда декларативного описания пользовательского интерфейса, правила разграничения доступа и функциональные подсистемы). Такой подход снимает архитектурные ограничения на масштабируемость системы как по источникам данных, так и по аналитическому функционалу.

В частности, помимо базовой программы «Шерп – Технологическая платформа», предназначенной для поддержки исполнительного ядра ШЕРП, имеются готовые подсистемы: Упpaвлeниe oтнoшeниями c клиeнтaми, Учёт пocтaвщикoв и дoгoвopoв c ними, Упpaвлeниe бизнec-пpoцeccaми, Упpaвлeниe пepcoнaлoм, Упpaвлeниe пpoeктaми, Учёт имyщecтвa, Упpaвлeниe финaнcaми, Упpaвлeниe дoкyмeнтaми.

Помимо этого программа «ШЕРП – Технологическая платформа» предоставляет возможность разработки дополнительных функциональных подсистем корпоративной информационной системы силами бизнес-аналитиков предприятия.

С точки зрения ГИС-приложения применение интеграционных платформ позволяет не только осуществлять лишь одно подключение к базе данных (вместо множества – через коннекторы различных по форматам источников данных), но и получать уже сформированные (пересчитанные) результаты аналитических запросов, которые без дальнейших преобразований можно визуализировать в картографическом блоке Системы.

Применение интеграционной платформы ШЕРП – дело вкуса. Для нас – это оптимальное сочетание цены, качества и скорости разработки.

Интеграция разнородных данных для корпоративной ГИС – процесс, от которого нельзя отказаться, на котором невозможно и не дОлжно экономить. Знание же закономерностей и методов интеграции дает существенный ресурсный выигрыш как для разработчиков систем, так и для их пользователей.