Перспективные технологии обработки изображений

Джон Алан, исполнительный директор по развитию бизнеса, и Брюс Радо, вице-президент компании ERDAS, рассказывают о перспективах развития средств обработки изображений и геоинформационных систем. В основном, это принципиально новые решения, хотя некоторые из них уже реализуются в программных средствах ERDAS и ESRI.
Современный инструментарий геоинформатики активно использует технологии на основе проблемно-ориентированных мастеров и экспертных систем. Это позволяет новичкам гораздо быстрее достигать желаемых результатов в обработке и дешифрировании изображений, извлечении из них информации, необходимой для геоинформационных систем. Специалистам из самых разных областей, таких как телекоммуникации, сельское хозяйство, промышленная разведка, правоохранительные органы, службы экстренного реагирования, туризм, средства массовой информации, страхование и операции с недвижимостью, – большинству из них до недавнего времени не приходилось заниматься обработкой данных дистанционного зондирования. И хотя они признавали ценность ДДЗ и результатов их обработки для своей работы, – хотя бы в качестве источника данных для обновления векторных карт, – сама технология казалась им слишком сложной или громоздкой для повседневной работы. Но, тем не менее, их интерес не угасал. А теперь он начинает реализовываться на практике. Ведь средства обработки изображений становятся все более доступными как по цене и легкости использования, так и по возможности их интегрирования с программными инструментами поддержки бизнес-процессов – от простых электронных таблиц до корпоративных баз данных.
Учитывая эти потребности, средства обработки изображений нового поколения разрабатываются на основе объектно-компонентной модели COM. Эта модель, вместе с технологией Visual Basic for Applications (VBA), сегодня является стандартом де-факто для управления приложениями и организации взаимодействия между ними. Эти новые средства обеспечивают тесную интеграцию средств обработки изображений с любой VBA-совместимой программой, такой как MS Excel или MS Word. Возможность анализа и представления ДДЗ в таких приложениях, как Excel, является значительным шагом вперед — к более широкому применению ДДЗ на рынке информационных технологий.
Представьте себе такую возможность: разработчик сможет взять нужные функции из различных существующих приложений и скомпоновать совершенно новое приложение для решения конкретных задач. Например, создать программу работы с ДДЗ, использующую средства визуализации изображений из основанного на COM пакета обработки изображений, имеющиеся в текстовом процессоре MS Word средства работы с текстовыми документами, а также встроенную электронную таблицу MS Excel. При этом получится цельный программный комплекс, «остро заточенный» под решение вполне определенных задач. Такая высокая степень интеграции и взаимодействия приложений подтолкнет дальнейшие разработки в этой области, включая средства поддержки сотрудничества через Интернет на основе COM-объектов.

Использование Интернет

Хотя сжатие изображений полезно и при работе на отдельном компьютере, действительный потенциал сжатия раскрывается в возможности представления функций по обработке изображений в Интернет. Представьте себе, что вы сидите за своим компьютером и подключаетесь к удаленному серверу, находящемуся в каком-нибудь в университете или исследовательском институте. Вы формулируете запрос на обработку, – и сервер выполняет ее, используя все свои инструменты пространственного моделирования, возможности трехмерной обработки и визуализации, технологии экспертных систем. Именно такой мы видим «бесшовную» рабочую среду для обработки изображений.
Интернет позволит также множеству пользователей получить доступ к океану пространственно-информационных ресурсов — как растровых, так и векторных, с возможностью их очень быстрого получения. Сегодня среди таких наиболее впечатляющих ресурсов – цифровые космоснимки метрового разрешения со спутника IKONOS (компания Space Imaging). Они подобны фотографиям и могут использоваться вместо базовой карты или для обновления векторных карт в ГИС. Эти снимки обеспечивают более высокую точность, чем прежде имевшиеся источники первичных данных для ГИС. Доступными через Интернет становятся также и базы аэроснимков с разрешением менее одного метра.
И если для обработки снимков сенсора Landsat Thematic Mapper применяются «по-пиксельные» алгоритмы классификации, то новые данные высокого разрешения требуют иных подходов. Пикселы на снимке среднего разрешения (Landsat TM) содержат усредненную информацию по довольно большой площади, в пределах которой могут присутствовать десятки и сотни деревьев. В то же время, на снимках высокого разрешения различные пикселы могут представлять солнечную и теневую стороны дерева, траву и почву возле него. Это не только увеличивает объем информации, присутствующей на снимке, но и требует учета контекста пикселов при их классификации.

Снимки высокого разрешения, экспертные системы, компонентное программное обеспечение – вот некоторые из факторов, питающих экспоненциальный рост геоинформационной индустрии.
Что же нас ждет?

Помощь – близко

Имея такое богатство и разнообразие информации на новых снимках, географические экспертные системы помогут пользователям «выуживать» из них необходимую информацию. Экспертная система – это компьютерная программа, решающая задачи в конкретной предметной области путем принятия решений на основе набора правил, условий и гипотез, записанных в базе знаний. Базы знаний формируются опытными экспертами, работающими в предметных областях. Знания представляются в виде вопросов, ответы на которые продвигают анализ к следующим вопросам – вниз по дереву принятия решения.
Такие системы уже широко используются в диагностической медицине и других научных и информационно-технологических приложениях. Экспертные системы подражают способности человека комбинировать знания и рассуждения с целью формирования выводов на основе имеющихся посылок. В географических приложениях по обработке изображений это обеспечивает настоящий прорыв – от традиционного статистического анализа пикселов в мир дешифрирования изображений на основе контекста и пространственных отношений объектов.
Внедрение технологии экспертных систем началось на этом рынке с выходом ERDAS IMAGINE 8.4. Вначале эксперт создает базу знаний с помощью простого графического интерфейса. База знаний представляется в виде древовидной схемы, состоящей из правил, условий и переменных, которые использовались бы экспертом при традиционном анализе тех же исходных данных. Второй частью является образованный последовательностью диалогов мастер. С его помощью пользователи, не являющиеся экспертами, могут применять базу знаний к собственным данным. Мастер запрашивает у пользователя необходимые данные, автоматически применяет к ним процедуры обработки и проводит анализ по дереву решений до формирования вывода. Указатель пути принятия решения позволяет пользователю получить еще больше информации из базы знаний, которая была вложена туда экспертом.
Главным достоинством данной технологии является то, что база знаний, созданная одним экспертом (например, в головном офисе крупной компании), может распространяться среди тысяч рядовых пользователей, которые благодаря этому смогут надежно воспроизводить процедуру обработки и выполнять пространственный анализ любой сложности. Переносимость знаний делает технологию экспертных систем ключевым компонентом будущих систем обработки географических изображений. Сами же базы знаний могут стать новым коммерчески эффективным информационным продуктом.

Видеть в трех измерениях

Использование в обработке изображений простых интерфейсов, мастеров и автоматизированных процессов приводит все больше пользователей в мир трехмерного дешифрирования, то есть — в мир цифровой фотограмметрии.
Фотограмметрия — это наука о получении точных измерений из двух или более одновременно обрабатываемых снимков. Хотя при этом используются весьма сложные вычисления, современное программное обеспечение существенно облегчает задачу и помогает новичкам проводить такие измерения. Так, например, можно непосредственно измерить высоту дерева, построить трехмерную модель здания, оцифровать трехмерный образ дороги на склоне холма, отдешифрировать классы землепользования и земельного покрова для городского планирования, провести съемку рельефа, увязанного с речной сетью и т.д.
Наряду с программным обеспечением развивается и становится все более дешевым аппаратное обеспечение компьютеров, которое может использоваться для фотограмметрических задач. Например, цены на видеокарты, поддерживающие просмотр в стереорежиме, упали в несколько раз, – теперь такую карту можно купить менее чем за 500 долл. США. И это значит, что, например, инженеры, прежде выходившие «в поле» для измерения высот зданий и природных объектов, теперь могут получить те же результаты в результате обработки стереопар на своем персональном компьютере.
И по мере того, как обработка изображений становится все более производительной и доступной по цене, все ближе становится слияние двухмерных и трехмерных данных в единый, «бесшовный» с точки зрения пользователя, массив информации. Это позволит обрабатывать стереоизображения, автоматически извлекать из них трехмерную информацию (здания, рельеф и т.д.) и затем просматривать эту и другую пространственную информацию в общей среде виртуальной реальности. Это позволит снизить стоимость ведения баз векторных данных и одновременно повысить их точность и актуальность.

Мобильность

Появляется все больше приложений для мобильной работы и на основе беспроводной связи. Несколько компаний ведут разработки пакетов, обеспечивающих обмен данными и взаимодействие с карманными компьютерами. Некоторые из таких продуктов смогут использовать беспроводные локальные сети, сотовую связь или беспроводные модемы. Уже сейчас интерфейс между настольным и карманным компьютером может использоваться в таких приложениях как оценка ущерба недвижимости, исследование среды обитания животных, военные полевые операции, мониторинг дорожного покрытия, организация гуманитарной помощи беженцам или на территориях с разрушенной инфраструктурой.
С повышением точности и снижением стоимости технологий глобального местоопределения (GPS), компании, занимающиеся разработкой программного обеспечения, начинают интегрировать эти инструменты в свои продукты для облегчения сбора полевых данных. Например, группа специальных проектов (SPT) компании ERDAS создала инструмент для системы обработки изображений ERDAS IMAGINE, который объединяет данные GPS с процессом съемки местности с воздуха в режиме реального времени с помощью портативного компьютера. Эта технология может использоваться и в других областях, например, в картировании полос отчуждения линий электропередачи или трубопроводов, мониторинге речных фарватеров и т.д.
Сегодня наша отрасль расширяется одновременно по многим направлениям, и трудно сказать, технические достижения определяют рост или наоборот. Геоинформационные технологии уже проникли в персональные компьютеры, в карманные компьютеры, в автомобили, – скоро они проникнут в наручные часы.
Конечно, достижение успеха определяется не только удешевлением аппаратных и программных средств. Главный фактор успеха – в том, насколько эти новые средства отвечают потребностям пользователей – планировщиков землепользования, менеджеров недвижимости, управляющих природными ресурсами, страховых агентств, органов правопорядка, туристических бюро, неправительственных организаций – всех тех, кому снимки могут помочь вести их базы данных и дать наиболее точную картину окружающей действительности. Мы считаем, что средства пространственной обработки данных следующего поколения откроют их глаза – и умы – на реальный потенциал развивающихся географических технологий.

Снимки высокого разрешения

Все большее распространение получают доступные по сети базы данных аэрофотоснимков с пространственным разрешением лучше 1 м. Здесь показан снимок города Сан Луис Обиспо, штат Калифорния, с разрешением 20 см, который был ортотрансформирован в IMAGINE OrthoBASE. Снимок предоставлен компанией Golden State Aerial Surveys, Inc.
Здесь показана созданная в IMAGINE VirtualGIS трехмерная сцена, созданная на основе снимка со спутника IKONOS с разрешением 1 м. Информация о высоте объектов извлекается с помощью Stereo Analyst.

Экспертные системы

Здесь показаны предварительные результаты применения простой базы знаний. Вверху – снимок в естественных цветах с наложенными поверх него результатами работы IMAGINE Expert Classifier. Области, показанные желтым цветом, были отнесены к классу дорог. Красные области были вероятными кандидатами в этот же класс, но были отсеяны на основе критериев размера и формы. Внизу – исходное изображение в естественных цветах, приведенное для сравнения. Оно было получено четырехзональной цифровой камерой с разрешением 1м.

Работа в стереорежиме

Трехмерные модели домов г. Луисвиль, штат Кентукки, были созданы с помощью Stereo Analyst и показаны в IMAGINE VirtualGIS вместе с ортотрансформированным снимком поверх цифровой модели рельефа.

Трехмерная информация, создаваемая в Stereo Analyst, обеспечивает реалистичную трехмерную визуализацию городской среды, полезную в презентациях, анализе и других ГИС-процессах. Данное изображение создано в среде VirtualGIS.