Инструменты нечеткой логики в ArcGIS 10

Серебрянная О.Л., компания Esri CIS, Глебова К.С.

New fuzzy logic tools in ArcGIS 10

 

 

Одним из важнейших свойств человеческого интеллекта является способность принимать правильные решения в условиях неполной и нечеткой информации. Вопросы перевода наших приближенных размышлений на математическую основу, построения соответствующих управляющих алгоритмов и моделей и их использование в компьютерных системах являются предметом научной дисциплины, называемой нечёткой логикой (fuzzy logic). Она базируется на теории нечетких множеств, по сути являющихся значениями лингвистической переменной. Средства нечёткой логики – логические операции над нечёткими множествами – помогают переводить неоднозначные жизненные утверждения в язык чётких и формальных математических формул и принимать на их основе более обоснованные суждения и решения. То есть, в данном случае понятие множества расширяется допущением, что функция принадлежности элемента к множеству может принимать любые значения в интервале [0…1], а не только 0 или 1 (однозначно не принадлежит или принадлежит). В настоящее время сфера приложения этих возможностей обширна и многообразна: от систем оценки глобальных процессов (например, загрязнения атмосферы) и прогнозирования землетрясений до управления большим бизнесом и производством (например, в АСУ заводских цехов), в авто- и других видах транспорта, в военной области, для изучения окружающей среды и природных ресурсов, и т.д. Имеются и коммерческие системы массового применения.

Нечёткая логика в ArcGIS

В приложении к Геоинформационным системам (ГИС), в нашем случае к среде ArcGIS, в состав которой включены соответствующие инструменты (рис. 1а, б, в), нечёткая (размытая) логика может использоваться как технология для более продвинутого решения традиционных задач анализа посредством наложения тематических пространственных данных, например, при выборе подходящих по заданным критериям территорий и применении моделей пригодности.

 


Рис. 1а. Чтобы активизировать дополнительный модуль Spatial Analyst, в меню Настройка щёлкните Дополнительные модули и отметьте его. Предварительно этот модуль надо установить и активизировать лицензию.


Рис. 1б. Инструменты нечёткой логики находятся в группе инструментов Наложение (Overlay) набора инструментов Spatial Analyst.


Рис. 1в. SDM – это набор инструментов геообработки для моделирования пространственных данных, который можно скачать из ArcScripts на сайте http://arcscripts.esri.com/details.asp?dbid=15341.

 

Итак, основная исходная предпосылка нечёткой логики состоит в том, что существуют неточности (нечеткость) в атрибутах и в геометрии пространственных данных. Нечёткая логика обеспечивает методы для выявления и устранения двух типов неточностей, но, поскольку она в нашем случае относится к анализу наложения, то фокусируется на неточности в атрибутивных данных. Две основные области, где в атрибутивных данных появляются неточности, возникают в определении классов и в измерении явления. Оба эти источника, особенно в определении классов, могут привести к неточности в присвоении ячеек конкретным классам.

Определение классов в классификации и неточность в сортировке явлений по классам могут повлиять на результаты работы и принятие решений. Инструменты Нечёткого наложения (Fuzzy Overlay) помогают в устранении этих неточностей или их учету в анализе данных. Нечёткая логика сосредоточена на моделировании неточностей класса границ.

Инструменты Взвешенное наложение (Weighted Overlay) и Взвешенная сумма (Weighted Sum) основаны на чётких наборах, где каждая ячейка либо находится в классе, либо нет. При нечёткой логике специально рассматриваются ситуации, когда строгие границы между классами не ясны. В отличие от чётких наборов, для нечёткой логики не важно положение внутри или вне класса. Она определяет вероятность того, что это явление является членом набора (или класса). Нечёткая логика основана на теории множеств, поэтому необходимо определить возможности, а не вероятности.

Например, в модели пригодности для строительства жилья, если уклон является одним из входных критериев, каждое значение уклона будет преобразовано, и ему будет присвоено значение от 0 до 1 на основании того, что значения уклона будут членом набора пригодности для постройки (или класса), то есть будут ли они подходящими. Значение 1 означает полную уверенность, что значение находится в наборе, а 0 указывает с полной уверенностью, что оно не находится в наборе. Все другие значения предполагают некоторый уровень возможности, и чем выше значение, тем больше вероятность принадлежности. Процесс трансформации исходных входных значений в диапазон возможности принадлежности от 0 до 1 называется процессом подготовки задачи для решения методами нечёткой логики. Каждый критерий для модели, например экспозиция склонов, расстояние до дорог и тип землепользования, будут обработаны методами нечёткой логики. Инструмент Нечёткая принадлежность (Fuzzy Membership) используется для трансформации данных в масштаб возможности 0 к 1.

Чтобы определить местоположения, которые лучше всего отвечают всем критериям, то есть имеют высокую вероятность принадлежности во всех наборах, используется инструмент Нечёткое наложение (Fuzzy Overlay). При комбинировании нескольких критериев этот инструмент рассматривает вероятность ячейки быть членом каждого набора, определённого несколькими критериями. Например, при определении того, какова вероятность, что определённое местоположение принадлежит благоприятной пригодности для уклона, экспозиции и расстояния до дорог.

Таким образом, два основных шага в анализе нечёткой логики – это подготовка задачи и анализ нечёткого наложения. Эти два шага соответствуют шагам переклассифицировать/трансформировать и добавить/комбинировать, соответственно, в обычном процессе пространственного наложения. Дополнительную информацию по данной тематике можно, например, посмотреть в системе Справки ArcGIS.

Объединение знаний экспертов

Для многих задач пространственного моделирования эксперты могут описать процесс принятия решения, применяемый для прогноза текущего состояния и развития явлений реального мира: благоприятность для расположения месторождений минералов или археологических объектов, наличие стихийных бедствий, таких как оползни или вспышки заболеваний, ареалы различных видов животных или растений или оптимальное место для открытия бизнеса. Для большинства таких и подобных им пространственных задач знания экспертов часто описываются как близость к некоторому свойству, или в высказываниях, в которых присутствуют «иногда» или «возможно». Подобные семантические описания полезны, но не точны. И тут есть смысл обратиться к помощи нечёткой логики.

Нечёткая логика дает приближение к «истине», позволяющее перевести семантические описания экспертов в числовую пространственную модель, например, для прогноза расположения некоторого интересующего вас объекта с размытыми или неопределенными границами.

 


Рис. 2. Графический пример функции принадлежности Высота. Семантическое утверждение могло бы быть таким: «высота в 82 дюйма всегда считается большой», в то время как «высота ниже 38 дюймов никогда не считается большой». Высота около 70 дюймов может рассматриваться и так, и так и ей присваивается значение функции принадлежности 0.55.


Рис. 3. Схема инструмента Веса категорий (Categorical Weights) из набора инструментов SDM.

 

В дополнение к инструментам Булева логика (Boolean logic) и Взвешенное наложение (Weighted Overlay) в ArcGIS 10 появились два новых инструмента наложения: Нечёткая принадлежность (Fuzzy Membership) и Нечёткое наложение (Fuzzy Overlay). Наложение с использованием нечёткой логики обеспечивает более гибкое взвешивание фактов и сочетаний фактов, чем традиционное Булево наложение или Взвешенное наложение (рис. 2). Эти новые инструменты попали в ArcGIS из набора инструментов Spatial Data Modeller (SDM), разработанного Геологическими службами США и Канады. [SDM– это набор инструментов геообработки для моделирования пространственных данных, который можно скачать из ArcScriptsна сайте http://arcscripts.esri.com/details.asp?dbid=15341]. Инструмент Нечёткая логика (Fuzzy Logic) – всего лишь один из множества методов, доступных в SDM, где имеются также веса фактов, логистическая регрессия, экспертные системы и проверка модели (рис. 3).

Непространственный пример

Рассмотрим простой пример применения непространственной модели булевой и нечёткой логики на данных о параметрах людей, приведенных в табл. 1. Булева логика работает в ситуациях, которые могут быть только истинными или ложными. Нечёткая логика допускает степень правдивости (выражаемую в виде функции принадлежности) от нуля до единицы. В данном примере эксперт применяет значения нечёткой принадлежности для определения значимости двух характеристик людей (рост и возраст) для использования в качестве прогностического факта (значения между 0 и 1). Эксперт также определяет, как сочетаются факты, в данном примере применяя нечёткие операторы «И» и «ИЛИ».

Вероятность является частным случаем нечёткой принадлежности. Если вероятность истины равна 0,8, тогда вероятность лжи равна 0,2 (то есть, если вероятность того, что событие произойдет, равна x, то вероятность того, что оно не произойдет, составляет 1-x). Это свойство аддитивной инверсии вероятных утверждений в нечёткой логике не требуется. Нечёткая принадлежность может рассматриваться как «возможность» того, что высказывание верно.

В булевой модели рост Маши (см. табл. 1) абсолютно не высокий, то есть высота (рост) равна нулю, в то время как в модели нечёткой логики высота Маши мала с уровнем роста 0,42. В общем, принадлежность 0,5 указывает на двойственную ситуацию: утверждение не является ни истинным, ни ложным. Пример функции принадлежности с семантическими описаниями (например, возможно низкий, возможно высокий) приведен в графическом виде на рис. 2. Таким образом, нечёткая принадлежность обеспечивает чувствительность к тонким аспектам моделируемого процесса. Кроме того, доступен набор операторов нечетких комбинаций, которые значительно превосходят простые операторы «И» и «ИЛИ», применяемые в булевой логике, и позволяют моделировать гибкость и комплексность, присутствующие во многих решениях, принимаемых в отношении реальных объектов.

Таблица 1. Непространственный пример сопоставления булевой и нечёткой логики.

Факт

Имя Высота Нечёткий

рост

Булев

рост

Возраст Нечёткий

возраст

Булев

возраст

Фред 3′ 2″ 0,00 0 27 0,21 0
Майк 5′ 5″ 0,21 0 30 0,29 0
Сэлли 5′ 9″ 0,28 0 32 0,33 0
Маша 5′ 10″ 0,42 0 41 0,54 1
Джон 6′ 1″ 0,54 1 45 0,64 1
Сью 7′ 2″ 1,00 1 65 1,00 1

 

Непространственные модели

 

Булева логика Нечёткая логика
Истина (Маша высокая) = 0 Истина (Маша высокая) = 0,42
Истина (Фред старый) = 1 Истина (Фред старый) = 1
Истина (Сэлли высокая и старая) = 0 Истина (Сэлли высокая и старая) = 0,21
Истина (Джон высокий или старый) = 1 Истина (Джон высокий или старый) = 0,54

Примечание к таблице: В булевой логике истина может быть равна лишь нулю или единице. В нечёткой логике истина имеет градации между нулем и единицей. Нечёткая высота и нечёткая старость являются принадлежностью с точки зрения высоты и старости в данной концепции. Булева высота и булева старость являются бинарными принадлежностями в данной концепции. Таким образом, в булевой логике человек либо высокий, либо нет; в то время как в нечёткой логике человек может быть в какой-то степени высоким. Операторы «И» и «ИЛИ» применяются для комбинирования фактов в обоих методах.

Пространственный пример

В модели на основе нечёткой логики в ArcGIS, растрам фактов приписываются значения принадлежности с помощью инструмента Нечёткая принадлежность (Fuzzy Membership). Некоторые функции нечеткой принадлежности приведены в табл. 2. Принадлежности комбинируются с помощью инструмента Нечёткое наложение (Fuzzy Overlay) путем выбора операторов нечёткой комбинации в зависимости от того, как взаимодействуют признаки.

Таблица 2. Обзор операторов, доступных в инструменте Нечёткое наложение в ArcGIS 10.

В приведенной модели могут использоваться различные операторы. Эти операторы обеспечивают большую гибкость, чем модели взвешенного суммирования или наложения, и позволяют эксперту привнести большую чувствительность на основании данных о взаимодействии признаков. На практике операторы комбинирования признаков выбираются относительно просто, однако функция нечёткой принадлежности может потребовать некоторой настройки параметров принадлежности, чтобы точнее представить экспертную информацию.

Простое семантическое описание эксперта

Простой пример пространственной модели на основе нечёткой логики иллюстрирует рис. 4. Эта геологическая модель для месторождений золота карлинского типа использует базы данных, доступные через набор инструментов Spatial Data Modeller (www.ige.unicamp.br/sdm/default_e.htm). [Месторождения золота карлинского типа, с содержанием золота от 1 до 5 грамм на тонну, были первоначально открыты в Неваде. Они названы в честь наиболее крупного месторождения золота в Северном полушарии – Карлинского]. Исходя из семантического описания критериев обнаружения месторождений золота карлинского типа, упрощенная семантическая модель может основываться на следующих утверждениях:

  • Высокое содержание сурьмы (Sb) или мышьяка (As) сопутствует золоту карлинского типа. Используйте геохимию промыва и осаждения для определения геохимического фактора минерализации.
  • Скалы, содержащие месторождения карлинского типа, являются грязными карбонатными скалами Палеозоя и Мезозоя. Используйте геологическую карту для определения влияния литологического фактора.
  • В грязных карбонатных породах содержится мало калия (K). Примените геохимию промыва и осаждения для согласования литологии и геохимического фактора минерализации. Повышенное содержание K отличает золотоносные месторождения карлинского типа от месторождений золота в вулканических породах, хотя в обоих типах отмечается высокая концентрация Sbили As.

 


Рис. 4. Демонстрация простой модели нечёткой логики. Принадлежность к категориям описана на рис.3. Остальными инструментами служат инструменты наложения в ArcGIS 10.

На основе этих семантических высказываний может быть определена простая схема модели с нечёткой логикой.

Простая модель на основе нечёткой логики

Нередко в таких моделях имеются подмодели или факторы, описывающие комплексные особенности пространственной модели. Эти подмодели часто представляют факторы, заданные одной отраслью; таким образом, «Эксперт» для целой модели (на практике) часто представлен группой экспертов, которые привносят в процесс принятия решения информацию из различных отраслей. Окончательная модель получается за счет сочетания факторов. Процесс определения согласованных с литологией геохимических и литологических факторов в модели, приведенной на рис. 4, описывается посредством следующих семантических утверждений.

Геохимический фактор минерализации. Используем инструмент Большая нечёткая принадлежность (Large Fuzzy Membership) для присвоения значений нечёткой принадлежности Sbи As. Настраиваем параметры этого инструмента, чтобы сделать нечеткие карты фактов приемлемыми для эксперта. Объединяем нечёткие карты Sbи Asоператором «Нечёткое ИЛИ». Используем инструмент Нечёткая принадлежность для K, вновь настраивая параметры для инструмента Малая нечёткая принадлежность (Small Fuzzy Membership), чтобы создать удовлетворяющую предъявляемым требованиям карту.

Согласованный с литологией геохимический фактор. Воспользуемся оператором «Нечёткое И» для объединения геохимического фактора минерализации с принадлежностью К.

Литологический фактор. Присваиваем нечеткую принадлежность различным типам отложений, присутствующим на геологической карте, следуя рекомендациям эксперта и применяя инструмент Нечёткая принадлежность из набора инструментов Spatial Data Modeller (рис. 3). Затем объединяем согласованный с литологией геохимический фактор с литологическим фактором, используя оператор «Гамма комбинация», чтобы получить карту вероятности расположения золотого месторождения карлинского типа. Настраиваем значение параметра «гамма», чтобы получить приемлемую комбинацию.

 


Рис. 5. Простая модель нечёткой логики для золотоносных месторождений карлинского типа.

 

После сборки приведенной на рис. 5 модели необходимо согласовать параметры нечёткой принадлежности, чтобы настроить нечёткие принадлежности для правильного представления концепций эксперта. Эту настройку можно сделать графически в электронной таблице или просто путем пространственной проверки растров. Использование итерационных методов в отдельно настраиваемых моделях полезно для быстрого отбора растров с рядом параметров. Эксперты оценят наилучшее представление пространственных данных. Для выявления и сглаживания несоответствий в оптимальной настройке нечётких принадлежностей многие модели имеют различные опции, которые можно быстро создать и протестировать в процессе проверки модели. Сопоставление моделей, созданных на основе булевой и нечёткой логики, приведено на рис. 6. Модель взвешенного суммирования оказывается похожей (но не идентичной) с моделью на основе нечёткой логики.

 

   
Рис. 6. Модели на основе булевой и нечёткой логики. Используются побитовые «ИЛИ» и «И» вместо нечетких «ИЛИ» и «И». Нечеткий ряд заменен на побитовое «ИЛИ», наиболее напоминающее нечеткий ряд.

 

После завершения составления модели или моделей важно провести проверку результатов. Если известны примеры моделирования сходных объектов (например, известных месторождений, ареалов животных и т.п.), то они могут быть использованы для тестирования того, насколько хорошо модель воспроизводит их. Инструмент Частота измерений (Area Frequency) из набора Spatial Data Modeller проводит измерение качества прогноза. В случае отсутствия известных примеров, для проверки модели требуется оценка экспертов и тестирование полей.

Таковы некоторые из вариантов применения принципов нечёткой логики на основе инструментов, представленных в ArcGIS 10.

Примечание: в основу данной статьи положены материалы Гари Л. Рэйнса, Дона Л. Завацки и Грэма Ф. Бонхам-Картера, бывших геологов-исследователей из Геологических служб США и Канады, опубликованные в журнале ArcUser (см. esri.com/news/arcuser/0410/fuzzylogic.html).