Геостатистические методы при выявлении причинно-следственных связей между факторами и откликами на территории города
Струков Д.Р., Мельник М.А., СПб ГУЗ Медицинский информационно-аналитический центр, Отдел геоинформационных технологий (2001 – 2007), e-mail: Denis.Strukov@gmail.com

 

Geostatistical approaches for detection of relationships between factors and responses within a city

 

Математические методы пространственного анализа, реализованные в среде современных геоинформационных систем (ГИС), могут помочь медицинским специалистам строить интересные гипотезы и проверять их вероятностную достоверность. В СПб ГУЗ «Медицинский информационно-аналитический центр» (СПб МИАЦ) Комитета по здравоохранению Правительства Санкт-Петербурга несколько лет назад была проведена одна из таких работ. О некоторых результатах этого эксперимента мы уже рассказали в статье в специальном выпуске ArcReview [2]. Здесь мы осветим решавшуюся задачу в более практическом плане.

Эксперимент и геостатистическое исследование в здравоохранении

 

Целью работы явилась проверка гипотезы о пространственной зависимости некоторых типов мутагенных и онкологических заболеваний от абсолютных и вероятных для человека канцерогенов и мутагенов, содержащихся в атмосфере Санкт-Петербурга. Полученные результаты могли помочь предсказать пространственное распределение заболеваемости лейкозами в зависимости от воздействия экологических факторов по территории крупного мегаполиса.

Поставленная цель достигается путем построения упрощенной эпидемиологической модели, а задачи исследования последовательно решаются путем применения геостатистических и детерминированных математических методов обработки пространственно-привязанных данных (геоданных), реализованных в системе ArcGIS с рядом дополнительных модулей, прежде всего в модуле Geostatistical Analyst. После анализа практически всей совокупности типов геостатистических исследований и их специфики была сформулирована общая методика построения цифровых моделей поверхностей распределения, а также методика (алгоритм) выбора способа построения соответствующих цифровых моделей. Кратко рассмотрим основные этапы, лежащие в основе геостатистического исследования:

  • выбирается способ решения задач выявления пространственной зависимости внутри одной или между несколькими тематическими выборками;
  • анализируются статистические параметры выборки и ее пространственная специфика (блок пространственного анализа данных);
  • исходя из особенностей полученных данных, выбирается метод интерполяции, а также оценивается пространственная зависимость (на ковариационных функциях и вариаграммах) внутри выборки (или между несколькими выборками по кроссковариации);
  • выбирается наиболее адекватный для каждого конкретного случая метод интерполяции при помощи гибкого инструментария «подгонки» моделей;
  • строятся различные типы цифровых моделей: модель поверхности распределения, поверхность распределения стандартных ошибок значений и др.

Цифровые модели топологически привязываются к географическим объектам с целью их дальнейшей интерпретации.

Рассмотрим основные результаты проведенной работы, полученные с применением функций геостатистического анализа.

  1. Построенные цифровые модели врожденных деформаций и хромосомных нарушений (ВДХ) у детей до года, а также ВДХ с учетом наличия в атмосфере мутагенных факторов позволили сделать вывод о пространственной зависимости между ВДХ и мутагенными факторами на территории Адмиралтейского, Кировского и прилегающих к ним районов (см. рис. 1, 2). Данный анализ демонстрируют не только результирующие поверхности, но и кроссковариационные функции (рис. 2).
  2. Цифровые модели поверхности распределения отдельных отклонений в перинатальный период развития плода лишь доказывают факт реагирования чувствительных групп населения на присутствие в окружающей среде поллютантов (см. рис. 1, 2) практически в тех же районах города.
  3. При анализе следует учитывать поверхность «ошибок» отклонений. Ошибки интерполяции показывают отклонения истинных значений от прогнозных в определенных местах пространства, Так, черно-белые поверхности на рис. 1 демонстрируют ошибки как конкретных показателей, так и поверхностей показателей, рассчитанных с учетом наличия воздействующих факторов. Более темные зоны на картах – места с максимальными отклонениями от прогноза.
  4. Топологическая привязка цифровых моделей к геообъектам (водоемам города, основным магистралям 4 ранга загруженности (более 35 тысяч автомобилей в сутки), жилым и нежилым зонам, территориям предприятий при помощи средств ГИС может подсказать исследователям некоторые возможные причины распространения заболеваемости по территории (рис. 1).
  5. Менее чувствительная группа населения реагирует не так однозначно. Данный метод показывает отчетливую миграцию населения, которой подвержена, главным образом, взрослая группа по причине занятости (притяжение к центру города). При помощи инструментария модуля ArcGIS Spatial Analyst создана пространственная «модель притяжения населения», демонстрирующая специфику внутридневной миграции жителей (рис. 3).
  6. Неярко выраженная пространственная зависимость между лейкозами в 1995-2000 и канцерогенами в 1990-1998 годах имеет место на территориях Московского, Фрунзенского и Невского районов – видимо, это юго-восточный тренд переноса канцерогенов, связанный с преимущественным среднегодовым направлением ветра. Именно на этих территориях, с учетом поверхностей ошибок интерполяций, можно говорить о значимом вкладе канцерогенных факторов в причины заболеваемости лейкозами проживающего здесь населения (см. рис. 2 – слева).
  7. На примере поверхностей ошибок цифровых моделей, характеризующих неоднородное распределение пунктов мониторинга воздуха, обосновывается выделение определенных территорий, где следует расположить дополнительные пункты мониторинга (в местах максимальных статистических ошибок), что позволит построить более точные модели распределения загрязнений (более темные зоны на поверхностях ошибок интерполированных значений на рис. 1, 2).

Кроме того, геостатистический метод анализа при помощи ArcGIS Geostatistical Analyst был апробирован на выявлении этиологии рака молочной железы по Санкт-Петербургу и экологических факторов (содержание канцерогенов в атмосфере). Получились любопытные результаты (см. рис. 4 справа): анализ пространственных зависимостей ни по одному из математических методов не дал результатов даже на уровне тенденций. Картина демонстрирует довольно хаотичное распределение, зависящее, как правило, от уровня жизни населения. Это говорит о том, что экологический фактор (а именно – нахождение определенных канцерогенов в атмосфере крупного мегаполиса) не вносит в таком виде явный вклад в причину этой формы заболеваемости. Истинными причинами, скорее всего, могут быть социально-экономические факторы. Однако конкретные показатели таких факторов довольно сложно собрать и привязать к топооснове с требуемой для геостатистического метода точностью и детальностью. То есть, для более глубокой проработки этой темы необходимы дальнейшие исследования.

Анализ предложенных методик и полученных данных позволяет сделать следующие предварительные заключения и выводы относительно применения геостатистического метода исследований в сфере здравоохранения:

  • В целом, геостатистические методики позволяют выявлять различные причинно-следственные связи и статистические отклонения изучаемых факторов в приложении к конкретным ареалах территории.
  • При интерполяции факторов и откликов реально построить соответствующие поверхности (модели) с количественным учетом ошибок прогноза.
  • В ArcGIS (в модуле Geostatistical Analyst) включен достаточно мощный блок аналитических функций, позволяющий корректировать выборки под «математику», проводить геокорректное изучение наборов данных.
  • Возможности Geostatistical Analyst для решения медико-экологических задач намного шире описанных выше достаточно частных, хотя и интересных примеров; не изучено, например, в приложении к целям нашего эксперимента, но представляется перспективным построение и анализ «карты» прогнозов превышения ПДК от заданного изменения и влияния до 5 факторов, и многое другое.

Таким образом, программное обеспечение Esri, в том числе инструменты и функции дополнительных аналитических модулей ArcGIS Spatial Analyst и ArcGIS Geostatistical Analyst, корректно и в достаточном объеме собираемые данные о показателях окружающей среды и здоровья населения предоставляют эпидемиологу большие возможности для исследований причинно-следственных связей на определенной территории, их моделирования, интерпретации и наглядного картографического представления получаемых результатов.

Литература

  1. Петров Е.И., Струков Д.Р., Красильников И.А. Геоинформационные технологии в здравоохранении// Материалы Юбилейной 8-ой Санкт-Петербургской международной конференции «Региональная информатика 2002», СПб – 26-28 ноября 2002 г
  2. Красильников И.А., Разгуляев К.А., Струков Д.Р., Петров Е.И. Географические информационные системы в управлении здравоохранением Санкт-Петербурга»// «ArcReview. Современные геоинформационные технологии» Спец выпуск к 300-летию Санкт-Петрбурга о лучших ГИС-проектах Северо-Западного региона. М.- ООО «Дата+», 2003 – 24 с.
  3. Струков Д.Р., Разгуляев К.А. Пространственный анализ распределения абсолютных и вероятных для человека канцерогенов в атмосфере Санкт-Петербурга в его связи с распространением заболеваемости населения//Материалы Международной конференции «Воздух 2004». / Под ред. Н.З. Битколова и Ю.И. Мусийчука. – СПб, 2004. – 308 с.
  4. Струков Д.Р. Пространственно-временной анализ распределения вредных веществ в атмосфере Санкт-Петербурга. Сезонная пространственная изменчивость их распространения. // Материалы Международной конференции «Воздух 2004». / Под ред. Н.З. Битколова и Ю.И. Мусийчука. – СПб, 2004. – 308 с.
  5. Попов Г.А., Кононенко Д.В., Струков Д.Р. Пространственно-временной анализ распределения вредных веществ в атмосфере Санкт-Петербурга // Материалы Международной конференции «Воздух 2004» / Под ред. Н.З. Битколова и Ю.И. Мусийчука. – СПб, 2004. – 308 с.
  6. Красильников И.А., Струков Д.Р., Разгуляев К.А. Внедрение системы медико-экологического мониторинга окружающей среды на базе геоинформационных технологий // Материалы Международной конференции «Воздух 2004». / Под ред. Н.З. Битколова и Ю.И. Мусийчука. – СПб, 2004. – 308 с.
  7. Бузников А.А., Разгуляев К.А., Струков Д.Р., Горохов В.Л. Обработка экологической информации в системе медико-экологического мониторинга окружающей среды // Материалы 2-ой Всероссийской конференции «Дистанционное зондирование земных покровов и атмосферы аэрокосмическими средствами» – СПб, 2004.
  8. Струков Д.Р., Попов Г.А. Пространственный анализ характеристик городской популяции в медико-экологическом исследовании на примере обработки баз данных диспансеризации детей // Материалы научно-практической конференции «Здоровье женщины. Вопросы профилактики и оздоровления» / Под ред. И.В. Добрякова и Ю.И. Мусийчука. – СПб, 2005. – 120 с.
  9. Мерабишвили В.М., Струков Д.Р. Геостатистический метод пространственного анализа на примере исследования распространения мутагенных и канцерогенных факторов в Санкт-Петербурге и отклонений здоровья матерей и детей // Материалы научно-практической конференции «Здоровье женщины. Вопросы профилактики и оздоровления» / Под ред. И.В. Добрякова и Ю.И. Мусийчука. – СПб, 2005. – 120 с.
  10. Струков Д.Р., Красильников И.А. Геоинформационные технологии в управлении здравоохранением// Материалы 9-й Всероссийской конференции «Проблемы ввода и обновления пространственных данных» – М.: ГИС-Ассоциация, 2005. – 48 с.
  11. Струков Д.Р., Попов Г.А. Пространственный анализ характеристик детской популяции в медико-экологическом исследовании при помощи ГИС // Материалы 9-й Всероссийской конференции «Проблемы ввода и обновления пространственных данных» – М.: ГИС-Ассоциация, 2005. – 48 с.
  12. Струков Д.Р., Попов Г.А. Использование геоинформационных систем для оценки качества массивов медицинской информации и фальсификаций при заполнении результатов диспансеризации детей // Материалы 9-й Всероссийской конференции «Проблемы ввода и обновления пространственных данных» – М.: ГИС-Ассоциация, 2005. – 48 с.
  13. Мерабишвили В.М., Струков Д.Р. Пространственный анализ распространения мутагенных и канцерогенных факторов в среде крупного мегаполиса и патологий различных групп населения с применением геостатистического метода // Материалы 9-й Всероссийской конференции «Проблемы ввода и обновления пространственных данных» – М.: ГИС-Ассоциация, 2005. – 48 с.
  14. Струков Д.Р. Проект системы медико-экологического мониторинга окружающей среды на базе ГИС // Материалы 9-й Всероссийской конференции «Проблемы ввода и обновления пространственных данных» – М.: ГИС-Ассоциация, 2005. – 48 с.
  15. Струков Д.Р. Геоинформационные технологии в управлении здравоохранением. Общие принципы. // Материалы Всероссийской научно-практической конференции «Информационные технологии в системе модернизации здравоохранения – 2005» – М., 2005. – 130 с.
  16. Струков Д.Р., Попов Г.А. Использование геоинформационных систем для оценки качества массивов медицинской информации // Материалы Всероссийской научно-практической конференции «Информационные технологии в системе модернизации здравоохранения – 2005» – М., 2005. – 130 с.
  17. Струков Д.Р., Красильников И.А., Мерабишвили В.М. Геоинформационные системы и методы пространственного анализа для исследования заболеваемости населения злокачественными новообразованиями. Глава IV к сборнику «Злокачественные новообразования в Северо-Западном федеральном округе России» под ред. Проф. В.М. Мерабишвили, СПб МИАЦ, ПРР. – СПб,2005. – 314 с.
  18. Струков Д.Р., Лучанинов С.С., Мерабишвили В.М., Осикина М.В., Попов Г.А. Опыт использования ГИС в управлении здравоохранением на территориях. // Материалы 11-й Всероссийской конференции пользователей ESRI & Leica Geosystems в России и странах СНГ. – М., ООО «Дата+», 2005 г., CD
  19. Попов Г.А., Струков Д.Р., Осикина М.В. Пространственный анализ характеристик городской популяции в медико-экологическом исследовании на примере обработки баз данных диспансеризации детей. // Материалы Всероссийской конференции «Использование геоинформационных систем для решения задач природопользования и охраны окружающей среды» – СПб., 2005. – 88 с.
  20. Струков Д.Р., Попов Г.А., Геостатистический метод пространственного анализа на примере исследования распространения мутагенных и канцерогенных факторов в среде крупного мегаполиса и патологий различных групп населения// Материалы Всероссийской конференции «Использование геоинформационных систем для решения задач природопользования и охраны окружающей среды» – СПб., 2005. – 88 с.
  21. Струков Д.Р. Проект системы медико-экологического мониторинга окружающей среды на базе геоинформационных технологий, как часть городской медицинской системы» // Материалы конференции «ИТ в системе модернизации здравоохранения», 2005 г.
  22. Добрых Д.В., Струков Д.Р. «Web-GIS – Интернет- ориентированная геоинформационная система для отрасли здравоохранения Санкт-Петербурга» // Материалы XII Всероссийского форума «Рынок геоинформатики России», 2006 г.
  23. Декстер А.П., Струков Д.Р. «Построение геоинформационной системы здравоохранения региона» / Врач и информационные технологии, №4 2008., Москва.
  24. Струков Д.Р. «Геоинформационные системы», глава №8 в книге Мерабишвили В.М., Щебрук Ю.А. М52 Современное развитие информационных систем онкологической службы. – СПб.: ООО «ИПК «КОСТА», 2009. – 244 с.
  25. Струков Д.Р. Построение ГИС для задач управления здравоохранением города на примере Санкт-Петербурга, Материалы доклада на VIII Общероссийском форуме «Стратегическое планирование в регионах и городах”, – Санкт-Петербург, 2009.
  26. Гребенюк А.Н., Мерабишвили В.М., Мусийчук Ю.И., Попов Г.А., Струков Д.Р. «Подходы к оценке окружающей среды урбанизированных территорий и влияние ее на здоровье населения (на примере Санкт-Петербурга)» С.29-54 Тома III. «Пути решения проблем окружающей среды в больших городах и промышленных зонах. Управление окружающей средой» монографии «Экология и гидрометеорология больших городов и промышленных зон (Россия-Мексика)». – Санкт-Петербург, 2010.

Рис. 1. Пространственный анализ поверхностей распределения мутагенных факторов в атмосфере и заболеваемости чувствительных групп населения.

Рис. 2. Прогноз значения отдельных состояний беременных в перинатальном периоде, зависимых от мутагенных факторов в атмосфере (a), поверхность ошибок (б) и кроссковариационная функция (внизу).

Рис. 3. Учет миграции населения в Санкт-Петербурге: а) цифровая пространственная модель миграции населения (2004 г.); б) численность проживающего населения; в) распределение показателя загрязнения атмосферы группой «легких» веществ-канцерогенов.

Рис. 4. Примеры цифровых моделей распределения заболеваний: лейкозов (слева), рака молочной железы (справа).