Равняемся на классиков: ГИС-трекер коронавируса от университета Джонса Хопкинса и его последователи

Гохман В.В., компания Esri CIS, e-mail: vgokhman@esri-cis.ru

Great efforts lead to the creation of the world’s most popular coronavirus tracker

ГИС-технологии продемонстрировали свою исключительную пользу для отслеживания пандемии COVID-19, планирования и разворачивания усилий по борьбе с ее последствиями, оценки доступных ресурсов и мощностей. Особенно наглядными, информативными и массовыми стали картографические операционные панели, отображающие складывающуюся ситуацию в разных пространственно-временных масштабах. В статье более подробно рассматривается, как возник и работает самый популярный и авторитетный в мире трекер коронавируса от университета Джонса Хопкинса, как и многие другие основанный на веб-приложении ArcGIS Dashboards от компании Esri. Как отмечают разработчики этого привлекшего всеобщее внимание и получившего заслуженное признание проекта, удостоенного престижной награды на всемирной пользовательской конференции Esri 2020 года, собравшей около 90 тысяч зарегистрированных участников из 180 стран, «каждый день – это новый сюрприз».


Многие веб-сайты отслеживают и отображают на картах разрушительное воздействие стихийных бедствий и других катаклизмов, поскольку картография и возможности геоинформационных технологий (ГИС) предоставляют наиболее развитую среду для наглядного отображения и оперативного анализа складывающейся ситуации и ее пространственно-временной динамики. В настоящее время особое место тут занимает мониторинг распространения болезней и смертей, вызванных пандемическим коронавирусом 2020 года.

Так становятся классиками

В этот глобальный процесс вовлечены многие известные международные и национальные организации, СМИ и другие заинтересованные структуры, начиная с глобальной карты Всемирной организации здравоохранения (ВОЗ, см. global map) и заканчивая подсчетом случаев заболевания на уровне штатов и округов в США и отдельных регионов во многих других странах, включая Россию. Но одна из первых попыток наглядной и понятной для всех демонстрации распространения этого заболевания, онлайновая операционная панель, управляемая специалистами Университетом Джонса Хопкинса (Johns Hopkins University online dashboard), быстро стала и остается наиболее популярным местом для получения постоянно актуализируемых данных о затронувшей всех новой коронавирусной заразе (рис. 1).

 Рис. 1. Операционная панель по коронавирусу Центра системной науки и техники университета Хопкинса.

Запущенный в Хопкинсе ГИС-трекер Coronavirus COVID-19 Global Cases
с его центральной картой «черного мира» (впрочем, карту-подложку можно при желании быстро менять, для этого есть более 20 вариантов), усеянной красными кружками, с актуальными данными по случаям заболеваний, летальных исходов и выздоровлений, графиками тенденций и другой информацией, представленной в глобальном масштабе, по странам и, во многих случаях, по более мелким районам, с самого начала придерживается основного принципа — никаких причудливых визуальных изысков, всё должно быть простым и понятным.

Тем не менее, этот сайт, на котором в течение последних месяцев постоянно фиксируется до 4,5 миллиардов посещений и запросов данных в день (а общее их число уже составляет несколько триллионов), стал самым авторитетным источником данных о случаях COVID-19, на который постоянно ссылаются другие. При этом есть много запросов на данные с доступными ссылками, которые многие загружают непосредственно в свои собственные внутренние инструментальные панели и используют для выработки политики действий. Этот ресурс используется новостными компаниями и агрегаторами, государственными органами и ведомствами, международными организациями и множеством людей во всех странах. Его операционная панель (дашборд, основанный на приложении ArcGIS Dashboards) с той или иной степенью подобия была скопирована тысячами последователей по всему миру. Она развивалась с течением времени, добавляя больше деталей для отслеживания распространения и воздействия вируса. То, что начиналось как попытка контролировать вспышку в Китае, превратилось в один из самых надежных в мире источников информации о пандемии.

На 40-й Всемирной пользовательской конференции Esri 2020 года эта разработка была удостоена престижной награды за особые достижения, оказавшие глобальное влияние и привлекшие всеобщее внимание (рис. 2). Впервые за свою историю в этом году это самое масштабное событие в мире ГИС прошло в дистанционном режиме 13-16 июля, но было, как обычно, информационно насыщенным, увлекательным и познавательным, что и засвидетельствовали более 88 тысяч зарегистрированных виртуальных зрителей и слушателей из 180 стран.

 Рис. 2. Команда Университета Джонса Хопкинса получила престижную награду на Всемирной пользовательской конференции Esri.

Как это всё возникло и работает, комментарий из первых рук

У истоков этого сайта находится Лорен Гарднер (Lauren Gardner), со-директор Центра системной науки и техники университета Джонса Хопкинса в Балтиморе, чья предыдущая работа была посвящена пространственному моделированию эпидемий кори и вируса Зика (рис. 3). Гарднер побеседовала с Джоселин Кайзер (Jocelyn Kaiser), представителем новостного агентства ScienceInsider в пятницу, 3 апреля, в день, когда случаи заболеваний COVID-19 превысили 1 миллион во всем мире, с более чем 50 000 смертей. Ниже приведено краткое изложение этого интервью, которое было опубликованное на сайте Science, а также дополнительная информация, поступавшая по мере развития пандемии.

 Рис. 3. Лорен Гарднер стоит у руля популярнейшего сайта-трекера университета Хопкинса.

— Есть много сайтов, отслеживающих случаи COVID-19. Как ваши разработки вышли на первое место?

– Вероятно, потому что они имеют самую долгую историю. Мы стартовали в январе, когда вспышка была в основном только в Китае. Мой аспирант Эншен Донг (Ensheng Dong), а он китаец, проявил личную заинтересованность в реализации этой идеи, явился ее вдохновителем. Донг имеет основательные знания в области ГИС (он даже стажировался в Esri), географии, статистики и системного инжиниринга. И он по опыту своей работы знает, что операционная панель является идеальным средством для отображения данных по здравоохранению и их географической визуализации во многих приложениях, в том числе при отслеживании распространения вспышек заболеваний и эпидемий. Он уже имел сходный опыт визуализации кори, а теперь росла вероятность гораздо более серьезного кризиса. И вот буквально за несколько часов мы создали начальную версию нашей операционной панели (дашборда). А на следующий день [22 января] я выложила ее в Твиттер, и она сразу привлекла внимание и быстро стала очень популярной.

— Содержание этой панели основано на сотнях информационных источников: от данных ВОЗ и национальных агентств до сайтов, которые собирают новости и сообщения о COVID-19 в социальных сетях. Как вы убеждаетесь, что данные точны и не содержат повторов?

– Такие панели мониторинга обычно ориентированы вокруг карты с сопровождающими диаграммами, графиками или другими визуальными элементами, обогащающими и поясняющими общий контекст карты. Но в первую очередь панель требует данных. На представляемые на нашей панели данные смотрят миллионы внимательных глаз. Так что если мы отойдем от истины, люди обратятся к нам очень быстро. Мы получаем тысячи сообщений по электронной почте. И нам, например, скажут: «Эй, здесь есть два новых случая, о которых вы не знаете». Теперь у нас также есть система обнаружения аномалий, которая предупреждает нас о расхождениях в отчетах о случаях, которые мы собираем и анализируем в автоматическом режиме.

Также нам нужно беспокоиться о замкнутых циклах (петлях), когда наши собственные данные передаются нам же из других источников как оригинальные случаи. В США существует сайт агрегации СМИ под названием called 1point3Acres, за которым мы очень внимательно следим. Мы берем у них сводные данные по США, а они получают от нас глобальные данные. При этом мы должны быть очень осторожны, чтобы оперативно ссылаться только на авторитетные данные от национальных агентств. Но дело в том, что если появилась какая-то петля, о которой не говорится в отчетах, и нет подтверждающих сообщений [о новых случаях заражения и смертях от COVID-19], то у нас возникает обоснованное сомнение в ее достоверности. Поэтому мы, по умолчанию, подозреваем, что этого на самом деле могло не быть, и действуем, исходя из такого предположения.

Я хотела бы, чтобы все различные местные органы здравоохранения продолжали совершенствовать свои собственные отчеты таким образом, чтобы мы могли получать данные непосредственно из них, а не из сообщений местных СМИ и других не столь авторитетных источников.

— Можете ли вы получать данные по США из Центров по контролю и профилактике заболеваний?

– Это предположение кажется логичным. Но эти центры предоставляют данные только на уровне штата, и иногда это происходит с задержкой от 24 до 48 часов. В их отчетах нет ничего на уровне округа (Наше примечание: с момента этого интервью произошло много изменений, и данные по США и многим другим странам стали намного детальнее).

— Насколько велика ваша команда?

– Сначала это была моя обычная группа, в которой около шести человек. Но уже на ранней стадии руководство Хопкинса протянуло руку помощи и предложило внутреннюю поддержку. Потому что мы реально взорвали серверы Amazon [облачных вычислений] со всеми нашими требованиями и объемами информации. Теперь Лаборатория прикладной физики [в Хопкинсе] помогает с внутренней обработкой данных и технологиями. Компания Esri, которая создала и предоставляет современное картографическое программное обеспечение, пользователями которого мы являемся, всячески помогает поддерживать работоспособность нашей платформы [в основном силами группы сопровождения и развития Живого атласа Мира
и дружной команды глобального оперативного реагирования при возникновении ЧС]. А люди в Хопкинсе управляют взаимодействием со средствами массовой информации и коммуникациями. Но в целом, группа все еще намного меньше, чем она должна быть для того объема работ, который мы выполняем.

— Какова у вас рабочая нагрузка? Вы работаете посменно?

– Более двух месяцев мы совершенствовали алгоритмы принятия решений о том, откуда собирать данные, каким данным можно доверять, как их агрегировать и проверять. Изначально все это мы делали вручную. Дважды в день Донг обновлял содержание панели и в течение первого месяца почти не спал — пять часов в день или меньше. Затем почти весь процесс постепенно был автоматизирован с помощью различных перекрестных проверок. Содержание нашей инструментальной панели автоматически обновляется ежечасно. Мы также работаем посменно круглые сутки при решении таких вопросов, как обслуживание серверов и обработка потоков данных. Например, у нас есть доктор философии, находящийся в Англии, который отрабатывает раннюю утреннюю смену (по нашему местному времени).

Это большая общественная работа на добровольной основе. Мы просто стараемся сделать ее как можно лучше, но мы осознаем, что мы не идеальны.

— Вы подвергались критике за название страны Тайвань на вашей панели [что не вполне корректно с политической точки зрения] и за то, что изначально разместили данные по случаям заболеваний на круизном лайнере Diamond Princess в центре Соединенных Штатов, в Канзасе.

– Да, каждый день чреват новыми сюрпризами. Некоторые геополитические последствия были для нашей работы стрессовыми и отвлекающими. Но я просто хочу сообщать данные, которые будут наиболее полезными и подходящими для людей, которые пытаются получить к ним быстрый и удобный доступ. Вирусу нет дела до национальных границ.

Были и другие казусы. Так вплоть до вчерашнего дня (4 апреля) у нас было много случаев (сообщений о заболеваниях) без связанного с ними географического местоположения – на Нул-Айленде [«Остров Ноль»; Null Island, место в Атлантическом океане у западного побережья Африки в Гвинейском заливе с нулевыми координатами широты и долготы]. Это было весьма символично. Я подумала, что это отличное место для предварительного размещения всего, что еще не имеет определенного местоположения. Но это расстроило многих людей, пришлось от этой затеи отказаться.

— По мере роста количества случаев COVID-19 приходится всё больше работать?

– На самом деле, это теперь всё в меньшей степени ручная работа, потому что она автоматизирована. Сейчас мы проводим больше времени, занимаясь другими видами исследований. Почти 90% моих интересов и усилий возвращается к математическому моделированию этой болезни. Мы проводим оценку рисков в реальном времени того, что происходит, особенно в Соединенных Штатах, куда теперь переместился эпицентр пандемии, и стремимся донести эти результаты до разработчиков политики реагирования, чтобы сказать: «Вот те округа, о которых нам следует побеспокоиться в ближайшее время». Мы можем сделать это, поэтому мы должны помочь с решением этих вопросов. А Донг теперь часть своего времени посвящает изучению самой пандемии, используя модели мобильности для своей докторской диссертации.

— Вам удается выспаться?

– Это утомительно. Мы занимаемся этим с января. Мы бросили все остальные дела в лаборатории. И, вероятно, так будет еще как минимум несколько месяцев. И я думаю, что мы будем отслеживать вспышку в течение всего года. Все это будет продолжаться со скачками по всему миру. Так что это наверняка потребует 110% наших усилий. Я думаю, что все работники общественного здравоохранения, работающие в этом пространстве, чувствуют то же самое.

Массовое применение и информационные ресурсы

Результаты отличной работы, проводимой медицинскими и научными командами Университета Джонса Хопкинса, и принятый ими подход к открытому обмену информацией с целью предоставления лучших и актуальных данных помогли и помогают полнее осветить масштабы и региональные особенности пандемии COVID-19. Всего полгода назад было трудно в столь убедительном и наглядном виде представить всю мощь картографических и аналитических возможностей и инструментов ГИС и их повсеместную востребованность.

В этой связи хотелось бы чуть больше рассказать о роли и месте ГИС-приложений для освещения чрезвычайных ситуаций на примере современной глобальной обстановки, когда подобные операционные панели по COVID-19 получили широкое распространение и развернуты тысячами организаций и компаний во всем мире. Кстати, на территорию России один из вариантов такой панели создан специалистами Esri CIS на основе того же веб-приложения ArcGIS Dashboards, она размещена на сайте Esri CIS и, в модифицированном виде, — на сайте агентства РИА новости.

Компания Esri практически с начала широкого распространения новой инфекции активно участвует в процессе информирования граждан, международных организаций (ООН и многие другие), национальных правительств и органов власти всех уровней, неправительственных организаций, новостных агентств и участников социальных сетей о текущей ситуации по COVID-19, предоставляя разнообразные ресурсы и программное ГИС-обеспечение.

Широкую известность получил постоянно дополняемый новыми ресурсами тематический ГИС-хаб Esri
(www.esri.com/ru-ru/covid-19/overview) с глобальными и региональными картами, дашбордами, приложениями, наборами данных, готовыми специализированными решениями (для мониторинга, реагирования, поддержания и восстановления сообществ и бизнеса) и другими полезными материалами по данной тематике (рис. 4).

 Рис. 4. Раздел по коронавирусу на сайте компании Esri с широким спектром информационных ресурсов, включая карты, данные, приложения и специализированные решения для мониторинга, аналитики, принятия решений и действий.

На основе этих ресурсов и приложений, а также собственных данных более 4 тысяч агентств, СМИ и других организаций во всем мире создали свои интерактивные карты и дашборды, освещающие развитие пандемии в разных странах, регионах или по территории их операционной деятельности (рис. 5, 6). Ускоренный обмен такими данными помогает повысить уровень осведомленности и готовности, позволяет делать умозаключения и прогнозы, принимать меры противодействия, снижать риски и угрозы.

 Рис. 5. Всемирная организация здравоохранения (ВОЗ) использует ГИС-карты и дашборды для представления и анализа данных по коронавирусу (см.: https://covid19.who.int/)..

 Рис. 6. Сайт ООН с данными по коронавирусу широко использует ГИС-платформу Esri (см.: https://covid-19-data.unstatshub.org).

У этих приложений есть общие принципы и общие элементы, настроенные в соответствии со спецификой доведения нужной информации до целевой аудитории. Значительная их часть создана на основе технологии ArcGIS Dashboards — одном из самых популярных ГИС-приложений в линейке ПО Esri. Картографический инструмент ArcGIS Dashboards
позволяет, не используя ни строчки кода, наиболее подходящим для ваших задач образом организовать и представлять в веб-браузерах и на мобильных устройствах наглядную и хорошо читаемую информацию, включая карты, статистические выкладки, графики, диаграммы, индикаторы и другие виды инфографики.

По сути, с внедрением ГИС-дашбордов появился многослойный ресурс, который включает в себя разнообразную графику и экспертный анализ для поддержки «умных правительств» в их действиях по решению общегосударственных и муниципальных проблем. Коронавирус стал настоящей историей, включающей множество историй. Среди них основанные на представляемых данных истории о неравенстве в обществе, о связанной с пандемией неодинаковой (дифференцированной) угрозе и последствиях для разных слоев общества, воздействием социально-экономического неравенства, безработицы, этнической и расовой принадлежности и т.д. А также истории о готовности к таким событиям, затрагивающим жизни многих-и-многих людей, основанные на отображении и сравнении данных о демографии и местных условиях, о вместимости больниц, наличии средств медицинской помощи и страховки и многие другие. Это целый пласт историй, которые помогают раскрыть технологии геоинформационных систем.

Вообще говоря, картографическое представление информации является особенно актуальным, наглядным и востребованным для освещения глобальных и региональных событий, в том числе таких, как эпидемии, а также при крупномасштабных стихийных бедствиях и других катаклизмах.

Медицинское сообщество и связанные с этой деятельностью структуры с давних времен используют картографию для отображения особенностей и динамики распространения болезней и, в конечном итоге, – для спасения жизней и минимизации ущерба. Наибольшую известность в этом плане получила вошедшая в исторические анналы карта, созданная доктором Джоном Сноу в 1854 году, когда с ее помощью ему удалось связать местоположение и заболеваемость во время вспышки холеры в Лондоне. Начиная с атласов болезней начала 20-го века и до недавних веб-карт вирусных заболеваний Эбола и Зика, работники сферы здравоохранения уже давно рассматривают карты и географический (пространственный) подход, а в последнее время и их цифровую платформу — географические информационные системы (ГИС), как важнейший инструмент для отслеживания и борьбы с заразными заболеваниями, выявления основных рисков и тенденций, принятия решений и действий по сглаживанию последствий.

Дополнительная информация по использованию ГИС в сфере здравоохранения и во многих других отраслях доступна на сайтах компании Esri и ее представителя в России и СНГ — компании Esri CIS.