Создание метаданных: просто и перспективно

Серебряная О.Л., Гохман В.В., ДАТА+, ESRI CIS

Метаданные – важный компонент грамотно созданных пространственных данных. Без них не обойтись при формировании каталогов геоинформационных ресурсов, обеспечении полноценной поддержки поиска геоданных, в том числе по распределенным в сети источникам. Документирование информационных ресурсов путем создания метаданных является необходимым этапом в развертывании инфраструктур пространственных данных как внутри организации, так и на региональном, национальном или глобальном уровне. Эти «данные о данных» содержат сведения о покрываемой исходными данными территории, описание их тематики, первоисточника, исходного масштаба, сведения об авторстве, времени создания, другую информацию, полезную для понимания их сути, актуальности, надежности и т.п. для потенциально заинтересованных в подобных данных людей.

На практике, этому важнейшему вопросу не всегда уделяется достойное внимание, либо он практически полностью игнорируется – по разным причинам. Когда информационные ресурсы невелики, и с ними работает только автор данных и ограниченный круг его коллег, потребность в полноценных метаданных не столь очевидна. И эта «пагубная» привычка со ссылками на недостаток времени, опыта и т.п. может сохраниться и в последующем, особенно если в организации нет строгих требований к обязательному документированию, описанию имеющихся и создаваемых информационных ресурсов.


Закладка Метаданные диалогового окна Опции в ArcCatalog.

 

В этом случае лучше сразу подумать о пересмотре своего отношения к значению метаданных. Тем более что внесение несложных изменений в процесс создания данных, сопровождаемых метаданными, не потребует заметного роста затрат на их подготовку, но при этом кардинально улучшит качество ваших информационных ресурсов, их доступность и удобство использования. Это понимают и многие наши коллеги, обращаясь к специалистам нашей компании, в том числе к преподавателям нашего учебного центра, за советом и помощью.

Приведенные ниже советы, надеемся, помогут создать хорошо структурированные, высококачественные метаданные. Это не намного труднее чем, например, произнести и осмыслить незамысловатую фразу «Описание стандартов метаданных для цифровых геопространственных данных Федерального комитета США по географическим данным». Эти рекомендации, в основном, адресованы тем, кто знает, как работать в ArcGIS с приложением ArcCatalog и имеет общее представление о пространственных данных и метаданных.

Создание структуры метаданных для вашей организации

Разработка структуры метаданных – важный, но часто игнорируемый этап в создании метаданных. А многие вообще не знакомы с процессом создания структуры метаданных, поэтому просто используют первую, по умолчанию предлагаемую программным продуктом. Структура метаданных определяет, каким образом интерпретируются и реализуются стандарты, установленные для метаданных, в определенной компании или организации. Поскольку многие стандарты для метаданных громоздки и часто содержат поля для свободного заполнения, может быть очень полезным пересмотреть их в отношении соответствия целям и задачам, преследуемым вашей организацией, и с их учетом создать собственную структуру метаданных, удовлетворяющую вашим запросам. Это поможет стандартизировать создание метаданных в вашей компании.

Ваша организация может создавать метаданные для отдельных взаимосвязанных целей, например, для обеспечения процесса записи, защиты авторских прав или разрешения на совместное использование данных. По своей сути метаданные должны объяснять, каким образом структурированы ваши данные.


Добавление кнопки Установить работающие синхронизаторы.

 

В первую очередь желательно определиться со стандартами метаданных. В настоящее время в мире существует несколько стандартов для документирования пространственных данных.

ISO 19115:2003 «Geographic information Metadata» (Географическая информация. Метаданные) – разработан Техническим комитетом ISO/TC 211, представлен в виде диаграмм на UML (Unified Modeling Language) и принят в качестве международного стандарта содержания пространственных цифровых метаданных в мае 2003 г. Набор метаданных ISO 19115 состоит из пакетов, агрегирующих сходные описания классов, содержит более 400 элементов и атрибутов, сгруппированных в 95 классов, которые составляют атомарные единицы метаданных. 22 элемента составляют ядро, включающее 7 обязательных, 4 условных и 11 необязательных элементов.

FGDC-STD-001-1998 – американский прототип ISO 19115, разрабатывался с начала 1990-х годов Федеральным комитетом по географическим данным США (FGDC), принят в качестве национального стандарта содержания на цифровые пространственные метаданные (Content Standards for Digital Geographical Metadata, CSDGM), содержит более 200 элементов. Первая версия подготовлена в 1994 г., вторая в 1998 г.

ГОСТ Р 52573-2006 «Географическая информация. Метаданные» – введен в действие 1 января 2007 г. и является российским профилем ISO 19115. К сожалению, он не имеет полной совместимости с исходным международным стандартом и нуждается в корректировке во избежание технических барьеров при использовании на международном уровне. В российском профиле отброшена большая часть (около 200) непопулярных элементов ISO 19115, добавлены новые элементы и специализированные словари для удобства использования на российском рынке геоданных. Этот ГОСТ довольно прост и удовлетворяет большинство потребностей российских поставщиков пространственных данных и услуг. Стандарт представлен в виде диаграмм на UML и разделен на 10 пакетов, которые передают сходные данные, определенные в ISO 19115. В профиле содержатся 194 элемента и атрибута, сгруппированные в более чем 50 классов. Ядро профиля ГОСТ Р 52573-2006 полностью наследует 22 элемента ядра ISO 19115.

ISO 19139:2007 «Географическая информация. Метаданные. Спецификация реализации». Международный стандарт ISO 19115:2003 описывает общее содержание метаданных и взаимоотношения между элементами метаданных. Однако он не дает указаний по поводу того, как должны строиться и форматироваться (кодироваться) записи метаданных. С этой целью был разработан стандарт ISO 19139:2007 «Geographic information Metadata XML schema implementation» (Географическая информация. Метаданные. Внедрение системы языка XML), утвержденный в статусе международного и опубликованный в апреле 2007 г. Стандарт введен для создания схемы XML, предписывающей структуру формата записей метаданных ISO 19115, а также включает элементы метаданных, на которые имеются ссылки, но которые не определены в стандарте ISO 19115 (например, описания объектов и атрибутов, введенных стандартом пространственных данных ISO 19109). ISO 19139 предлагает схему кодирования для описания, подтверждения и обмена метаданными географических наборов данных и др.


Интерфейс редактора метаданных EPA (EME).

 

Существуют также специальные стандарты метаданных, разработанные Европейским комитетом по стандартизации CEN (CEN prEN 12657),а также в Австралии (ANZLIC the Australian Spatial Data Infrastructure), Великобритании (UK GEMINI) и некоторых других странах, но здесь мы не будем их отдельно рассматривать.

Теперь попробуем разобраться, который из стандартов вам нужен.

  • Если вам требуется лишь необходимый минимум метаданных, можно использовать для работы лишь первый и седьмой пункты стандарта FGDC CSDGM (рекомендовано для минимальной структуры);
  • Если же важна точность используемых и полученных данных, а также и поэтапное описание их создания, в метаданные должен быть также включен второй пункт;
  • Если у ваших данных присутствует атрибутивная информация, вам необходимо также использовать и пятый пункт;
  • Если вы распространяете свои данные, вам, возможно, потребуется шестой пункт.

 

При создании собственной структуры метаданных надо продумать, насколько важен каждый из этих пунктов для ваших целей.


Русифицированный редактор метаданных ISO.

 

В зависимости от размера вашей организации и числа сотрудников, занимающихся созданием метаданных, количество шагов, отводимых на создание метаданных, может изменяться. Для крупных организаций будет полезным создать рабочую группу для обсуждения выбранного стандарта, определения языка для главных полей, по которым будут создаваться запросы. После того, как все эти вопросы будут решены, вы можете создать шаблон (этот процесс описан ниже) и пояснительную документацию для других служащих вашей компании, создающих метаданные. Пример структуры для пространственных метаданных, созданный Агентством по охране окружающей среды США (EPA) доступен по адресу www.epa.gov/geospatial/policies.html, называется Geospatial Metadata Technical Specification Version 1.0 (EPA – Техническое определение (спецификация) для пространственных метаданных, версия 1).

Затраты времени на создание структуры метаданных на первом шаге работы во многом помогут упростить и ускорить процесс создания самих метаданных. Заложенная в метаданные информация будет более логичной, вы сэкономите время на ее внесение и будете уверены в том, что в метаданных содержатся все необходимые вам сведения.

Выбор подходящего инструмента для редактирования метаданных

Создание метаданных может превратиться в нетривиальную задачу без использования соответствующих средств. Правильные инструменты для редактирования могут значительно повысить продуктивность вашей работы, позволят ее ускорить и автоматизировать. Их выбор зависит от возможностей программного обеспечения, его гибкости, простоты в использовании, полноты документации и справки, а также, естественно, от поддержки им полных FGDC и/или ISO стандартов. В некоторых случаях ваша организация для достижения поставленных целей может остановить свой выбор на комбинированном использовании доступных инструментов. Принимая решение, особенно важно суметь оценить возможности удовлетворения ваших потребностей определенным инструментом.

Сразу оговоримся, что в стандартном интерфейсе ArcGIS Desktop можно одновременно использовать два разных редактора для документирования своих данных – FGDC и ISO. Редактор, указанный в диалоговом окне Опции, будет открываться при щелчке на кнопке Редактировать метаданные на панели инструментов Метаданные. Документ метаданных в приложении ArcCatalog может одновременно хранить информацию и по стандарту FGDC, и по стандарту ISO. Оба этих стандарта существуют параллельно в одном и том же документе, поскольку в каждом из них используются принципиально разные наборы XML-тегов для хранения информации. Тем не менее, если вы создали заголовок в редакторе FGDC и потом переключитесь на редактор ISO, ранее добавленная вами информация не отобразится.


Экспорт записей метаданных.

 

Для тех, кто предпочитает работать в локализованной (русифицированной) версии ArcGIS, небезынтересно будет узнать, что редактор для построения метаданных ISO в настоящее время полностью русифицирован. Чтобы переключиться на русский редактор метаданных, в меню Инструменты щелкните Опции и в открывшемся диалоговом окне перейдите на закладку Метаданные. В нижней части этой закладки переключите Редактор метаданных на ISO Wizard и щелкните ОК. После этого будет открываться русифицированный редактор метаданных ISO. Обратите внимание на то, что редакторы метаданных FGDC u ISO используют разные теги для форматирования метаданных, поэтому просматривать метаданные рекомендуется в соответствующих стилях – удобно использовать шаблон ISO_RU, но можно и любой другой ISO.

Так как метаданные для покрытий, шейп-файлов и других файловых источников данных хранятся на диске в виде файлов XML, вы можете использовать редакторы XML или приложения Visual Basic (VB) для изменения их содержания и вне ArcCatalog. Аналогично, можно использовать редакторы метаданных, входящие в состав ArcCatalog, для редактирования отдельных документов в формате XML. Таким образом можно создавать шаблоны метаданных, которые будут включать стандартную информацию – о приобретении данных или с кем можно связаться для получения дополнительной информации.

Существует несколько источников, где приведена информация о ряде инструментов для построения метаданных, соображения по их выбору и особенностям использования (их примеры даны в таблице).

Сайт URL Доступные ресурсы
Редактор метаданных EPA (EME) www.epa.gov/geospatial/eme.html Бесплатное приложение для работы с метаданными в ArcCatalog
Федеральный комитет США по географическим данным www.fgdc.gov/metadata/geospatial-metadata-tools Информация об инструментах для работы с метаданными и выборе наилучшего инструмента для редактирования метаданных как стандарта FGDC CSDGM, так и ISO 19115/19139
Компания Innovate! Inc. http://innovateteam.com/projects/epa-and-partners-geospatial-metadata-training/ Тренировочные модули по различным аспектам метаданных, основанные на FGDC CSDGM и NAP ISO 19115/19139 стандартах, каталогах метаданных и других геопространственных данных, собранных в одном месте.
Агентство EPA www.epa.gov/geospatial/policies.html Техническое определение для пространственных метаданных, версия 1 (Geospatial Metadata Technical Specification Version 1.0)

 

Один из наиболее популярных инструментов – это редактор метаданных EPA (EME), версия 3, на который дана ссылка в таблице. EME является бесплатной надстройкой ArcCatalog, предоставляющей точную идентификацию требований, кнопки для авто-заполнения отдельных записей выбранной по умолчанию информацией, использование конфигурируемой базы данных Microsoft Access со значениями по умолчанию, а также интегрированную справочную систему. Более подробная информация, руководство пользователя и учебные видеоматериалы находятся на сайте EME.

Конфигурирование средств синхронизации для ваших метаданных

Многие, создавая метаданные, не заботятся о создании синхронизации для них. Фактически, большинство людей используют синхронизаторы без знания принципов их работы. Это происходит потому, что синхронизация в ArcCatalog – это автоматический процесс, активируемый по умолчанию. Метаданные автоматически создаются или обновляются, когда вы отображаете их на закладке Метаданные. ArcCatalog считывает свойства источника данных и записывает значения этих свойств в метаданные. Это гарантирует, что метаданные сохраняются в актуальном состоянии, даже если сами данные со временем меняются. Например, экстент и количество пространственных объектов шейп-файла будет соответствовать реальным значениям, даже если новые пространственные объекты были добавлены совсем недавно.


Импорт записей метаданных.

 

Синхронизация – это процесс добавления информации о ваших данных в метаданные, это может быть информация об атрибутивных данных, пространственном экстенте, системе координат и других деталях. Синхронизация осуществляется в ArcCatalog каждый раз, когда вы щелкаете на базе данных. Это очень большое преимущество, так как благодаря автоматическому обновлению документации данных вы можете быть уверены в их достоверности и актуальности.

Если вы хотите самостоятельно контролировать время создания и обновления метаданных, можно отключить опцию автоматического запуска этой процедуры. Это можно осуществить или для всех источников данных (в диалоговом окне Опции), или для отдельных источников (путем изменения установок в диалоговом окне Свойства Метаданных). Отключать автоматическое обновление метаданных для отдельного источника данных можно только после завершения работы с ним. Если автоматическое обновление метаданных для элемента отключено, вы можете обновить их вручную нажатием на кнопку Создать/Обновить метаданные на панели инструментов Метаданные или изменением его шаблона.

Автоматические обновления метаданных сопровождаются использованием синхронизаторов метаданных. Все поставляемые с ArcGIS Desktop синхронизаторы по умолчанию включены. Если вы создаете метаданные с помощью редактора FGDC, синхронизаторы FGDC CSDGM и Geography Network должны быть включены; вы можете отключить синхронизатор ISO Metadata. Если вы создаете метаданные с помощью редактора метаданных ISO, синхронизатор метаданных ISO должен быть включен, а синхронизаторы FGDC CSDGM и Geography Network надо отключить – в противном случае возникнут проблемы при публикации ваших метаданных на сервисе метаданных. Перед тем, как отключить синхронизатор метаданных, вы должны добавить на панель инструментов Метаданные команду Set Working Synchronizers (Установить работающие синхронизаторы).

Но и в этом процессе синхронизации могут появляться некоторые непредусмотренные эффекты, такие как добавление ненужной информации о ваших записях в метаданные, одновременное добавление и FGDC, и ISO элементов или добавление несовместимой информации. Чтобы иметь возможность все это контролировать, необходимо сконфигурировать ваше синхронизирующее устройство. ArcCatalog позволяет заблокировать или разблокировать синхронизирующее устройство, а также выбрать то синхронизирующее устройство, которое будет использоваться. Включение или выключение синхронизирующего устройства выполняется на закладке Метаданные в диалоговом окне Опции, которое открывается из меню Инструменты в ArcCatalog.

Здесь можно подключить или отключить процесс синхронизации, выбрать синхронизирующее устройство для использования, добавив кнопку Подключение работающих синхронизирующих устройств на панель управления в ArcCatalog. Эта кнопка позволит вам выбрать синхронизирующее устройство, которое будет использоваться по умолчанию (FGDC, ISO или Geography Network). Недостаток данного метода – получение результатов в бескомпромиссной форме. Синхронизирующее устройство может быть либо полностью подключено, либо полностью отключено. Однако, некоторым пользователям может потребоваться большая гибкость для работы. Если при синхронизации надо обновлять лишь отдельные элементы, это можно настроить в синхронизаторе EPA, доступном в вышеупомянутом EME.

Создание шаблонов метаданных

Если кому-то не подходит стандартный способ создания метаданных, можно поэкспериментировать с созданием собственных шаблонов метаданных. Использование таких шаблонов может обеспечить большую логичность и автоматизацию процесса создания метаданных. Шаблоны метаданных могут стать отправной точкой при создании метаданных на основе значений, используемых по умолчанию. Шаблоны можно создавать «с нуля» прямо в рабочей области или на основе уже существующих. Если у вас уже есть записи с информацией, которую ваша компания будет повторно использовать, экспортируйте их в формат XML (особенно FGDC CSDGM) и сохраните у себя на компьютере. Затем можно импортировать этот файл и использовать его в качестве основы для других данных. Будьте внимательными при импорте шаблонов, поскольку при этом переписываются все ранее созданные метаданные.

В зависимости от природы ваших данных, бывает полезно создать серию тематических шаблонов. Можно создавать шаблоны для различных типов географической информации, используемой в вашей организации, таких, например, как доступные для загрузки данные, интерактивные данные и карты, либо по сферам применения.

Для улучшения качества создаваемых метаданных рекомендуется выполнять все этапы, описанные в этой статье, но даже выполнение одного или двух из них поможет сделать ваши метаданные значительно лучше. Независимо от преследуемых вами задач уделите немного времени на изучение возможностей по улучшению создаваемых вами метаданных, это будет хорошей инвестицией в ваши данные, позволит значительно улучшить их качество на длительное время, наладить взаимодействие и обмен информацией на разных уровнях – от подразделений организации до глобального.

За дополнительной информацией по работе с метаданными можно обратиться к Справочной системе ArcGIS Desktop, разделы Управление данными в ArcCatalog – Метаданные.

Итак, метаданные очень важны как для поставщиков данных, в том числе при их публикации в Web, так и для потребителей при поиске информационных ресурсов, отвечающих определенным критериям, или людей и организаций, занимающихся решением сходных задач.

Основные программные продукты компании ESRI поддерживают базовые возможности работы с метаданными. В следующей версии ArcGIS 10 появятся обновленный редактор метаданных – более удобный в использовании и поддерживающий разные стандарты и профили метаданных, полноценный механизм хранения метаданных в базе геоданных, а также комплексный метод поиска и извлечения геоданных на основе описательной информации разной структуры. Это обеспечит более эффективный поиск данных, инструментов геообработки, карт и слоев, символов и стилей, поддержку сложных запросов для поиска специфических и взаимосвязанных данных. В результате, будет легче создавать и обновлять сами метаданные, проводить на их основе расширенный поиск необходимых информационных ресурсов.

Литература

Андрианов В.Ю. Метаданные. ArcReview, № 37, С. 8.

Стрельцов И.В., Андрианов В.Ю. Сервер метаданных. ArcReview, № 37, С. 9.

Ускорьте создание метаданных с помощью шаблонов. ArcReview, № 37, С. 7.

M. Torreano, J.L. Zichichi. The EPA Metadata Editor. ArcUser, лето 2007, pp. 12-14.

J.L. Zichichi, C.S. Roberts. Get a New Strategy. Five easy ways to streamline geospatial metadata production. ArcUser, весна 2009, pp. 46-49.