Реализация системы поддержки метаданных на основе профиля стандарта ISO 19115 и технологии ESRI

Салтовец А.А., Николаев В.М., компания СПАЭРО, Украина, г.Харьков, E-mail: saltovec@spaero.kharkov.ua, Web: www.spaero.kharkov.ua

 

Сегодня уже нет необходимости пропагандировать или разъяснять роль и место глобальных и национальных инфраструктур пространственных данных в современной жизни. Они успешно работают и решают свою основную задачу – обеспечивают функциональную совместимость пространственных данных, удобство и простоту их использования. Решение этой задачи базируется на использовании метаданных пространственных данных. Программные системы поддержки метаданных обеспечивают поиск данных, определяют способы и методы доступа к ним, а зачастую и способы их использования.

Рассмотрим методологическую основу создания Инфраструктуры пространственных данных (далее по тексту – ИПД). Для создания ИПД необходимо создать сами пространственные данные, описать их – то есть создать их метаданные, а также обеспечить средства и методы поиска и доступа к нужным данным.

Метаданные служат основой и ключевым элементом двух последних процессов. Сами данные, без их описания и возможности опоискования – мертвы и недоступны (или труднодоступны) для пользователей. Но для того, чтобы метаданные могли обеспечивать все, что от них требуется, они должны быть одинаково понимаемы сообществом пользователей и не зависеть от форматов и структур данных или конкретных программных средств по работе с ними. Выполнение этих требований обеспечивается использованием Международного стандарта ISO 19115.

В Международной Организации по стандартизации (ISO) стандартами в области геоинформатики (геоматики) занимается технический комитет TC 211, который разрабатывает серию стандартов 19000. Сегодня стандарты этой серии наиболее наукоемкие и системно построенные из всего множества Международных стандартов. Они полностью ориентированы на информационные технологии. В основу стандартов этой серии положено понятие эталонной модели стандарта предметной области, которая дает методы описания предмета стандартизации и требований к нему [1].

В соответствии с понятием эталонной модели каждый стандарт этой серии является концептуальной моделью предметной (в смысле стандартизации) области. Для единства описания и простоты применения стандартов в качестве языка для описания концептуальной модели используется универсальный язык моделирования UML [2].

Совокупность стандартов этой серии представляет собой как бы единую виртуальную модель географической (пространственной) информации. Сущности, определенные в одном стандарте, могут быть с легкостью использованы в модели иной области стандартизации. Объектно-ориентированный подход к описанию стандарта позволяет использовать наследование, полиморфизм и инкапсуляцию при создании таких моделей.

Стандарт ISO 19115 занимает в серии одно из центральных мест. И это понятно, так как для описания пространственных данных нужно указать и описать все их свойства и особенности, определяемые в других стандартах серии 19000 [3]. Таким образом, ISO 19115 как бы объединяет все остальные стандарты и использует их сущности в своей модели.


Рис. 1. Сведения о метаданных.

 

Что же представляет собой концептуальная модель метаданных? Корневая UML-диаграмма модели представлена на Рис. 1. Каждый из присутствующих в модели классов представлен своими собственными диаграммами разной степени сложности. Например, информация о распространении выглядит следующим образом (рис. 2).


Рис. 2. Информация о распространении.

 

В так называемой всеобъемлющей концептуальной модели метаданных ISO 19115 содержится 16 диаграмм, которые снабжены соответствующим словарем данных.

Изучив все эти диаграммы, автор пространственных данных начинает понимать, что же должно (или может) содержаться в метаданных его данных. Но как это реализовать на практике? Стандарт не дает ответа на этот вопрос – он предназначен для иной цели. А вот другие стандарты из этой же серии как раз и посвящены реализации метаданных на практике.

В простейшем случае метаданные пространственных данных могут быть представлены в виде текстового описания. Но при этом, естественно, возникает целый ряд проблем: в каком формате их хранить, как «привязать» к самим данным, как вести поиск, как обеспечить не только «человеческое», но и «машинное» понимание этой информации. Все эти проблемы решаются с помощью языка XML – Extensible Markup Language. Этот язык и принят в качестве стандартного для представления метаданных.

Так как все стандарты серии 19100 представляют собой концептуальные UML-модели предметной области, то для части из них (в частности для метаданных) нужны правила и методы превращения их из логических абстракций в реальные кодированные описания, которые можно использовать в информационных технологиях.

Общие правила кодирования географической информации в XML-схемы описаны в стандарте ISO 19118 [4]. Детальному же описанию методов кодирования и специфических приемов их применения для UML-моделей метаданных посвящена техническая спецификация ISO 19139 [5].

Географические метаданные представлены в ISO 19115 как ряд пакетов UML, содержащих один или более UML-классов. ISO 19115 обеспечивает универсальное, независимое от кодирования представление метаданных пространственной информации. А ISO 19139, в свою очередь, обеспечивает универсальную реализацию ISO 19115 через кодирование XML-схемы, которое соответствует правилам, описанным в ISO 19118.

Одним из основных понятий XML является понятие пространства имен. Пространство имен – это коллекция имен, идентифицированных ссылкой на URI (Uniformed Resource Identifier – Унифицированный Идентификатор Ресурса), которые используются в документах XML как имена элементов и имена атрибутов.

ISO 19139 определяет следующие пространства имен:

Кроме них используются следующие внешние пространства имен:

Основным для метаданных является пространство имен gmd, которое и используется для кодирования классов и атрибутов метаданных.

XML-схема предлагает много альтернатив для того, чтобы структурировать информацию для обмена. ISO 19118 определяет набор правил кодирования для преобразования концептуальных UML-схем, содержащихся в документах серии ISO 19100, в XML-схемы. Но даже с учетом ограничений ISO 19118 существуют варианты при создании определенных XML-схем. ISO 19139 описывает детали кодирования в XML-схемы концептуальной UML-схемы ISO 19115.

Приведем простейший пример использования правил кодирования.

ISO 19118 определяет, что фундаментальным понятием моделирования в UML является класс. В результате, фундаментальные правила кодирования фокусируются на кодировании класса UML и строятся исходя из этого. Важно отметить, что в ISO 19118 свойство представляет собой пару «имя-значение». Оно может представлять атрибут, ассоциацию, агрегацию или композицию. Класс состоит из одного или более свойств. Например, на рис. 3 классClass1имеет три свойства:attr1, attr2 иrole1. Для кодирования в XML-схему важно понять, что нет никакого различия между свойствами, которые являются атрибутами UML, ассоциациями, агрегациями или композициями.


Рис. 3. Пример UML.

 

Класс UML кодируется в XML-схему как сложный тип XML: xs:complexType. Этот сложный тип XML в дальнейшем именуется XML Class Type (XCT). В XML-схеме каждый XCT имеет атрибут имени, значение которого – имя класса с суффиксом _Type:

<xs:complexType name="Class1_Type">

     (…)

</xs:complexType>

Все классы UML по умолчанию будут иметь сложное содержание. Для обеспе­чения этого элемент xs:complexType включает в себя элемент xs:complexContent:

<xs:complexType name="Class1_Type">

     <xs:complexContent>

          (…)

     </xs:complexContent>

</xs:complexType>

ISO 19118 также указывает на необходимость использования в XML-схеме идентификаторов (id) и предписывает использовать для этого универсальные уникальные идентификаторы (uuid). Для обеспечения необходимых идентификаторов в пространстве имен gco существует специальный тип XML-схемы gco:AbstractObject_Type.

Все классы UML по умолчанию расширяют gco:AbstractObject_Type, добавляяэлемент xs:extension с атрибутом base, равным gco:AbstractObject_Type:

<xs:complexType name="Class1_Type">

     <xs:complexContent>

          <xs:extension base="gco:AbstractObject_Type">

              (…)

          </xs:extension>

     </xs:complexContent>

</xs:complexType>

Все классы UML по умолчанию будут иметь последовательность, содержащую все свойства класса. Это обеспечивается добавлениемэлемента xs:sequence, содержащего элементы xs:element для каждого свойства класса. Атрибутамиэлемента xs:element будут:

атрибутname, значением которого является имя свойства;

атрибут type, значением которогоявляется имя класса с добавлением «_PropertyType»;

атрибутыminOccurs иmaxOccurs

<xs:complexType name="Class1_Type">

     <xs:complexContent>

          <xs:extension base="gco:AbstractObject_Type">

              <xs:sequence>

                   <xs:element name="attr1" type="ns1:typeAttr1_PropertyType"/>

                   <xs:element name="attr2" type="ns1:typeAttr2_PropertyType" minOccurs="0” />

                   <xs:element name="role1" type="ns1:Class2_PropertyType" minOccurs="1" maxOccurs="unbounded"/>

              </xs:sequence>

          </xs:extension>

     </xs:complexContent>

</xs:complexType>

Приведем пример фрагмента XML-схемы, полученной в результате кодирования части UML-модели информации о качестве данных из ISO 19115 (рис. 4).


Рис. 4. Часть UML-модели информации о качестве данных из ISO 19115.

 

 

<xs:complexType name="DQ_DataQuality_Type">

     <xs:complexContent>

          <xs:extension base="gco:AbstractObject_Type">

               <xs:sequence>

                   <xs:element name="scope" type="gmd:DQ_Scope_PropertyType"/>

                   <xs:element name="lineage" type="gmd:LI_Lineage_PropertyType" minOccurs="0"/>

                   <xs:element name="report" type="gmd:_DQ_Element_PropertyType" minOccurs="0" maxOccurs="unbounded"/>

              </xs:sequence>

          </xs:extension>

     </xs:complexContent>

</xs:complexType

Таким образом, используя набор правил из вышеперечисленных стандартов, мы можем преобразовать UML-модель метаданных в XML-схему. Эта большая работа уже проделана специалистами ТС 211 и на сайте технического комитета опубликован набор пространств имен с соответствующими XML-схемами. Следует подчеркнуть, что эти схемы представляют собой результат кодирования всеобъемлющей концептуальной моделиметаданных и поэтому могут служить только примером методики. Они не предназначены для практического применения в программировании приложений, работающих с метаданными.

Рассмотрим практическое применение вышеописанной методики для решения конкретных задач создания системы поддержки метаданных (рис. 5). Уровень этой системы (национальный, региональный, ведомственный и пр.) не имеет значения, так как для любого из этих уровней необходимо произвести одни и те же действия.


Рис. 5. Функциональная модель методики.

 

Первым шагом создания такой системы является разработка прикладного профиля метаданных для данного уровня системы. Следует кратко остановиться на понятии профиля. Профиль – это концептуальная модель метаданных для данного конкретного сообщества пользователей пространственных данных. Правилам и методике создания профилей посвящен Международный стандарт ISO 19106. В более сжатом и конкретизированном виде раздел о создании профилей включен непосредственно в стандарт ISO 19115.

Модель профиля отличается от всеобъемлющей модели стандарта ISO 19115 тем, что в ней исключены те сущности (классы, атрибуты, отношения), которые не существенны для этого конкретного сообщества пользователей, и добавлены так называемые расширения, которые содержат новые сущности, нужные этому сообществу и отсутствующие в стандарте.

В 2006 г. в России был принят ГОСТ Р 52573-06 «Географическая информация. Метаданные», который соответствует требованиям ISO 19115 и, практически, является национальным российским профилем метаданных. Разработка этого стандарта – огромный шаг в развитии ИПД России, который трудно переоценить. Национальный профиль метаданных может являться базовым для всех нижележащих иерархических уровней и, в свою очередь, модифицироваться для получения профилей на этих уровнях.

Разработка UML-модели профиля может производиться с помощью таких программных пакетов, как Microsoft Visio или Rational Rose. При этом работа значительно облегчается, если наряду с текстом Государственного стандарта – профиля метаданных доступны также и UML-диаграммы в форматах этих программных средств, что не предусмотрено разработчиками российского ГОСТа. Таким образом, «ручное» составление UML-диаграмм может привести к накоплению значительного количества ошибок в производных профилях.

Следующим шагом является разработка XML-схемы профиля метаданных. Общая методика этого процесса была описана выше. Ее конкретная реализация состоит в том, что должно быть произведено кодирование прикладной UML-модели профиля метаданных в конкретную XML-схему. При этом должна учитываться специфика планируемых к разработке программных средств поддержки метаданных. Дело в том, что сама Техническая Спецификация ISO 19139 содержит ряд расширений, обеспечивающих, например, работу в WEB-среде, различные методы передачи метаданных и самих данных и т.п. Все эти специфические моменты должны быть учтены в процессе кодирования XML-схемы.

XML-схема может создаваться в различных приложениях-редакторах – Visual Studio, XMLSpy, Liquid XML Studio и т.п. Следует также отметить, что в Rational Rose имеется возможность полуавтоматической генерации XML-схемы из UML-модели. При создании XML-схемы следовало бы в качестве исходных использовать готовые блоки из заранее подготовленного и утвержденного на государственном уровне набора XML-схем ГОСТ Р 52573-06, который должен быть общедоступен в электронном виде. Результатом проделанной работы является набор XML-схем – файлов формата XSD (XML Schema Definition), сгруппированных по различным пространствам имен.

Полученные XSD используются для разработки программных средств поддержки метаданных – редакторов, валидаторов, просмотрщиков и т.п. Каждое из этих средств работает с метаданными в формате XML, создавая их, проверяя правильность их составления, обеспечивая просмотр или обращаясь с запросами к хранилищу метаданных. Для отображения содержания XML в удобочитаемом для человека виде используется технология XSLT (Extensible Style Language Transformation) [6].

Первоочередной задачей при создании ПО по работе с метаданными является разработка соответствующего редактора, способного создавать и редактировать XML-описание данных на основе профиля метаданных в формате XSD. Примером такого программного средства может служить редактор МД, разработанный нами для ИПД ООО «Газдобыча Ямбург».

В основе этого редактора лежат два основных принципа:

вся необходимая для формирования экземпляра метаданных информация содержится непосредственно в XML-схеме профиля метаданных;

необходимая для адаптации пользовательского интерфейса информация содержится в дополнительных XML-описаниях.

Созданный редактор метаданных инвариантен по отношению к используемой в нём XML-схеме, шаблону экранного представления и шаблону локализации имён используемых ключевых слов.

Разработанное приложение позволяет создавать и редактировать XML-описания на основе заданной XML-схемы, сохранять XML-описания в файлы XML, отображать содержимое текущего XML-описания с применением подключаемой схемы трансляции XSLT, проводить проверку XML-описания на соответствие заданной XML-схеме.

Приложение реализовано в пакете MS VisualStudio 2005 на языке C#. Для работы с XML используется штатный парсер Microsoft msxml.dll (MSXML 4.0).

Общий вид интерфейса пользователя приложения приведен на <strong>Рис. 6.</strong> Левую сторону рабочего поля приложения занимает дерево элементов используемой XML-схемы. Процесс построения дерева элементов экземпляра метаданных состоит из интерпретации заданной в файле конфигурации XML-схемы (далее – схемы) и трансляции имён отображаемых сущностей и атрибутов схемы в локализованные имена, в соответствии со специально подготовленным для выбранной схемы файлом отображения имён. Обязательные для заполнения элементы схемы выделены в дереве специальным значком.


Рис. 6. Общий вид редактора метаданных.

 

Правая часть рабочего поля приложения представляет собой набор «закладок», переключающих приложение в режимы редактирования, просмотра текущего экземпляра XML, просмотра журнала ошибок и просмотра значений из файла конфигурации. Ключевой особенностью приложения является отсутствие заготовленных форм на закладке редактирования. Все элементы редактирования генерируются «на лету», на основании информации из XML-схемы.

Процесс проверки XML-описания на соответствие заданной XML-схеме запускается автоматически при переходе пользователя на закладку «Журнал ошибок». И в этом процессе, опять-таки, используется текущая XML-схема.

Для обеспечения успешной проверки корректности метаданных при размещении их в сервисе метаданных ArcGIS ArcIMS применяется специальный XML-файл, обеспечивающий добавление к генерируемому экземпляру метаданных тегов, проверяемых ArcIMS при публикации.

На рис. 7 приведено изображение страницы конфигурации приложения, на котором видно, что все элементы входных данных, участвующие в обработке экземпляра XML-описания, представляют собой файлы форматов XSD, XML и XSL.


Рис. 7. Параметры конфигурации редактора метаданных.

 

В целом, разработанный редактор позволяет получать экземпляры метаданных, в виде XML-файлов, в соответствии с задаваемой XML-схемой профиля метаданных. В качестве XML-схемы для тестирования была выбрана XML-схема из стандарта ООО «Газдобыча Ямбург» «Профиль метаданных пространственных данных», разработка которого была выполнена в соответствии с методикой, рекомендованной для создания профилей метаданных в серии стандартов ISO 19100.

Последним этапом создания системы поддержки метаданных является разворачивание инфраструктуры этой поддержки, состоящей из хранилищ метаданных, средств их публикации, опоискования и связи с самими пространственными данными.

ESRI предлагает готовое решение для разворачивания такой инфраструктуры, которое нуждается только в адаптации его под конкретные условия.

Система поддержки метаданных в линейке программных продуктов фирмы ESRI является одним из самых сложных и разветвлённых элементов, в работе которого принимают участие практически все уровни клиентских и серверных приложений. Это определяет высокую сложность управления и настройки системы, а также достаточно высокую стоимость её внедрения.

Для подготовки, хранения и публикации метаданных ESRI предусматривает использование следующих составляющих:

  • профиль метаданных ESRI [7], доступный по URL http://www.esri.com/metadata, а также сопутствующие профилю материалы в виде описаний, файлов определения типов, таблиц стилей и трансляции;
  • ArcCatalog и набор инструментов для обработки метаданных – создание, редактирование, просмотр и поиск метаданных;
  • ArcSDE и промышленная СУБД с поддержкой полнотекстового индексирования – хранилище метаданных;
  • ArcIMS, WEB-сервер (MS IIS, Apache), сервлетная машина (ServletExe, Tomcat) – создание сервиса метаданных и публикация метаданных;
  • MetadataExplorer – удалённый клиент для доступа к сервису метаданных (начиная с версии 9.2 выведен из состава системы метаданных и поставляется в виде примера приложения).

Рассмотрим составляющие этого решения подробнее.

Профиль метаданных ESRI датирован мартом 2003 г. В нем в явном виде указано на то, что он является профилем «Стандарта на содержание метаданных цифровых геопространственных данных» (Content Standard for Digital Geospatial Metadata, CSDGM) FGDC (FGDC-STD-001-1998) и он радикально отличается по форме представления от понятия «профиль», определенного в ISO 19115. При этом в нем присутствует ряд тегов, по структуре и информационному смыслу соответствующих стандарту ISO 19115, но для их имен используются краткие имена, а не полные, как определено в стандарте. В версии 9.2 программных продуктов ESRI упоминается стандарт ISO 19139, который на самом деле является технической спецификацией кодирования XML-схемы, и даже подготовлен ряд таблиц трансляции тегов.

В целом, профиль метаданных ESRI является руководством для создания совместимых метаданных и программных продуктов их поддержки, но он не учитывает сегодняшнее состояние дел ряда стандартов ISO, связанных с метаданными.

ArcCatalog включает в себя средства создания и редактирования метаданных на основе профиля ESRI с возможностью выбора режима заполнения метаданных на базе CSDGM или ISO. Предусмотрено использование различных редакторов метаданных, расширение их функциональности и даже подключение собственных редакторов. Просмотр содержимого метаданных реализован с помощью подключаемых стилей (файлов XSLT). При подключении к сервису метаданных ArcIMS, ArcCatalog может работать в режиме клиента этого сервиса и служит основным средством для размещения подготовленных метаданных в сервисе метаданных. ArcCatalog способен выполнять поиск пространственных данных с использованием метаданных, включая поиск в подключенных сервисах метаданных. Однако, поиск с использованием сервиса ограничивается поиском по тегам, явно прописанным в теле программы, что фактически не позволяет выполнять поиск по метаданным, созданным на основе профиля стандарта ISO 19115.

Для адаптации ArcCatalog к решению задач, рассматриваемых в статье, с использованием имеющихся в системе программирования ESRI специальных объектов, предназначенных для создания редакторов метаданных, разработано специализированное расширение ArcCatalog. Оно сочетает функциональность рассмотренного выше редактора метаданных с информацией о пространственных данных, доступной при помощи программных объектов ArcObjects. Хотелось бы при этом отметить явно недостаточное использование мощнейшего организующего элемента в виде XML-схем в программном обеспечении ESRI.

Роль ArcSDE в системе метаданных ограничивается размещением в геобазе довольно простых информационных структур поддержки сервисов метаданных и взаимодействием с выбранной СУБД для выполнения запросов от сервисов метаданных. Непосредственно к хранилищу метаданных предъявляется требование поддержки полнотекстового индексирования. В целом, система реализует подход к созданию хранилища, при котором метаданные хранятся и опоисковываются как полные XML-описания. Для задания полнотекстовых индексов служит специальный конфигурационный файл, который содержит имена и краткие описания тегов поиска, что даёт возможность полностью адаптировать поиск метаданных к выбранной XML-схеме профиля метаданных.

Публикацию метаданных в системе ESRI обеспечивает сервер ArcIMS. Один сервер ArcIMS может обеспечить публикацию нескольких сервисов метаданных, использующих собственные информационные структуры в геобазе под управлением ArcSDE. Сервис метаданных IMS может публиковать любые XML-описания при отключении в файле конфигурации проверки корректности по некоторым предопределённым ESRI тегам.

Особенностью сервиса метаданных ArcIMS является взаимодействие с клиентами исключительно при помощи фирменного, тщательно документированного подмножества XML – ArcXML, что даёт возможность реализации собственных модификаций клиентов работы с метаданными и отлично согласуется с общим подходом к созданию системы метаданных. Кроме того, сервер ArcIMS имеет внутреннюю систему разграничения прав доступа, которая позволяет регулировать уровень доступности метаданных в зависимости от ролевой функции подключаемых клиентов.

Удаленным клиентом для доступа к сервису метаданных служит MetadataExplorer. До версии 9.1 включительно он входил в состав ArcIMS и позволял очень быстро обеспечить доступ к публикуемым сервисам метаданных при помощи Internet-браузера. В версии 9.2 аналогичный по функциональности клиент присутствует в виде примера WEB-приложения. Недостатками обеих реализаций является использование весьма ограниченного набора тегов поиска, который встроен непосредственно в тело скриптов WEB-приложений. Для адаптации «тонких» клиентов системы метаданных ESRI к работе с метаданными, созданными на основе профиля стандарта ISO 19115, нужно провести работу по локализации WEB-приложений и настройки их на поддержку имён из пространства используемой XML-схемы.

Таким образом, система поддержки метаданных ESRI является готовым промышленным решением и, в целом, отвечает потребностям создания инфраструктуры поддержки метаданных, создаваемых на основе профиля стандарта ISO 19115. Однако для полноценной поддержки профилей стандарта ISO 19115 требуется существенная адаптация части её ключевых элементов.

Следует отметить, что в «белых страницах» ESRI за последнее время [8, 9] явно обозначена заинтересованность в поддержке международных инициатив по интеграции систем поддержки метаданных пространственных данных, что с учётом стандартов ISO должно привести к качественному пересмотру подхода ESRI к использованию профилей метаданных.

Методология и технологические средства, описанные в настоящей статье, были использованы при построении системы поддержки метаданных в инфраструктуре пространственных данных ООО «Газдобыча Ямбург».

Проделанная работа показала, что для широкого распространения и использования метаданных в ИПД России необходимо:

дополнить ГОСТ Р 52573-06 «Географическая информация. Метаданные» правилами создания профилей стандарта;

опубликовать UML-модель стандарта в электронном виде в форматах наиболее распространенных систем моделирования (например, Microsoft Visio или Rational Rose);

локализировать и утвердить в качестве Государственного стандарта техническую спецификацию ISO 19139 и опубликовать имплементацию концептуальной схемы ГОСТ Р 52573-06 в виде набора файлов XSD;

проводить популяризацию этих стандартов, средств и методов работы с ними в среде разработчиков геоинформационных систем (публикации, WEB-публикации, курсы, семинары, конференции).

 

Литература

International Standart ISO 19101 Geographic information – Reference model. – ISO, 2002. – 42 p.

Technical Specification ISO/TS 19103 Geographic information – Conceptual schema language. – ISO, 2005. – 67 p.

International Standart ISO 19115 Geographic information – Metadata. – ISO, 2003. – 140 p.

International Standart ISO 19118 Geographic information – Encoding. – ISO, 2005. – 104 p.

Technical Specification ISO/TS 19139 Geographic information – Metadata – XML schema implementation. – ISO, 2007. – 111 p.

XSL Transformations (XSLT) Version 2.0: W3C Recommendation — http://www.w3.org/TR/2007/REC-xslt20-20070123/

ESRI Profile of the Content Standard for Digital Geospatial Metadata — An ESRI Technical Paper, March 2003

ESRI Geospatial Portal Technology — An ESRI White Paper, September 2007

ESRI Technology and INSPIRE — An ESRI White Paper, June 2007