ISSN 0236-235X (P)
ISSN 2311-2735 (E)

Journal influence

Higher Attestation Commission (VAK) - К1 quartile
Russian Science Citation Index (RSCI)

Bookmark

Next issue

2
Publication date:
16 June 2024

The article was published in issue no. № 4, 2004
Abstract:
Аннотация:
Authors: () - , Konukhov I.А. (konuhov@cps.tver.ru) - R&D Institute Centerprogramsystem (Head of Department), Tver, Russia, () -
Ключевое слово:
Page views: 19284
Print version
Full issue in PDF (1.31Mb)

Font size:       Font:

В отличие от WWW, в которой все основные функции управления информационными ресурсами системы базируются на едином языке HTML, создатели платформы XML избрали иной путь. Выделены "фундаментальные" стандарты, составляющие концептуальную и синтаксическую основы платформы. Их средствами определяется комплекс других стандартов, каждый из которых выполняет специфические функции. И этот комплекс открыт для пополнения новыми стандартами. Именно такая модульность организации платформы обеспечивает ее открытый характер, возможности введения новых стандартов, не затрагивая уже существующих. Полная функциональность этой платформы определяется целым комплексом взаимосвязанных стандартов, часть из которых уже принята W3C, другие находятся в стадии разработки.

В процессе разработки стандартов участвует несколько организаций и неофициальных групп. Ниже перечислены основные классы стандартов платформы XML и ее окружения разрабатываемые консорциумом W3C. Порядок принятия и стадии разработки стандартов описаны в статье «Международ- ный консорциум W3C: от рабочего проекта до рекомендации» на http://citforum.ru/. Полный список стандартов (рекомендаций W3C) опубликован на http://www.w3.org/TR/.

Фундаментальные стандарты: InfoSet, Namespace, XML

InfoSet – XML Information set. Спецификация этого стандарта определяет набор абстрактных информационных элементов, используемых в правильно построенных XML-документах.

Namespace – Namespaces in XML, пространство имен, используется для устранения неоднозначности в именах элементов и атрибутов при распределенной разработке.

XML – Extensible markup language (XML). Расширяемый язык разметки, описывает класс объектов XML document, а также частично работу компьютерных программ, обрабатывающих объекты с данными, реализующими этот класс.

Структурообразующие стандарты: Xlink, Xpointer

Xlink – XML Linking language (XLink). Язык связывания, определяет конструкции, которые могут быть вставлены в XML-документы для описания связей между объектами.

XPointer – XML Pointer language – определяет конструкции, которые поддерживают адресацию во внутренних структурах XML-документов. В частности, он предназначен для специфических ссылок на элементы, символьные строки и другие части XML-документов. Cостоит из ряда спецификаций: XPointer Framework, XPointer element() Scheme, XPointer xmlns() Scheme, The XPointer xpointer() scheme.

Стандарты форматирования и трансформации XML-документов: XSL, XSLT, Xforms, CSS

XSL – расширяемый язык стилевых таблиц состоит из двух частей: языка для трансформации XML-документов и из XML-словаря, определяющего семантику форматирования. Стилевая таблица XSL определяет представление класса XML-документов, описывая, как представитель класса, трансформируемый в XML-документ, использует словарь форматирования.

XSLT – язык XSLT (XSL Transformations) разработан как часть XSL. XSL определяет стилизацию XML-документа, задействуя XSLT для объяснения того, как документ трансформируется в другой XML-документ на основе словаря форматирования. Кроме того, XSLT может использоваться независимо от XSL.

Xforms – XSL FO (Formatting objects – форматирующие объекты) – набор классов, в терминах которых отражена семантика форматирования. Они представляют собой узлы дерева, полученного в результате XSL-трансформации. Классы форматирующих объектов определяют полиграфические термины (страница, параграф и т.п.). Лучший контроль над представлением этих объектов обеспечивается свойствами форматирования (отступы, промежутки между словами и т.п.). В XSL классы свойств и объектов форматирования обеспечивают словарь для отражения цели представления.

CSS – в спецификации «Каскадные таблицы стилей» (Cascading style sheets (CSS)) описывается, как применять стиль презентации к разметке. Эта спецификация широко известна благодаря своему использованию при форматировании HTML Web-страниц, однако после выхода CSS Level 2 она стала подходить и для представления XML-документов в среде Web.

Стандарты представления метаданных: XML DTD, XML Schema, Relax NG, RDF, OWL

DTD – часть исходной спецификации XML 1.0, называемая Document type definitions (DTD – определение типа документа), описывала способ определения и ограничения структуры документа.

XML Schema – самостоятельная спецификация, которая поддерживает более строгую типизацию данных, предоставляет расширяемые возможности для определения типов данных элементов и атрибутов.

Relax NG – язык схемы XML, развитый техническим комитетом в OASIS и предназначенный стать альтернативой схеме XML W3C.

RDF – инструментарий описаний ресурсов (Resource description framework) – это набор инструментов для работы с метаданными. Он обеспечивает единую (стандартизированную) среду управления внутренним (без вмешательства человека) взаимодействием приложений, которые обмениваются в Web информацией, понимаемой машинами. RDF делает ударение на легкость автоматизированной обработки Web-ресурсов. Метаданные RDF могут быть использованы в разных областях работы приложений. В общем, RDF обеспечивает основу для элементарных инструментов авторизации, поиска и редактирования данных понимаемых машинами, что содействует трансформации Web в аппаратно обрабатываемое хранилище информации.

В феврале 2004 г. принят целый ряд спецификаций, раскрывающих тему в целом: resource description framework (RDF): Concepts and fbstract syntax; RDF Semantics; RDF Primer; RDF Vocabulary description language 1.0: RDF schema; RDF/XML Syntax specification (revised); RDF Test cases.

OWL – язык описаний web-онтологий. Под онтологией в данном случае понимается совокупность терминов и понятий, используемых в определенной области знаний или деятельности. Онтология также содержит формальные, а значит, понятные компьютерам описания ключевых концепций и взаимоотношений между понятиями. Средства описания и обработки онтологий позволят найти общий язык самым разнотипным приложениям: OWL Web ontology language overview; OWL Web ontology language guide; OWL Web ontology language reference; OWL Web ontology language semantics and abstract syntax; OWL Web ontology language test cases; OWL Web ontology language use cases and requirements.

Стандарты языков запросов: XQuery, XPath, XSLT

Xquery – Расширяемый язык запросов (XML Query Language) – это нотация для адресации и фильтрации элементов и текста в XML-документах. XQL является естественным расширением схемы синтаксиса XSL. Он обеспечивает выразительную и простую нотацию для указания на специфические узлы, а также для поиска узлов со специальными, частными характеристиками. Этот язык, базируясь на возможностях XSL, обеспечивает идентификацию классов узлов путем добавления булевой логики, фильтров, индексации в коллекциях узлов и т.д.

Xpath – главной задачей XPath является адресация частей XML-документа. Для этой цели XPath представляет XML-документ как некоторое дерево узлов различного типа. Поэтому помимо адресации в XPath обеспечиваются минимальные возможности по обработке данных различных типов. Третьей задачей XPath можно назвать динамическое генерирование контента, если этот контент не может быть создан до первого обращения к документу.

XSLT – см. выше.

Стандарты интерфейсов прикладного программирования: DOM, SAX

DOM – существует целая группа спецификаций разной степени проработки. В апреле 2004 г. была принята рекомендация W3C Document object model (DOM) Level 3 Core specification. DOM-анализаторы преобразуют XML-документ в иерархическую древовидную структуру. После этого при помощи API DOM программа может перемещаться по дереву вверх и вниз, следуя иерархии документа.

SAX – Simple API for XML. SAX-анализаторы преобразуют документ в последовательность обратных вызовов программы, которые информируют программу о каждой встреченной анализатором части документа. В ответ программа может выполнять определенные действия, например, реагировать на начало каждого раздела документа или на конкретный атрибут.

DOM-анализатор удобен в тех случаях, когда размер документа сравнительно мал, так все дерево помещается в памяти, а анализатор типа SAX позволяет обрабатывать большие документы небольшими фрагментами.

Стандарты для обеспечения преемственности: XHTML, XML Base

XHTML. Расширяемый HTML (extensible HTML, XHTML) является результатом применения правил синтаксиса XML к стандарту HTML. Расширяемость XHTML заключается в возможности определения таких конструкций, как элементы, атрибуты, сущности и т.п. с помощью подключения определения типа документа (document type definition, DTD).

XML Base – представляет собой аналог элемента BASE из языка HTML. Он описывает механизм предоставления сервисов базовых URI (uniform resource locator, универсальное местоположение ресурса) для XLink.

Стандарты транспорта данных и web-служб: XML-Protocol, SOAP, WSDL:

SOAP – простой протокол доступа к объектам (simple object access protocol, SOAP) представляет собой облегченный протокол для обмена информацией в децентрализованной, распределенной среде. Этот базирующийся на XML протокол состоит из трех частей:

·    конверт, который служит для определения содержимого сообщения и способов его обработки;

·    набор правил кодировки (encoding rules), предназначенных для описания определенных в приложении типов данных;

·    соглашение о вызовах удаленных процедур (remote procedure Call, RPC) и об их результатах.

WSDL – согласно официальному определению, спецификация «Язык описания Web-сервисов (WSDL)» – это «формат XML, предназначенный для описания сетевых сервисов в виде конечных точек, обрабатывающих сообщения, которые содержат ориентированную на документ либо на процедуру информацию». В этой спецификации на ряде уровней абстрагирования определяются компоненты сквозной передачи в Web-сервисе. Язык WSDL обычно позиционируется вместе с SOAP как базовая технология Web-сервисов, но он может быть использован для описания других протоколов, помимо SOAP.

Стандарты представления графики SVG

Scalable vector graphics (SVG) – составной язык для описания двухмерных векторных и смешанных растрово/векторных изображений в XML. Фрагменты документов SVG могут внедряться в другие такие же документы.

Стандарты идентификации информационных ресурсов: URI, URL, URN

В стандартах XML-платформы предусматривается возможность использования более общего вида идентификаторов ресурсов – universal resource identifier по сравнению с универсальным локатором ресурсов URL, применяемым в языке HTML для поддержки гиперсвязей между информационными ресурсами Web. Привычный для Web первого поколения, основанного на языке HTML, способ идентификации ресурсов по их местоположению в Интернет с помощью URL, а также абстрактные имена ресурсов URN являются частными случаями URI. Наряду с возможностью идентификации XML-данных по месту их хранения в сети URI допускает использование их абстрактных «логических» имен. Различные системы логического именования ресурсов могут поддерживаться для сообществ пользователей специальными сервисами именования, обеспечивающими уникальность таких имен.

Стандарты информационной безопасности: XML-Signature, XML Decription

Обеспечение функций цифровой подписи и шифрования для частей XML-документов.

Вспомогательные стандарты: XInclude, XFragment, Canonical XML, Xpath

Xinclude – расширяемый язык встраивания (XML include language) предназначен для объединения блоков информации в формате XML (XML infosets) в единый составной информационный блок. Спецификация документов XML (или информационных блоков), которые должны быть объединены, а также процесс объединения описываются с помощью дружественного языку XML синтаксиса (элементов, атрибутов, ссылок на URI).

Xfragment – XML-стандарты предполагают, что логические документы компонуются из неcкольких сущностей. Может выступать в качестве удаленного или локального целевого ресурса ссылок. Фрагмент документа может состоять из некоторого его узла, части узла или совокупности таких компонентов.

Canonical XML – канонический XML. Этот стандарт W3C определяет метод, позволяющий генерировать удовлетворяющую специфицированным в нем правилам каноническую форму XML-документа. Благодаря этому можно устанавливать логическую эквивалентность двух XML-документов с различным физическим (синтаксическим) представлением. Различия могут, например, заключаться в порядке атрибутов элементов документов, кодировке литер и т.д. Возможность логического отождествления документов необходима, в частности, для стандарта цифровой подписи.

Xpath – см. выше.

Стандарты вертикальной сферы

Группа стандартов отдельных отраслей, реализующая обработку специальных возможностей. Например, представление математических текстов, химических формул и т.д.

MathML – математический язык разметки (mathematical markup language, MathML) – базирующийся на XML язык описания математических формул. Пред-

ставляет собой расширение XML, предназначенное как для отображения, так и для обработки структуры математических публикаций. Этот язык предназначен для создания инструментария разметки математики в Web.

Анализируя приведенную классификацию стандартов, нетрудно видеть, что некоторые из них многофункциональны и в соответствии с этим отнесены здесь к нескольким классификационным категориям. Кроме того, из названий классов интуитивно ясна функциональная структура стандартов платформы XML.

Области применений стандартов платформы XML постоянно расширяются и охватывают ряд технологий и стандартов как горизонтальной, так и вертикальной сферы. В горизонтальной сфере (технологии, независимые от конкретной области приложений) стандарт XML нашел применение в ряде стандартов консорциумов Object management group (OMG), Meta data coalition (MDC) и Workflow management coalition (WfMC), в стандартах ISO/IEC и др.

В ряде стандартов горизонтальной сферы предусматривается использование языка XML как языка-посредника для обмена информацией между различного рода системами с помощью Web. В качестве одного из примеров можно назвать созданный консорциумом OMG стандарт XMI (XML metadata interchange) обменного формата метаданных для инструментов CASE, поддерживающих язык UML.

В связи с успешным продвижением платформы XML в практику начались работы над новым, ранее не планировавшимся компонентом SQL/XML следующей версии стандарта языка SQL – SQL:200n. По замыслу разработчиков, он будет определять возможности совместного использования ресурсов SQL и XML. В частности, будет определяться представление схем и данных SQL в форме XML-документов и наоборот.

Важной сферой применения стандартов XML становится формирующаяся в последние годы новая ветвь технологий баз данных – XML-ориентированные базы данных. В таких системах язык XML используется в качестве языка определения данных. Языками запросов служат XPath, XSLT и XQL – один из ранних претендентов на роль стандарта языка запросов для платформы XML. Активно ведутся разработки спецификаций стандарта языка запросов XQuery. Имеются программные продукты этой категории, которые обеспечивают интерфейс прикладного программирования, основанный на объектной модели стандарта DOM.

Стандарты XML широко применяются и в вертикальной сфере (конкретные области приложений – электронный бизнес, управление производством и т.п.). Здесь следует, в частности, упомянуть технологии и стандарты консорциумов OASIS, OMG и OGC (Open GIS Consortia), компаний IBM, Microsoft, Ariba.


Permanent link:
http://swsys.ru/index.php?page=article&id=575&lang=en
Print version
Full issue in PDF (1.31Mb)
The article was published in issue no. № 4, 2004

Perhaps, you might be interested in the following articles of similar topics: