Управление данными XML: подходы к определению документов XML
Эллиотт Расти Хэролд (Elliotte Rusty Harold)
Перевод: Intersoft Lab
Оригинал: Managing XML data: Identify XML documents
Название файла XML не обязательно должно иметь расширение .xml. Более того, документ XML даже не всегда может быть файлом. Он может представлять собой запись базы данных, часть файла, транзитный поток байтов в памяти, который даже не записывается на диск, или комбинацию нескольких различных файлов. Но многие документы XML все же хранятся на дисках или других носителях. В таком случае необходимо иметь возможность быстро их различать. В статье представлены наиболее распространенные расширения файлов и типы электронной корреспонденции (MIME media types), используемые в документах XML.
Трехбуквенные расширения используются для идентификации типов файлов как минимум с конца 1960-х годов. Некоторые операционные системы используют четыре, две или даже одну букву вместо трех, но общая конструкция не меняется: имя файла - точка - расширение. При перемещении файлов между гетерогенными системами имя и расширение часто оказываются единственными метаданными, которые остаются с ними.
Если документы XML хранятся в виде файлов, то лучше использовать стандартные расширения. Это существенно облегчает поиск, распознавание и обработку файлов XML. На сегодня самым распространенным расширением является .xml, но для отдельных подмножеств XML используется и ряд других (табл. 1).
Таблица 1. Стандартные расширения файлов XML
Расширение | Значение |
.xml | Общий документ XML |
.ent | Элемент документа, фрагмент документа |
.dtd | Определение типа документа |
.rdf | XML-синтаксис описания ресурсов |
.atom | Обеспечение синдикации атомарных данных |
.owl | Язык онтологии web |
.xhtml | Расширяемый язык разметки гипертекста |
.xsd | Язык схем XML (W3C XML Schema Language) |
.xsl | Преобразования расширяемого языка таблиц стилей (Extensible Stylesheet Language, сокр. XSL) |
.fo | Форматирование объектов XSL |
.rng | Синтаксис RELAX NG XML |
.sch | Схема языка Schematron |
.svg | Масштабируемая векторная графика |
.rss | Простая синдикация (Really Simple Syndication), формат Rich Site Summary или RDF Site Summary |
.plist | Формат списка свойств Apple |
Ресурсы, обслуживаемые web-сервером, не обязательно могут быть файлами. Но если они являются документами XML, то их URL должны обязательно заканчиваться одним из выше названных расширений, соответствующих конкретному типу того или иного ресурса.