Главная страница
qrcode

Стандарт кодирования и передачи метаданных Library FoundationMetadata Encoding


НазваниеСтандарт кодирования и передачи метаданных Library FoundationMetadata Encoding
Дата03.04.2019
Размер9.32 Mb.
Формат файлаpdf
Имя файлаsbornik_mets_portal.pdf
оригинальный pdf просмотр
ТипДокументы
#44503
страница1 из 31
Каталог
  1   2   3   4   5   6   7   8   9   ...   31
Стандарт кодирования и передачи метаданных
С
та
н
д
а
р
т кодирования и передачи метаданных Library Foundation
Metadata Encoding
and Transmission Standard
www.prlib.ru
Стандарт кодирования и передачи метаданных
Санкт-Петербург
Президентская библиотека
Президентская библиотека (Санкт-Петербург).
METS : Стандарт кодирования и передачи метаданных : перс англ. / Digital Library Federation ; рук. рабочей группы попер. ЮГ. Селиванова]. – Санкт-Петербург : Президентская библиотека, 2018. – 309 сил, схем Стандарт METS разработан под эгидой и при финансовой поддержке Федерации цифровых библиотек) для кодирования метаданных, необходимых для обработки цифровых объектов и обмена ими. Издание включает перевод документов, входящих в стандарт METS: Краткое описание и руководство пользователя, Начальное руководство и краткий справочник, Схема METS» с комментариями на русском языке.
УДК 025.3
ББК 78.362
П71
П71
УДК 025.3
ББК 78.362
ISBN 978-5-9909733-5-0
© Президентская библиотека, перевод, Документы, вошедшие в настоящее издание, опубликованы на сайте Библиотеки Конгресса США (www.loc.gov) на условиях «Creative Commons CC0 1.0 передача в общественное достояние на территории всего мира англ. Creative Commons CC0 1.0 Universal Public Domain Dedication) Руководитель рабочей группы по переводу ЮГ. Селиванова

Члены рабочей группы ЕД. Жабко, Т. Л. Масхулия, О. В. Преображенская, А. А. Воробьёв, А. В. Зайцев

Перевод с английского языка ДА. Савельев

Ответственный редактор ОН. Жлобинская
Электронная версия размещена на портале Президентской библиотеки www.prlib.ru
Оглавление
Предисловие к русскому изданию ..................................................................................4
METS: Краткое описание и руководство пользователя ................................................7
METS: Начальное руководство и краткий справочник версия 1.6, редакция 2010 года) Схема METS (версия 11.1) ..........................................................................................209
Предисловие к русскому изданию
Перевод на русский язык документов, вошедших в настоящее издание, выполнен специалистами Президентской библиотеки в соответствии с разрешением редакционной коллегии METS (METS Editorial Board). По условиям соглашения Президентская библиотека имеет право на перевод на русский языки издание в любом виде документов «METS: Краткое описание и руководство пользователя (METS Overview & Tutorial), «METS: Начальное руководство и краткий справочник (METS Primer), Схема METS» (METS Schema) и Документация к схеме METS» (METS Schema Documentation), в том числе на размещение текста перевода на своем портале.
«Стандарт кодирования и передачи метаданных (Metadata Encoding and
Transmission Standard, METS) – это спецификация кодирования и передачи данных на языке XML, разработанная на основе результатов проекта Создавая Америку II» (Making of America II, MOA2) для кодирования метаданных, необходимых для обработки цифровых объектов в репозитории и обмена такими объектами. Проект MOA2 стартовал в 1997 году с целью организовать среду для служб цифровых библиотеки завершился созданием схемы MOA2 DTD
(XML DTD), которая определила стандарт описания цифрового объекта для кодирования административных, описательных, структурных метаданных объекта и его основного содержания. В дальнейшем сообщество MOA2 осознало необходимость расширить возможности обмена, архивирования и представления цифровых объектов результатом пересмотра и переработки схемы MOA2 стала версия 1.0 схемы METS (mets.xsd). В настоящее время действует версия Редакционный контроль METS осуществляет редакционная коллегия
METS – группа экспертов, состоящая из выбранных международным сообществом METS и работающих на добровольных началах специалистов. Члены редакционной коллегии, как правило, заняты в различных областях, связан
Предисловие кр bbусbbскbbомbbу изданию
ных с созданием и распространением информации, включая академические научные библиотеки, местные и национальные архивы, музеи, национальные библиотеки, правительственные и неправительственные организации, организации – поставщики услуг или программного обеспечения. В задачи редакционной коллегии входит популяризация использования этого стандарта, ведение реестра профилей METS и выявление примеров наиболее эффективного применения METS. Финансирование METS осуществляется Федерацией цифровых библиотек (Digital Library Federation
1
) – консорциумом библиотеки других организаций, положивших начало созданию стандарта. Библиотека Конгресса США выполняет функции ведущей организации, в частности осуществляя хостинг веб-сайта.
Стандарт METS включает схему схему профиля METS; официальную документацию METS. Вся документация METS размещается на сайте Библиотеки Конгресса США на условиях «Creative Commons CC0 1.0 передача в общественное достояние на территории всего мира (англ. Creative Commons
CC0 1.0 Universal Public Domain В настоящее издание вошли переводы актуальных на декабрь 2017 года версий документов «METS: Краткое описание и руководство пользователя (METS
Overview & Tutorial), «METS: Начальное руководство и краткий справочник
(METS Primer, версия 1.6), Схема METS» (METS Schema, версия 1.11). Все эти переводы, а также перевод Документации к схеме METS» (METS Schema
Documentation, версия 1.9) размещены на портале Президентской библиотеки. По договоренности с редакционной коллегией METS все переводы будут также размещены на сайте Библиотеки Конгресса.
Президентская библиотека планирует работы по внедрению стандарта
METS. Предложения и комментарии, связанные с применением стандарта, просим присылать по электронной почтена адрес selivanova@prlib.ru.
1
URL: http://www.diglib.org
2
URL: www.loc.gov/mets
METS: КРАТКОЕ ОПИСАНИЕ И РУКОВОДСТВО ПОЛЬЗОВАТЕЛЯ
MET
S: КРАТКОЕ ОПИСАНИЕ И РУКОВОДСТВО ПО
ЛЬЗОВ
АТЕ
ЛЯ
Содержание
Введение Заголовок METS ............................................................................................................. Описательные метаданные ........................................................................................... Административные метаданные Раздел файлов Структурная карта Структурные связи Раздел сценариев Заключение .....................................................................................................................19
9
MET
S: КРАТКОЕ ОПИСАНИЕ И РУКОВОДСТВО ПО
ЛЬЗОВ
АТЕ
ЛЯ
ВВЕДЕНИЕ
Ведение библиотеки цифровых объектов требует обязательного создания метаданных об этих объектах и их сопровождения. Метаданные, которые необходимы для эффективного управления цифровыми объектами и их использования, существенно отличаются от метаданных, которые применяются для управления коллекциями печатных книги других физических объектов. Если библиотека, создавая описательные метаданные о книге из своей коллекции, не укажет метаданные о структуре книги, книга от этого не рассыплется на отдельные страницы. Ученые смогут определить ценность книги даже в том случае, если в описании не будет указано, что книга изготовлена на офсетной печатной машине «Ryobi». Совершенно иначе дело обстоит с цифровой версией этой же книги. Без структурных метаданных сканированный образ страницы или текстовые файлы малополезны, а без технических метаданных о процессе оцифровки ученые не смогут достоверно оценить, насколько точно оцифрованная версия воспроизводит оригинальное издание. С целью обеспечения процессов внутреннего управления библиотека должна иметь доступ к соответствующим техническим метаданным, для того чтобы периодически обновлять данные и осуществлять их миграцию, способствующую сохранности ценных ресурсов.
В рамках проекта Создавая Америку II» (Making of America II, MOA2 1
) была предпринята попытка решить эти вопросы, в частности путем разработки формата кодирования описательных, административных и структурных метаданных для текстовых произведений и графических образов. METS, инициатива Федерации цифровых библиотек – это попытка разработать на основе результатов MOA2 формат для кодирования метаданных, необходимых как для управления объектами цифровой библиотеки внутри репозитория, таки для обмена такими объектами между репозиториями (или между репозиториями и пользователями. В зависимости от конкретного применения документ
METS может использоваться в качестве сдаточного, архивного или дистрибутивного информационного пакета (соответственно Submission Information
Package (SIP), Archival Information Package (AIP), Dissemination Information
Package (DIP)) в рамках эталонной модели Open Archival Information System
(OAIS
3
).
1
URL: http://sunsite.berkeley.edu/MOA2/
2
URL: http://www.diglib.org
3
URL: http://nssdc.gsfc.nasa.gov/nost/isoas/ref_model.html
10
MET
S: КРАТКОЕ ОПИСАНИЕ И РУКОВОДСТВО ПО
ЛЬЗОВ
АТЕ
ЛЯ
Документ METS состоит из семи больших разделов. Заголовок METS.
Содержит метаданные, описывающие собственно документ METS, включая информацию о создателе, редакторе и т. д. Описательные метаданные Может содержать описательные метаданные, внешние по отношению к документу (например, запись в каталоге OPAC или запись EAD на веб-сервере), либо внутренние описательные метаданные (те. встроенные в документ METS), либо оба типа метаданных одновременно. В этом разделе допускается включение нескольких вхождений внешних и внутренних описательных метаданных. Административные метаданные Раздел содержит информацию о том, как файлы создавались и хранились, оправах интеллектуальной собственности, о свойствах исходного объекта сведения о происхождении файлов, составляющих объект электронной библиотеки (те. сведения о связи «мастер-копия – производный файла также о миграции/трансформации цифровых объектов. Как ив случае описательных метаданных, административные метаданные могут быть либо внешними по отношению к документу METS, либо встроенными в документ METS.
4. Раздел файлов Содержит перечень всех файлов с контентом, составляющим электронные версии цифрового объекта. Элементы могут объединяться в группы внутри элементов , для того чтобы обеспечить группировку файлов по версии объекта. Структурная карта Это центральная часть документа METS. Она отражает иерархическую структуру объекта электронной библиотеки и связывает элементы этой структуры с файлами контента и метаданными, соответствующими каждому элементу. Структурные связи Раздел структурных связей документа METS позволяет создателям документа фиксировать информацию о существовании гиперссылок между иерархическими элементами, указанными в структурной карте. Это имеет особое значение в случае использования
METS при архивировании веб-сайтов.
7. Сценарии Раздел может быть использован для связи исполняемых сценариев с контентом конкретного объекта. Каждый сценарий, описанный в разделе, имеет элемент определения интерфейса, который являет собой абстрактное определение действий, представленных конкретным разделом сценариев. Кроме того, каждый сценарий имеет элемент механизма, определяющий модуль исполняемого кода, в котором реализованы и запускаются действия, указанные элементом определения интерфейса.
Далее приводится более подробное описание каждого раздела и взаимосвязей между ними
11
MET
S: КРАТКОЕ ОПИСАНИЕ И РУКОВОДСТВО ПО
ЛЬЗОВ
АТЕ
ЛЯ
ЗАГОЛОВОК Элемент заголовка METS позволяет включить в документ METS минимальные описательные метаданные непосредственно об объекте METS. Эти метаданные содержат дату создания документа METS, дату его последней модификации и статус документа METS. Кроме того, в заголовок можно включить имена одного или нескольких агентов (лиц или организаций, которые имеют отношение к созданию документа, сведения о функции указанных агентов, а также записать небольшое примечание относительно их деятельности. Наконец, можно указать один или несколько альтернативных идентификаторов документа METS в дополнение к основному идентификатору документа METS, записанному в атрибуте OBJID корневого элемента METS. Краткий пример заголовка METS может выглядеть следующим образом CREATEDATE="2003-07-04T15:00:00" RECORDSTATUS="Complete">
Jerome McDonough
Ann Butler
Этот пример включает два атрибута элемента – CREATEDATE и RECORDSTATUS, которые используются для указания даты и времени создания записи, а также статуса ее обработки. Указаны два агента (лица, которые работали с записью METS, – лицо, ответственное за создание записи, и архивист, ответственный за исходный материал. Атрибуты ROLE и TYPE элемента
ROLE: ARCHIVIST (архивист, CREATOR (создатель, CUSTODIAN (хранитель, DISSEMINATOR (распространитель, EDITOR (редактор, IPOWNER владелец интеллектуальной собственности) и OTHER (другое. Для атрибута
TYPE допустимые значения – INDIVIDUAL (лицо, ORGANIZATION (организация) и OTHER (другое. ОПИСАТЕЛЬНЫЕ МЕТАДАННЫЕ

Раздел описательных метаданных документа состоит из одного или более элементов . Каждый элемент может содержать указатель на внешние метаданные (элемент ), внутренние метаданные (в элементе ), либо оба типа метаданных одновременно.
Внешние описательные метаданные (mdRef): элемент содержит, который может быть использован для получения внешних метаданных. В следующем примере указывает на опись конкретного объекта цифровой библиотеки
12
MET
S: КРАТКОЕ ОПИСАНИЕ И РУКОВОДСТВО ПОЛЬЗОВАТЕЛЯ ID="dmd001">
LABEL="Berol Collection Finding Aid"> Элемент разделав этом примере содержит четыре атрибута. Атрибут LOCTYPE указывает тип локатора, который содержится в теле элемента допустимые значения атрибута LOCTYPE включают URN,
URL, PURL, HANDLE, DOI и OTHER. Атрибут MIMETYPE позволяет указать тип внешних описательных метаданных, а MDTYPE – форму метаданных, на которую ссылается элемент. Допустимые значения элемента MDTYPE включают MARC, MODS, EAD, VRA (VRA Core), DC (Dublin Core), NISOIMG
(NISO Technical Metadata for Digital Still Images, Технические метаданные
NISO для неподвижных цифровых изображений, LC-AV (Library of Congress
Audiovisual Metadata, Технические метаданные, определенные в рамках проекта Библиотеки Конгресса США по сохранению аудиовизуального наследия, TEIHDR (TEI Header, Заголовок TEI), DDI (Data Documentation Initiative, Инициатива по документации данных, FGDC (Federal Geographic Data
Committee Metadata Standard, Стандарт метаданных Федерального комитета США по географическим данными. Атрибут
LABEL обеспечивает механизм описания этих метаданных для пользователей при просмотре документа METS, например в режиме просмотра оглавления. Внутренние описательные метаданные (mdWrap):
элемент представляет обертку метаданных, встроенных в документ METS. Такие метаданные могут быть представлены водной из двух форм) метаданные в XML, с использованием пространства имен, отличного от пространства имен документа METS;
2) любая произвольная бинарная или текстовая форма ПРИ УСЛОВИИ, что метаданные кодируются в Base64 и встраиваются в элемент внутри элемента . Следующие примеры иллюстрируют использование элемента .



Alice's Adventures in Wonderland
Lewis Carroll
between 1872 and 1890
McCloughlin Brothers
text



13
MET
S: КРАТКОЕ ОПИСАНИЕ И РУКОВОДСТВО ПОЛЬЗОВАТЕЛЯ ID="dmd003">

MDI0ODdjam0gIDIyMDA1ODkgYSA0NU0wMDAxMDA...(etc.)

Обратите внимание, что все элементы должны иметь атрибут
ID. Этот атрибут содержит уникальное внутреннее имя для каждого элемента
, которое может использоваться в структурной карте для связи отдельного раздела иерархии документа с конкретным элементом . Это позволяет связывать отдельные разделы описательных метаданных с соответствующими частями цифрового объекта.
АДМИНИСТРАТИВНЫЕ МЕТАДАННЫЕ
Элементы Каждый из этих четырех типов административных метаданных имеет уникальный подэлемент в разделе , ,
и . Все четыре перечисленных элемента могут повторяться в любом документе Элементы , , и используют туже модель содержания, что и : они могут содержать элемент для указания на внешние административные метаданные, элемент для включения административных метаданных непосредственно в документ, или оба вида указанных элементов одновременно. Допускается использование нескольких указанных элементов водном документе, при этом каждый из них должен включать атрибут ID, для того чтобы другие элементы в документе
14
MET
S: КРАТКОЕ ОПИСАНИЕ И РУКОВОДСТВО ПОЛЬЗОВАТЕЛЯ (например, разделы в структурной карте или элементы ) можно было связать с соответствующими подэлементами может включать технические метаданные относительно подготовки файла ID="AMD001">
LABEL="NISO Img.Data">

image/tiff
LZW
8 Interpretation>
1
NYU Press

В таком случае с помощью элемента внутри можно указать, что эти административные метаданные относятся к файлу, который идентифицирует этот элемент. Для указания на этот элемент используется атрибут ADMID.


Раздел файлов () содержит один или более элементов , которые используются с целью объединить в группу связанные между собой файлы. Элемент содержит перечень всех файлов, составляющих одну электронную версию объекта цифровой библиотеки. Например, можно определить отдельные элементы для миниатюр, мастер-копий, версий, текстовых версий в кодировке TEI и т. д.
Рассмотрим следующий пример раздела файлов объекта цифровой библиотеки устной истории, который представлен в трех разных форматах кодированный в TEI транскрипт, мастер-аудиофайл в формате WAV и производный аудиофайл в формате MP3.


CREATED="2001-06-10">

http://dlib.nyu.edu/tamwag/beame.xml

15
MET
S: КРАТКОЕ ОПИСАНИЕ И РУКОВОДСТВО ПОЛЬЗОВАТЕЛЯ

CREATED="2001-05-17" GROUPID="AUDIO1">

http://dlib.nyu.edu/tamwag/beame.wav




CREATED="2001-05-18" GROUPID="AUDIO1">

http://dlib.nyu.edu/tamwag/beame.mp3


В этом случае включает три дочерних элемента – по одному для каждой версии объекта. Первая версия – файл транскрипта в XML, вторая – мастер-аудиофайл в формате WAV и третья – производный аудиофайл в формате MP3. Строго говоря, в таком простом примере использование элементов для разделения различных версий объекта необязательно намного более полезным является в случае описания объектов, состоящих из большого количества сканированных образов страниц, или вообще – когда одна версия объекта состоит из большого числа файлов. При таком условии возможность разделить все элементы на несколько групп упрощает задачу идентификации файлов, относящихся к конкретной версии документа.
Можно обратить внимание на наличие атрибутов GROUPID с одинаковыми значениями в двух элементах , идентифицирующих аудиофайлы; это указывает на то, что эти два файла содержат одну и туже основную информацию, хотя и относятся к различным форматам объекта (с этой же целью можно использовать GROUPID для указания эквивалентных файлов страниц в объектах цифровой библиотеки с большим числом сканированных страниц).
Можно также заметить, что все элементы используют уникальный атрибут ID. Он содержит уникальное внутреннее имя этого файла, которое может быть использовано для ссылки на этот файл из других частей документа. Вы увидите такой тип ссылок в действии в разделе Структурная карта».
Необходимо отметить, что элементы вместо элемента могут включать элемент . Элементы используются для включения содержания файла непосредственно в документ METS; при этом содержание файла должно быть представлено либо в формате, либо в кодировке
Base64. Хотя подобное встраивание файлов при подготовке документа METS для отображения объектов цифровой библиотеки маловероятно, такая возможность может быть очень полезна при обмене объектами цифровой библиотеки между репозиториями или при архивировании версий объектов цифровой библиотеки для внешнего хранения
16
MET
S: КРАТКОЕ ОПИСАНИЕ И РУКОВОДСТВО ПО
ЛЬЗОВ
АТЕ
ЛЯ
СТРУКТУРНАЯ КАРТА
Раздел структурной карты документа METS определяет иерархическую структуру, которая может быть представлена пользователям цифровой библиотеки для навигации по библиотечным ресурсам. Элемент кодирует эту иерархию в виде серии вложенных элементов
. Каждый элемент
содержит атрибуты, информация которых указывает, к какому типу деления относится этот
; кроме того, элемент
может содержать несколько элементов указателей METS () и указателей файла (), которые идентифицируют контент, соответствующий этому
. Указатели METS ссылаются на самостоятельные документы METS, которые содержат информацию, соответствующую элементу
, в который они входят. Это может быть полезно при кодировании больших коллекций материалов (например, весь комплект журналов, чтобы размер каждого файла в наборе был относительно небольшим. Указатели файла содержат информацию о файлах (в отдельных случаях – о группах файлов и о конкретном местонахождении в файле) в текущем разделе
документа METS, который соответствует части иерархической структуры, представленной текущим элементом В следующем примере приводится очень простая структурная карта TYPE="logical">

TYPE="oral history">

ORDER="1">
FILEID="FILE001">
BETYPE="IDREF"/>

FILEID="FILE002">
BETYPE="TIME"/>

FILEID="FILE003">
BETYPE="TIME"/>



FILEID="FILE001">
BETYPE="IDREF"/>

FILEID="FILE002">
BETYPE="TIME"/>

FILEID="FILE003">
BETYPE="TIME"/>

17
MET
S: КРАТКОЕ ОПИСАНИЕ И РУКОВОДСТВО ПОЛЬЗОВАТЕЛЯ


ORDER="3">
FILEID="FILE001">
BETYPE="IDREF"/>

FILEID="FILE002">
BETYPE="TIME"/>

FILEID="FILE003">
BETYPE="TIME"/>



Эта структурная карта показывает, что у насесть объект цифровой библиотеки устной истории (рассказ Абрахама Бима, мэра Нью-Йорка), который включает три части вступительное слово интервьюера, сведения из истории семьи мэра Бима и разговор о том, как Абрахам Бим пришел к участию в профсоюзе педагогических работников Нью-Йорка. Каждая из этих частей/разделов связана стремя файлами (см. выше пример групп файлов транскрипт в XML и два аудиофайла – мастер-файл и производный файл. В каждом элементе используется дочерний элемент
Раздел структурных связей формата – это самый простой по структуре раздел среди основных разделов METS, он содержит всего один элемент – (хотя этот элемент может повторяться. Раздел структурных связей METS служит для того, чтобы можно было указать гиперссылки между элементами структурной карты, – как правило, между элементами
. Это полезно, если вы планируете использовать METS для архивирования веб-сайтов и при этом хотите сохранить гипертекстовую структуру сайтов отдельно от файлов самого сайта
18
MET
S: КРАТКОЕ ОПИСАНИЕ И РУКОВОДСТВО ПО
ЛЬЗОВ
АТЕ
ЛЯ
В качестве примера рассмотрим документ METS для веб-страницы, содержащей изображение, связанное гиперссылкой с другой страницей. Элемент
может содержать элементы
для двух страниц FILEID="HTMLF1"/>

Page 2">




второй страницы, следовало бы использовать элемент в разделе документа METS следующим образом from="IMG1" to="P2" xlink:title="Hyperlink from
JPEG Image on Page 1 to Page 2" При записи элемента ссылки в примере, приведенном выше, используется несколько модифицированная форма синтаксиса XLink; используются все атрибуты XLink, но атрибуты «to» (к) и «from» (от) декларируются как принадлежащие типу IDREF, а не NMTOKEN, как в оригинальной спецификации XLink. Это позволяет указать существование ссылок между любыми двумя узлами в структурной карте, а также использовать средства обработки XML для подтверждения, что связанные узлы действительно существуют.
  1   2   3   4   5   6   7   8   9   ...   31

перейти в каталог файлов


связь с админом