Conversão de registros em XML para MARC 21: apresentação no ENANCIB 2014

ENANCIB 2014

O ENANCIB de 2014 foi realizado na Escola de Ciência da Informação da Universidade Federal de Minas Gerais (UFMG), em Belo Horizonte.

Nesse ENANCIB, que foi o primeiro do qual participei, apresentei minha dissertação de mestrado, Conversão de registros em XML para MARC 21: um modelo baseado em folhas de estilo XSLT, desenvolvida no Programa de Pós-Graduação em Ciência da Informação da UNESP, Campus de Marília.

O ENANCIB foi transmitido online através de um canal no YouTube. Minha apresentação, apesar de pequenas perdas devido a alguns cortes na transmissão, está disponível no vídeo a seguir (a partir de 1h15m).

No evento também foram apresentados outros trabalhos sobre catalogação, tais como “Ontologia baseada nos FRBR: proposta de aplicação em catálogos online”, de Rogério Aparecido Sá Ramalho, Zaira Regina Zafalon e Marcos Teruo Ouchi. Você pode conferir a programação completa do evento,  os anais e assistar às apresentações.

Conversão de registros em XML para MARC 21

Conversão de registros em XML para MARC 21: um modelo baseado em folhas de estilo XSLT

É com grande alegria que compartilho com vocês minha dissertação: Conversão de registros em XML para MARC 21: um modelo baseado em folhas de estilo XSLT, defendida recentemente no Programa de Pós-Graduação em Ciência da Informação da UNESP.

Apesar dos Formatos MARC 21 desempenharem um importante papel no cenário internacional da catalogação, existem sistemas de gerenciamento de bibliotecas que não possibilitam a exportação dos registros de acordo com esses formatos – o que pode limitar a participação das bibliotecas usuárias desses sistemas em programas de catalogação cooperativa e causar conflitos durante a migração dos dados.

Pensando nessa situação, o objetivo da pesquisa que desenvolvi durante meu mestrado foi o de elaborar um modelo para a conversão de registros que pudesse auxiliar as instituições que desejam converter seus registros para algum dos Formatos MARC 21 (principalmente o bibliográfico e o de autoridade).

O modelo elaborado, a revisão de literatura que serviu de base para sua elaboração, bem como sua aplicação na conversão dos registros bibliográficos do Personal Home Library (PHL) para o Formato MARC 21 para Dados Bibliográficos, estão descritos na versão final da dissertação, disponível aqui.

Aproveito para agradecer aos membros da banca, os professores doutores Zaira Zafalon, Silvana Vidotti, Ricardo Santana e Maria Elisabete Catarino por suas contribuições, e a Prof.ª Plácida Santos, por sua orientação durante todos esses anos.

Fabrício Assumpção e Plácida Santos, 20/09/2013

O texto completo da dissertação está disponível em: marilia.unesp.br/Home/Pos-Graduacao/CienciadaInformacao/
Dissertacoes/assumpcao_fs_me_mar.pdf
.

MADS: uma alternativa à utilização do Formato MARC 21 para Dados de Autoridade

Metadata Authority Description Schema (MADS)

O número mais recente (v. 18, n. 1) da revista Informação & Informação, publicada pelo Departamento de Ciência da Informação da Universidade Estadual de Londrina (UEL), trouxe entre seus artigos o trabalho Metadata Authority Description Schema (MADS): uma alternativa à utilização do formato MARC 21 para dados de autoridade, de autoria minha e da Prof.ª Plácida Santos.

Introdução: O intercâmbio de registros de autoridade requer o estabelecimento e a adoção de padrões de metadados, tais como o Formato MARC 21 para Dados de Autoridade, formato utilizado por diversas agências catalogadoras, e o Metadata Authority Description Schema (MADS), padrão que permanece pouco explorado pela literatura e pouco difundido entre as agências.

Objetivo: Apresentar um estudo introdutório sobre o padrão MADS.

Metodologia: Pesquisa bibliográfica descritiva e exploratória.

Resultados: São abordados o contexto de criação do MADS, seus objetivos, sua estrutura e as principais questões relacionadas à conversão de registros em MARC 21 para registros MADS.

O artigo completo está disponível neste endereço. Seguem as figuras utilizadas do artigo em melhor qualidade.

Exemplo de registro MADS
Figura 1 – Exemplo de registro MADS. Fonte: adaptado de: <http://lccn.loc.gov/n79026451/mads>. Acesso em: 4 dez. 2011.
Exemplos da utilização dos elementos mads e madsCollection
Figura 2 – Exemplos da utilização dos elementos mads e madsCollection
Conversão de registros MARC 21 para registros MADS
Figura 3 – Conversão de registros MARC 21 para registros MADS
Opções na conversão do subcampo “q” do campo 100
Figura 4 – Opções na conversão do subcampo “q” do campo 100

Padrões bibliográficos

Entre alguns textos, encontrei uma categorização dos padrões, modelos, regras, etc. bibliográficos apresentada na documentação do W3C Library Linked Data Incubator Group.

A categorização (disponível em w3.org/2005/Incubator/lld/wiki/File:LayeredModelV3.pdf) compreende desde os modelos conceituais até as especificações como a XML, passando pelos códigos de catalogação, seus elementos e os formatos de metadados, como mostrado na figura abaixo.

Padrões bibliográficos
Padrões bibliográficos
Na camada dos modelos estão os requisitos funcionais, representados pelos modelos conceituais Functional Requirements for Bibliographic Records (FRBR) (Requisitos Funcionais para Registros Bibliográficos), Functional Requirements for Authority Data (FRAD) (Requisitos Funcionais para Dados de Autoridade) e Functional Requirements for Subject Authority Data (FRSAD) (Requisitos Funcionais para Registros de Autoridade de Assunto).

Na camada dos padrões de conteúdo estão as regras de catalogação, os elementos das regras de catalogação e os vocabulários. As regras de catalogação e os elementos das regras de catalogação são bastante familiares: AACR2r e seus elementos, RDA e seus elementos, ISBD e seus elementos, etc.

Os vocabulários, apesar de serem utilizados na catalogação (não somente nos processos temáticos, mas também nos descritivos), muitas vezes não são vistos como tal. Quando consultamos a lista de termos para a designação geral do material (DGM) no AACR2r (regra 1.1C), estamos consultando um vocabulário.

Também utilizamos vocabulários quando consultamos as listas dos códigos de países e de idiomas utilizados nos Formatos MARC 21, assim como as listas de termos presentes no RDA para indicar o tipo de suporte de um recurso informacional (RDA 3.3).

Na camada de estrutura estão os formatos de metadados e as sintaxes de codificação. Alguns dos formatos de metadados, também chamados de padrões de metadados, são figuras presentes nas atividades do catalogador, como é o caso do Formato MARC 21 para Dados Bibliográficos.

Outros formatos de metadados, o Metadata Object Description Schema (MODS) (Esquema de Metadados para a Descrição de Objeto), por exemplo, ainda permanecem pouco conhecidos pelos catalogadores, principalmente no Brasil.

Nas sintaxes de codificação estão as especificações, recomendações ou padrões para codificação de dados. Uma dessas recomendações é a Extensible Markup Language (XML) (Linguagem de Marcação Extensível). Originalmente projetada para vencer os desafios da publicação eletrônica em larga escala, a XML adquire um papel cada vez mais importante no intercâmbio de uma variedade de dados na Web e em outros ambientes digitais (WC3, 2012).

Segundo Ray (2003, p. 6, tradução nossa),

Estritamente falando, a XML não é uma linguagem de marcação. Uma linguagem tem vocabulário e gramática fixados, a XML na verdade não define qualquer elemento. Em vez disso ela estabelece uma série de restrições sintáticas sob as quais você pode construir sua própria linguagem. Assim, uma descrição mais adequada seria chamar a XML de um kit de ferramentas para linguagem de marcação.

O MODS é o exemplo de uma linguagem (em nosso caso um formato de metadados) criado com base na XML.

Outra sintaxe de codificação existente (que provavelmente muita gente na área já ouviu falar mas não entendeu bem o que realmente é) é a ISO 2709 Documentation – Format for Bibliographic Information Interchange on Magnetic Tape (Documentação – Formato para intercâmbio de informação bibliográfica em fita magnética) (SIQUEIRA, 2003, p. 47).

A ISO 2709:2008 especifica os requisitos para um formato de intercâmbio geral que conterá registros descrevendo todos os tipos de materiais passíveis de descrição bibliográfica, bem como outros tipos de registros. Ela não define o tamanho ou o conteúdo de registros individuais, nem atribui qualquer significado às tags, indicadores ou identificadores, pois tais especificações são funções de um formato de implementação. (ISO 2709:2008).

Os Formatos MARC 21 são exemplos de implementação da ISO 2709. Assim, a ISO 2709 define, entre outros, que o código de um campo será composto por três caracteres, por exemplo “245”, e não “o que significa 245” ou, melhor dizendo, “que dado deve ser registrado no campo 245”. O que deve ser registrado em um determinado campo ou subcampo é definido pelo formato de metadados e não pela sintaxe de codificação.

Junto ao diagrama elaborado pelo W3C Library Linked Data Incubator Group estão outros diagramas, dentre eles uma “linha do tempo” representando a cronologia do surgimento dos padrões bibliográficos.

Linha do tempo dos Padrões bibliográficos
Linha do tempo dos Padrões bibliográficos
Essa é uma das categorizações existentes para os padrões, modelos, regras, etc. bibliográficos. Alguns autores incluem ou excluem categorias, de modo que as categorizações encontradas possam parecer divergentes entre si. Nesses casos é necessário considerar que as categorizações foram elaboradas com diferentes propósitos, sob diferentes pontos de vista e considerando diferentes variáveis. Assim, cabe ao leitor ou ao pesquisador interessado no assunto escolher a categorização que melhor atender seus objetivos.

Referências

INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. ISO 2709:2008 Information and documentation – Format for information exchange. Geneva, 2008.

LIBRARY standards. In: LIBRARY Linked Data Incubator Group wiki. [S.l.: s.n.], 2010.

RAY, E. T. Learning XML. 3rd ed. Beijing: O’Reilly, 2003.

SIQUEIRA, M. A. XML na Ciência da Informação: uma análise do MARC 21. 2003. 133 f. Dissertação (Mestrado em Ciência da Informação) – Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2003.

W3C. Extensible Markup Language (XML). [S.l.], 2012.