Envio de trabalhos para o I Encontro Nacional de Catalogadores

Biblioteca Nacional

O prazo para o envio de trabalhos para o I Encontro Nacional de Catalogadores e 3º Encontro de Estudos e Pesquisas em Catalogação foi prorrogado até 18 de abril.

O encontro, que tem o tema “Pensando a catalogação no Brasil”, ocorrerá nos dias 4 e 5 de outubro de 2012 no Auditório Machado de Assis, da Biblioteca Nacional, no centro do Rio de Janeiro.

As instruções para o envio de resumos e mais informações podem ser obtidas em: gepcat.blogspot.com.br.

Bancos de dados para implementação do RDA: estrutura "flat file"

O Resource Description and Access (RDA) foi (e está sendo) desenvolvido pelo Joint Steering Committee (JSC). Dentre a documentação utilizada pelo JSC está o documento “RDA Database Implementation Scenarios“, de autoria de Tom Delsey.

Os cenários descritos nesse documento têm como objetivo apenas ilustrar algumas das potenciais implementações dos dados criados com o RDA em diversas estruturas de bancos de dados.

O documento descreve três cenários:

  • Cenário 1: Estrutura de banco de dados relacional ou orientado a objeto (Relational / object-oriented database structure)
  • Cenário 2: Registros bibliográficos e de autoridade vinculados (Linked bibliographic and authority records)
  • Cenário 3: Estrutura de banco de dados “flat file” (sem vínculos) (‘Flat file’ database structure (no links))

O principal motivo pelo qual decidi por abordar esses três cenários aqui no blog está na oportunidade de melhor conhecermos as estruturas dos catálogos (antigos, atuais e futuros) e refletirmos sobre as mesmas.

Ressalto que é de extrema importância que o catalogador conheça as estruturas dos catálogos (ao menos a do catálogo com que ele trabalha), pois essas estruturas estão relacionadas à própria catalogação, às vezes condicionam a atividade do catalogador e, certamente, influem sobre a relação usuário-catálogo, mais precisamente, no modo com que o usuário recupera a informação por meio das possibilidades de busca e de navegação.

Para tornar a explicação dos três cenários mais compreensível e esclarecedora, dedicarei três postagens ao tema, começando hoje pelo Cenário 3, o qual entendo como o mais simples.

Cenário 3: Estrutura de banco de dados “flat file” (sem vínculos)

O Cenário 3, embora seja encontrado também em catálogos digitais, ilustra uma estrutura a muito tempo conhecida na catalogação: a dos catálogos de fichas. Para compreender esse cenário, retomaremos um pouco a estrutura desses catálogos.

De modo geral, cada ficha (ou mais de uma, caso a descrição exceda os 7,5 x 12,5 cm) contém a descrição bibliográfica de um recurso informacional e um ponto de acesso autorizado (cabeçalho) que permite à descrição ser encontrada no catálogo.

Em um catálogo de fichas, as fichas representando dois ou mais recursos informacionais associados a uma mesma pessoa, entidade coletiva, conceito, etc. (dois livros escritos por um mesmo autor, por exemplo) serão dispostas (arquivadas) de forma subsequente, seguindo uma alfabetação.

Nesse caso, por mais que as fichas estejam próximas, não há qualquer vínculo explícito entre elas, cabendo ao usuário a tarefa de notar a semelhança existente. Assim, cabe ao usuário traçar conscientemente ou inconscientemente o relacionamento existente entre os recursos.

Se o usuário tem à disposição um arquivo de autoridade como um instrumento de apoio à utilização do catálogo, ele pode checar em tal arquivo qual o ponto de acesso adotado pela instituição para uma determinada pessoa, entidade coletiva, conceito, etc.

Se o arquivo de autoridade está construído sobre a tecnologia da ficha catalográfica (sim, a ficha catalográfica é uma tecnologia!) não há vínculos explícitos entre um ponto de acesso autorizado do arquivo de autoridade e as fichas do catálogo, cabendo novamente ao usuário a tarefa de traçar os relacionamentos.

As remissivas “ver” e “ver também”, se inseridas no catálogo ou no arquivo de autoridade, atuam de forma semelhante: indicam vínculos não explícitos.

Deixar ao usuário a tarefa de traçar o relacionamento existente entre duas ou mais fichas catalográficas parece-me que foi a solução mais adequada dentre as existentes no contexto tecnológico da criação dos catálogos de fichas.

Para entender a estrutura do banco de dados do Cenário 3 basta transpor um catálogo de fichas para o ambiente digital, com alguns “ajustes terminológicos”, claro. No ambiente digital, chamaremos as fichas catalográficas de “registros bibliográficos“, os vínculos explícitos de “links” e o catálogo de “banco de dados“. Dessa forma, os bancos de dados do Cenário 3 contêm registros sem links entre si.

Tradução de Delsey (2009, p. 5)*

No Cenário 3 não há links entre registros bibliográficos e de autoridade, nem entre os registros de autoridade. Os registros são dispostos em uma mera listagem, assim como as fichas são ordenadas em uma gaveta. Nesse Cenário, o arquivo de autoridade pode estar em outro banco de dados, em outro armário (no caso da utilização de fichas) ou ser uma lista impressa de cabeçalhos de assunto.

No ambiente digital, os links entre os registros podem oferecer algumas vantagens, como veremos nos cenários 1 e 2. A não utilização desses links, como ocorre no Cenário 3, apresenta algumas desvantagens, dentre elas o fato de que, caso seja necessário atualizar um ponto de acesso autorizado (inserir uma data de nascimento ou de morte de um autor ou alterar o termo escolhido para representar um conceito, por exemplo) será necessário atualizar todos os registros bibliográficos em que o referido ponto de acesso autorizado está registrado, o que pode demandar muito tempo e esforço.

O fato dos bancos de dados do Cenário 3 não apresentarem links (relacionamentos) entre os registros faz com que sejam chamados de “flat file databases” (bancos de dados de arquivo simples). Os bancos de dados que estabelecem links entre registros bibliográficos e de autoridade estão enquadrados no Cenário 2, o qual será abordado em uma postagem futura.

______________

* Os atributos indicados com asterisco (*) são definidos no RDA como “core elements” (elementos essenciais). É recomendado que tais elementos seja registrados se forem aplicáveis a entidade que está sendo descrita.

Os registros de autoridade de nome-título são utilizados para pontos de acesso de representando obras e expressões.

Referências

BURGER, R. H. Authority work: the creation, use, maintenance, and evaluation of authority records and files. Littleton: Libraries Unlimited, 1985.

DELSEY, T. RDA Database Implementation Scenarios. [S.l.]: Joint Steering Committee for Development of RDA, 2009.

JIMÉNEZ PELAYO, J.; GARCÍA BLANCO, R. El catálogo de autoridades: creación y gestión en unidades documentales. Gijón: Trea, 2002.

Imagem utilizada para a ficha catalográfica: “Found” por idogcow.

Os componentes do trabalho de autoridade

Um dos objetivos do catálogo é permitir que todos os recursos informacionais associados a uma determinada entidade do tipo pessoa, família ou entidade coletiva sejam encontrados (STATEMENT…, 2009, p. 3).

Uma entidade é algo com caráter unitário e independente; algo com existência independente ou separada; uma abstração, conceito ideal, objeto de pensamento ou objeto transcendental (STATEMENT…, 2009, p. 11, tradução nossa), assim, pessoas, famílias, entidades coletivas, objetos, conceitos, lugares, criações intelectuais, dentre outros, são considerados entidades.

Uma entidade pode ser conhecida por mais de um nome (nome de nascimento, nome artístico, nome oficial, etc.) e um nome pode se referir a diferentes entidades.

Esses distintos nomes e suas diversas formas são utilizados na catalogação descritiva como base para os pontos de acesso, os quais representam as entidades em um catálogo e são utilizados para encontrar os recursos informacionais representados no catálogo.

Diante da diversidade de pontos de acesso para uma mesma entidade, um usuário do catálogo que possui conhecimento de apenas um dos nomes da entidade pode não conseguir encontrar todos os recursos informacionais que estão associados à entidade por ele desejada, por exemplo, todos os livros de um determinado autor.

Desse modo, faz-se necessário reunir e manter controle sobre todos os pontos de acesso que representam uma mesma entidade, assegurando que o usuário encontre todos os recursos associados à entidade desejada ao realizar uma busca utilizando um e somente um dos nomes pelos quais tal entidade é conhecida. Dessa necessidade surgem os conceitos de controle de autoridade (authority control) e trabalho de autoridade (authority work).

Distintas definições de controle de autoridade e de trabalho de autoridade podem ser encontradas na literatura. Por agora adoto as definições de Robert H. Burger.

Segundo Burger (1985, p. 1, tradução nossa) “o controle de autoridade é alcançado quando os cabeçalhos [pontos de acesso] em um catálogo estão consistentes e quando um mecanismo (o arquivo de autoridade) e políticas de catalogação relacionadas têm sido estabelecidos para assegurar esta consistência”.

Ainda segundo Burger (1985, p. 3, tradução nossa), “o trabalho de autoridade permite o controle de autoridade ocorrer”. O trabalho de autoridade, por sua vez, é definido como um conjunto de no mínimo cinco complexos processos:

1. a criação de registros de autoridade (os quais serão utilizados para criar registros bibliográficos autorizados)
2. a reunião dos registros em um arquivo de autoridade
3. a vinculação do arquivo de autoridade ao arquivo bibliográfico; juntos eles formam um sistema de autoridade
4. a manutenção do arquivo e do sistema de autoridade
5. a avaliação do arquivo e do sistema (BURGER, 1985, p. 3, tradução nossa).

Para a realização do trabalho de autoridade cinco componentes são necessários: pontos de acesso, dados de autoridade, registros de autoridade, arquivos de autoridade e sistemas de autoridade. Seguem algumas explanações sobre esses componentes.

Pontos de acesso

Um ponto de acesso é “um nome, termo, código, etc. por meio do qual, dados bibliográficos ou de autoridade são procurados e identificados” (STATEMENT…, 2009, p. 9, tradução nossa). Um ponto de acesso pode ser de diferentes tipos:

Além dessas divisões, os pontos de acesso podem ser divididos também de acordo com os tipos de entidades que eles representam, por exemplo, pontos de acesso de nome pessoal, de título, de assunto, etc.

Dados de autoridade

Os dados de autoridade podem ser definidos como a soma de informações sobre uma pessoa, família, entidade coletiva ou obra, cujo nome seja utilizado como base para um ponto de acesso controlado em citações bibliográficas ou em registros bibliográficos de um catálogo de biblioteca ou banco de dados bibliográficos (REQUISITOS…, 2009, p. 9).

Os dados de autoridade sobre determinada entidade, quando são reunidos e registrados constituem um registro de autoridade. Segundo Park (1992, p. 76 apud MARAIS, 2004, p. 65) os dados de autoridade compreendem o conteúdo intelectual do registro de autoridade.

Registros e autoridade

A Declaração dos princípios internacionais de catalogação define um registro de autoridade como “um conjunto de elementos de dados que identifica uma entidade e pode ser utilizado para facilitar o acesso ao ponto de acesso autorizado para tal entidade ou a exibição de qualquer ponto de acesso para a entidade” (STATEMENT, 2009, p. 9, tradução nossa).

Exemplo de um registro de autoridade. Fonte: http://lccn.loc.gov/n79005673.

Chan (1994, p. 23) aponta que um registro de autoridade contém essencialmente um ponto de acesso autorizado, as formas variantes do nome e as fontes utilizadas para o estabelecimento do ponto de acesso autorizado e das formas variantes.

Maxwell (2002, p. 5) acrescenta que um registro de autoridade pode conter também informações de uso para os bibliotecários e para os usuários da biblioteca, mensagens que provem informação adicional para o usuário (por exemplo, notas que auxiliam a busca no catálogo) e informações inapropriadas aos usuários, mas necessárias aos catalogadores (por exemplo, notas justificando a escolha e forma do ponto de acesso autorizado).

Arquivos de autoridade

Um arquivo de autoridade é “uma coleção de registros de autoridade” (TAYLOR, 2004, 356, tradução nossa). Para Hagler (1997, p. 117), um arquivo de autoridade é o principal produto do trabalho de autoridade e a expressão tangível de um vocabulário controlado.

Jiménez Pelayo e García Blanco (2002, p. 25, tradução nossa) apontam que o arquivo de autoridade “constitui a garantia de uma maior uniformidade e objetividade de critérios aplicados em uma biblioteca ou centro documental”.

Arquivos de autoridade podem ser criados para reunir registros de autoridade para pontos de acesso de nomes, títulos, títulos de séries e assuntos. Dessa forma, os arquivos de autoridade que comportam registros de autoridade para nomes de pessoas, famílias e entidades coletivas – aos quais nos atemos neste trabalho – são chamados de “arquivos de autoridade de nomes”.

Na literatura é possível encontrar algumas variações terminológicas para denominar um arquivo de autoridade, tais como “catálogo de autoridades”, “lista de cabeçalhos autorizados”, “lista de autoridades”, “catálogo de identidade”, “catálogo de formas autorizadas”, entre outros.

Sistemas de autoridade

Como apresentado por Burger (1985, p. 3), a união de um arquivo de autoridade e um arquivo bibliográfico constitui um sistema de autoridade.

Sobre os relacionamentos existentes entre arquivos bibliográficos e de autoridade, Jiménez Pelayo e García Blanco (2002, p. 41-47) destacam quatro tipos:

  • registro bibliográfico – registro de autoridade
  • registro de autoridade – registro bibliográfico
  • registro de autoridade – registro de autoridade
  • registro bibliográfico – registro bibliográfico.

Esses quatro tipos de relacionamentos estão exemplificados na figura abaixo, a qual exemplifica também um “sistema desenvolvido de informação bibliográfica” (arquivo bibliográfico e arquivo de autoridades) (JIMÉNEZ PELAYO; GARCÍA BLANCO, 2002, p. 48-49).

Fonte: Elaborada com base em Jiménez Pelayo e García Blanco (2002, p. 48).

Este texto, parte do estudo que desenvolvi em 2010 e 2011 com apoio da Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) (processo n. 10/07477-9), foi apresentado no XXIII Congresso de Iniciação Científica da Unesp. Ele está disponível também em PDF.

Um estudo sobre os componentes do trabalho de autoridade

Referências

BURGER, R. H. Authority work: the creation, use, maintenance, and evaluation of authority records and files. Littleton: Libraries Unlimited, 1985.

CHAN, L. M. Cataloguing and classification: an introduction. 2nd ed. New York: McGraw-Hill, 1994.

HAGLER, R. The bibliographic record and information technology. 3rd ed. Chicago: ALA; Otawa: Canadian Library Association, 1997.

JIMÉNEZ PELAYO, J.; GARCÍA BLANCO, R. El catálogo de autoridades: creación y gestión en unidades documentales. Gijón: Trea, 2002.

MARAIS, H. Authority control in an academic library consortium using a union catalogue maintained by a central office for authority control. 2004. 310 f. Tese (Doctor of literature and philosophy in the subject Information Science) – University of South Africa, Pretoria, 2004. MAXWELL, R. L. Maxwell’s guide to authority work. Chicago: ALA, 2002.

REQUISITOS funcionales de los datos de autoridad (FRAD): un modelo conceptual. [S.l.]: IFLA; Biblioteca Nacional de España, 2009.

STATEMENT of International Cataloguing Principles. [S.l.]: IFLA, 2009.

TAYLOR, A. G. The organization of information. 2nd ed. Westport: Libraries Unlimited, 2004.

Padrões bibliográficos

Entre alguns textos, encontrei uma categorização dos padrões, modelos, regras, etc. bibliográficos apresentada na documentação do W3C Library Linked Data Incubator Group.

A categorização (disponível em w3.org/2005/Incubator/lld/wiki/File:LayeredModelV3.pdf) compreende desde os modelos conceituais até as especificações como a XML, passando pelos códigos de catalogação, seus elementos e os formatos de metadados, como mostrado na figura abaixo.

Padrões bibliográficos
Padrões bibliográficos
Na camada dos modelos estão os requisitos funcionais, representados pelos modelos conceituais Functional Requirements for Bibliographic Records (FRBR) (Requisitos Funcionais para Registros Bibliográficos), Functional Requirements for Authority Data (FRAD) (Requisitos Funcionais para Dados de Autoridade) e Functional Requirements for Subject Authority Data (FRSAD) (Requisitos Funcionais para Registros de Autoridade de Assunto).

Na camada dos padrões de conteúdo estão as regras de catalogação, os elementos das regras de catalogação e os vocabulários. As regras de catalogação e os elementos das regras de catalogação são bastante familiares: AACR2r e seus elementos, RDA e seus elementos, ISBD e seus elementos, etc.

Os vocabulários, apesar de serem utilizados na catalogação (não somente nos processos temáticos, mas também nos descritivos), muitas vezes não são vistos como tal. Quando consultamos a lista de termos para a designação geral do material (DGM) no AACR2r (regra 1.1C), estamos consultando um vocabulário.

Também utilizamos vocabulários quando consultamos as listas dos códigos de países e de idiomas utilizados nos Formatos MARC 21, assim como as listas de termos presentes no RDA para indicar o tipo de suporte de um recurso informacional (RDA 3.3).

Na camada de estrutura estão os formatos de metadados e as sintaxes de codificação. Alguns dos formatos de metadados, também chamados de padrões de metadados, são figuras presentes nas atividades do catalogador, como é o caso do Formato MARC 21 para Dados Bibliográficos.

Outros formatos de metadados, o Metadata Object Description Schema (MODS) (Esquema de Metadados para a Descrição de Objeto), por exemplo, ainda permanecem pouco conhecidos pelos catalogadores, principalmente no Brasil.

Nas sintaxes de codificação estão as especificações, recomendações ou padrões para codificação de dados. Uma dessas recomendações é a Extensible Markup Language (XML) (Linguagem de Marcação Extensível). Originalmente projetada para vencer os desafios da publicação eletrônica em larga escala, a XML adquire um papel cada vez mais importante no intercâmbio de uma variedade de dados na Web e em outros ambientes digitais (WC3, 2012).

Segundo Ray (2003, p. 6, tradução nossa),

Estritamente falando, a XML não é uma linguagem de marcação. Uma linguagem tem vocabulário e gramática fixados, a XML na verdade não define qualquer elemento. Em vez disso ela estabelece uma série de restrições sintáticas sob as quais você pode construir sua própria linguagem. Assim, uma descrição mais adequada seria chamar a XML de um kit de ferramentas para linguagem de marcação.

O MODS é o exemplo de uma linguagem (em nosso caso um formato de metadados) criado com base na XML.

Outra sintaxe de codificação existente (que provavelmente muita gente na área já ouviu falar mas não entendeu bem o que realmente é) é a ISO 2709 Documentation – Format for Bibliographic Information Interchange on Magnetic Tape (Documentação – Formato para intercâmbio de informação bibliográfica em fita magnética) (SIQUEIRA, 2003, p. 47).

A ISO 2709:2008 especifica os requisitos para um formato de intercâmbio geral que conterá registros descrevendo todos os tipos de materiais passíveis de descrição bibliográfica, bem como outros tipos de registros. Ela não define o tamanho ou o conteúdo de registros individuais, nem atribui qualquer significado às tags, indicadores ou identificadores, pois tais especificações são funções de um formato de implementação. (ISO 2709:2008).

Os Formatos MARC 21 são exemplos de implementação da ISO 2709. Assim, a ISO 2709 define, entre outros, que o código de um campo será composto por três caracteres, por exemplo “245”, e não “o que significa 245” ou, melhor dizendo, “que dado deve ser registrado no campo 245”. O que deve ser registrado em um determinado campo ou subcampo é definido pelo formato de metadados e não pela sintaxe de codificação.

Junto ao diagrama elaborado pelo W3C Library Linked Data Incubator Group estão outros diagramas, dentre eles uma “linha do tempo” representando a cronologia do surgimento dos padrões bibliográficos.

Linha do tempo dos Padrões bibliográficos
Linha do tempo dos Padrões bibliográficos
Essa é uma das categorizações existentes para os padrões, modelos, regras, etc. bibliográficos. Alguns autores incluem ou excluem categorias, de modo que as categorizações encontradas possam parecer divergentes entre si. Nesses casos é necessário considerar que as categorizações foram elaboradas com diferentes propósitos, sob diferentes pontos de vista e considerando diferentes variáveis. Assim, cabe ao leitor ou ao pesquisador interessado no assunto escolher a categorização que melhor atender seus objetivos.

Referências

INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. ISO 2709:2008 Information and documentation – Format for information exchange. Geneva, 2008.

LIBRARY standards. In: LIBRARY Linked Data Incubator Group wiki. [S.l.: s.n.], 2010.

RAY, E. T. Learning XML. 3rd ed. Beijing: O’Reilly, 2003.

SIQUEIRA, M. A. XML na Ciência da Informação: uma análise do MARC 21. 2003. 133 f. Dissertação (Mestrado em Ciência da Informação) – Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2003.

W3C. Extensible Markup Language (XML). [S.l.], 2012.

Você segue o MARC 21?

Se você é bibliotecário provavelmente já ouvi dizer que é necessário “seguir” os padrões utilizados na catalogação, por exemplo, os formatos MARC 21.

Márcia Carvalho Rodrigues e Marcelo Votto Teixeira, no artigo “Aplicabilidade dos campos 490 e 800-830 do Formato MARC 21 para Dados Bibliográficos“, buscam informar aos desavisados bibliotecários (principalmente aos catalogadores) a importância de conhecer, entender e participar do processo de desenvolvimento e atualização dos padrões da catalogação.

“A padronização dos registros bibliográficos na catalogação é um subsídio fornecido aos profissionais para que possam unificar informações e facilmente transportá-las pelas redes de computadores. É uma tarefa em constante aprimoramento e dela depende não apenas o conhecimento de números, símbolos e suas representações dentro de um contexto sistematizado, mas o acompanhamento das mudanças tecnológicas e as consequentes adequações desses padrões a novos recursos informacionais.” (p. 47)

Em suas considerações finais, os autores deixam bem claro a realidade de boa parte da catalogação brasileira: ela apenas “segue” o MARC 21.

“No Brasil, o formato MARC é visto como um qualificador de bibliotecas e é comum ver em apresentações institucionais as expressões “Trabalhamos com o formato MARC” ou “Nossa catalogação segue o padrão MARC”. Mas é esse o principal questionamento que levantamos sobre a catalogação brasileira: ela apenas “segue o padrão MARC” (entenda aqui a expressão “seguir” como “estar sempre atrás”), já que as bibliotecas brasileiras nunca acompanham efetivamente o que está sendo decidido acerca desse conglomerado de campos, subcampos e indicadores que constituem o MARC 21.” (p. 59-60)

O artigo está disponível na íntegra em revista.ibict.br/index.php/ciinf/article/viewArticle/1793.