Bancos de dados para implementação do RDA: estrutura "flat file"

O Resource Description and Access (RDA) foi (e está sendo) desenvolvido pelo Joint Steering Committee (JSC). Dentre a documentação utilizada pelo JSC está o documento “RDA Database Implementation Scenarios“, de autoria de Tom Delsey.

Os cenários descritos nesse documento têm como objetivo apenas ilustrar algumas das potenciais implementações dos dados criados com o RDA em diversas estruturas de bancos de dados.

O documento descreve três cenários:

  • Cenário 1: Estrutura de banco de dados relacional ou orientado a objeto (Relational / object-oriented database structure)
  • Cenário 2: Registros bibliográficos e de autoridade vinculados (Linked bibliographic and authority records)
  • Cenário 3: Estrutura de banco de dados “flat file” (sem vínculos) (‘Flat file’ database structure (no links))

O principal motivo pelo qual decidi por abordar esses três cenários aqui no blog está na oportunidade de melhor conhecermos as estruturas dos catálogos (antigos, atuais e futuros) e refletirmos sobre as mesmas.

Ressalto que é de extrema importância que o catalogador conheça as estruturas dos catálogos (ao menos a do catálogo com que ele trabalha), pois essas estruturas estão relacionadas à própria catalogação, às vezes condicionam a atividade do catalogador e, certamente, influem sobre a relação usuário-catálogo, mais precisamente, no modo com que o usuário recupera a informação por meio das possibilidades de busca e de navegação.

Para tornar a explicação dos três cenários mais compreensível e esclarecedora, dedicarei três postagens ao tema, começando hoje pelo Cenário 3, o qual entendo como o mais simples.

Cenário 3: Estrutura de banco de dados “flat file” (sem vínculos)

O Cenário 3, embora seja encontrado também em catálogos digitais, ilustra uma estrutura a muito tempo conhecida na catalogação: a dos catálogos de fichas. Para compreender esse cenário, retomaremos um pouco a estrutura desses catálogos.

De modo geral, cada ficha (ou mais de uma, caso a descrição exceda os 7,5 x 12,5 cm) contém a descrição bibliográfica de um recurso informacional e um ponto de acesso autorizado (cabeçalho) que permite à descrição ser encontrada no catálogo.

Em um catálogo de fichas, as fichas representando dois ou mais recursos informacionais associados a uma mesma pessoa, entidade coletiva, conceito, etc. (dois livros escritos por um mesmo autor, por exemplo) serão dispostas (arquivadas) de forma subsequente, seguindo uma alfabetação.

Nesse caso, por mais que as fichas estejam próximas, não há qualquer vínculo explícito entre elas, cabendo ao usuário a tarefa de notar a semelhança existente. Assim, cabe ao usuário traçar conscientemente ou inconscientemente o relacionamento existente entre os recursos.

Se o usuário tem à disposição um arquivo de autoridade como um instrumento de apoio à utilização do catálogo, ele pode checar em tal arquivo qual o ponto de acesso adotado pela instituição para uma determinada pessoa, entidade coletiva, conceito, etc.

Se o arquivo de autoridade está construído sobre a tecnologia da ficha catalográfica (sim, a ficha catalográfica é uma tecnologia!) não há vínculos explícitos entre um ponto de acesso autorizado do arquivo de autoridade e as fichas do catálogo, cabendo novamente ao usuário a tarefa de traçar os relacionamentos.

As remissivas “ver” e “ver também”, se inseridas no catálogo ou no arquivo de autoridade, atuam de forma semelhante: indicam vínculos não explícitos.

Deixar ao usuário a tarefa de traçar o relacionamento existente entre duas ou mais fichas catalográficas parece-me que foi a solução mais adequada dentre as existentes no contexto tecnológico da criação dos catálogos de fichas.

Para entender a estrutura do banco de dados do Cenário 3 basta transpor um catálogo de fichas para o ambiente digital, com alguns “ajustes terminológicos”, claro. No ambiente digital, chamaremos as fichas catalográficas de “registros bibliográficos“, os vínculos explícitos de “links” e o catálogo de “banco de dados“. Dessa forma, os bancos de dados do Cenário 3 contêm registros sem links entre si.

Tradução de Delsey (2009, p. 5)*

No Cenário 3 não há links entre registros bibliográficos e de autoridade, nem entre os registros de autoridade. Os registros são dispostos em uma mera listagem, assim como as fichas são ordenadas em uma gaveta. Nesse Cenário, o arquivo de autoridade pode estar em outro banco de dados, em outro armário (no caso da utilização de fichas) ou ser uma lista impressa de cabeçalhos de assunto.

No ambiente digital, os links entre os registros podem oferecer algumas vantagens, como veremos nos cenários 1 e 2. A não utilização desses links, como ocorre no Cenário 3, apresenta algumas desvantagens, dentre elas o fato de que, caso seja necessário atualizar um ponto de acesso autorizado (inserir uma data de nascimento ou de morte de um autor ou alterar o termo escolhido para representar um conceito, por exemplo) será necessário atualizar todos os registros bibliográficos em que o referido ponto de acesso autorizado está registrado, o que pode demandar muito tempo e esforço.

O fato dos bancos de dados do Cenário 3 não apresentarem links (relacionamentos) entre os registros faz com que sejam chamados de “flat file databases” (bancos de dados de arquivo simples). Os bancos de dados que estabelecem links entre registros bibliográficos e de autoridade estão enquadrados no Cenário 2, o qual será abordado em uma postagem futura.

______________

* Os atributos indicados com asterisco (*) são definidos no RDA como “core elements” (elementos essenciais). É recomendado que tais elementos seja registrados se forem aplicáveis a entidade que está sendo descrita.

Os registros de autoridade de nome-título são utilizados para pontos de acesso de representando obras e expressões.

Referências

BURGER, R. H. Authority work: the creation, use, maintenance, and evaluation of authority records and files. Littleton: Libraries Unlimited, 1985.

DELSEY, T. RDA Database Implementation Scenarios. [S.l.]: Joint Steering Committee for Development of RDA, 2009.

JIMÉNEZ PELAYO, J.; GARCÍA BLANCO, R. El catálogo de autoridades: creación y gestión en unidades documentales. Gijón: Trea, 2002.

Imagem utilizada para a ficha catalográfica: “Found” por idogcow.

Os componentes do trabalho de autoridade

Um dos objetivos do catálogo é permitir que todos os recursos informacionais associados a uma determinada entidade do tipo pessoa, família ou entidade coletiva sejam encontrados (STATEMENT…, 2009, p. 3).

Uma entidade é algo com caráter unitário e independente; algo com existência independente ou separada; uma abstração, conceito ideal, objeto de pensamento ou objeto transcendental (STATEMENT…, 2009, p. 11, tradução nossa), assim, pessoas, famílias, entidades coletivas, objetos, conceitos, lugares, criações intelectuais, dentre outros, são considerados entidades.

Uma entidade pode ser conhecida por mais de um nome (nome de nascimento, nome artístico, nome oficial, etc.) e um nome pode se referir a diferentes entidades.

Esses distintos nomes e suas diversas formas são utilizados na catalogação descritiva como base para os pontos de acesso, os quais representam as entidades em um catálogo e são utilizados para encontrar os recursos informacionais representados no catálogo.

Diante da diversidade de pontos de acesso para uma mesma entidade, um usuário do catálogo que possui conhecimento de apenas um dos nomes da entidade pode não conseguir encontrar todos os recursos informacionais que estão associados à entidade por ele desejada, por exemplo, todos os livros de um determinado autor.

Desse modo, faz-se necessário reunir e manter controle sobre todos os pontos de acesso que representam uma mesma entidade, assegurando que o usuário encontre todos os recursos associados à entidade desejada ao realizar uma busca utilizando um e somente um dos nomes pelos quais tal entidade é conhecida. Dessa necessidade surgem os conceitos de controle de autoridade (authority control) e trabalho de autoridade (authority work).

Distintas definições de controle de autoridade e de trabalho de autoridade podem ser encontradas na literatura. Por agora adoto as definições de Robert H. Burger.

Segundo Burger (1985, p. 1, tradução nossa) “o controle de autoridade é alcançado quando os cabeçalhos [pontos de acesso] em um catálogo estão consistentes e quando um mecanismo (o arquivo de autoridade) e políticas de catalogação relacionadas têm sido estabelecidos para assegurar esta consistência”.

Ainda segundo Burger (1985, p. 3, tradução nossa), “o trabalho de autoridade permite o controle de autoridade ocorrer”. O trabalho de autoridade, por sua vez, é definido como um conjunto de no mínimo cinco complexos processos:

1. a criação de registros de autoridade (os quais serão utilizados para criar registros bibliográficos autorizados)
2. a reunião dos registros em um arquivo de autoridade
3. a vinculação do arquivo de autoridade ao arquivo bibliográfico; juntos eles formam um sistema de autoridade
4. a manutenção do arquivo e do sistema de autoridade
5. a avaliação do arquivo e do sistema (BURGER, 1985, p. 3, tradução nossa).

Para a realização do trabalho de autoridade cinco componentes são necessários: pontos de acesso, dados de autoridade, registros de autoridade, arquivos de autoridade e sistemas de autoridade. Seguem algumas explanações sobre esses componentes.

Pontos de acesso

Um ponto de acesso é “um nome, termo, código, etc. por meio do qual, dados bibliográficos ou de autoridade são procurados e identificados” (STATEMENT…, 2009, p. 9, tradução nossa). Um ponto de acesso pode ser de diferentes tipos:

Além dessas divisões, os pontos de acesso podem ser divididos também de acordo com os tipos de entidades que eles representam, por exemplo, pontos de acesso de nome pessoal, de título, de assunto, etc.

Dados de autoridade

Os dados de autoridade podem ser definidos como a soma de informações sobre uma pessoa, família, entidade coletiva ou obra, cujo nome seja utilizado como base para um ponto de acesso controlado em citações bibliográficas ou em registros bibliográficos de um catálogo de biblioteca ou banco de dados bibliográficos (REQUISITOS…, 2009, p. 9).

Os dados de autoridade sobre determinada entidade, quando são reunidos e registrados constituem um registro de autoridade. Segundo Park (1992, p. 76 apud MARAIS, 2004, p. 65) os dados de autoridade compreendem o conteúdo intelectual do registro de autoridade.

Registros e autoridade

A Declaração dos princípios internacionais de catalogação define um registro de autoridade como “um conjunto de elementos de dados que identifica uma entidade e pode ser utilizado para facilitar o acesso ao ponto de acesso autorizado para tal entidade ou a exibição de qualquer ponto de acesso para a entidade” (STATEMENT, 2009, p. 9, tradução nossa).

Exemplo de um registro de autoridade. Fonte: http://lccn.loc.gov/n79005673.

Chan (1994, p. 23) aponta que um registro de autoridade contém essencialmente um ponto de acesso autorizado, as formas variantes do nome e as fontes utilizadas para o estabelecimento do ponto de acesso autorizado e das formas variantes.

Maxwell (2002, p. 5) acrescenta que um registro de autoridade pode conter também informações de uso para os bibliotecários e para os usuários da biblioteca, mensagens que provem informação adicional para o usuário (por exemplo, notas que auxiliam a busca no catálogo) e informações inapropriadas aos usuários, mas necessárias aos catalogadores (por exemplo, notas justificando a escolha e forma do ponto de acesso autorizado).

Arquivos de autoridade

Um arquivo de autoridade é “uma coleção de registros de autoridade” (TAYLOR, 2004, 356, tradução nossa). Para Hagler (1997, p. 117), um arquivo de autoridade é o principal produto do trabalho de autoridade e a expressão tangível de um vocabulário controlado.

Jiménez Pelayo e García Blanco (2002, p. 25, tradução nossa) apontam que o arquivo de autoridade “constitui a garantia de uma maior uniformidade e objetividade de critérios aplicados em uma biblioteca ou centro documental”.

Arquivos de autoridade podem ser criados para reunir registros de autoridade para pontos de acesso de nomes, títulos, títulos de séries e assuntos. Dessa forma, os arquivos de autoridade que comportam registros de autoridade para nomes de pessoas, famílias e entidades coletivas – aos quais nos atemos neste trabalho – são chamados de “arquivos de autoridade de nomes”.

Na literatura é possível encontrar algumas variações terminológicas para denominar um arquivo de autoridade, tais como “catálogo de autoridades”, “lista de cabeçalhos autorizados”, “lista de autoridades”, “catálogo de identidade”, “catálogo de formas autorizadas”, entre outros.

Sistemas de autoridade

Como apresentado por Burger (1985, p. 3), a união de um arquivo de autoridade e um arquivo bibliográfico constitui um sistema de autoridade.

Sobre os relacionamentos existentes entre arquivos bibliográficos e de autoridade, Jiménez Pelayo e García Blanco (2002, p. 41-47) destacam quatro tipos:

  • registro bibliográfico – registro de autoridade
  • registro de autoridade – registro bibliográfico
  • registro de autoridade – registro de autoridade
  • registro bibliográfico – registro bibliográfico.

Esses quatro tipos de relacionamentos estão exemplificados na figura abaixo, a qual exemplifica também um “sistema desenvolvido de informação bibliográfica” (arquivo bibliográfico e arquivo de autoridades) (JIMÉNEZ PELAYO; GARCÍA BLANCO, 2002, p. 48-49).

Fonte: Elaborada com base em Jiménez Pelayo e García Blanco (2002, p. 48).

Este texto, parte do estudo que desenvolvi em 2010 e 2011 com apoio da Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) (processo n. 10/07477-9), foi apresentado no XXIII Congresso de Iniciação Científica da Unesp. Ele está disponível também em PDF.

Um estudo sobre os componentes do trabalho de autoridade

Referências

BURGER, R. H. Authority work: the creation, use, maintenance, and evaluation of authority records and files. Littleton: Libraries Unlimited, 1985.

CHAN, L. M. Cataloguing and classification: an introduction. 2nd ed. New York: McGraw-Hill, 1994.

HAGLER, R. The bibliographic record and information technology. 3rd ed. Chicago: ALA; Otawa: Canadian Library Association, 1997.

JIMÉNEZ PELAYO, J.; GARCÍA BLANCO, R. El catálogo de autoridades: creación y gestión en unidades documentales. Gijón: Trea, 2002.

MARAIS, H. Authority control in an academic library consortium using a union catalogue maintained by a central office for authority control. 2004. 310 f. Tese (Doctor of literature and philosophy in the subject Information Science) – University of South Africa, Pretoria, 2004. MAXWELL, R. L. Maxwell’s guide to authority work. Chicago: ALA, 2002.

REQUISITOS funcionales de los datos de autoridad (FRAD): un modelo conceptual. [S.l.]: IFLA; Biblioteca Nacional de España, 2009.

STATEMENT of International Cataloguing Principles. [S.l.]: IFLA, 2009.

TAYLOR, A. G. The organization of information. 2nd ed. Westport: Libraries Unlimited, 2004.

Anais do VII Encuentro de Catalogadores

Estão disponíveis no site da Biblioteca Nacional da Argentina os anais do VII Encuentro Internacional e no III Nacional de Catalogadores “Estándares y procedimientos para la organización de la información”, realizados em Buenos Aires nos dias 23, 24 e 25 de novembro de 2011.

As temáticas dos trabalhos apresentados durante o evento são:

  • Normas de catalogação (AACR2, RDA, ISBD)
  • Requisitos Funcionais para Registros Bibliográficos (FRBR)
  • Formato MARC 21
  • Metadados
  • Controle de autoridade de nomes e de assuntos
  • Vocabulários controlados
  • Cooperação em catalogação
  • Formação de catalogadores

Os textos e os slides dos trabalhos podem ser conferidos no endereço http://www.bn.gov.ar/vii-encuentro-de-catalogadores.

(Sugestão da Zaira Regina Zafalon por meio da lista de discussão do Grupo de Estudos e Pesquisas em Catalogação.)

Virtual International Authority File (VIAF)

O Virtual International Authority File (VIAF) (Arquivo de Autoridade Internacional Virtual ou Base Virtual Internacional de Autoridade) é um projeto conjunto de várias instituições implementado pela OCLC.

O objetivo do VIAF é reduzir o custo e aumentar a utilidade dos arquivos de autoridade por meio da correspondência e vinculação de registros de autoridade e da disponibilização destes na Web.

O VIAF, que iniciou apenas com pontos de acesso para pessoas, cobre hoje também entidades coletivas, obras e expressões, totalizando quase 20 milhões de registros de autoridade de 24 fontes [1]. A quantidade de registros, aliada a facilidade de consulta, torna o VIAF uma fonte de informação muito útil para catalogadores.

Algumas das instituições que participam do projeto:

National Library of Australia
Library and Archives Canada
Bibliotheca Alexandrina (Egypt)
Bibliothèque nationale de France
Deutsche Nationalbibliothek
Biblioteca Nacional de Portugal
Biblioteca Nacional de España
Library of Congress/NACO

Mais informações sobre o VIAF podem ser obtidas na página do próprio projeto, na página sobre o projeto ou nos registros da webinar recentemente realizada pela OCLC.

Pontos de acesso: controlados, não controlados, autorizados e formas variantes

Tipos de pontos de acesso
Algumas vezes a terminologia empregada na catalogação é um pouco confusa, o que acaba dando origem a algumas inquietações na hora de ler ou redigir um texto. Um dos termos que acredito que gera um pouco de confusão é “ponto de acesso”.

O que seria um ponto de acesso?

Para tentar esclarecer um pouco sobre os pontos de acesso, apresento aqui algumas definições encontradas na Declaração dos princípios internacionais de catalogação e algumas considerações que podem auxiliar na compreensão desse elemento essencial aos catálogos.

Primeiramente, um “ponto de acesso” é definido como “um nome, termo, código, etc. por meio do qual, dados bibliográficos ou de autoridade são procurados e identificados” (Statement…, 2009, p. 9, tradução nossa).

Um ponto de acesso pode ser controlado ou não. Um “ponto de acesso controlado” é um ponto de acesso registrado em um registro de autoridade, enquanto que um “ponto de acesso não-controlado” não é controlado por um registro de autoridade (Statement…, 2009).

Por sua vez, um ponto de acesso controlado pode ser autorizado ou uma forma variante do nome. Um “ponto de acesso autorizado” é o ponto de acesso controlado preferido para representar uma entidade e construído de acordo com regras e padrões, enquanto que uma “forma variante do nome” é uma forma do nome que não a escolhida como o ponto de acesso autorizado para a entidade. A forma variante do nome, também chamada de remissiva ou ponto de acesso não autorizado, pode ser utilizada para acessar o registro de autoridade para a entidade ou ser apresentada como um link para o ponto de acesso autorizado (Statement…, 2009).

Já que uma imagem vale mais que mil palavras, segue um gráfico que fiz com base nas definições apresentadas acima:

pontos-de-acesso-catalogacao

Além de se dividirem em controlado e não controlado, autorizado e forma variante, os pontos de acesso podem ser divididos de acordo com os tipos de entidades que eles representam. Por exemplo, o ponto de acesso que representa uma pessoa é chamado de “ponto de acesso de nome pessoal”, enquanto que o representa um assunto pode ser chamado de “ponto de acesso de assunto”.

Alguns exemplos de pontos de acesso:

Pontos de acesso representando pessoas:

  • Wilde, Oscar, 1854-1900 (Ponto de acesso autorizado para o escritor Oscar Wilde construído de acordo com o RDA)
  • Wilde, Oscar Fingal O’Flahertie Wills, 1854-1900 (Forma variante do nome – ponto de acesso não autorizado – para o escritor Oscar Wilde construído de acordo com o RDA)

Ponto de acesso representando uma família:

  • Allende (Família : Chile) (Ponto de acesso autorizado para a família Allende (família chilena que reúne grandes políticos e escritores) construído de acordo com o RDA)

Pontos de acesso representando entidades coletivas:

  • Sociedade Portuguesa de Ciências da Educação (Ponto de acesso autorizado para a Sociedade Portuguesa de Ciências da Educação (SPCE) construído de acordo com o RDA)
  • Lacrimosa (Grupo musical) (Ponto de acesso autorizado para a banda musical Lacrimosa construído de acordo com o RDA)

Pontos de acesso representando assuntos:

  • Programas de Imunização (Ponto de acesso autorizado)
  • Programas de Vacinação (Forma variante – ponto de acesso não autorizado)

Qual a diferença entre ponto de acesso e entrada? E entre ponto de acesso e cabeçalho?

É comum o emprego dos termos “ponto de acesso”, “cabeçalho” e “entrada” como sendo sinônimos, no entanto acredito que, muitas vezes, tal uso se dá de modo incorreto. Seguem alguns esclarecimentos:

Cabeçalho”, segundo o Código de Catalogação Anglo-Americano (AACR2r) (2004, p. D-2) é “um nome, palavra ou frase, colocados no alto de uma entrada catalográfica para fornecer um ponto de acesso”. De fato, exceto pela expressão “no alto de uma entrada catalográfica”, o conceito de cabeçalho apresentado no AACR2r é semelhante ao de ponto de acesso da Declaração dos princípios internacionais de catalogação (Statement…, 2009, p. 9). Assim, posso dizer que “cabeçalho” e “ponto acesso” são sinônimos.

O que diferencia esses dois termos é que “cabeçalho” volta-se mais ao contexto dos catálogos de fichas, enquanto que “ponto de acesso” mostra-se mais atualizado e adequado para acompanhar a catalogação no contexto dos catálogos digitais e dos avanços das Tecnologias de Informação e Comunicação (TIC).

Já o termo “entrada” representa um registro de um item no catálogo (Código…, 2004, p. D-5). Essa denominação advém dos catálogos analógicos, nos quais uma entrada é composta por um ponto de acesso (ou cabeçalho), uma descrição e dados de localização.

Uma ficha catalográfica pode ser um bom exemplo de uma entrada, vejamos:

Ficha catalográfica - exemplo de uma entrada

Por mais que “entrada” signifique um registro, tal termo vem sendo utilizado no contexto dos catálogos digitais com o mesmo significado de “ponto de acesso”.

Utilizar “entrada” como sinônimo de “ponto de acesso” é incorreto uma vez que uma entrada compreende, entre outros elementos, um ponto de acesso.

Referências

CÓDIGO de catalogação anglo-americano. 2. ed., rev. 2002. São Paulo: FEBAB, 2004.