O armazenamento de registros MARC 21 em bancos de dados bibliográficos, ou "Como não utilizamos as tecnologias atuais"

Figura 2 - Os dados de um registro armazenados separadamente:
Formatos MARC 21

Em duas postagens anteriores abordei algumas das características das diferentes estruturas dos bancos de dados bibliográficos.

Na primeira postagem, Bancos de dados para implementação do RDA: estrutura “flat file”, abordei as estruturas “flat file” (arquivo simples). Os catálogos baseados em bancos de dados com essa estrutura, em geral, tendem a reproduzir – em ambiente digital – um catálogo em fichas: são armazenados blocos de dados (registros) sem vínculos explícitos (links) entre si.

Na segunda postagem, Bancos de dados para a implementação do RDA: registros bibliográficos e de autoridade vinculados, falei um pouco sobre a estrutura comumente encontrada nos atuais sistemas de gerenciamento de bibliotecas. Nos catálogos de tais sistemas, em geral, são criados links entre registros bibliográficos e registros de autoridade, entre registros de autoridade e entre registros bibliográficos e registros de itens (exemplares): blocos de dados com links entre si.

Esses blocos de dados (registros), com ou sem links entre si, na maior parte dos casos são construídos de acordo com um formato, tal como o MARC 21, o UNIMARC, etc.

Os Formatos MARC 21

Em 1965, Henriette Avram (7 de outubro de 1919 – 22 de abril de 2006) juntou-se ao Office of the Information Systems Specialist da Library of Congress (LC).

Designada para analisar dados catalográficos para determinar sua manipulabilidade por computador, ela mergulhou nos rudimentos da catalogação e rapidamente reconheceu o aspecto mais crucial da automação de bibliotecas: elaborar um meio de transporte padrão para a comunicação de dados bibliográficos. A culminação desses esforços resultou no MARC Pilot Project. (RATHER; WIGGINS, 1989, p. 856).

O MARC Pilot Project foi, então, iniciado no início de 1966 e, em novembro do mesmo ano, passou a operar.

Ao final do projeto piloto, em junho de 1968, a LC havia distribuído em fitas magnéticas aproximadamente 50.000 registros legíveis por máquina. O relatório final do projeto, publicado em 1968, além de apontar os resultados e a experiência das bibliotecas envolvidas no projeto, descrevia o MARC II.

Da década de 1970 aos dias de hoje, diversos foram os formatos criados sobre a base estabelecida por Avram durante o MARC Pilot Project:

Os Formatos MARC 21 atualmente compreendem cinco formatos:

  • MARC 21 Format for Bibliographic Data (Dados Bibliográficos)
  • MARC 21 Format for Authority Data (Dados de Autoridade)
  • MARC 21 Format for Holdings Data (Dados de Coleção)
  • MARC 21 Format for Classification Data (Dados de Classificação)
  • MARC 21 Format for Community Information (Dados de Comunidade).

O registro MARC 21

Este registro bibliográfico no Formato MARC 21 está pronto para ser intercambiado:

00595nam a2200205 a 45  0010010000000080041000100200013000510350016000 640400020000800410013001000820012001131000033001 252450069001582500013002272600048002403000013002 88440003200301500003400333650002200367 000259911 030128s1982    rjb           000 1 por d   a(Broch.)   aCM001775391   aBIBLIODATA bpor 1 apor heng   a823.914 1  aChristie, Agatha, d1890-1976 12 aA casa torta / cAgatha Christie ; tradução de Carmen Ballot. –   a8. ed. –   aRio de Janeiro, RJ : bNova Fronteira, c1982   a238 p. – 1 a(Coleção Agatha Christie)   aTradução de: Crooked house. 4 aFicção inglesa.

(Um registro MARC 21, aquele que você baixa da LC, Bibliodata, etc., é uma única linha contínua, aqui essa linha foi quebrada em várias linhas para possibilitar uma melhor visualização.)

A norma ISO 2709 Documentation – Format for Bibliographic Information Interchange on Magnetic Tape (Documentação – Formato para intercâmbio de informação bibliográfica em fita magnética) é utilizada como base para os Formatos MARC 21, ou seja, a estrutura dessa linha contínua (registro) é definida pela ISO 2709. Vale lembrar que, quando digo estrutura, nesse caso, estou falando das partes do registro (líder, diretório, campos) e não do significado de cada um dos campos e subcampos.

O registro acima, construído sobre “uma estrutura destinada especialmente para comunicações entre sistemas de processamento de dados e não para uso como formato de processamento pelos sistemas” (ISO 2709, p. 1), pode ser exportado em um sistema e importado em outro.

Ao receber o registro, o sistema que fará a importação localizará, por meio da estrutura definida na ISO 2709, o líder, o diretório e os campos dentro do registro. Após a localização das partes do registro será identificado, por meio da marcação dos códigos de campos e subcampos, o que é título, local de publicação, nome do publicador, etc.Este formato (linha contínua) deveria ser apenas o formato para o intercâmbio de registros, pois o MARC 21 é um formato de intercâmbio.

Penso que, em algum momento da história da catalogação dos últimos 50 anos, o MARC deixou de ser utilizado somente como um formato de intercâmbio, passando a ser utilizado também como um formato de armazenamento dos dados catalográficos, como um modelo para a construção (modelagem) de catálogos (bancos de dados) e, em muitos casos, como um condicionador do fazer do catalogador (você segue o MARC 21?).

No decorrer dos anos, em razão dos programas de catalogação centralizada, cooperativa e copiada e de outros fatores, os formatos como o MARC adquiriram uma enorme importância na catalogação e, consequentemente, no desenvolvimento de sistemas de gerenciamento de bibliotecas.

Há algum tempo, houve um momento em que, após a importação de um registro, retirar dele alguns elementos para possibilitar a busca e armazená-lo no banco de dados como um bloco de dados (Figura 1) tornou-se mais fácil que “quebrá-lo” em vários pedacinhos (dados) e armazenar cada um deles separadamente (Figura 2).

Figura 1 - Registros MARC 21 armazenados como "blocos de dados"
Figura 1 – Registros MARC 21 armazenados como “blocos de dados”
Figura 2 - Os dados de um registro armazenados separadamente:
Figura 2 – Os dados de um registro armazenados separadamente:

(As figuras foram feitas apenas para exemplificar o que disse, desse modo, não representam exatamente as tabelas do banco de dados de um sistemas de gerenciamento de bibliotecas.)

Assim, penso que muitos dos atuais sistemas de gerenciamento de bibliotecas têm seus bancos de dados modelados (projetados, planejados, etc.) para armazenar registros nos Formatos MARC 21 como “grandes blocos de dados”.

Por que fazer diferente?

Esses grandes blocos de dados, aliados a outros fatores, fazem com que não sejam exploradas todas as possibilidades de relacionamentos entre os dados que são oferecidas pelas atuais tecnologias.

Em um banco de dados como o apresentado na Figura 1, para cada catalogação de um livro cuja editora é a Nova Fronteira, eu terei “Nova Fronteira” armazenada no banco de dados ao menos duas vezes: uma no registro MARC e outra no campo publicador (utilizado para possibilitar as buscas). Assim, se forem catalogados 200 livros publicados pela editora Nova Fronteira, eu terei “Nova Fronteira” armazenado ao menos 400 vezes no banco de dados.

Já em um banco de dados como o exemplificado na Figura 2, eu terei armazenado apenas um “Nova Fronteira” para cada livro: 200 “Nova Fronteira” ao todo.

Fazendo uso das possibilidades oferecidas pelas tecnologias, eu poderia ter “Nova Fronteira” armazenado uma única vez no banco de dados. Poderia ser criada uma tabela para armazenar os nomes das editoras. Nessa tabela, cada editora receberia um código, Nova Fronteira receberia, por exemplo, “0005”. Assim, cada vez que um livro dessa editora fosse catalogado, no campo “publicador” seria armazenado “0005”. Se um dia eu precisasse alterar o nome dessa editora bastaria acessar a tabela “Editoras” e realizar a modificação uma única vez.

A eliminação de redundâncias no banco de dados é um dos diversos benefícios que uma utilização mais consciente dos padrões (neste caso do MARC) e das tecnologias podem proporcionar aos catálogos.

Neste post tentei apresentar algumas considerações sobre os Formatos MARC 21 e a relação deles com a estrutura dos bancos de dados bibliográficos (catálogos). Um longo e intenso trabalho ainda precisa ser feito até a catalogação alcançar um patamar condizente com a situação tecnológica atual. Felizmente, diversos grupos, principalmente internacionais, já estão empenhados nessa tarefa.

Na próxima postagem (antes do terceiro post da série “Bancos de dados para a implementação do RDA”) falarei um pouco sobre o modelo conceitual FRBR. Esse modelo tem provocado inúmeras discussões no cenário da catalogação descritiva, impactando no modo com que nossas regras de catalogação estão estruturadas, nossos bancos de dados bibliográficos (catálogos) são modelados e, consequentemente, no modo com que transmitimos dados via formatos de intercâmbio.

Referências

ISO 2709

RATHER, Lucia J.; WIGGINS, Beacher. Henriette D. Avram: close-up on the career of a towering figure in library automation and bibliographic control. American Libraries, p. 855-859, oct. 1989.

Autor: Fabrício Assumpção

Bacharel em Biblioteconomia. Doutorando em Ciência da Informação na UNESP.

8 pensamentos em “O armazenamento de registros MARC 21 em bancos de dados bibliográficos, ou "Como não utilizamos as tecnologias atuais"”

  1. Olá Fabrício! Tenho acompanhado sempre teu blog e acho teus post ótimos. Consegues, de uma forma bastante didática, explorar questões extremamente técnicas da representação descritiva. Bom seria se mais bibliotecários demonstrassem o mesmo interesse pela catalogação, pois estamos vivendo uma época de profundas transformações, com questões importantíssimas sendo discutidas e alterações sendo propostas e implementadas, sem a participação de representantes brasileiros neste processo (isso vale para a área da representação temática também). Procuro acompanhar as novidades e observo que, à exceção de alguns poucos profissionais mais antenados e que manifestam sua opinião a respeito dos assuntos de nossa área, a grande maioria dos bibliotecários assume uma postura de espera, sem ao menos se dar ao trabalho de demonstrar curiosidade ou interesse pelo assunto, o que é realmente uma pena, pois há muito a explorar. Bom, mas voltando ao post, concordo contigo quando defendes um melhor aproveitamento das possibilidades do MARC em termos de interação e cruzamento de dados, porém acredito que essa interação não seja efetiva em função do não uso dos 5 formatos, ou seja, se utilizássemos os 5 formatos MARC teríamos uma interação entre os campos completa e efetiva (seria o caso, por exemplo, da editora que citaste). Um abraço.

    1. Oi Márcia!
      Que bom que tem gostado dos meus textos. Tenho acompanhado seus blogs e tenho apreciado bastante, principalmente o mais recente, o Catalogabib.
      Realmente, infelizmente, não temos muitos brasileiros empenhados nas questões da catalogação.

      Sobre a utilização efetiva dos 5 formatos, penso que resolveria muitos dos problemas, principalmente os relacionados aos pontos de acesso.

      O artigo “New perspectives on the shared cataloging environment and a MARC 21 shopping list” (http://escholarship.org/uc/item/6z76m6p9) apresenta uma discussão sobre os possíveis problemas do MARC 21. A autora aponta que muitos dos problemas identificados no MARC são, na verdade, problemas externos ao formato, tais como as práticas de catalogação, o ambiente da catalogação compartilhada e os softwares de bibliotecas.

      A má utilização do MARC 21, que compreende desde a não utilização dos links entre os formatos até o uso do Formato para o armazenamento dos dados, certamente é a causa de boa parte dos problemas.

      No entanto, muitos problemas dos Formatos MARC 21 decorrem da tecnologia utilizada em tais formatos.

      Outros formatos, desenvolvidos mais recentemente (MARCXML, MODS, MADS), têm como base a XML e não a ISO 2709, o que mostra que a tecnologia para o contexto do intercâmbio de dados em fita magnética já está ultrapassada, sendo necessário desenvolver formatos mais compatíveis com os ambientes nos quais os dados são intercambiados atualmente.

      Abraços,

    2. Olá Fabricio! Obrigada pela dica do artigo (ja baixei para ler). Realmente, mais uma vez tenho que concordar contigo: usamos o padrão pela metade, copiamos muita coisa sem saber ao certo para que, não exploramos todas as possibilidades que o formato permite e o pior de tudo: não sabemos usar todos os recursos disponíveis até hoje!
      Tenho acompanhado as discussões em torno do futuro não muito promissor do MARC 21 e acredito que a saída mais fácil seja realmente o MARCXML, principalmente agora que o RDA impõe algumas mudanças que o MARC 21, por mais que se esforce, não terá condições de acompanhar.
      Um abraço!

  2. Olá. Acabei de descobrir o blog e gostei muito. Aqui onde trabalho (UFABC), utilizávamos o sistema PHL que é basicamente uma interface web que faz a interação com um banco de dados ISIS, e não utilizava formato MARC, apesar de aceitá-los para importação de registros bibliográficos.

    Atualmente estamos usando o software Sophia Biblioteca, que utiliza-se de estrutura relacional SQL, no nosso caso, ORACLE. Sobre o primeiro programa, o tamanho em disco das bases de dados era infinitamente menor, e a velocidade de recuperação era quase instantânea mesmo em uma máquina e conexão com o servidor com poucos recursos. A arquitetura nova requer um monstruoso esforço de hardware e faz recuperações lentíssimas, apesar de ter as vantagens da arquitetura relacional, como o exemplo que você cita de alteração de nome da editora.
    Como MARC é um universo novo para mim, e ISO 2709 é algo mais misterioso ainda (acho que não tem sentido você inventar uma norma para padronizar as coisas e cobrar por essa norma. Afinal, quer que seja seguida, ou não?).
    E estou me deparando com problemas aparentemente simples e que seriam resolvidos se eu soubesse do que se tratam diversos detalhes que não localizo em lugar algum. Por exemplo: Como fazer um arquivo ficar ISO? (fora do meu sistema, sendo a fonte, excel por exemplo). Como montar um registro MARC a partir do mesmo Excel? Como bem disse esses formatos deveriam auxiliar o intercâmbio de dados, mas eles não se comunicam com nada (aparentemente, para um desavisado como eu).

    Atenciosamente,

    1. Oi Hugo!
      Que bom que gostou do blog! Fico feliz com isso!

      Pois é, a complexidade das aplicações (e as vantagens trazidas por elas!) está exigindo cada vez mais recursos. O PHL, devido suas origens, tem como um ponto positivo sua velocidade e os requisitos mínimos para sua instalação.

      “Como fazer um arquivo ficar ISO? (fora do meu sistema, sendo a fonte, excel por exemplo). Como montar um registro MARC a partir do mesmo Excel?”

      O MarcEdit possui a funcionalidade “Delimited Text Translator” que permite criar registros MARC/ISO 2709 a partir de planilhas do Excel. É uma funcionalidade bastante interessante, apesar de suas limitações. Se tiver interesse podemos conversar mais sobre!

      Obrigado pela visita e pelo comentário no blog!
      Abraços,

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *