Transformando registros MARC em uma planilha

Neste tutorial, mostrarei como converter um arquivo contendo registros MARC 21 em uma planilha do Excel utilizando o software MarcEdit. Este passo a passo pode ser útil caso você tenha um conjunto de registros e deseje extrair dele algumas informações.

Os registros MARC dos quais estamos falando aqui são aqueles que estão em arquivos com a extensão .mrc, codificados com a ISO 2709. Ao abrir um arquivo desses no bloco de notas, por exemplo, você verá uma sequência de números e letras aparentemente incompreensível; esse é o registro “legível por máquina”; é esse tipo de arquivo que usaremos no tutorial. Saiba mais sobre ISO 2709.

O resultado da conversão será um arquivo .csv contendo os dados dos campos e subcampos selecionados por você. Arquivos CSV são arquivos de texto simples em que os dados estão organizados na forma de uma planilha, portanto, podem ser editados em softwares como o Microsoft Office Excel e LibreOffice Calc. Pessoalmente, recomendo o uso do LibreOffice Calc (software livre e gratuito) caso você queira trabalhar com os dados (limpar, completar, juntar, separar, filtrar, etc.) após a conversão.

Se você estiver utilizando um sistema de gerenciamento de bibliotecas e precisar de uma planilha contendo as informações de seus registros MARC, a melhor forma de conseguir isso é, provavelmente, a partir dos relatórios gerados por seu próprio sistema, e não por este tutorial.

Vamos lá! Você precisará de:

MarcEdit. Baixe e instale em seu computador a versão do MarcEdit referente ao seu sistema operacional.

Microsoft Office Excel, LibreOffice Calc ou outro software para edição de planilhas.

Arquivo contendo os registros MARC. Para este tutorial, utilizarei como exemplo um arquivo contendo 50 registros MARC 21 que obtive do catálogo da Unesp. Caso queira testar com este arquivo, clique aqui para baixá-lo.

1ª Etapa: Analisando os registros

Para converter os registros com o MarcEdit será necessário listar os campos e subcampos que serão levados para a planilha. Se você conhece bem os seus registros e tem certeza dos campos e subcampos que precisa, já pode seguir direto para a 2ª Etapa. No entanto, se você desconhece os dados que estão no arquivo, recomendo que você gere um relatório, assim, saberá quais campos e subcampos fazem parte do arquivo e poderá selecioná-los com maior segurança. Nesta 1ª Etapa, geraremos esse relatório de campos e subcampos.

  1. Na tela inicial do MarcEdit, clique no menu Tools > Generate reports > Field count report.
  1. Selecione o arquivo .mrc contendo seus registros MARC e clique em Abrir.
  1. Escolha a pasta em que deseja salvar o relatório, o nome do arquivo e Salvar. O MarcEdit mostrará uma mensagem informando que o relatório foi salvo.
  2. O relatório foi salvo em arquivo .txt e você pode abri-lo no bloco de notas. A primeira coluna do relatório informa o campo, a segunda, o subcampo, e a terceira, a quantidade de vezes em que o campo ou subcampo aparece no arquivo.

Dos campos e subcampos utilizados nos registros, quais você precisa que estejam na planilha? Você precisa que os subcampos de um campo estejam todos dentro de uma mesma célula ou cada subcampo em uma coluna diferente? Precisaremos dessas informações na etapa seguinte.

2ª Etapa: Convertendo os registros

Nesta 2ª etapa, usaremos a funcionalidade do MarcEdit que extrairá os dados do arquivo .mrc e os colocará em um arquivo .csv ou .txt.

  1. Abra o MarcEdit.
  2. Clique no menu Tools > Export… > Export tab delimited records.
  1. No Step 1, vamos escolher os arquivos e as configurações iniciais. Clique na pasta amarela e selecione o arquivo .mrc.
  2. Clique na pasta amarela com a seta verde e escolha o local para salvar o arquivo resultante da conversão. Atenção: se você for utilizar o Excel, deixe o tipo Tab Delimited Text (.txt). Se você for utilizar o LibreOffice, altere o tipo para Comma Delimited (.csv).
  1. Não é necessário alterar as demais opções, basta clicar em Next. Futuramente, após obter maior familiaridade com o MarcEdit, com a conversão e com o trabalho com registros em planilhas, sugiro que você explore essas opções. Elas têm as seguintes finalidades:

In field delimiter: caractere que separa as múltiplas ocorrências de um campo dentro de célula da planilha. Por exemplo, se o registro contém três 650$a, a célula da planilha terá: Assunto1;Assunto2;Assunto3

Contextual delimiter: caractere que separa os subcampos dentro da célula da planilha. Por exemplo, o espaço em branco entre Cidade : #Editora,#data

  1. No Step 2, informaremos quais campos e subcampos serão levados para a planilha. Cada grupo de campo-subcampo será uma coluna da planilha.
  2. Em Field, selecione o campo. Preencha o Subfield com o subcampo desejado. Em seguida, clique em Add field. Repita isso para todos os grupos de campo-subcampo desejados. Exemplos de como preencher o Subfield:

Para obter um único subcampo, informe a letra ou número dele:
Field: 260 Subfield: a
Resultado: coluna 260$a contendo os locais de publicação.

Para obter mais de um subcampo em uma mesma coluna, informe todos os códigos juntos:
Field: 260 Subfield: abc
Resultado: coluna 260$a$b$c contendo local, editora e data de publicação.

Para obter todo o conteúdo de um campo, deixe o Subfield em branco:
Field: 260 Subfield: (em branco)
Resultado: coluna 260 contendo indicadores, códigos e conteúdo dos subcampos.

  1. Opcionalmente, antes de concluir a conversão, podemos salvar essa configuração (lista dos campos e subcampos selecionados), assim, poderemos reutilizá-la sempre que precisarmos realizar essa mesma conversão. Para salvar, clique em Settings > Save settings.
  1. Na janela que será aberta, escolha a pasta para salvar as configurações e o nome do arquivo, e clique em Salvar. Pronto, a lista de campos e subcampos está salva. Em futuras conversões, você pode utilizá-la clicando em Settings > Load settings e selecionando o arquivo salvo.
  2. Para concluir a conversão, clique em Export. O MarcEdit mostrará uma mensagem confirmando que o arquivo (.csv ou .txt) foi criado. Clique em OK.
  3. Abra a pasta escolhida para salvar a planilha e confirme se o arquivo .csv/.txt foi salvo.

3ª Etapa: Abrindo a planilha

Nesta 3ª Etapa, abriremos a planilha no Excel ou no LibreOffice. Atenção: podem ocorrer variações dependendo da versão do seu Excel ou LibreOffice.

No Excel
  1. Abra o Excel, clique no menu Arquivo > Abrir. Localize a pasta em que salvou o arquivo .txt gerado pelo MarcEdit. Na janela, altere para Todos os arquivos, para que o arquivo .txt seja exibido. Selecione o arquivo e clique em Abrir.
  1. Na primeira etapa do Assistente de importação de texto, é necessário que a opção Delimitado esteja selecionada. Em Origem do arquivo, selecione Unicode (UTF-8). Na visualização, confirme se os acentos, cedilhas e tis do arquivo estão aparecendo corretamente. Clique em Avançar.
  1. Em Delimitadores, deixe selecionado Tabulação. No Qualificador de texto, mantenha as aspas. Clique em Avançar.
  1. Escolheremos agora o formato dos dados (texto, número, data, etc.) de cada coluna da planilha. Se você deixar o tipo como Geral, o Excel tentará adivinhar o tipo de dados. Sugiro que você altere todos os tipos para Texto. Para alterar, clique em cada coluna e em Geral. Utilize a barra de rolagem horizontal para alterar o tipo de todas as colunas. Clique em Concluir.

Pronto! Se deu tudo certo (estou torcendo para que tenha dado!) cada coluna da planilha será um campo/subcampo escolhido e cada registro estará em uma linha.

No LibreOffice Calc
  1. Abra o LibreOffice, clique no menu Arquivo > Abrir. Localize a pasta em que salvou o arquivo .csv gerado pelo MarcEdit. Selecione o arquivo e clique em Abrir.
  1. No Conjunto de caracteres, selecione Unicode (UTF-8).
  2. Nas Opções de separadores, deixe marcado apenas Tabulação.
  3. Em Campos, clique na célula em branco acima do número 1 para selecionar todas as colunas e altere o Tipo de coluna para Texto. Clique em OK.

Pronto! Se deu tudo certo (estou torcendo para que tenha dado!) cada coluna da planilha será um campo/subcampo escolhido e cada registro estará em uma linha.

Algumas dicas

Mesmo abrindo nos softwares de edição de planilhas, o arquivo continua sendo .csv/.txt. Ao salvá-lo no LibreOffice ou no Excel, você pode continuar com ele em .csv/.txt, no entanto, a formatação e outros recursos (cores, fontes, bordas, filtros, etc.) serão perdidos. Se você deseja mantê-los, salve o arquivo com o formato .ods (formato ODF / ODS do próprio LibreOffice) ou .xlsx (formato do próprio Excel).

Conversão de registros MARC é algo fascinante! Faça vários testes. Explore as funcionalidades do MarcEdit, LibreOffice e Excel. Muito do que você precisa fazer pode ser facilitado com essas ferramentas!

Seguem alguns links que pode ser úteis na exploração dessas ferramentas:

Autor: Fabrício Assumpção

Bacharel em Biblioteconomia. Doutorando em Ciência da Informação na UNESP.

Um comentário em “Transformando registros MARC em uma planilha”

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.