Este artigo apresenta a proposta e subsequente construção de um protótipo para catalogação semântica de publicações científicas. O protótipo desenvolvido segue os princípios Linked Data da nova Web Semântica proposta pelo consórcio W3C e encontra-se operacional. A proposta tem como diferencial o fato de todos os arquivos digitais das publicações serem anotados semanticamente com metadados semiestruturados inteligíveis por máquinas, permitindo que agentes de software nos auxiliem nas tarefas de busca, integração e processamentos de tais publicações, estabelecendo uma base de conhecimento Linked Data de publicações. A pesquisa que ampara o estudo e desenvolvimento do protótipo apresenta conceitos inerentes à Web Semântica, ao padrão de dados semiestruturados Resource Description Framework (RDF) e o uso de ontologias para representação de domínios de conhecimento. Testes de funcionamento são demonstrados e foram realizados com algumas publicações também relacionadas ao tema, salientando a capacidade do protótipo em fornecer informações acessíveis a pessoas e a máquinas (agentes de software), por meio de negociação de conteúdo. O protótipo encontra-se hospedado e está disponível para verificação online por qualquer interessado no tema deste artigo.
Apresenta a aplicabilidade do Simple Knowledge Organization System (SKOS) para a área da Organização da Informação (OI). No contexto da Web, mais especificamente voltados para o projeto Web Semântica, os Knowledge Organization System (KOS) têm sido convertidos para os padrões recomendados pelo World Wide Web Consortium (W3C), portanto o SKOS foi apresentado e inserido no contexto da OI. Para tanto, desenvolveu-se uma pesquisa bibliográfica e documental, discorrendo sobre as temáticas: Web Semântica e Web de Dados, RDF e SKOS; bem como apresentado exemplos de aplicação e ferramentas disponíveis para a edição e validação do modelo. O SKOS é um modelo de dados para desenvolvimento de esquemas de conceitos tais como tesauros, listas de cabeçalhos, taxonomias, sistemas de classificação, e outros vocabulários controlados, que segue o modelo Resource Description Framework (RDF) e que por conseguinte permite que os esquemas de conceito sejam inseridos na proposta Web Semântica. Pretende-se que este texto possa contribuir com os pesquisadores e profissionais da área de Ciência da Informação nesta temática.
Considerando o modelo de dados Resource Description Framework – RDF como um modo de representação e de descrição de recursos que visa à interoperabilidade e o acesso à informação em ambientes digitais, objetiva-se apresentar tal modelo, sua origem e suas principais características. Tratando-se de uma pesquisa teórica e exploratória com finalidade descritiva, foi utilizada a revisão de literatura como meio de investigação bibliográfica. Pôde-se perceber a importância do RDF para a descrição de quaisquer recursos, sejam eles digitais ou não, bibliográficos ou não. O RDF oferece para as comunidades de descrição de recursos a possibilidade de definirem a semântica de seus metadados de maneira formal, ou seja, de determinarem o significado dos elementos de metadados conforme as suas necessidades específicas de descrição e de modo processável por máquinas. Utilizando-se da Extensible Markup Language – XML como sintaxe para o intercâmbio e o processamento de metadados, o RDF colabora positivamente para a interoperabilidade entre os vários sistemas de informação e de descrição existentes, contribuindo, desse modo, para a construção de mecanismos de busca mais integrados que permitirão a oferta de serviços mais especializados aos seus usuários.
De 7 a 10 de julho de 2013 aconteceu em Florianópolis – SC, o XXV CBBD. Seguem neste post algumas impressões minhas a respeito das apresentações e das discussões sobre catalogação que presenciei/participei.
A primeira apresentação, “RDF como modelo de descrição no contexto biblioteconômico”, foi realizada por Maria Elisabete Catarino. Entendo que essa introdução sobre o Resource Description Framework (tema quase nunca explorado nos eventos brasileiros de catalogação) foi algo marcante dessa reunião. A exposição gerou a percepção de que faltava conhecimento aos ouvintes.
Infelizmente, muitos participantes parecem não ter entendido o propósito do RDF e, por isso, não perceberam a relação dele com a catalogação. Entre os fatores que não contribuíram para esse entendimento está o desconhecimento de alguns conceitos e tecnologias que antecederam o RDF e/ou que são utilizados com ele: a boa e velha XML, o conceito e a aplicabilidade dos namespaces e, ainda mais importante, o conceito de vocabulário.
Felizmente, a percepção de que lhes faltava conhecimento, incentivou alguns participantes em seus estudos. Assim, me agrada o pensamento de que essa foi a primeira de muitas outras apresentações/discussões nacionais sobre o RDF e a catalogação.
Por mais que seja difícil prever uma tendência de pesquisa sem ter em mãos quaisquer dados bibliométricos/cientométricos, estimo que daqui a dois anos as discussões nacionais sobre RDF e sobre os conceitos a ele relacionados serão muito mais fraquentes em nossos eventos de catalogação. Faço essa estimativa principalmente considerando os projetos de Linked Data e as iniciativas como a do BIBFRAME. Esses são desenvolvimentos internacionais da área e, por não estarmos acompanhando/participando, estamos sendo deixados de lado e, em algum momento, seremos engolidos ou sufocados por eles.
A segunda apresentação, “Reutilização de dados catalográficos: um olhar sobre o uso estratégico das tecnologias de informática na catalogação descritiva“, foi realizada por mim. Tentei traçar uma sistematização sobre a conversão/reutilização de dados no contexto da catalogação. Retomei algumas práticas de catalogação e como as tecnologias foram e têm sido utilizadas para favorecer a reutilização dos dados catalográficos.
Também falei sobre como a reutilização de dados está sendo pensada levando em consideração a integração e a ligação dos dados no contexto dos desenvolvimentos da Web Semântica. Não sei se fui compreendido. Talvez não. Mas não há problema. Não é a primeira vez e nem será a última =) Seguem meus slides:
A terceira apresentação, “FRAD: contexto e conceitos“, foi realizada por Denise Mancera Salgado, que trouxe uma explanação breve, bastante clara e objetiva sobre o modelo conceitual FRAD.
FRAD: contexto e conceitos – Denise Mancera SalgadoFRAD: contexto e conceitos – Denise Mancera Salgado
A quarta apresentação, “RDA e ISBD Consolidada“, trouxe algumas reflexões do Fernando Modesto sobre o papel da ISBD na história da catalogação, as novidades da edição consolidada (principalmente a Área 0) e alguns questionamentos sobre a relação ISBD-RDA.
RDA e ISBD Consolidada – Fernando Modesto
Ana Maria Pereira, na quinta apresentação, abordou o “Ensino da Catalogação com o RDA e suas inovações na área de Biblioteconomia“, destacando alguns dos problemas atuais na educação do catalogador: carga horária, grade dos cursos e avanços tecnológicos.
Ensino da Catalogação com o RDA e suas inovações na área de Biblioteconomia – Ana Maria Pereira
Penso que essa apresentação (e outras realizadas no I ENACAT) deixou bem claro que devemos discutir o ensino de catalogação para traçarmos ações que efetivamente possam nos ajudar a amenizar os problemas enfrentados por todos os professores de catalogação.
Ensino da Catalogação com o RDA e suas inovações na área de Biblioteconomia – Ana Maria Pereira
A sexta apresentação, “O uso do RDA no catálogo de autoridades da UCS“, foi realizada por Marcelo Votto Teixeira, que sintetizou o processo de implantação do RDA na Universidade de Caxias do Sul. Marcelo destacou que tal implementação é parcial, envolvendo apenas a utilização de alguns dos campos do Formato MARC 21 para Dados de Autoridade criados para suportar a utilização do RDA.
O uso do RDA no catálogo de autoridades da UCS – Marcelo Votto Teixeira
Em uma apresentação anterior, realizada na Universidade Federal de Minas Gerais, Marcelo descreveu mais detalhadamente o que ele está realizando na UCS em relação ao RDA.
Os exemplos de registros de autoridade trazidos pelo Marcelo suscitaram discussões acaloradas durante boa parte da reunião.
O uso do RDA no catálogo de autoridades da UCS – Marcelo Votto Teixeira
Por fim,Liliana Giusti Serra falou sobre “Catalogação e RDA: questões observadas no congresso da American Library Association“. Essa apresentação finalizou muito bem a reunião do GEPCAT trazendo de forma clara informações sobre como o RDA está sendo pensando, discutido e utilizado nos Estados Unidos.
Catalogação e RDA: questões observadas no congresso da American Library Association – Liliana Giusti SerraCatalogação e RDA: questões observadas no congresso da American Library Association – Liliana Giusti Serra
Apenas um problema: a reunião ocorreu em uma sala minúscula (cerca de 30 lugares). Em alguns momentos, acompanhar as discussões tornou-se quase impossível para algumas pessoas em razão da falta de espaço.
O objetivo das apresentações – levantar discussões – certamente foi alcançado. A reunião iniciou por volta das 14h e terminou depois das 18:30h. Manter os participantes naquela pequena sala por tanto tempo e discutindo intensamente é a prova de que espaços para a discussão da catalogação são cada vez mais necessários.
Trabalhos apresentados
Presenciei e participei de algumas apresentações de trabalhos que, de alguma forma, envolviam catalogação. Minhas impressões sobre essas apresentações podem ser resumidas nos seguintes comentários.
Está cada vez mais evidente a necessidade de conhecermos padrões de metadados como o Dublin Core. Esse conhecimento deve ser comunicado ainda nos cursos de graduação. Para isso, penso que a atuação conjunta dos docentes das disciplinas de catalogação e das disciplinas “tecnológicas” (introdução à Ciência da Computação, automação, repositórios, bibliotecas digitais, sistemas de gerenciamento, etc.) é primordial.
A abordagem sobre o Dublin Core em qualquer dessas disciplinas deve ser complementada com aspectos trazidos das outras disciplinas. Por exemplo, ao abordar o Dublin Core em uma disciplina sobre repositórios, é necessário deixar claro que:
O Dublin Core, no contexto dos repositórios, desempenha o papel que o MARC 21 desempenha no contexto das bibliotecas;
O Dublin Core e o MARC 21 fazem quase que a mesma coisa, mas com propósitos um pouco diferentes;
A conversão de Dublin Core para MARC 21 e vice-versa é possível sem a necessidade de retrabalho;
Existem ferramentas que permitem trabalhar com Dublin Core e com MARC 21, possibilitando que os sistemas que utilizam esses distintos padrões possam “conversar” entre si.
Descrição dos boletins da Faculdade de Filosofia, Ciências e Letras e Faculdade de Filosofia (FFCL) e Faculdade de Filosofia, Letras e Ciências Humanas (FFLCH) utilizando o padrão de metadados Dublin Core (DC) – Brianda de Oliveira Ordonho Sígolo, Eliana Mara Martins RamalhoAdequação do Dublin Core ao AACR2: o caso da Biblioteca Digital da Assembleia Legislativa do Estado de Minas Gerais – Paulo de Castro Gonçalves, Cristina Machado Leão, Márcia Milton Vianna
Uma percepção geral sobre os trabalhos e sobre a reunião do GEPCAT: muito do conhecimento de que precisamos está lá fora: fora da Biblioteconomia/Ciência da Informação, fora de nossas instituições, fora de nossos tradicionais espaços de atuação, fora de nossa zona de conforto e, por favor, fora dos 7,5 x 12,5 cm.
Penso que buscar novos olhares e novas abordagens nunca foi tão importante quanto agora, assim como a catalogação nunca foi tão importante quanto poderá ser se os profissionais/pesquisadores que sobre ela se debruçam se debruçarem também sobre outras fontes.
Obrigado aos organizadores do evento e a todos que possibilitaram a reunião do GEPCAT. Sem dúvida esse espaço de discussão fez toda a diferença!
Foi muito bom rever os colegas, fazer novos e conhecer tantos outros pessoalmente. Abraços e nos vemos no próximo evento!
Como mencionado em um post anterior, o Grupo de Estudos e Pesquisas em Catalogação (GEPCAT) realizará uma reunião durante o XXV CBBD. Segue o programa da reunião que será realizada na manhã de 8 de julho.
Programa
09:30h Abertura, por Profa. Dra. Zaira Regina Zafalon
Apresentação dos objetivos do Gepcat
Informes sobre eventos
Informes sobre o desenvolvimento das atividades da pauta
10:00h Reutilização de dados catalográficos: um olhar sobre o uso estratégico das tecnologias de informática na catalogação descritiva, por Fabrício Silva Assumpção