Metadata - descrevendo recursos das agências do governo
1. Introdução
O problema comum na troca de dados e informações está normalmente relacionado à falta de um padrão, simples e igualmente compreendido quanto ao significado por todas as agências do governo. Ora, como podemos estabelecer e administrar um padrão comum, igualmente compreensível em tão grande diversidade de setores como escolas, saúde, polícia, agricultura, bibliotecas, saneamento, instituições de pesquisa e muitas outras? A resposta está na criação de comunidades de descrição de recursos. Comunidades de descrição de recursos requerem habilidades para descrever certos tipos de recursos. Para recursos bibliográficos, por exemplo, atributos descritivos incluindo "autor", "título" e "assunto" são comuns. Muitas comunidades estão adotando padrões de Metadata como alternativas para a descrição de recursos e troca de informações e alguns destes padrões já estão sendo aceitos por outras comunidades de peritos. Metadata é dados sobre dados. O termo refere a qualquer dado usado para ajudar a identificação, descrição e localização de recursos eletrônicos na rede. Visando promover o uso de Metadata e responder questões desta natureza, este trabalho está organizado como segue: A seção 1 apresenta, a título de motivação, as comunidades de descrição de recursos e o incentivo recebido pelas agências de governos de outros países; a seção 2 apresenta um modelo de representação de Metadata e suas influências de diferentes fontes e a seção 3 apresenta as considerações finais com algumas sugestões adicionais.
2. Comunidades de descrição de recursos
O National Archives of Australia é uma agência de manutenção do padrão de Metadata AGLS, (Australian Government Locator Service). O padrão AGLS de Metadata é um conjunto de 19 elementos descritivos que departamentos do governo e agências podem usar para melhorar a acessibilidade dos seus serviços e informações na Internet. [NAT 2000].
Os Governos Australianos endossaram o uso de Metadata para facilitar a descoberta de informações e serviços por todas as esferas: municipal, estadual e federal. Para ser efetivo, toda agência deveria usar os mesmos elementos. Elas são estimuladas a usar o padrão AGLS para interagir prontamente com outras agências.
AGLS é simples, contudo, poderoso o bastante para descrever coleções de recursos produzidos pelo governo. AGLS está baseado no padrão Dublin Core (DC) de Metadata que é comumente usado em muitas indústrias e setores estatais.
Outra comunidade de descrição de recursos é a Rede de Educação da Austrália (EdNA - The Educational Network of Australia). É uma rede da comunidade de educação australiana (sistema de educação governamental, não governamental, vocação educacional, treinamento, educação da comunidade de adultos e ensino superior) e é organizada com base no currículo australiano e suas ferramentas são grátis a pedagogos. É fundada pelo corpo responsável pela provisão de educação na Austrália.
Elementos de Metadata são recomendados para uso na EdNA. Alguns setores têm identificado seus próprios conjuntos de elementos obrigatórios, em particular o setor das escolas.
A implementação de Metadata é como um sistema simples, aplicável por toda a rede de educação, embora alguns componentes sejam mais orientados a um setor que outro. (por exemplo, o elemento de EDNA.Userlevel é mais pertinente a escolas). O conjunto de Metadata EdNA é composto por nove elementos, além dos já suportados 15 elementos Dublin Core. São eles: EDNA.Entered, EDNA.Approver, EDNA.Reassessment, EDNA.Userlevel, EDNA.Categories, EDNA.Conditions, EDNA.Indexing, EDNA.Review, EDNA.Version.
Estes elementos são criados especificamente para a rede de educação da Austrália. O formato é semelhante aos elementos Dublin Core, mas estes elementos, não terão nenhum significado fora do ambiente da EdNA.
O Dublin Core Metadata Initiative [DUB 2000], um simples modelo de descrição de conteúdo para recursos eletrônicos é um conjunto de elementos de Metadata que pretende facilitar a descoberta de recursos eletrônicos. Originalmente concebido para descrição de autoria de recursos da Web, chamou a atenção de comunidades de descrição de recurso formais como museus, bibliotecas, agências de governo e organizações comerciais.
A principal característica do conjunto de elementos do Dublin Core é o consenso e a experiência coletiva de uma variedade de especialistas interdisciplinares e internacionais da área de descrição de recursos.
As características que o distinguem como um candidato proeminente para descrição de recursos eletrônicos, entram em várias categorias:
Simplicidade: é pretendido que o Dublin Core seja utilizável por leigos como também por especialistas de descrição de recursos. A maioria dos elementos tem uma semântica comumente compreendida.
Semântica e interoperabilidade: promovendo um conjunto de descritores de entendimento comum que ajudam a unificar outros conteúdos de dados padrões, incrementa a possibilidade de interoperabilidade através de disciplinas.
Extensibilidade: adicionalmente, o conjunto de elementos de Dublin Core, inclui flexibilidade suficiente e extensibilidade para codificar estrutura e semântica mais elaborada, inerente em padrões de descrição mais ricos.
Modularidade de Metadata na rede: a diversidade de necessidades de Metadata na rede requer uma infra-estrutura que apóia a coexistência de pacotes independentemente mantidos. O Consórcio W3C começou a implementar uma arquitetura para Metadata .
Muitos métodos diferentes podem ser usados para registrar ou transferir Metadata Dublin Core. Métodos comuns incluem HTML, XML, RDF e bancos de dados relacionais.
O conjunto completo dos 15 elementos é: Title, Creator, Subject, Description, Publisher, Contributor, Date, Type, Format, Identifier, Source, Language, Relation, Coverage e Rights e são usados para tentar descrever o significado dos elementos de um recurso.
3. Modelo de representação de Metadata
O Resource Description Framework (RDF) é uma infra-estrutura, que possibilita a codificação, troca e reuso de Metadata estruturado. O RDF permite adicionar declarações, sinônimos e palavras que não estão presentes nos recursos, mas que são pertinentes a eles.
Como resultado de muitas comunidades trabalhando em conjunto e concordando com princípios básicos de representação de Metadata e transporte RDF, tem sofrido influências de várias fontes. A principal influência tem vindo da comunidade de padronização da Web (Web Standardization Community), da comunidade de biblioteca (Library Community), da comunidade de documentos estruturados (Structured Document Community) e também da comunidade de representação de conhecimento (Knowledge Representation Community).
2.1 Modelo RDF
O fundamento básico do RDF é um modelo para representar propriedades nomeadas e valores de propriedade. Propriedades de RDF podem ser pensadas como atributos de recursos que neste contexto correspondem ao tradicional par atributo-valor. O modelo básico consiste em três tipos de objetos:
Recursos: Todas as coisas sendo descritas pelas expressões RDF são chamadas de recursos. Um recurso pode ser uma página da Web inteira, tal como um documento HTML, um recurso pode ser parte de uma página Web, por exemplo, um elemento específico HTML ou XML dentro de um documento origem.
Propriedades: Uma propriedade é um aspecto específico, uma característica, um atributo, ou uma relação usada para descrever um recurso.
Declarações: Um recurso específico junto com uma propriedade nomeada mais o valor daquela propriedade para aquele recurso é uma declaração RDF. Uma declaração RDF pode ser desenhada usando diagramas de arcos e nodos, onde os nodos (desenho oval) representam os recursos, os arcos (setas) representam as propriedades nomeadas. Nodos que representam literais serão desenhados como retângulo.
A representação do modelo de dados é usada para avaliar equivalência de significado. Duas expressões RDF são equivalentes se, e somente se, suas representações de modelo de dados forem a mesma. Esta definição de equivalência permite algumas variações sintáticas nas expressões sem alterar o significado. Considere as duas sentenças abaixo (tabela 2.1):
Tabela 2.1 - Sentenças sintaticamente diferentes com o mesmo significado
Para humanos, estas declarações levam o mesmo significado (quer dizer, o João é o autor de um documento particular). Para uma máquina, porém, estas são sentenças completamente diferentes. Considerando que os humanos são extremamente adeptos de extrair significado de diferentes construções sintáticas, máquinas permanecem grotescamente ineptas [MIL 98].
Usando o modelo recursos, propriedades e objetos, RDF tenta prover um método sem ambigüidades de expressar semântica em uma codificação legível por máquina.
As duas sentenças, acima descritas, no modelo proposto pelo RDF têm as seguintes partes (tabela 2.2):
Tabela 2.2 - Partes de uma declaração RDF
Nesse contexto, o esquema do grafo rotulado seria o mesmo para as duas sentenças, tornando a codificação "legível por máquina; semanticamente equivalente.
Figura 2.1 - Representação de modelo de dados RDF
2.2 Esquema RDF
Um esquema define as condições que serão usadas em declarações de RDF e serão dados significados específicos a eles. [W3C 99]. O esquema é um lugar onde são documentadas definições e restrições de uso para propriedades. Para evitar confusões entre independentes e possivelmente conflitantes definições do mesmo termo, RDF usa a facilidade de namespace XML. [W3C 98]. Namespaces simplesmente são um modo para amarrar um uso específico de uma palavra dentro de um contexto, para o esquema onde a definição pretendida será encontrada. Em RDF, cada predicado usado em uma declaração deve ser identificado com exatamente um namespace, ou schema.
Em RDF, todos os vocabulários são expressos dentro de um único modelo bem definido. Isto permite gerenciar os vocabulários de maneira descentralizada pelas comunidades independentes de peritos. [W3C 2000].
3. Conclusão
Comunidades de descrição de recursos têm-se preocupado com a localização, acesso e troca de informações em um contexto específico. Para esse grupo de pessoas, a linguagem XML tem prometido bons resultados. A proposta de metadata RDF não pretende substituir as tecnologias existentes de troca de informações, no entanto, sugere a adição de mais um recurso a elas. Com o significado e tipo das propriedades colocados juntos com o par atributo-valor de cada recurso, consultas, validações, verificações de integridade e decisões internas de processos de softwares se tornam mais simples. Mecanismos de validação poderiam evitar erros no uso das marcações; editores interativos poderiam sugerir valores válidos para propriedades, indexadores de texto poderiam reduzir a sobrecarga de informações, esquemas poderiam ser traduzidos para idiomas diferentes, participação e respaldo das agências que dominam aquela área de conhecimento, bem como o privilégio de manutenção e autoria do padrão, poderiam aproximá-las incentivando a colaboração, além de muitas outras possibilidades.
O custo de se adotar uma tecnologia desse tipo não está relacionado, na grande maioria, aos recursos de hardware e software. Pelo contrário, estão relacionados a uma metodologia de trabalho, pois é preciso aderir a uma estrutura conceitual para poder aplicá-las e usá-las.
Embora haja poucas evidências que comprovem a plena utilização de metadata pelas empresas, acreditamos que uma pequena mudança na cultura e na metodologia utilizada possa viabilizar esse projeto, trazendo para os esforços deste governo uma importante infra-estrutura para comunicação e troca de informações na rede.
4. Referências
1. DUBLIN CORE METADATA INITIATIVE. About the dublin core metadata initiative. (October 18, 2000). Disponível em:
http://dublincore.org/about/. Acesso em: 23 set. 2002.
2. MILLER, E. An introduction to the resource description framework. (November 5, 1998). Disponível em: http://www.dlib.org/dlib/
may98/miller/05miller.html. Acesso em: 23 set. 2002.
3. NATIONAL ARCHIVES OF AUSTRALIA. Australian government locator service (AGLS) introduction.March 30, 2000). Disponível em: http://www.naa.gov.au/recordkeeping/
gov_online/agls/summary. html. Acesso em: 25 set. 2000.
4. W3C (WORLD WIDE WEB CONSORTIUM). (January 19, 1998).Disponível em: http://www.w3.org/TR/1998/NOTE-xml-names-0119.html. Acesso em: 23 set. 2002.
5. W3C (WORLD WIDE WEB CONSORTIUM). Resource Description Framework (RDF) modeland syntax specification. (February 22, 1999). Disponível em:
http://www.w3.org/TR/REC-rdf-syntax/. Acesso em: 23 set. 2002.
6. W3C (WORLD WIDE WEB CONSORTIUM). Resource Description Framework (RDF) schema specification 1.0(March 27, 2000). Disponível em: http://www.w3.org/TR/2000/
CR-rdf-schema-20000327/. Acesso em: 23 set. 2002.