Gestão de Metadados: Sua Evolução na Tecnologia da Informação

Autor: Ricardo Shoiti Ikematu - GPT

RESUMO

Antes de tratar o assunto de gestão de metadados, tentamos revisar a definição do que é metadados. Logo após, discorremos sobre o tratamento de metadados através do tempo. Depois, procuramos destacar a importância e o contexto deste assunto nas organizações. Abordamos as forças que atuam sobre os metadados e os classificamos em duas categorias básicas. Dentro destas categorias, mostramos as ações que têm sido feitas pela comunidade de Tecnologia de Informação. Por fim, abordamos, ainda que superficialmente devido à sua complexidade, o assunto de gestão de metadados.

1. Visão Geral

As pessoas que têm algum contato com alguma ferramenta de Tecnologia da Informação provavelmente utilizam alguma forma de metadados, mesmo sem saber que as usa ou o seu significado. Isto é normal até porque a sua própria definição não é um consenso, gerando alguma confusão. A definição mais comum de metadados é dados sobre dados. Porém esta definição não diz muita coisa. Ao pesquisar sobre metadados você provavelmente encontrará diferentes interpretações. Selecionei algumas delas somente para ilustrar esta questão.

  • Metadados são dados que descrevem atributos de um recurso. Ele suporta um número de funções: localização, descoberta, documentação, avaliação, seleção, etc.
  • Metadados fornece o contexto para entender os dados através do tempo.
  • Metadados é dado associado com objetos que ajuda seus usuários potenciais a ter vantagem completa do conhecimento da sua existência ou características.
  • Metadados é o instrumental para transformar dados brutos em conhecimento.

Segundo Terry Moriarty, estas diferentes interpretações estão relacionadas ao estágio da organização dentro da hierarquia evolucionária de gestão do conhecimento (ver figura 1). Organizações no nível mais baixo da hierarquia gerenciam dados brutos. Organizações mais avançadas são capazes de administrar seus recursos de informação no nível de Informação, Conhecimento ou Sabedoria. No nível de informação, o foco é nos relacionamentos entre todos os componentes do sistema e os papéis individuais que eles assumem no sistema. Uma organização que está envolvida ao ponto que ela pode mostrar explicitamente as regras de negócio governando, seu comportamento está no nível de conhecimento. Uma organização atinge o nível mais avançado da hierarquia quando ela monitora ativamente seus sistemas para garantir que seu comportamento esteja de conformidade com o planejado. Tal que uma organização pode detectar e diagnosticar qualquer comportamento anormal do sistema.

A finalidade principal dos metadados é documentar e organizar de forma estruturada os dados das organizações, com o objetivo de minimizar duplicação de esforços e facilitar a manutenção dos dados.

Para se ter uma idéia da sua importância vamos fazer uma analogia no mundo real. Os dados sem os metadados é como se fosse um turista em uma cidade desconhecida sem qualquer informação sobre esta cidade. O usuário fica sem uma orientação para obter a informação desejada.

Atualmente o interesse sobre o assunto de metadados vem crescendo porque:

  • as pessoas necessitam melhores formas de encontrar e avaliar informações na Internet e nas intranets;
  • os sistemas de gerenciamento de conhecimento integrando informações de fontes múltiplas e aplicações precisam (ser mais fácil de pesquisar e manter) oferecer maior facilidade de pesquisa e manutenção.

Estágio Recurso a ser administrado Definição de Metadados
Dados Valores dos dados Informação necessária para administrar o recurso dos dados
Informação Valores dos dados e o contexto da informação Informação necessária para administrar o recurso da informação
Conhecimento Valores dos dados, contexto da informação e instruções das regras de negócio Informação necessária para administrar as regras e políticas de negócio da organização
Sabedoria Valores de dados, contexto da informação, regras de negócio executáveis, monitoração das regras de negócio e regras e métricas de avaliação Informação necessária para administrar o comportamento da organização de acordo com suas regras e políticas de negócio.

Figura 1 - Nível de Gerenciamento do Conhecimento

2. A Evolução no Tratamento de Metadados

Metadados é um assunto que é tratado há muito tempo em sistemas de processamento da informação. O que tem mudado é o escopo de sua atuação conforme a evolução da Tecnologia da Informação.

Antigamente os metadados somente estavam vinculados internamente aos programas. Com o surgimento dos Sistemas Gerenciadores de Banco de Dados (SGBD), muitas organizações tentaram implementar alguma forma de dicionário de dados, a partir dos anos 70. Depois vieram as ferramentas CASE e os ambientes de desenvolvimento com seus repositórios proprietários. Nos anos 80, houve uma iniciativa frustada da IBM de criar um repositório global para troca de metadados através do seu AD/Cycle.

Através dos tempos, metadados tem sido apresentado para a comunidade de informática como um problema intratável. E como as organizações cresceram, os problemas com metadados se multiplicaram. Entretanto, os próprios problemas com metadados apresentam boas oportunidades para os fabricantes de software. Porém, isto é mais evidente em ambientes de Data Warehouse corporativos.

3. A Sua Importância Para a Organização

Metadados existe em todas as funções da Tecnologia da Informação (TI). Porém uma das razões porque os esforços de metadados falham é porque metadados é considerado apenas um recurso técnico.

Em Post Capitalist Society, Peter Drucker escreve "o recurso básico da economia não é capital, nem recursos naturais ou trabalho. Ele será o conhecimento. O valor agora é criado pela produtividade e inovação, ambos aplicações do conhecimento para o trabalho".

Através de afirmações como esta podemos dizer que a informação é o patrimônio mais valioso da organização? Eu diria que sim, mas as pessoas ainda encontram bastante dificuldade para justificar esta afirmativa em suas organizações.

Muitas organizações não fazem o melhor uso de suas informações porque elas não são bem gerenciadas. Uma das razões porque a informação é tão mal administrada pode ser porque ela não é bem entendida. A informação não obedece as mesmas leis econômicas de outros patrimônios. Ela tem algumas propriedades únicas que devem ser entendidas para administrá-la efetivamente. A seguir, discutiremos algumas destas propriedades.

A informação é compartilhável infinitamente. Podemos combinar as informações de várias formas para beneficiar a organização. Porém, conhecimento é poder, e como resultado, as pessoas não compartilham informações facilmente. A restrição de informação representa uma perda de oportunidades de negócio, tanto quanto custos adicionais para a organização, com várias áreas de negócio controlando a mesma informação.

O valor da informação aumenta com o uso. Em muitas organizações existem muitas informações que poderiam ser usadas para adquirir vantagem competitiva, entretanto as oportunidades não são realizadas porque as pessoas não sabem que elas existem ou não podem acessá-las.

O valor da informação diminui com o tempo, porém ela varia conforme o tipo da informação: informações para tomada de decisão têm uma vida útil maior que informações operacionais.

O valor da informação aumenta quando combinada com outra informação. A informação geralmente é mais útil quando ela pode ser comparada e combinada com outra informação.

A informação gera outra informação. O processo de usá-la tende a resultar em mais informação.

Até hoje a transformação de dados em informação tem sido conduzida pela tecnologia (Dados + Contexto = Informação). Estes avanços tecnológicos estão sendo integrados pela organização. Esta integração ajuda a gerenciar não só a informação, mas também formas em que as pessoas aprenderão e influenciarão a informação e a compartilharão com outros. (Informação + Experiência = Conhecimento).

A tecnologia de metadados está surgindo em função das necessidades das organizações de conhecer melhor os dados que elas mantêm e conhecer com mais detalhes os dados de outras organizações através de intranets e extranets. A catalogação dos dados propiciará a maior utilização deles por usuários com múltiplos interesses. Sem uma documentação eficiente dos dados é dificultada aos usuários a localização de dados necessários para suas aplicações. Organizações que não documentam seus dados, freqüentemente, com o decorrer do tempo, ficam sujeitas à superposição de esforços de coleta e manutenção de seus dados, vulneráveis a problemas de inconsistências e, principalmente, pagarão um alto custo pelo não uso ou uso impróprio dessa informação.

4. Forças Atuantes

Um dos principais motivos porque metadados é um problema é que cada unidade de metadados é colocada entre duas fortes forças com direções opostas. Aonde isto é acentuado há uma instabilidade do ambiente. Se há a necessidade de integração e uma uniformidade de linguagem e significado dos dados através da corporação, os metadados devem ser o núcleo dos esforços, geralmente de forma centralizada. Por outro lado, o usuário final deve ter autonomia de processamento para ter criatividade e produtividade em seu ambiente de trabalho. Ele não está preocupado com a gestão de metadados. Ainda não há ferramenta que trabalhe os dois aspectos ao mesmo tempo.

5. Categorias Básicas

Ao estudar o assunto de metadados você encontrará uma enorme variedade de taxonomias a respeito do assunto. No meu entendimento, há uma divisão clara em relação a metadados que denominei de duas categorias básicas: metadados técnico e metadados de negócios. Preferi chamar de categoria porque as classificações que encontrei podem ser encaixadas dentro de uma categoria ou da outra.

Metadados técnico é a descrição dos dados necessários pelas várias ferramentas para armazenar, manipular ou movimentar dados. Estas ferramentas incluem banco de dados relacionais, ferramentas de desenvolvimento de aplicações, ferramentas de modelagem, ferramentas de pesquisa em banco de dados, ferramentas OLAP, etc.

Para os fabricantes atingirem um nível de integração de metadados há várias estratégias: construir uma ponte proprietária entre vários produtos, fornecer uma solução completa de Tecnologia de Informação ou criar um padrão internacional de troca de metadados.

As pontes oferecem uma alta funcionalidade e compartilhamento de metadados. Mas manter estas pontes consome muitos recursos, especialmente se o número de pontes cresce. Vários fabricantes estão adquirindo ou construindo os componentes necessários para oferecer um ambiente integrado de uma solução completa. Esta estratégia requer que o usuário abandone as melhores abordagens e se sujeite aos produtos de um único fabricante. Os usuários têm que pesar as desvantagens de ficarem presos a uma linha de produtos de um fabricante contra as funcionalidades que um ambiente proprietário pode oferecer.

A outra alternativa é a utilização de um meio comum para a troca de metadados através dos padrões internacionais.

Existem padrões diferentes de metadados para finalidades distintas de informações. Para se ter uma idéia da variedade de esforços vamos relacionar alguns destes padrões:

  • Directory Interchance Format (DIF) - padrão para criar entradas de diretórios que descrevem um grupo de dados;
  • Government Information Locator Service (GILS) - informações governamentais;
  • Federal Data Geographic Committee (FGDC) - descrição de dados geoespaciais;
  • Machine Readable Card (MARC) - catalogação bibliográfica;
  • Dublin Core (DC) - dados sobre páginas da Web;
  • Consortium for the Interchange of Museum Information (CIMI) - informações sobre museus;
  • Meta Data Interchange Specification (MDIS) - padrão para troca de metadados entre ferramentas da Tecnologia de Informação;
  • Open Information Model (OIM) - conjunto de especificações para facilitar o compartilhamento e reuso no desenvolvimento de aplicações e data warehouse;
  • Common Warehouse Meta Model (CWM) - padrão para troca de informações entre esquemas de banco de dados e data warehouse.

Metadados de negócio é a descrição de dados necessários pelos usuários de negócio, para entender o contexto do negócio e o significado dos dados. Atualmente existem ferramentas só para efeito de documentação.

Quando metadados for rotineiramente usado para gerar regras de negócio executáveis, a definição de metadados será a representação de instruções de regra de negócio de acordo com o esquema de classificação que pode ser transformado em sistemas de informação do negócio.

6. Gestão de Metadados

Para iniciar o gerenciamento de metadados você precisa primeiro delimitar seu escopo de atuação. É muito difícil decidir quais metadados devem ser coletados e mantidos. Uma arquitetura de informação deve ser flexível para permitir um acréscimo ou decréscimo na quantidade de metadados à medida que novas necessidades surgem.

Há vários problemas ao lidar com metadados:

  • Metadados tomam uma variedade de formas, especializadas ou gerais;
  • Novos conjuntos de metadados irão ser criados à medida que a informação da rede fique mais madura;
  • Diferentes comunidades irão propor, projetar e ser responsáveis por diferentes tipos de metadados;
  • Existem muitos usuários de metadados;
  • Adoção de diferentes vocabulários de metadados significa aumento de buscas usando vocabulários de metadados que não são familiares.

As tarefas para criar um ambiente de gestão de metadados são:

  • definir requisitos para metadados que devem estar disponíveis para os usuários de dw;
  • desenvolver a arquitetura de gestão dos metadados do dw;
  • selecionar que ferramentas deveriam ser incorporadas na infra-estrutura de gestão de metadados;
  • desenvolver programas que integram e customizam as ferramentas selecionadas para atender as necessidades de gestão de metadados específicos da organização;
  • desenvolver e executar um programa de treinamento para os usuários de metadados do Data Warehouse.

O projeto de gestão de metadados é mais um problema de integração de sistemas do que um esforço de desenvolvimento de aplicações. Poucas organizações constroem suas próprias ferramentas de gestão de metadados.

CONCLUSÃO

Os metadados vão adquirir muito mais importância com o casamento da tecnologia Web e Data Warehousing. Esta união resultará em um único ponto de acesso para a informação do negócio através de um ‘browser’ de metadados seja na intranet, sistema operacional ou data warehouse. Os metadados se tornarão um componente crítico para qualquer arquitetura.

REFERÊNCIAS BIBLIOGRÁFICAS

BIEBER, Monty. Data warehousing in government. DM Review Magazine, v. 8, n.5, May 1998.

CALSAVARA, Alcides. Constructing highly-available distributed metainformation systems. Newcastle, 1996. Tese (Doutorado) - Department of Computing Science, University of Newcastle Upon Tyne.

AVIDSON, Scott. Knowledge management - an overview. DM Review Direct, v.1 n. 9, Nov. 1998.

DESIO, Vince. Informational Metadata. Disponível na Internet. http://www.datawarehouse.com/resources/articles/desio.htm. Sep. 1996.

DEXTER, Michael. Metadata: Data Warehouse key. Disponível na Internet. http://www.datawarehouse.com/resources/articles/dexter.htm. Oct. 1998.

INMON, William H. Enterprise meta data. DM Review Magazine, v. 8, n. 10, Nov. 1998.

MADSEN, M. S. et al. Metadata systems: integrative information technologies. Libri, v. 44, n. 3, p. 237-257, 1994.

MARCO, David. Managing Meta Data. DM Review Magazine, Mar. 1998.

MOODY, Daniel; WALSH, Peter. Information economics: measuring the value of information assets. In: AUSTRALIAN CONFERENCE ON SOFTWARE METRICS. Proceedings... Melbourne, 1996.

MORIATY, Terry. What is Metadata? Database Programming and Design, San Mateo, v. 10, n. 7, p. 57-59, July 1997.

PENNY, Paul. Knowledge management: maximizing the return on your intellectual assets. DM Review Magazine, v. 8, n. 10, Nov. 1998.

RIBEIRO, Gilberto Pessanha. Metadados geoespaciais digitais. In: WORKSHOP DE BANCOS DE DADOS NÃO CONVENCIONAIS, (2. : 1995 : Niterói) Anais... Niterói, 1995.

ROBERTSON, Paul. Integrating legacy systems with modern corporate applications. Communications of the ACM, New York, v. 40, n. 5, p. 39-46. May 1997.