Data Warehouse - Administração de Dados

Autor: Carlos Alberto Sowek

Em um artigo que fala sobre data warehousing são discutidas 5 idéias fundamentais para se ter sucesso com Data Warehouse:

  • Aplicativos Operacionais X Suporte a Decisão
  • Dados Primitivos X Derivados
  • Dados Históricos
  • Administração de Dados
  • Arquitetura do Sistema

Destas 5 idéias achamos importante ressaltar a que se refere à Administração de Dados, que é algo visto com pouca importância e às vezes deixada de lado, e que deve ser melhor avaliada pelas organizações, pois a existência dela torna-se fundamental na construção de um Data Warehouse.

ADMINISTRAÇÃO DE DADOS

Um obstáculo na utilização de administração de informações é a utilização e a qualidade da informação das aplicações existentes. A maioria das aplicações existentes são desenhadas para um propósito operacional específico, e administra os dados somente para este propósito. Diferentes aplicações, desenvolvidas em diferentes tempos, para diferentes propósitos operacionais, muitas vezes contêm dados que são inconsistentes ou redundantes com dados em outras aplicações. Elementos de dados com o mesmo nome podem ser definidos diferentemente. O mesmo elemento em dois sistemas diferentes pode ser armazenado com nomes diferentes. Em casos piores; múltiplos elementos de dados são, algumas vezes, embutidos no mesmo campo.

Ainda que o valor do dado nas empresas modernas seja bem documentado, a necessidade de administrar os dados da corporação não é geralmente reconhecida.

Em recentes artigos encontramos os seguintes comentários:

  • Muitos administradores não percebem a qualidade do dado que eles usam. Qualidade ruim parece ser normal, mais do que uma exceção, e eles têm largamente ignorado o uso da qualidade;
  • Qualidade ruim do dado pode causar imediatamente danos econômicos e tem outros indiretos e sutis efeitos;

Administração de Dados é o meio para administrar a qualidade dos dados corporativos. Isto envolve especificar responsabilidades específicas:

  • Identificar e administrar "data proponency": Um "data proponent" é a pessoa que é responsável pela qualidade de uma coleção de elementos de dados conhecidos.. Usualmente o "data proponent" é um membro chave do staff no grupo de responsáveis pelos processos da organização onde o dado é originado. Por exemplo; o analista chave de recursos humanos pode ser o "data proponent" para o dado empregado. Se existe um problema com qualidade do dado empregado, o analista de recursos humanos deverá ser a pessoa que encontre o problema e corrija-o. Para cada elemento de dado, administradores de dados identificam de onde o elemento é originado e qual é o "data proponent".
  • Estabelecer padrões de administração de dados, políticas e procedimentos: Administradores de Dados estabelecem as diretrizes para gerenciar os recursos dos dados corporativos. Estas diretrizes incluem padrões para definir elementos de dados, modelagem de dados e política para particionar dados com diferentes grupos dentro e fora da organização. Estas responsabilidades, incluem estabelecimento de padrões para definição e uso do dado, coordenação e aprovação de modelo de dados, participando no esforço de correção do dado, desenvolvimento de medidas para qualidade dos dados e melhoria dos processos que geram consistentemente qualidade ruim dos dados.
  • Coordenar e aprovar modelo de dados: Administradores de dados revisam modelos de dados criados na análise do negócio e desenvolvimento de sistemas para assegurar que o modelo esteja em conformidade com padrões de administração de dados, políticas e procedimentos. Como parte da revisão do modelo de dados, os administradores de dados asseguram que cada elemento de dado está apropriadamente definido. Uma lista parcial dos itens requeridos para definir alguns elementos de dados deverá incluir uma concisa e precisa descrição verbal. O domínio do elemento (intervalo dos valores possíveis válidos), e a fonte do elemento (que sistema é entrada para, ou de qual provedor externo).

Isto é muito importante para distinguir Administradores de Dados (AD) de administradores de banco de dados. Administradores de dados são orientados a negócio, focando nos meios e uso do dado. Administradores de Banco de Dados (DBA´s) são tecnicamente orientados, e estão preocupados com a confiabilidade, integridade e performance das aplicações de banco de dados. Enquanto o DBA tipicamente corrige erros das aplicações para resolver problemas de processamento do banco de dados, um AD tipicamente trata com problemas do negócio, verifica valores de dados incorretos ou uso inválido dos dados ou mal interpretação dos mesmos.

Um Data Warehouse é um sistema para administradores de dados. Data Warehouse provém um sistema que administradores de dados podem usar para administrar e melhorar os dados. A menos que seja guiado pelos princípios e técnicas de administração de dados, o data warehouse não deverá ser uma fonte de informações verdadeiras.

Parte do esforço para obter sucesso em data warehousing é um programa de treinamento em administração de dados, assegurando que todos os participantes entendam e suportem os objetivos da qualidade dos dados, e que a administração deve assinalar os "data proponent" e deve ir fundo para ressaltar melhor a qualidade dos dados nas aplicações.

A intenção com este artigo não é de definir as tarefas nem de estabelecer quem deve fazê-las e que maneira, pois cada organização tem seus critérios e suas políticas para implementá-las. O que colocamos é um alerta no sentido de que existe a necessidade de que os papeis de AD existam e sejam exercidos efetivamente dentro da organização e dentro de certos princípios de qualidade, pois de nada serve ter respostas rápidas e de formato agradável se a pessoa que toma decisões não confia nos dados ou não sabe qual a fonte dos mesmos.

Como o termo AD está um pouco em desuso, algumas organizações fazem o uso do termo ARI (Administração de Recursos para Informação) que abrange não só o aspecto do dado como da tecnologia do dado, isto é, preocupa se em prover maneiras eficientes de gerenciar, acessar, manipular e distribuir os dados existentes nos vários ambientes/plataformas da organização.

REFERÊNCIA BIBLIOGRÁFICA

LAMBERT, Bod. Data Warehousing fundamentals: What you Need to Succeed. Disponível na Internet. http://www.data-warehouse.com/resource/articles/lamb8.htm. 30 nov. 1996.