Implementação da Gestão Operacional de Pequena e Média Plataformas com Eficiência e Baixo Custo

Autor: Flávio Luis de Oliveira, Hélio Hamilton Sartorato, e Yuri Damasceno Schultz

 

O desenvolvimento de ferramentas e metodologia próprias para gestão de ambiente operacional como alternativa à aquisição de soluções já existentes no mercado é um caminho para resolver problemas operacionais que alia customização e confiabilidade a baixo custo em serviços de informática pública.

1. Introdução

O objetivo deste trabalho é apresentar um estudo de caso sobre a experiência da implementação de monitoramento e gestão do ambiente operacional na Companhia de Informática do Paraná, através do remanejamento e melhoria de estrutura já existente, tendo como focos principais a ótima qualidade de serviços e o baixo custo.

2. A Celepar

A Companhia de Informática do Paraná - CELEPAR é uma sociedade de economia mista, criada em novembro de 1964, sendo a primeira empresa de informática pública do país. Atua no desenvolvimento de sistemas e soluções corporativas e de tecnologia da informação específicas para cada área do governo, integrando o Governo do Estado do Paraná no parque corporativo de informática, com 160 servidores hospedando sistemas que dão acesso a bancos de dados com informações do Estado e de serviços prestados ao cidadão.

2.1. O Datacenter

A Divisão de Operações é o setor responsável por manter o Datacenter da Celepar em regime de operação 24x365 (24 horas por dia, 365 dias por ano). No início do ano de 2001, o Datacenter era composto por 40 servidores e um Mainframe Fujitsu. O ambiente cresceu rapidamente e hoje, além do Mainframe Fujitsu e um IBM em fase de instalação, conta com 160 servidores em diferentes arquiteturas com sistemas operacionais Windows2000, NT, Solaris, HP-UX, IBM-AIX, FreeBSD e diversas distribuições de Linux. Associada a esta estrutura está uma solução de armazenamento da EMC2 com capacidade de 2TB, onde são mantidas as principais bases de dados corporativas do Estado do Paraná. Completa este ambiente um pool de impressoras com capacidade de 17.500 páginas por hora.

Os equipamentos são hospedados em ambiente com temperatura controlada e portas de segurança. A continuidade das operações é garantida por um sistema de no-break formado por um banco de baterias capazes de suprir energia por, pelo menos, 30 minutos ao Datacenter, as quais são alimentadas por um gerador a diesel, podendo manter os equipamentos operacionais, na ausência da rede elétrica, o tempo que for necessário.

3. O Grupo GOPMP

A fim de implementar soluções de monitoramento centralizado dos servidores e aplicações, surgiu, em março de 2003, o grupo GOPMP ou Gestão Operacional de Pequena e Média Plataforma. O grupo foi criado a partir de recursos humanos da Divisão de Operações sob a coordenação de um analista de informática, e tem os seguintes objetivos:

- Manter uma base de dados de informações sobre os equipamentos instalados, visando um rápido atendimento das ocorrências e a conseqüente diminuição do tempo de indisponibilidade;

- Desenvolver e implementar ferramentas de monitoramento e gestão para todas as plataformas envolvidas;

- Desenvolver e implementar normas para execução de procedimentos operacionais nas plataformas envolvidas.

4. Desenvolvendo Ferramentas Próprias

A utilização de ferramentas de software próprias e customizadas permite uma maior aproximação das necessidades do ambiente, além de não possuir custos de aquisição e manutenção.

O início dos trabalhos no monitoramento do ambiente operacional foi através da utilização de ferramentas freeware e shareware disponíveis no mercado. Durante a utilização foi possível verificar que as ferramentas analisadas, apesar de possuírem uma funcionalidade adequada para o uso em monitoramento de servidores, geralmente não possibilitavam uma maior customização para atender à demanda do ambiente. Esta necessidade justificou o início do desenvolvimento do CelDisp (Celepar Disponibilidade de Servidores e Serviços). Em três meses estava pronta a primeira versão. Atendendo todas as expectativas dos operadores com relação ao teste de portas lógicas e de páginas web pré-defindas, analisando o conteúdo de retorno, além de permitir ajustes nos intervalos de timeout e repetição dos testes, o CelDisp tornou-se a ferramenta oficial de monitoramento, conforme Figura 1.

O CelDisp opera de forma descentralizada, gravando seus dados no banco de dados do GOPMP, permitindo a utilização destas informações por outros aplicativos, entre eles o CelConsole, uma página web dinâmica atualizada a cada dez segundos, trazendo do banco de dados as informações de disponibilidade dos servidores, conforme Figura 2. Isto permite uma rápida ação dos técnicos da Divisão de Operações em caso de falhas, e possibilita monitorar a disponibilidade do ambiente fora do Datacenter através do browser, proporcionando, por exemplo, uma visão de negócio por parte da gerência e diretoria.

Como o CelDisp e o CelConsole tiveram grande impacto na redução do tempo de atendimento aos serviços faltosos, o próximo passo seria a criação de uma ferramenta que permitisse antever o surgimento dos problemas, possibilitando a sua prevenção. Teve início então o desenvolvimento do CelMonitor (Celepar Monitoramento de Performance), ferramenta composta de um servidor centralizador de informações e agentes instalados nos servidores, responsáveis por obter informações de utilização de processador, memória, discos rígidos e outros dispositivos. Atualmente o agente atende apenas o ambiente Windows, e o desenvolvimento para outras plataformas será iniciado em breve. Através dos relatórios do CelMonitor é possível detectar melhor os “picos” e os “vales” no processamento dos serviços e fornecer subsídios para outros setores atuarem em melhoria de equipamentos ou reaproveitamento de recursos pouco utilizados. Assim como o CelDisp, o CelMonitor também é descentralizado e armazena informações no banco de dados do GOPMP, permitindo que suas análises de hardware estejam da mesma forma disponíveis no CelConsole.

Outro problema enfrentado pela equipe do ambiente operacional era o telefone. No momento em que caíam serviços, os técnicos da operação tinham de dividir-se em prestar o suporte para o reestabelecimento dos sistemas e o suprimento de informações para a Central de Atendimento ao Cliente (CAC), muitas vezes passando e recebendo informações truncadas, pela própria deficiência do meio telefônico. Para minimizar o problema e agilizar o contato e a passagem de informação para os analistas do suporte de segundo nível, foi desenvolvida uma ferramenta de console de mensagens chamada CelMessage (Celepar Serviço de Mensagens Urgentes), já disponível nas estações de trabalho dos técnicos do ambiente operacional, Central de Atendimento a Clientes e analistas da Gerência de Tecnologia da Informação, bem como chefes e gerentes envolvidos. O CelMessage possibilita uma comunicação global rápida e eficiente, trazendo informação atualizada, clara e disponível para todos os usuários, conforme Figura 3. As mensagens do CelMessage ficam registradas no banco de dados do GOPMP, permitindo uma consulta das ocorrências do ambiente através do acesso ao portal de monitoramento.

Para consolidar os serviços oferecidos pelo GOPMP e servir como um concentrador de informações do Datacenter Celepar, foi desenvolvido e está sendo aprimorado um Portal de Monitoramento que, além do CelConsole e do CelMonitor, presta diversos serviços referentes aos servidores, como geração de relatórios e gráficos do monitoramento de performance, realização de buscas e cadastramento de informações, impressão de etiquetas de identificação, acesso ao histórico de mensagens do CelMessage e inclusão de documentos digitais referentes aos servidores, entre outras tarefas integradas pelo banco de dados do GOPMP. Este Portal, mostrado na Figura 4, está sendo desenvolvido em ambiente de software livre, atendendo a atual meta do Governo do Estado do Paraná.

5. A Importância de um Cadastro Fiel de Servidores e Serviços

Nenhuma das ferramentas desenvolvidas tem sentido se não for mantida uma base de dados confiável sobre os servidores e serviços instalados no Datacenter. Por isso, a constante atualização das informações do cadastro de servidores integrado com o banco de dados do GOPMP é vital para o funcionamento dos aplicativos. Se, por exemplo, altera-se um endereço IP em um servidor e esta alteração não é executada no cadastro do servidor, as ferramentas de performance e disponibilidade atuantes naquele servidor deixarão de atuar ou reportarão informações errôneas. Para minimizar estes problemas e seguindo as implementações existentes em ferramentas de monitoramento de uso comercial, está previsto para o futuro o desenvolvimento do CelInvent, também integrado com o banco GOPMP que fornecerá e manterá atualizadas informações sobre o inventário dos servidores, detectando inclusive alterações em hardware ou software. É claro que esta ferramenta não poderá monitorar dados igualmente importantes mas que devem ser entrados manualmente, como números de telefone ou nome do contato no cliente, que também compõem cadastro de servidores.

6. Normatização de Procedimentos

A criação de procedimentos normatizados para o Datacenter é a garantia de que a execução das diferentes tarefas será feita sempre da mesma forma e com qualidade nos quatro diferentes turnos de operação. Estas normas devem atender todas as possibilidades, desde tarefas simples como o check list de todos os passos na entrada e saída de servidores no ambiente, até a forma de interação com a CAC e acionamento do suporte de segundo nível, no caso de ocorrências não solucionadas pela Divisão de Operações. A criação de cada procedimento traz consigo amplos e “acalorados” debates entre as áreas envolvidas, mas também oferece a oportunidade de eliminar pontos de falha em tarefas rotineiras que não evoluíram seus procedimentos com o tempo. Para facilitar sua execução e compreensão, alguns procedimentos são criados na forma de fluxogramas, com as etapas do processo envolvido, conforme apresentado na Figura 5.

7. Resultados Obtidos e Planos para o Futuro

Mesmo com o pouco tempo de existência do grupo GOPMP e das ferramentas desenvolvidas, foi possível verificar uma melhora significativa nas estatísticas de disponibilidade dos servidores e serviços, obtendo-se como resultado, para o mês de agosto de 2003, por exemplo, uma disponibilidade média do ambiente da ordem de 99,73%, como mostra a Figura 6.

Muito existe ainda para ser feito, e dentre as metas para o futuro no monitoramento do ambiente operacional estão, além dos já citados, o monitoramento de serviços em ambiente Mainframe, o monitoramento de sites remotos, permitindo a atuação das ferramentas de monitoramento em ambientes fora do Datacenter Celepar e integração das ferramentas existentes com sistemas antivírus, IDS e firewall.

8. Referências

1. HOSPEDAGEM de servidores PROCERGS. Disponível em: <http://www.hsp.procergs.com.br>. Acesso em: mar. 2003.

2. MSDN. Disponível em: <http://jakarta.apache.org>. Acesso em: mar. 2003.

3. THE APACHE jakarta project. Disponível em:
<http://jakarta.apache.org>. Acesso em: mar. 2003.

4. THE SOURCE for java technology. Disponível em:
<http://javasoft.com/>. Acesso em: mar. 2003.