Além da gerência de ativos de TI: uma visão de negócio

Por: opservices em 03.11.2013

Gerenciamento de ativos de TI – outras aplicações

Quando houve o acidente com o reator nuclear de Fukushima no Japão, alguém começou a mostrar gráficos de forma (quase) real time sobre os níveis de radiação do reator de forma pública. O que chamou nossa atenção foi que os dados sobre os níveis de radiação eram monitorados pela plataforma Nagios que por sua vez obtinha os dados de radiação da Tokyo Metropolitan Institute of Public Health (clique aqui para saber a estória toda) e os plotava usando os recursos nativos da plataforma Nagios.

Usualmente, a plataforma Nagios, é utilizada para monitorar ativos de TI e ao lembrar desta forma não-usual de monitoração, percebi o quanto já utilizamos o OpMon, plataforma de gerenciamento de TI desenvolvido pela OpServices, para a monitoração de itens que vão além dos ativos de TI. Esse tipo de monitoração, muitas vezes, consegue disponibilizar informações vitais para o negócio das empresas de forma eficaz e muito rápida.

 
Topologia de Rede - Gerenciamento de TI

 

Gerência de Ativos de TI com o OpMon

Busquei alguns cases do uso do OpMon para realizar este tipo de checagem e aqui vão alguns exemplos de como se pode utilizar o OpMon para obter informações importantes sobre a saúde do negócio de sua empresa.

Um dos primeiros cases deste tipo foi uma solicitação de uma indústria de calçados que necessitava monitorar a chegada das ordens de produção até as máquinas injetoras de plástico. Não conhecendo nada do processo fabril, tivemos que entender um pouco mais do problema do cliente e na ocasião, nos foi explicado que quando uma injetora de plástico, por alguma razão, não recebe a programação na hora certa, ela deixa de produzir (o que por si só já representa algum prejuízo financeiro) ou mesmo que esta injetora pode travar e necessita de horas para ser limpa novamente e disponibilizada para a produção novamente. O que o gestor da linha de produção necessitava era saber se as ordens de produção estavam disponíveis para serem carregadas nas injetoras no momento certo, ordens de produção que por sua vez, eram geradas no ERP da empresa.

 

O desafio da gerência de ativos de TI

O desafio neste caso era checar se os arquivos de programação estavam disponíveis na hora certa para serem carregados nas injetoras. A solução não foi trivial, mas conseguimos, com a ajuda do cliente, monitorar corretamente a chegada das ordens e avisar, com antecedência ao gestor das máquinas, quando uma ordem estava com problemas e este poder acionar procedimentos manuais de carga na injetora. Uma solução que com certeza não se encontraria em um pacote de gerência de redes tradicional, pois é preciso entender a fundo o problema do cliente e propor uma solução criativa e funcional.

Outra grande indústria tinha um problema sério quando uma das catracas eletrônicas de entrada e saída de uma das fábricas deixava de funcionar. Com um número de mais de 20.000 operários, a entrada e saída de pessoas aos finais de turnos e em horários de almoço, era um gargalo sério na operação fabril. Imagine um “engarrafamento” de pessoas esperando para sair e outro tanto esperando para entrar na área fabril da empresa quando havia um problema. O custo da indisponibilidade para a empresa era muito alto.

Felizmente as catracas eletrônicas estavam ligadas na rede e assim foi possível monitorá-las e em caso de problemas, um técnico era rapidamente enviado para substituir a catraca defeituosa. Com isto, além de utilizar o OpMon para gerar alarmes de indisponibilidade, foi possível obter dados históricos sobre a qualidade das catracas e assim exigir do fabricante uma melhor qualidade dos equipamentos.

 

Descobrindo surpresas

Um de nossos clientes também havia inaugurado um site backup de contingência para seu data center. Este site backup possuía um gerador a diesel que era acionado automaticamente em caso de interrupção no fornecimento de energia pela concessionária. Os testes com o sistema de contingenciamento foram todos efetuados a contento, mas, um certo dia, houve uma interrupção no fornecimento de energia e o site backup foi acionado. O gerador a diesel foi acionado, funcionou por algum tempo e depois se desligou sem motivo aparente. Uma investigação posterior mostrou que o gerador havia se desativado por falta de diesel em seus tanques de combustível.

Por alguma razão, alguém havia retirado o diesel do gerador. Este cliente nos solicitou que o nível de combustível no tanque pudesse ser monitorado e um alarme fosse gerado quando este baixasse de um determinado nível. A solução encontrada, desenvolvida em parceria com o engenheiro responsável pelo sistema, foi a criação de um plugin que monitorasse um PC (com uma solução proprietária) que armazenava os dados sobre o nível de combustível do gerador, bem como outras informações relativas a alimentação de energia, temperatura da sala-cofre e até mesmo informações sobre quando a porta da sala-cofre era aberta e novamente fechada.

 
Gerência de ativos de TI

 

Problemas de energia

Na mesma linha, outro cliente teve um problema de falta de energia por parte da concessionária e neste caso os servidores passaram a utilizar automaticamente suas UPS (no-breaks). O problema nesta caso foi de que o gerador não funcionou adequadamente e as baterias das UPS esgotaram-se, causando uma queda não controlada dos servidores. O resultado foi que diversas bases de dados e arquivos acabaram corrompidos, causando um grande prejuízo financeiro na operação da empresa pela interrupção dos serviços de TI pela indisponibilidade dos mesmos.

A solução encontrada foi a monitoração das UPS de forma a sinalizar quando a bateria das mesmas estivesse em estado crítico e o OpMon disparasse uma ação (event handler) em cada servidor para que estes fossem desligados de forma controlada, evitando assim a corrupção de arquivos e bases de dados.

Outra solução criada para atender requisitos de monitoração de segurança física, foi a necessidade de um cliente de integrar alarmes de monitoração de vídeos em seu data center. Este cliente gostaria de receber alarmes com um vídeo, identificando quem havia entrado em seu data-center e por onde esta pessoa havia circulado. Além disso, era importante manter um registro com as imagens de entrada e saída de pessoal para fins de auditoria.

Com a disponibilidade no mercado de equipamentos de vídeo IP mais baratos e com a funcionalidade destas câmeras de vídeo poderem enviar alarmes quando detectam movimentos, foi possível criar uma integração com a plataforma OpMon de forma a gerar um alarme e enviar uma amostra de vídeo com imagens de quem, quando e no que este pessoa havia mexido no data-center. Ao receber o alarme, um hiperlink permite ao operador rapidamente visualizar quem está no data-center diretamente através da interface do OpMon, sem a necessidade de possuir um custoso sistema paralelo de monitoração de vídeo vigilância.

 
O mercado de distribuidoras de energia no Brasil é fortemente regulado pela Agência Nacional de Energia Elétrica (ANEEL). Esta agência possui mecanismos rigorosos de punições as distribuidoras que não atinjam metas pré-estabelecidas de eficiência na prestação de serviços aos consumidores. Por exemplo, quando ocorre um fenômeno climático em uma determinada região, existe um aumento significativo de ocorrências reportadas ao call-center da distribuidora daquela região. Isto é absolutamente normal, porém, as distribuidoras de energia devem ser capazes de atender e registrar todas as solicitações de seus consumidores em um tempo mínimo determinado pelas regras da ANEEL.

Caso ela não consiga atingir as metas de atendimento estabelecidas, pesadas multas são aplicadas. Pois bem, um de nossos clientes gostaria de obter indicadores de disponibilidade e de tempo de resposta de suas aplicações em tempo real, especialmente quando da ocorrência de fenômenos climáticos. A solução foi a criação de um dashboard executivo no OpMon que mostra os tempo de resposta dos aplicativos utilizados pelas equipes de call-center para o registro e dispatch das ocorrências, tudo isto em tempo real.

O resultado foi a disponibilização em um telão do comportamento destas aplicações, além da disponibilização dos mesmos na intranet da empresa. Assim, os gestores do negócio podem visualizar e tomar ações corretivas de forma imediata e não baseados em dados históricos, quando nenhuma ação corretiva poderia ser tomada e implicaria em um prejuízo financeiro palpável.

Estes são apenas uns poucos exemplos de informações vitais para o negócio de qualquer empresa ou segmento e que podem ser monitoradas pela plataforma OpMon, indo além da mera monitoração de ativos de TI. Uma das perguntas que mais gostamos de ouvir na OpServices é justamente aquela que usualmente traz maiores retornos para nossos clientes: “Será que não daria para monitorar aquele ….”

Dario Bestetti – CEO OpServices

Compartilhe:

Facebook
Twitter
LinkedIn
Instagram

JUNTE-SE À NOSSA LISTA E RECEBA
OS NOSSOS CONTEÚDOS.

Entre para nossa lista e receba conteúdos exclusivos