
A monitoração da infraestrutura de TI já é uma atividade consolidada dentro da área de tecnologia. Profissionais especializados em infraestrutura buscam ferramentas para simplificar a descoberta dos problemas e incidentes que podem indisponibilizar aplicações e até a operação da empresa.
Para se precaver destes problemas, existem diversas soluções focadas em monitorar real-time a saúde do ambiente. Essas ferramentas se conectam à rede corporativa para emitir alertas assim que ocorrer algum problema, proporcionando maior agilidade na resposta da equipe de tecnologia.
Entretanto, a grande maioria das ferramentas não notifica a causa raiz dos problemas, pois não possuem a capacidade de estruturar de forma hierárquica, por exemplo, todos os elementos de tecnologia que sustentam uma aplicação.
E é sobre isso que vamos abordar neste artigo: monitoramento de causa raiz. Acompanhe o post e entenda como aumentar a maturidade da gestão de TI com este modelo de monitoração.
Monitoramento de Causa Raiz na Prática
Para entender melhor a causa raiz de um problema podemos analisar como funciona a monitoração tradicional. As ferramenta de monitoramento se conectam aos equipamentos via algum protocolo, como o SNMP, e começam a monitorar CPU, Memória e Disco de um servidor, por exemplo. Caso esse equipamento fique indisponível, isso será notificado pela plataforma.
E é exatamente aí que começa o problema, pois o monitoramento deveria estar ligado à monitoração do negócio e não focar nos elementos de tecnologia. E com isso não queremos dizer que este servidor não deveria ser monitorado, mas sim que o foco da monitoração deveria ser o que gera impacto na operação da empresa.
Por exemplo, para que a área financeira possa processar pedidos e emitir notas fiscais é importante um adequado funcionamento do ERP da empresa. Para que ele funcione adequadamente é preciso que seja suportado por um banco de dados, um servidor, que a conexão com a Internet esteja funcionando, entre diversos outros elementos.
Toda essa estrutura pode ser hierarquizada por plataformas mais poderosas, que agregam maior valor à monitoração, permitindo que a notificação de indisponibilidade do ERP possa identificar exatamente qual elemento da estrutura causou essa indisponibilidade. Além disso, ao monitorar o tempo de resposta, pode-se identificar qual componente está causando o gargalo na performance.
No exemplo abaixo você pode ver uma estrutura de mapa de dependências construída no software OpMon e que permite a descoberta da causa raiz dos problemas:
Na interface do OpMon também é possível adicionar o custo/hora do não funcionamento de um equipamento ou de uma aplicação crítica. Isso permite mensurar qualquer custo de parada e calcular a viabilidade de montar uma estrutura focada em alta disponibilidade.
A técnica dos 5 Porquês
Além da camada de software, que pode ser automatizada, existem algumas metodologias que permitem tratar o problema depois que ele foi mapeado. Uma delas é a técnica dos 5 porquês, desenvolvida no Japão e que serve para detectar a principal causa de um defeito ou problema. Veja o exemplo abaixo:
Problema: Produto com defeito
POR QUE o produto apresentou defeito? Porque houve problemas na fabricação.
POR QUE houve problemas? Porque a máquina apresentou defeito.
POR QUE a máquina apresentou defeito? Por falta de manutenção.
POR QUE não foi realizada manutenção? Porque o responsável não sabia sobre os cuidados necessários que deveria tomar com a máquina.
POR QUE não sabia? Porque seu gerente não passou as instruções.
Conclusão
Por possuirmos quase 20 anos de experiência monitorando ambientes complexos, podemos afirmar categoricamente que monitorar ambientes de TI é uma atividade complexa e que envolve comprometimento do time interno e dos fornecedores. É um processo que exige maturidade e não é construído do dia para a noite. Mas traz resultados comprováveis.
Um passo importante para evoluir na maturidade da área de infraestrutura e TI é a monitoração do negócio e a estruturação das dependências em catálogos de serviços ou mapa de dependências.
Caso você deseje evoluir a monitoração da sua empresa, para descobrir a causa raiz dos problemas, não deixe de entrar em contato com nossos especialistas. Estamos à disposição para fornecer software e serviços nesta área.