MTTR e MTBF, o que são e quais suas diferenças?

Por: opservices em 18.08.2015
o que é MTTR e MTBF

Dois dos principais indicadores de performance em vários setores são o MTTR e MTBF. Então, vamos conhecer a fundo quais são suas principais características e como monitorá-los para aperfeiçoar os resultados das organizações.

Você, como gestor da área de TI ou industrial, é exigido para alcançar as metas? Certamente sim. E, para atingi-las, é importante fiscalizar de perto os indicadores. Descubra neste artigo quais as diferenças entre essas duas métricas e como elas podem ser usadas para melhorar a eficiência dos processos em sua empresa!

 

O que são MTBF e MTTR?

MTBF (mean time between failures ou tempo médio entre falhas) e MTTR (mean time to repair ou tempo médio para reparo) são dois indicadores relacionado à disponibilidade de uma aplicação. Apesar de sua relevância no desempenho de processos, muitos gestores subutilizam esses indicadores de desempenho (KPIs) em suas atividades de controle.

O MTBF é a métrica que se refere à média de tempo transcorrido entre uma irregularidade e o próximo lapso. Essas falhas de tempo podem ser prognosticadas por meio de uma fórmula. Já o indicador de MTTR refere-se ao prazo médio que demora para realizar uma correção depois da eventualidade, o erro. Ou seja, é o tempo gasto durante a intervenção em um determinado processo.

Os dois índices são empregados como base referencial para tomar decisões nas organizações. O objetivo de uma operação é sempre aumentar o MTBF e diminuir o MTTR.

 

A diferença de MTTR e MTBF

Vale salientar que estamos lidando com instalações, sistemas, processos ou equipamentos que possam ser reparados. Caso nos referíssemos a algo irreparável, o KPI exato seria MTTF (tempo médio para falhas ou mean time to failure).

Diferenciar esses conceitos é essencial para empresas de todos os segmentos, especialmente as que trabalham com ambientes de alta disponibilidade nas quais as falhas podem gerar grandes prejuízos com vendas não concretizadas ou com perda de confiança na entrega dos serviços.

 

As duas fórmulas

Diferenças conceituais, fórmulas distintas! Veja as formas de cálculo de MTBF e MTTR:

 

MTBF

São os períodos de tempo que se perdem na operação de uma máquina, e sua média pode ser realizada por meio de uma fórmula. Devemos aplicar o tempo total do desempenho natural durante um ciclo preestabelecido sob o número de erros ocorridos durante esse tempo. Veja a fórmula: MTBF = (Tempo total disponível – Tempo perdido) / (Número de paradas)

 
Exemplo – Ao longo de um determinado período disponível para atuar, foi notado:

período integral disponível para operar = 24 horas

aconteceram 3 paralisações a cada uma delas: 1 hora, 2 horas e 30 minutos (0,5 horas)

MTBF = [24 – (1 + 2 + 0,5)] / 3 = 6,8333 horas ou 410 minutos

Tendo essa conclusão, pode-se criar estratégias para enfrentar um problema paulatinamente associado ao equipamento.

 

MTTR

O MTTR é calculado aplicando a média de tempo que demora para desempenhar uma reparação após o episódio da falha. Veja a fórmula: MTTR = (Tempo total de reparo) / (quantidade de falhas)

Caso use o exemplo acima, deverá obter a seguinte solução:

MTTR = (1 + 2 + 0,5) / 3 = 1,1666 horas ou 70 minutos

Essa solução estabelece o tempo médio que o aparelho ficou parado. Gerando uma relação com os dois índices, pode-se concluir que, a cada 2 horas, o programa se encontrará indisponível por 15 minutos. Quanto menor o MTTR, mais eficiente é a equipe de manutenção.

 
MTTR e MTBF | Relatórios OpMon

 

Cálculo do tempo de disponibilidade

O cálculo da disponibilidade envolve MTTR e MTBF. Podemos chegar ao tempo de disponibilidade de um sistema, por exemplo, utilizando esses 2 KPIs. Vamos à fórmula:

disponibilidade = MTBF/(MTBF + MTTR)

Para ficar mais claro, nada melhor do que um exemplo prático. Imagine a seguinte situação:

A. Tempo em que o sistema deveria trabalhar: 36 horas
B. Tempo total em que o sistema não está funcionando: 24 horas
C. Tempo no qual o sistema esteve disponível: 12 horas
D. Ao total ocorreram 4 falhas no sistema.

disponibilidade: (A-B/D) / [(A-B/D) + (B/D)] = (36-24/4) / [(36-24/4) + (24/4)] = 3 / 9 = 33%

 

Benefícios no uso desses indicadores de performance

MTTR e MTBF são dois indicadores usados há mais de 60 anos como pontos de referência para a tomada de decisões. Enquanto o MTBF mede a confiabilidade de um sistema, o MTTR aponta a eficácia da ação reparadora. Tendo o controle dos dois indicadores e sendo monitorados de perto, pode-se estabelecer o que necessita de mais atenção.

Se o MTBF aumentou após um processo de manutenção preventiva, isso indica uma clara melhoria na qualidade de seus processos e, provavelmente, em seu produto final, o que trará maior credibilidade à sua marca e confiança em seus produtos. Logo, o aumento do MTBF que mostrará que seus métodos de manutenção ou verificação estão sendo bem executados, um verdadeiro norte para as equipes de suporte!

Já no caso do MTTR, o esforço deve ser exatamente o contrário: reduzi-lo ao máximo para evitar a perda de produtividade por indisponibilidade de sistemas. Um menor tempo médio de reparo indica que sua empresa terá respostas rápidas para problemas em seus processos, o que demonstra alto grau de eficiência!

 

Implantação e acompanhamento dos dois indicadores

Com o acompanhamento dos indicadores de tempo médio entre as falhas e tempo médio para reparo consegue-se aumentar a cultura da empresa sobre seus procedimentos. Isso é particularmente crítico em um contexto no qual as equipes de manutenção necessitam se manter reduzidas e são formadas por colaboradores que se oferecem a várias áreas simultaneamente.

Logo após indicar uma frequência otimizada para trabalhar os dois indicadores, inicie a implantação das seguintes etapas:

  • identificação da falha — com o relatório, pode-se notar as ocorrências por padrão de falha e o impacto em tempo da pausa para esses casos. Dessa forma, consegue-se restringir a classe de problema e reconhecer se ele refere-se a alguma parte específica que pode ter adversidade;
  • diminuição do downtime — nesse instante, você sabe qual componente traz mais impasses para corrigi-lo;
  • elabore um processo de manutenção preditiva — não pratique a falha de sempre executar manutenções corretivas sem conseguir compreender a razão do problema.

Classificar as condições desses dispositivos exige uma tarefa detalhada de análise e coleta de informações dos segmentos monitorados, introduzindo nesse contexto a manutenção preditiva como instrumento primordial.

Como pode ser percebido, MTTR e MTBF são dois indicadores de performance poderosos e que devem ser utilizados para ampliar o conhecimento da empresa sobre seus processos e reduzir perdas de produtividade ou qualidade nos produtos oferecidos.

 

Relatórios do OpMon

 

Quais indicadores podem ser analisados em conjunto?

Esse desafio pode ser reduzido com a adoção de uma sequência de passos que tragam informações relevantes e confiáveis em tempo real. Vamos a eles:

  • identificação da falha: podemos recorrer ao histórico de falhas do equipamento e conversar com a operação para investigar a causa. Isso é eficaz? Infelizmente esse tipo de dado não possui a confiabilidade suficiente para chegarmos à raiz do problema, principalmente se você depender de dados coletados manualmente e da memória das pessoas;
  • eliminação da causa raiz e recorrência: com os dados compilados em um relatório que traga para um dado período, o número de ocorrências por tipo de falha e o impacto em tempo de parada para essas ocorrências, o gestor tem a oportunidade de afunilar o problema a um grupo de componentes e depois até a um componente que está causando todo o problema;
  • gestão da manutenção preventiva: o próximo passo para a excelência em manutenção é sistematizar esse processo. Já concebemos o fluxo conceitual desse método e somente com a automação da etapa de coleta e compilação dos dados será possível você ter diversas visões do sistema.

Em resumo, os indicadores de performance (MTTR e MTBF) devem servir como referência para tomada de decisão. O papel como gestor é de olhar para essas métricas e perceber a razão de estarem sendo expostos.

 

Software para monitoramento de MTTR e MTBF

Para monitorar tanto o MTTR quanto o MTBF é preciso utilizar algum tipo de software para o monitoramento de infraestrutura. A partir da disponibilidade do ambiente gerenciado é possível medir o tempo médio entre as falhas e o tempo médio para reparo. Todas as indisponibilidades são alertadas na plataforma com a possibilidade de gerar relatórios para medir MTTR/MTBF.

 
Como desenvolvedores do OpMon, solução para monitoramento de infraestrutura de TI e processos de negócios, sempre a indicamos caso o cliente deseje medir esse tipo de indicador, além é claro de todo o seu parque tecnológico. Caso tenha interesse, clique no botão abaixo:

 

Conheça o OpMon e monitore a sua infraestrutura de TI

 
Com funcionalidades vastas, envolvendo gráficos real-time, dashboards, relatórios pré-configurados e visões de hierarquia de serviços, o OpMon ajuda sua empresa a monitorar não só o MTBF e MTTR como diversos outros. Permite o monitoramento do ciclo de vida completo da infraestrutura e da gestão de desempenho.

Além disso, permite a construção e compartilhamento de dashboards visualmente incríveis e auxilia no acompanhamento de KPIs estratégicos e operacionais para assegurar o acompanhamento dos resultados da organização. Não interessa se o objetivo da instituição seja estratégico, operacional, ou ambos, a decisão é ofertar funcionalidades de gestão do desempenho flexíveis e competitivas.

 
Demonstração Online | OpMon

 

Conclusão

O MTBF refere-se essencialmente à credibilidade de um sistema, e o MTTR à efetividade nas operações corretivas do sistema. Por exemplo, se o MTBF está despencando após uma operação, isso deve apontar alguma falha no processo de manutenção. A nossa meta é transformar o MTBF o maior possível.

Já com o MTTR, o estímulo deve ser completamente o contrário, minimizando-o o máximo possível. Isso significa que a sua empresa tem soluções e intervenções rápidas, levando o sistema a ter mais produtividade.

 
Ainda em dúvida sobre esses dois referenciais? Continue navegando em nosso blog para saber mais sobre assuntos de tecnologia e não se esqueça de compartilhar esse artigo com seus colegas de trabalho. Para saber mais sobre o cálculo de disponibilidade, leia o nosso artigo sobre os custos de um downtime ou sobre como funciona uma estrutura de NOC.

Compartilhe:

Facebook
Twitter
LinkedIn
Instagram

JUNTE-SE À NOSSA LISTA E RECEBA
OS NOSSOS CONTEÚDOS.

Entre para nossa lista e receba conteúdos exclusivos