Mesmo as equipes de manutenção mais eficientes experimentam falhas de equipamento. Existem diferentes tipos de falha, mas em termos mais básicos, falha significa que um sistema, componente ou dispositivo que não produz mais os resultados desejados.
Gerenciar efetivamente esta falha é fundamental para reduzir o impacto negativo nas empresas. Algumas métricas podem te ajudar a compreender os tipos de falhas e a classificá-las de maneira eficiente.
A relevância da informação confiável
Para otimizar o tratamento das falhas das equipes, é fundamental coletar dados precisos e relevantes. Estes são alguns dos dados que devem ser reunidos como parte de um histórico de manutenção:
– Horas de mão de obra dedicadas à manutenção.
– Número de panes.
– Tempo operativo.
O processo de coleta de dados pode ser tedioso, mas é fundamental para melhorar as operações. Este processo pode levar muito tempo quando realizado manualmente, mas tem sido simplificado graças aos CMMS móveis.
O que é MTTR?
O tempo médio de reparo (MTTR) é uma métrica usada pelos departamentos de manutenção para medir o tempo médio necessário para reparar uma falha. O cálculo do MTTR considera o período de tempo entre o início do incidente e o momento em que o equipamento ou sistema retorna à produção. Isso inclui o tempo gasto:
– Diagnosticando o problema.
– Notificando aos técnicos de manutenção.
– Solucionando o problema.
– Remontando e validando os equipamentos.
– Reinicialização provando e iniciando o equipamento.
Como calcular o MTTR?
Para calcular o MTTR, você deve dividir o tempo total de manutenção não planejada gasto em um ativo pelo número total de falhas que o ativo experimentou durante um período especificado. O tempo médio de reparo é representado em horas. Por exemplo, se você gastou 50 horas em manutenção não planejada em um ativo que falhou sete vezes no decorrer de um ano, o tempo médio de reparo seria de 7,14 horas. O MTTR depende de diferentes fatores, como o tipo de ativo, sua idade, o tipo de repartição, etc. No entanto, um bom MTTR deve durar menos de cinco horas.
É importante notar que o tempo total de manutenção corretiva (e, consequentemente, o tempo médio de reparo) pode incluir o tempo desde o momento em que uma falha é detectada até o momento em que o trabalho de reparo realmente começa (incluindo o tempo de identificação, notificação, diagnóstico de falha, etc.)
Como usar MTTR?
O tempo médio para reparo é usado como padrão para aumentar a eficiência, de maneiras que podem ajudar a diminuir o tempo de inatividade não planejado e melhorar o resultado final. O MTTR ajuda as organizações a entender por que a manutenção pode demorar mais do que o normal e mantém todos informados sobre falhas, causas e soluções eficazes.
A análise do MTTR fornece informações úteis sobre como gerenciar tarefas de manutenção e agendar manutenção, como reduzir pedidos perdidos e como melhorar o atendimento ao cliente.
Embora o MTTR seja considerado manutenção reativa, o monitoramento do MTTR fornece uma ideia da eficiência dos programas de manutenção preventiva. Por exemplo, equipamentos com muito tempo para consertar podem ter causas subjacentes que contribuem para a falha. O MTTR pode ajudá-lo a começar a investigar a causa raiz das falhas para encontrar uma solução eficaz.
A análise de MTTR também é útil para tomar decisões, como reparar ou substituir um ativo. Se uma peça de equipamento demorar mais para consertar à medida que envelhece, pode ser uma opção melhor substituí-la. O histórico do MTTR também pode ser usado para prever os custos do ciclo de vida de novos equipamentos ou sistemas.
Como reduzir o MTTR?
Para reduzir o MTTR você terá necessariamente que avaliar e tentar reduzir os dois fatores (o tempo total de manutenção corretiva e o número de reparos). Embora, matematicamente, a redução do número de reparos não reduza o MTTR (se o tempo total de manutenção corretiva permanecer o mesmo), na realidade, a redução do número total de reparos levará a uma redução no tempo total de manutenção.
Aqui estão algumas boas práticas que podem ajudar suas equipes a reduzir o MTTR e melhorar o jogo de resposta a incidentes:
Criar um plano de ação sólido para a gestão de incidentes
As equipes necessitam de uma política clara que explique o que fazer se algo se rompe: a quem chamar, como documentar o que está acontecendo e como resolver os problemas. Algumas empresas atribuem funções de comandante de incidentes semi permanentes, enquanto que outras alternam os membros da equipe.
Treine a sua equipe
O treinamento cruzado vai te ajudar a evitar um dos riscos de resposta a incidentes mais perigosos: situações nas quais uma pessoa é a única capaz de gerenciar certo tipo de sistema ou tecnologia. Se essa pessoa tira férias ou deixa a organização, ninguém mais terá as habilidades ou os conhecimentos para solucionar os problemas.
Aproveite as capacidades de AIOps
AIOps (Artificial Intelligence for IT Operations) complementa as práticas de monitoramento, fornecendo uma fonte inteligente de informações sobre incidentes. Se você usar essas informações para analisar e agir com base nos dados, estará mais bem equipado para solucionar problemas e resolver incidentes. Além disso, você pode querer implementar um processo de incidente sem repetição (DRI), que envolve a interrupção de um novo trabalho em um serviço envolvido em um incidente até que as causas sejam corrigidas ou atenuadas. Isso reforça o compromisso com a solução de problemas, em vez de soluções de curto prazo.
Monitore as informações constantemente
Você pode ter um processo de solução de problemas sem monitorar os dados. Nesse caso, a equipe de resposta é forçada a diagnosticar e resolver o problema com base em suposições.
Ao monitorar os dados em tempo real, você pode fornecer à sua equipe informações precisas para que possam formular uma teoria sobre o que está causando um problema e como corrigi-lo, em vez de adivinhar as causas reais.
Calibre cuidadosamente suas ferramentas de alerta
Com todas as ferramentas de monitoramento disponíveis hoje, é possível ter muitas informações sobre seus sistemas, o que pode dificultar o desenvolvimento de um plano claro de como usar os dados. É aqui que os alertas programáticos se tornam essenciais.
Uma primeira etapa prática é definir alertas na forma de limites para indicadores de nível de serviço (SLIs). Essas são métricas ou limites simples que podem ser rastreados com ferramentas de monitoramento automatizadas, indicando quando um problema sério pode estar ocorrendo ou está prestes a ocorrer.
Cada incidente requer um líder técnico e um líder de comunicação, cada um dos quais se reporta ao comandante do incidente. O líder técnico geralmente dita a resposta técnica específica a um determinado incidente. Em alguns casos, você pode precisar de mais de um líder técnico, dependendo de quantos sistemas são afetados.
Como reduzir o tempo total de manutenção corretiva?
O tempo total de manutenção vai desde a detecção da falha até a sua resolução. A equipe não deve perder muito tempo relatando a falha ao técnico responsável. Se o tempo de reparo for muito longo, isso pode ser um indicador de que determinado equipamento precisa ser substituído.
Aqui estão algumas estratégias para reduzir o tempo de manutenção corretiva e permitir que sua organização opere com mais eficiência.
Melhore a intercambialidade
Ao substituir peças de equipamento, é útil saber quais componentes podem ser trocados física ou funcionalmente sem comprometer a integridade do ativo. As peças intercambiáveis são particularmente comuns com itens de hardware comuns, como bicos, mangueiras, dispositivos de fixação, válvulas, etc. Melhorar a intercambialidade pode reduzir o tempo de manutenção corretiva, aumentando a facilidade de remoção e substituição de componentes semelhantes.
Tenha em conta as limitações humanas
As tarefas de manutenção corretiva são realizadas principalmente pelos trabalhadores, sendo necessário ter em conta as limitações humanas na hora de desenhar como são dispostos os ativos e as equipes. Uma grande parte desta estratégia é considerar a ergonomia do lugar de trabalho.
Como reduzir o número de ações de reparo?
Se um operador perceber que uma determinada máquina ou equipamento não está funcionando corretamente, ele deve chamar um técnico imediatamente. Agir rapidamente pode evitar um mau funcionamento total do ativo e uma paralisação completa da produção. Em uma emergência, o gerente de operações técnicas deve estar disponível para fornecer uma resposta rápida e revisar o protocolo com outros membros da equipe.
Quase todos os equipamentos requerem revisões periódicas. No caso de máquinas pesadas, é altamente recomendável substituir alguns componentes mecânicos regularmente (muitas vezes anualmente). Usando um bom CMMS, você pode até automatizar essas notificações, garantindo que toda a manutenção esteja em dia e reduzindo o número de ações de reparo. Ao automatizar essas notificações, é mais fácil garantir que toda a manutenção esteja em ordem e você pode reduzir o número de ações de reparo.
Tenha em mente que o MTTR é importante, mas não é a única métrica. Para obter bons resultados de longo prazo, você deve implementar uma estratégia que coordene um fluxo contínuo de dados em tempo real, políticas de alerta e ferramentas para dar suporte aos processos de gerenciamento de incidentes. Esta é a melhor fórmula para resolver incidentes de forma sistemática e eficiente. É também a melhor maneira de reduzir continuamente o MTTR.