A indisponibilidade de telecomunicações foi causada por intermitência em hardware de roteamento de Internet recém instalado, equipamento novo de modelo Dell de nova geração.
Por ser uma falha intermitente, ocorrendo em intervalos de 1 segundo, ela não permitiu a conclusão do processo de "Failover" para a contingência, ficando em um estado constante de "Failover" e "Fallback", causando instabilidade na estrutura de telecomunicações e eventual indisponibilidade.
Para restauração de forma emergencial a equipe de datacenter desligou o equipamento apresentando falha, transferindo todo o tráfego para nosso equipamento de contingência.
O suporte 24x7 da Dell foi acionado para avaliação e troca do equipamento.
Como segunda medida, nossa equipe está atuando em uma alteração do processo de "Failover" sem "Fallback" automático, isto é, no evento de qualquer instabilidade no roteador primário, o segundo assume e não retorna para o primário até operação manual da equipe de datacenter da Neture.
----
Atualização:
Efetuamos manutenções em 03/02 aplicando as configurações planejadas de alteração no processo de Failover. Também foram adicionados novos parâmetros de monitoramento para detecção da falha com maior eficácia.