AWS: causa raiz da falha do serviço foi um subsistema responsável por monitorar balanceadores de carga de rede
Os serviços da AWS voltaram a funcionar normalmente por volta das sete da noite desta segunda-feira, 20/10. Impacto efetivo da paralisação de mais de 18 horas ainda será sentido no mercado de cloud.

Depois de quase 20 horas, a AWS informou que resolveu o problema técnico que interrompeu o uso da Internet em todo o mundo e derrubou uma série de serviços. “A causa raiz é um subsistema interno subjacente responsável por monitorar a integridade dos nossos balanceadores de carga de rede”, reportou a companhia. A falha começou na madrugada de domingo para segunda-feira, 20/10, e só foi resolvida por volta das sete da noite, no leste dos Estados Unidos.
Oficialmente, a AWS citou um “problema operacional” que afetava diversos serviços e disse estar “trabalhando em múltiplos caminhos paralelos para acelerar a recuperação”. Mais de 70 de seus próprios serviços foram afetados. Por volta das 6h35 (horário do leste dos EUA), a provedora de cloud comunicou que o problema de DNS havia sido “totalmente mitigado” e que as operações dos serviços da AWS estavam “funcionando normalmente”.
Especialistas seguem descartando ataque hacker. “É mais provável que seja uma falha técnica que afeta um dos principais data centers da Amazon”, disse Rob Jardin, diretor digital da empresa de segurança cibernética NymVPN. “Esses problemas podem ocorrer quando os sistemas ficam sobrecarregados ou uma parte importante da rede cai e, como muitos sites e aplicativos dependem da AWS, o impacto se espalha rapidamente”, acrescentou.
Carmi Levy, analista de tecnologia, observou que se há apostas em poucas opções- são três grandes provedores de nuvem dominando 66% do mercado global – há grandes riscos. “Se uma delas apresentar um problema, isso afetará muitas pessoas — literalmente bilhões de pessoas foram impactadas por essa interrupção específica. Isso realmente é um lembrete de que a tecnologia que usamos todos os dias é incrivelmente complexa e que há milhões de pequenas peças de tecnologia sob a superfície trabalhando juntas para manter tudo isso funcionando, manter as luzes acesas”, adicionou.
Analistas seniores da E-Marketer concordaram que o evento ressalta os riscos da infraestrutura de nuvem concentrada e a necessidade de maior resiliência em todos os ecossistemas digitais. Gadjo Sevilla afirmou que a interrupção “deixou evidente o quão profundamente o comércio, a comunicação e o entretenimento modernos dependem de uma única infraestrutura de nuvem”, alertando que a dependência excessiva de um único provedor “coloca em risco a reputação da marca e a confiança do cliente”.