Está virando rotina neste final de ano. Os serviços da Amazon Web Services (AWS) voltaram a cair pela terceira vez só em dezembro. Assim, a AWS passou por outra paralisação que interrompeu os principais aplicativos e serviços, como Slack, a plataforma de rastreamento de localização Life360, Grindr, o aplicativo McDonalds e a Epic Games Store, junto com jogos populares como Fall Guys.
E a nova queda pegou os usuários logo cedo, quando começavam a se conectar. Em minutos, a página de status da AWS foi atualizada para confirmar que a empresa detectou uma queda de energia “em um único data center em uma única Zona de disponibilidade (USE1-AZ4) na região US-EAST-1.” No entanto, o serviço já opera normalmente, inclusive na região da América do Sul, que abrange o Brasil.
Apesar da natureza relativamente localizada do blecaute, o impacto no serviço Elastic Computing (EC2) da Amazon foi bastante catastrófico no curto prazo, com a AWS recomendando que qualquer cliente capaz deveria “faltar” para Zonas de disponibilidade não afetadas.
AWS sofre terceira queda em apenas um mês
Os esforços de restauração começaram rapidamente e a AWS relatou o progresso na restauração da energia dentro de 18 minutos de sua confirmação inicial. No entanto, o processo de restauração permaneceu em andamento por várias horas mais até que a AWS notou que a energia foi totalmente restaurada às 9:51 AM EST. Mesmo assim, a página de suporte da empresa avisou que alguns problemas de conectividade de rede continuaram a persistir para uma parte das instâncias EC2 impactadas. Ele também revelou que alguns clientes de seu serviço de armazenamento EBS foram afetados por “degradação do desempenho de E / S” durante a interrupção.
Apesar do padrão aparente de interrupções ocorrendo em dezembro, os três incidentes têm muito pouco em comum. O primeiro em 7 de dezembro também impactou a região US-EAST-1, mas estava relacionado a um problema de dimensionamento de capacidade de rede automatizado, em vez de uma queda de energia. O segundo tempo de inatividade aconteceu em todo o país nas regiões US-WEST-1 e WEST-2 e estava relacionado a um problema de conectividade de rede.
Resta saber se há um motivo subjacente para o aumento repentino nos tempos de inatividade da AWS ou se a empresa acabou de passar por um período de extrema má sorte. No entanto, os aplicativos, serviços, jogos e sites que passaram a depender da AWS para sua própria estabilidade estão quase certamente começando a examinar o impacto que essas interrupções estão tendo em seus próprios resultados.
Via ZDNet