A Cloudflare diz que uma grande interrupção que afetou mais de uma dúzia de seus data centers e centenas de grandes plataformas e serviços online foi causada por uma mudança que deveria ter aumentado a segurança da rede.
“Hoje, 21 de junho de 2022, a Cloudflare sofreu uma interrupção que afetou o tráfego em 19 de nossos data centers”, disse a Cloudflare após investigar o incidente.
“Infelizmente, esses 19 locais lidam com uma proporção significativa de nosso tráfego global. Essa interrupção foi causada por uma mudança que fazia parte de um projeto de longa duração para aumentar a resiliência em nossos locais mais movimentados”.
De acordo com relatórios de usuários, a lista completa de sites e serviços afetados inclui, mas não se limita a Amazon, Twitch, Amazon Web Services, Steam, Coinbase, Telegram, Discord, DoorDash, Gitlab e muito mais.
A interrupção afetou os sites mais movimentados da Cloudflare
A empresa começou a investigar esse incidente aproximadamente às 06h34 UTC depois que relatos de interrupção da conectividade com a rede da Cloudflare começaram a chegar de clientes e usuários em todo o mundo.
“Os clientes que tentarem acessar os sites da Cloudflare nas regiões afetadas observarão 500 erros. O incidente afeta todos os serviços de plano de dados em nossa rede”, disse a Cloudflare.
Embora não haja detalhes sobre o que causou a interrupção no relatório de incidente publicado no site de status do sistema da Cloudflare, a empresa compartilhou mais informações sobre a interrupção de 21 de junho no blog oficial.
Essa interrupção foi causada por uma mudança que fazia parte de um projeto de longa duração para aumentar a resiliência em nossos locais mais movimentados”, acrescentou a equipe da Cloudflare.
Uma alteração na configuração de rede nesses locais causou uma interrupção que começou às 06:27 UTC. Às 06:58 UTC, o primeiro data center foi colocado novamente online e às 07:42 UTC todos os data centers estavam online e funcionando corretamente.
Dependendo de sua localização no mundo, você pode não ter conseguido acessar sites e serviços que dependem da Cloudflare. Em outras localidades, a Cloudflare continuou operando normalmente.
Erro de configuração de rede derrubou serviços da Cloudflare
Embora os locais afetados representem apenas 4% de toda a rede da Cloudflare, sua interrupção afetou cerca de 50% de todas as solicitações HTTP tratadas pela Cloudflare globalmente.
A mudança que levou à interrupção de hoje foi parte de um projeto maior que converteria os data centers nos locais mais movimentados da Cloudlfare em uma arquitetura mais resiliente e flexível, conhecida internamente como Multi-Colo PoP (MCP).
A lista de data centers afetados no incidente de hoje inclui Amsterdã, Atlanta, Ashburn, Chicago, Frankfurt, Londres, Los Angeles, Madri, Manchester, Miami, Milão, Mumbai, Newark, Osaka, São Paulo, San Jose, Cingapura, Sydney e Tóquio.