DeepSeek R2 adiado: escassez de chips NVIDIA H20 e busca por desempenho ideal freiam lançamento de LLM open source na China

Escrito por
Emanuel Negromonte
Emanuel Negromonte é Jornalista, Mestre em Tecnologia da Informação e atualmente cursa a segunda graduação em Engenharia de Software. Com 14 anos de experiência escrevendo sobre...

Uma notícia que ressoa profundamente no cenário global da Inteligência Artificial (IA) e na geopolítica da tecnologia! O lançamento do DeepSeek R2, o aguardado modelo de linguagem grande (LLM) da DeepSeek, foi adiado. A decisão, reportada pela imprensa chinesa, revela um dilema complexo impulsionado por dois fatores cruciais: a insatisfação da liderança da DeepSeek com o desempenho atual do modelo e a crítica escassez de chips NVIDIA H20 no mercado chinês, resultado das restrições de exportação impostas pelos Estados Unidos.

A DeepSeek é um dos principais desenvolvedores de LLMs abertos na China, e seus modelos são amplamente utilizados em plataformas de nuvem. O adiamento do R2 destaca a crescente dependência da infraestrutura de IA chinesa em hardware avançado da NVIDIA, e como as tensões comerciais estão impactando diretamente o avanço tecnológico.

Este artigo fará uma análise aprofundada dos motivos por trás do adiamento do DeepSeek R2, explorando o impacto da escassez de chips H20 na capacidade de computação de IA da China, a busca incessante por desempenho em LLMs e as implicações para o futuro da Inteligência Artificial global.

Por que o DeepSeek R2 foi adiado? Dois fatores cruciais

Insatisfação com o desempenho atual do modelo

A busca por excelência está no cerne do desenvolvimento do DeepSeek R2. Segundo informações do The Information, os engenheiros da DeepSeek têm trabalhado intensamente na otimização do modelo, mas Liang Wen-feng (梁文锋), líder do projeto, ainda não está satisfeito com os resultados.

A meta da equipe é atingir um nível superior de desempenho, e enquanto isso não for alcançado, o lançamento permanecerá indefinido. Essa decisão demonstra o compromisso da DeepSeek em entregar um modelo de alta qualidade, mesmo que isso signifique atrasar sua disponibilização ao público.

Escassez de chips NVIDIA H20: o impacto das sanções dos EUA

O segundo e mais decisivo fator é a escassez de chips NVIDIA H20 na China, essenciais para o treinamento e execução de modelos como o DeepSeek R2. Essa escassez é consequência direta das sanções impostas pelos Estados Unidos, que visam limitar o acesso chinês a tecnologias de ponta em IA.

As plataformas de nuvem chinesas, que atualmente hospedam o DeepSeek R1, dependem fortemente dos chips H20. Caso o R2 realmente apresente desempenho superior aos modelos abertos concorrentes, espera-se uma explosão de demanda que poderia sobrecarregar severamente os data centers, gerando gargalos em toda a infraestrutura de IA local.

DeepSeek no cenário de LLMs abertos na China

DeepSeek R1: o modelo atual

O DeepSeek R1 é atualmente o modelo mais usado por clientes de nuvem chineses. Ele passou por diversas atualizações, como a versão DeepSeek-R1-0528, que trouxe melhorias em lógica e raciocínio. Sua base sólida é o que alimenta a expectativa sobre o próximo passo da empresa com o R2.

Caso o R2 se mostre significativamente melhor, a demanda deverá aumentar exponencialmente, pressionando ainda mais os recursos computacionais disponíveis na China.

DeepSeek-V3: um gigante MoE

Outro destaque do portfólio da empresa é o DeepSeek-V3, um modelo MoE (Mixture-of-Experts) com 671 bilhões de parâmetros totais, sendo 37 bilhões ativos por token.

O MoE é uma arquitetura de LLM em que o modelo é formado por “especialistas” distintos, e apenas uma parte é ativada por token. Isso reduz o custo computacional mantendo a capacidade expressiva do modelo, sendo ideal para aplicações de grande escala.

O DeepSeek-V3 continua em desenvolvimento ativo, incluindo agora suporte à Huawei Ascend NPU, evidenciando o esforço da empresa em explorar alternativas aos chips da NVIDIA.

Impacto da escassez de hardware: a geopolítica da IA em ação

O adiamento do DeepSeek R2 escancara a dependência da China em relação ao hardware de ponta da NVIDIA. Esses chips são cruciais para treinar e executar LLMs com bilhões de parâmetros — e estão cada vez mais inacessíveis.

As restrições dos Estados Unidos fazem parte de uma estratégia clara para conter o avanço chinês em tecnologias sensíveis, como supercomputação e inteligência artificial de uso dual (civil e militar).

Essa conjuntura traz diversos impactos:

  • Freio ao avanço de LLMs chineses: Com menos chips disponíveis, projetos como o DeepSeek R2 sofrem atrasos significativos.
  • Gargalos nas nuvens chinesas: A infraestrutura atual corre risco de colapso diante da crescente demanda por IA.
  • Estímulo à inovação doméstica: Empresas como a Huawei estão investindo pesado em NPUs para IA, como alternativa ao domínio da NVIDIA.
  • Aceleração da corrida armamentista tecnológica: O caso do DeepSeek mostra que o hardware se tornou uma arma geopolítica, onde cada avanço ou bloqueio altera o equilíbrio global da IA.

DeepSeek e as empresas de nuvem chinesas: buscando soluções

Diante da crise de hardware, a DeepSeek iniciou uma abordagem estratégica: compartilhar com empresas parceiras as especificações técnicas do R2, antecipando os requisitos necessários para sua execução em nuvem.

O objetivo é que empresas como Baidu Qianfan, iFlytek Spark, 360 ZhiNao, Zhipu e até concorrentes globais como o ChatGPT compreendam os requisitos do modelo e planejem com antecedência sua implantação.

No entanto, o sucesso dessa estratégia dependerá fundamentalmente da disponibilidade real de chips como o NVIDIA H20 ou alternativas locais, o que ainda é uma grande incerteza.

Conclusão: o DeepSeek R2 — um barômetro da corrida global por IA

O adiamento do DeepSeek R2 é mais do que um simples atraso de lançamento; é um reflexo das complexidades técnicas, estratégicas e geopolíticas que moldam o futuro da Inteligência Artificial.

A combinação entre a insatisfação com o desempenho técnico e a escassez de chips NVIDIA H20 na China revela não apenas os desafios enfrentados por empresas como a DeepSeek, mas também a fragilidade das cadeias globais de suprimento de semicondutores e o peso crescente da IA nas disputas entre Estados Unidos e China.

O futuro da IA está intrinsecamente ligado ao hardware. Mantenha-se informado sobre a evolução dos LLMs, os desafios da infraestrutura computacional global e os rumos da tecnologia aberta no contexto de um mundo cada vez mais competitivo.

Para mais notícias e análises sobre Inteligência Artificial, tecnologia na China e o cenário global de hardware, continue acompanhando o SempreUpdate!

Compartilhe este artigo