Falha NVIDIA

NVIDIA enfrenta problemas críticos com drivers no Kernel Linux 6.10

A NVIDIA enfrenta um bug crítico que faz com que drivers falhem no kernel Linux 6.10. Usuários relatam travamentos e congelamentos. Saiba mais sobre os impactos e as possíveis soluções temporárias.

A NVIDIA está investigando um bug crítico nos drivers que afeta o kernel Linux 6.10, causando falhas graves no sistema. Veja as possíveis soluções temporárias enquanto aguarda uma correção definitiva.

A NVIDIA está atualmente investigando um bug crítico que faz com que seus drivers gráficos falhem ao rodar nas versões mais recentes do kernel Linux, a partir da versão 6.10. Esse problema tem causado transtornos significativos, afetando não apenas os drivers proprietários da NVIDIA, mas também suas versões de código aberto. As versões de drivers impactadas incluem as versões 550, 555, e até mesmo a mais recente, 560, lançada recentemente.

Contexto do problema

O problema parece estar relacionado a uma regressão introduzida na atualização para o kernel Linux 6.10. De acordo com relatos em fóruns da NVIDIA e observações de usuários, as falhas ocorrem em situações específicas, como ao ativar o mecanismo de suspensão do sistema ou ao processar gráficos 3D em aplicativos. A consequência é o surgimento de erros críticos no sistema (kernel oops), que comprometem tanto a experiência dos desenvolvedores quanto dos usuários finais.

Exemplos de falhas e sintomas

Os sintomas desse bug são variados e podem se manifestar de diferentes maneiras. O sistema pode começar a congelar inesperadamente, especialmente durante o uso de jogos ou aplicativos gráficos intensivos. Em um exemplo de log de sistema, são registrados erros como o seguinte:

[ 29.168385] ------------[ cortar aqui ]------------
[ 29.168385] AVISO: CPU: 13 PID: 7032 em include/linux/rwsem.h:80 follow_pte+0x1de/0x200
[ 29.168387] Módulos vinculados em: rfcomm nvidia_drm(OE) nvidia_uvm(OE) nvidia_modeset(OE) nvidia(OE)
...
[ 29.168456] CPU: 13 PID: 7032 Comm: nv_queue Tainted: PW OE 6.10.6-arch1-1 #1 703d152c24f1971e36f16e505405e456fc9e23f8
[ 29.168457] Nome do hardware: ASUSTeK COMPUTER INC. ASUS TUF Dash F15 FX517ZR_FX517ZR/FX517ZR, BIOS FX517ZR.317 05/03/2023
[ 29.169159] ret_from_fork+0x31/0x50
[ 29.169164] ---[ fim do rastreamento 0000000000000000 ]---

Além disso, outros sintomas comuns incluem:

  • Congelamentos de vídeo que ocorrem em intervalos regulares, a cada 45 segundos.
  • Durante jogos, a imagem pode congelar enquanto o jogo continua a rodar, o que pode ser desastroso em modos hardcore, como no jogo Core Keeper.
  • Após aproximadamente 30 minutos de uso intenso, a carga média do sistema pode subir para níveis extremos, embora ferramentas de monitoramento como top, iostat, vmstat, ou free não indiquem claramente deterioração no desempenho.
  • O comando dmesg frequentemente se enche de mensagens de rastreamento de pilha relacionadas ao problema.

Soluções temporárias

Até que uma solução definitiva seja lançada pela NVIDIA, os usuários têm buscado alternativas temporárias. Uma das abordagens mais recomendadas é o downgrade para uma versão anterior do kernel, como o branch linux-lts (Long Term Support) com o kernel 6.6. Essa combinação com os drivers das versões 550 ou 555 pode ajudar a evitar os travamentos, embora não seja uma solução ideal.

Investigação e próximos passos

A NVIDIA já está ciente do problema e uma investigação está em andamento. Discussões em fóruns da empresa revelam que os usuários têm relatado falhas aleatórias no sistema causadas pelos drivers da NVIDIA, além de problemas específicos antes da suspensão do sistema, atribuídos ao script nvidia-sleep.sh. Apesar da introdução da versão 560 do driver, que buscava corrigir alguns desses problemas, muitos usuários continuam enfrentando dificuldades.

Recomenda-se que os usuários afetados fiquem atentos aos fóruns da NVIDIA para atualizações sobre o status da investigação e possíveis soluções. Enquanto isso, a opção de reverter o kernel ou utilizar ramificações de suporte a longo prazo do Linux pode oferecer alguma estabilidade.

Conclusão

O problema com os drivers NVIDIA no kernel Linux 6.10 sublinha a importância da compatibilidade entre drivers e atualizações de kernel. Se você está enfrentando esses problemas, considere aplicar uma das soluções temporárias mencionadas e fique de olho nas atualizações da NVIDIA para resolver a situação de forma definitiva.