Suporte aprimorado

PyTorch 2.5 lançado com suporte aprimorado para GPU Intel e novas funcionalidades Beta e Prototype

PyTorch 2.5 traz melhorias importantes no suporte para GPUs Intel, incluindo compatibilidade com Windows e otimizações para CPUs Xeon, além de novos recursos Beta e Prototype para aprendizado de máquina.

Logotipo do PyTorch em fundo gradiente roxo e vermelho.

PyTorch 2.5 foi lançado como a mais recente grande atualização desta popular biblioteca de aprendizado de máquina. A nova versão traz melhorias significativas no suporte para GPUs da Intel, tanto para produtos voltados para o consumidor quanto para data centers. Agora, PyTorch 2.5 possui suporte inicial para GPUs de cliente Intel no Windows, além de melhorias no suporte existente para Linux.

Entre os destaques dessa versão estão:

  • Expansão da matriz de suporte ao backend de hardware do PyTorch para incluir GPUs Intel, tanto de data centers quanto de cliente.
  • Implementação de kernels SYCL para aumentar a cobertura e a execução dos operadores Aten em GPUs Intel, melhorando o desempenho no modo eager do PyTorch.
  • Backend da Intel para a função torch.compile aprimorado, o que melhora o desempenho de inferência e treinamento em uma ampla gama de workloads de aprendizado profundo.
  • Novo backend cuDNN para SDPA, que proporciona aceleração de até 75% para usuários do SDPA em GPUs NVIDIA H100 ou mais recentes, habilitado por padrão.
  • Compilação regional com torch.compile sem recompilações para reduzir o tempo de inicialização em módulos repetidos (como camadas de transformador em modelos de linguagem).
  • Backend TorchInductor com suporte para Windows, incluindo compatibilidade com compiladores MSVC, clang e Intel.
  • Suporte para FP16 no caminho da CPU, tanto para o modo eager quanto para o backend TorchInductor CPP, para melhorar o desempenho de inferência e treinamento.
  • Introdução da funcionalidade FlexAttention, permitindo a implementação de diversos mecanismos de atenção, como Sliding Window e Causal Mask, de forma mais simples e eficiente.
  • Extensão de autoload de dispositivos, facilitando a integração de extensões fora do core da biblioteca.
  • Novo recurso de Flight Recorder para facilitar a depuração de jobs travados, capturando informações contínuas sobre coleções enquanto elas são executadas.
Fluxo de trabalho do PyTorch, incluindo preparação de dados, escolha do modelo, ajuste do modelo, avaliação e melhorias contínuas.

PyTorch 2.5 também traz otimizações de desempenho para CPUs Intel Xeon, beneficiando quem utiliza essas CPUs em aplicações de aprendizado de máquina em larga escala.

Além disso, esta versão é composta por 4095 commits de 504 colaboradores, destacando o engajamento da comunidade PyTorch. Como sempre, encorajamos os usuários a experimentarem as novidades e reportarem quaisquer problemas que encontrarem.

Para mais detalhes e downloads da versão PyTorch 2.5, acesse o GitHub oficial. Novos benchmarks do PyTorch serão divulgados em breve.