ZenDNN 5.0

AMD ZenDNN 5.0: Melhorias para EPYC Zen 5 e modelos de IA Gerativa

Emanuel Negromonte

15/11/2024 12:01

A AMD lançou oficialmente a versão 5.0 de sua biblioteca ZenDNN, projetada para redes neurais profundas e otimizada para os processadores AMD Zen 5, incluindo a linha EPYC 9005. Esta atualização não só melhora o desempenho de modelos de linguagem gerativa, como também é compatível com as APIs do oneDNN da Intel, o que facilita a integração em sistemas já existentes.

Otimizações para processadores AMD Zen 5

O ZenDNN 5.0 foi especialmente ajustado para tirar o máximo proveito da nova geração de processadores AMD EPYC “Turin” e dos novos processadores Ryzen 9000. Com isso, a versão mais recente da biblioteca promete um desempenho superior em comparação às versões anteriores, especialmente em tarefas intensivas de IA, como o treinamento e execução de modelos de linguagem de grande escala.

Principais melhorias e recursos

Suporte para Processadores AMD Zen 5
A principal novidade é o suporte aprimorado para a arquitetura Zen5, proporcionando melhorias no desempenho e eficiência ao lidar com tarefas complexas, como operações de multiplicação de matrizes (MATMUL), agora otimizadas para precisão BF16.
Aprimoramentos para Modelos LLM Gerativos
O ZenDNN 5.0 traz importantes melhorias para modelos de linguagem de grande porte (LLMs), como Llama2, Llama3, GPT, e outros. Essas otimizações visam aumentar a velocidade e reduzir o uso de recursos, especialmente no uso do PyTorch, com a função zentorch.llm.optimize(), que aplica ajustes específicos para a arquitetura AMD EPYC™.
Otimizações Específicas para o PyTorch
Além de ajustes nos modelos generativos, o ZenDNN 5.0 introduz o operador de Atenção de Produto Escalar Otimizado (SDPA) e melhorias no cache KV para as arquiteturas de cache da AMD. Essas atualizações visam proporcionar maior desempenho em tarefas como recomendação de sistemas, através do suporte à precisão BF16.
Compatibilidade com TensorFlow e PyTorch
O ZenDNN 5.0 é totalmente compatível com TensorFlow 2.16+ e PyTorch 2.0+, duas das mais populares bibliotecas para treinamento de redes neurais. A integração com o ONNX Runtime v1.19.2 também é garantida, ampliando as possibilidades de uso do ZenDNN em diferentes frameworks.
Autotuning e Quantização de Peso
A atualização inclui um algoritmo de autotuning para a precisão BF16, projetado para otimizar modelos de LLM generativos. Além disso, o ZenDNN agora oferece suporte para quantização de peso com INT4 e ativações BF16, o que pode resultar em um uso mais eficiente de recursos, especialmente para modelos exportados usando o AMD Quantizer Quark.

Conclusão e impacto

O ZenDNN 5.0 representa um grande avanço para a AMD, oferecendo uma biblioteca poderosa para modelos de IA e aprendizado profundo, especialmente para aqueles que utilizam processadores AMD Zen 5. Com otimizações focadas em modelos generativos e melhorias de desempenho específicas para a arquitetura EPYC, a nova versão da biblioteca promete beneficiar tanto desenvolvedores de IA quanto cientistas de dados, proporcionando um desempenho superior em diversos cenários de uso.

Emanuel Negromonte Autor

Emanuel Negromonte

Autor

Jornalista especialista em Linux a mais de 20 anos. Fundador do SempreUpdate e entusiasta do software livre.

Mais Notícias

Imagem com a logomarca do Intel

Gerenciamento de Energia

Intel lança LPMD 0.0.9: Mais controle sobre o consumo de energia em Linux

A Intel acaba de disponibilizar a versão 0.0.9 do seu Low Power Mode Daemon (LPMD), uma ferramenta open-source para sistemas Linux projetada para refinar o consumo de energia em idle ativo nos processadores Intel Core. O daemon Intel LPMD oferece aos usuários de laptops com Core Ultra e até mesmo desktops Core uma maneira de […]

Samsung Exynos Auto UA200

Chip para veículos

Samsung revela Exynos Auto UA200: chip com UWB para carros

A Samsung apresentou o Exynos Auto UA200, chip para veículos com conectividade UWB, que oferece precisão de localização e recursos de segurança avançados.

Raspberry Pi CM4 agora disponível com variantes de "temperatura estendida"

Raspberry Pi CM4

Raspberry Pi CM4 agora disponível com variantes de "temperatura estendida"

Você já imaginou um dispositivo que pode funcionar perfeitamente em temperaturas extremas, desde o frio congelante do Ártico até o calor escaldante do deserto? Parece algo saído de um filme de ficção científica, mas a Raspberry Pi está tornando isso realidade com suas novas variantes de temperatura estendida do Compute Module 4 (CM4). Uma nova […]

Transformações gráficas no Raspberry Pi: A jornada da Igalia

Igalia

Transformações gráficas no Raspberry Pi: A jornada da Igalia

Descubra como a Igalia está revolucionando o desempenho gráfico dos Raspberry Pi com suas novas otimizações, apresentadas no FOSDEM 2025.

Dell é alvo de críticas por copiar nomes da Apple

Críticas recebidas

Dell é alvo de críticas por copiar nomes da Apple

A Dell enfrentou críticas em seu lançamento por adotar nomes como "Dell Pro" e "Dell Pro Max", semelhantes à linha do iPhone, gerando confusão e acusações de falta de originalidade.

Snapdragon X Series

Hardware e inovação

Snapdragon X Series: mini PCs potentes a partir de US$ 600

A Qualcomm apresenta no CES 2025 a nova linha Snapdragon X para mini PCs