No evento de IA da AMD, a empresa forneceu mais detalhes sobre sua série Instinct MI300 para seu empolgante acelerador de GPU discreto APU e CDNA3 para data center. O ROCm 6.0 também foi anunciado para aprimorar os recursos de software de IA da AMD. Então, a AMD detalha o MI300X e MI300A e anuncia o software ROCm 6.0.
Com o acelerador AMD Instinct MI300X eles pretendem diretamente ser uma excelente alternativa à NVIDIA para acelerações de IA.
Além de ter mais que o dobro da quantidade de memória HBM3 do H100 SXM, o AMD Instinct MI300X, pelo menos em seu potencial máximo teórico, deve superar a concorrência da NVIDIA. A potência total da placa do MI300X é de 750 Watts. Até oito aceleradores MI300X podem ser combinados em um único servidor para oferecer 1,5 TB de memória HBM3 e potencialmente 1,3x mais poder de computação do que o NVIDIA H100 HGX.
Os números fornecidos pela AMD parecem estar em muito boa posição em relação à concorrência H100 da NVIDIA. Infelizmente, nenhum teste independente antes do anúncio atual.
Pessoalmente, o que mais me intriga é o Instinct MI300A como acelerador APU para IA e HPC. O MI300A com núcleos de CPU Zen 4, gráficos AMD CDNA3 e 128 GB de memória unificada HBM3 oferece muito potencial interessante no data center como uma alternativa ao Xeon Max para aquela CPU Sapphire Rapids com memória HBM2e e à frente da APU Falcon Shores da Intel que está chegando em 2025.
O MI300A possui 24 núcleos de CPU Zen 4, 256 MB de cache infinito AMD, oito pilhas HBM3 para cerca de 5,3 TB/s de largura de banda de memória e 228 unidades de computação AMD CDNA3.
AMD detalha o MI300X e MI300A e anuncia o software ROCm 6.0
Os benchmarks da AMD mostram excelente desempenho de HPC e IA para cargas de trabalho ROCm capazes de aproveitar a incrível largura de banda de memória e a combinação das unidades de computação CNDA3 e núcleos de CPU Zen 4.
A AMD também usou o evento de IA para anunciar o ROCm 6. O ROCm 6.0 traz bibliotecas de IA com mais desempenho, suporte expandido ao ecossistema e mais otimizações de modelo de linguagem grande (LLM).
A AMD está mostrando grandes melhorias de desempenho com ROCm 6 em relação ao ROCm 5, além de estar melhor preparada agora para cargas de trabalho de AI/LLM.
Será interessante ver como o ROCm 6.0 funciona bem na prática. Com o evento de hoje focado na série Instinct MI300, não foi revelado se o ROCm 6.0 ampliará o suporte à GPU de consumidor Radeon além do suporte atual da série Radeon RX 7900 para modelos de GPU RDNA3 de baixo custo ou similares.
De qualquer forma, estes são alguns anúncios interessantes da AMD hoje, com finalmente a série Instinct MI300 pronta para uso e a AMD continuando a adotar software de código aberto em sua pilha de software ROCm e continuando a amadurecê-la para se tornar uma alternativa mais atraente ao CUDA da NVIDIA. .
A AMD também aproveitou o evento de hoje em São Francisco para anunciar a série móvel Ryzen 8040 com foco nos recursos Ryzen AI XDNA.