AMD fala sobre software de código aberto para IA e apresenta o Instinct MI300X

Biblioteca de tradução de endereços AMD "ATL" vem com Linux 6.8
AMD fala sobre software de código aberto para IA e apresenta o Instinct MI300X

Além de lançar o Bergamo e o Genoa-X, o AI Day da AMD também apresentou as novas ofertas AMD-Pensando DPU e também apresentou uma prévia de mais de sua APU aceleradora Instinct MI300 de última geração. A AMD fala sobre software de código aberto para IA e apresenta o Instinct MI300X. A AMD está organizando seu AI Day em São Francisco. 

Victor Peng, da AMD, falou sobre as ofertas de software de código aberto da AMD em torno da IA ??e seu ecossistema de software em geral no Linux. Victor falou sobre as ofertas de software de código aberto da AMD e os avanços feitos com a pilha ROCm. 

AMD fala sobre software de código aberto para IA e apresenta o Instinct MI300X

O CEO da Hugging Face, Clément Delangue, também esteve no evento AMD AI Day para falar sobre a importância da ciência aberta e do código aberto no mundo da IA. A Hugging Face e a AMD também formaram uma parceria para garantir o suporte completo da AMD para seus softwares e modelos hospedados, CI/CD em hardware AMD, etc.

O AMD Instinct MI300A com 24 núcleos Zen 4, 128 GB de memória HBM3 e CDNA3 agora é uma amostra para os clientes. A AMD também anunciou o Instinct MI300X como uma versão somente de GPU do CDNA3 com 192 GB de memória HBM3 e focada em lidar com modelos de linguagem grandes.

O AMD Instinct MI300X foi demonstrado com o modelo de linguagem grande Falcon-40B em um único MI300X executado inteiramente na memória. Um único MI300X pode lidar com grandes modelos de linguagem de até aproximadamente 80 bilhões de parâmetros.Lisa também apresentou a plataforma AMD Instinct com oito MI300X em uma plataforma de infraestrutura OCP e fornece 1,5 TB de memória HBM3 para lidar com LLMs AI muito grandes.

O Instinct MI300A está sendo testado desde o início deste trimestre para clientes HPC/AI. O MI300X e a plataforma AMD Instinct iniciarão a amostragem no terceiro trimestre. A rampa de produção total é esperada no quarto trimestre.

AMD usa AI Day para lançar Genoa-X e Bergamo

Além de a AMD anunciar a série Ryzen PRO 7000, eles anunciaram Bergamo, Genoa-X e outras novas ofertas de data center.

Lisa recapitulou as vantagens de desempenho do Genoa para seus processadores EPYC de 4ª geração existentes antes de anunciar o Genoa-X e o Bergamo.

A AWS anunciou no evento que suas instâncias M7a com tecnologia EPYC de 4ª geração já estão em pré-visualização com disponibilidade geral no próximo trimestre. Esta é uma grande atualização em relação às instâncias M6a que foram alimentadas pelo EPYC Milan de 3ª geração. A Oracle também está trazendo Genoa para sua nuvem a partir de julho.

O Bergamo permite até 128 núcleos/256 threads por soquete em comparação com o Genoa, que atinge o máximo de 96 núcleos. O Bergamo ainda suporta memória DDR5-4800 de 12 canais, AVX-512, PCIe Gen5 e outros recursos comuns ao Genoa, enquanto os núcleos “Zen 4c” são menores que o núcleo Zen 4 padrão. 

O Bergamo usa o mesmo soquete de CPU (SP5) do Genoa e também é compatível com a plataforma com a atualização do BIOS. Diz-se que o tamanho da área central do Zen 4C é 35% menor do que o núcleo do Zen 4, o que também ajuda a maximizar a eficiência energética.

Bergamo está enviando em volume agora para clientes hiperescaladores. Meta relata ter visto 2,5x o desempenho com Bergamo sobre o Milan.

O Genoa-X também foi apresentado por Lisa Su para promover suas ofertas de computação técnica. O Genoa-X oferece cache L3 de até 1,1 GB por soquete e núcleos Zen 4 como uma atualização muito boa em relação ao Milan-X. Liderando o AMD Genoa-X está o EPYC 9684X com 96 núcleos / 192 threads enquanto possui um tamanho de cache L3 de 1,1 GB graças ao 3D V-Cache. As ofertas do Genoa-X variam de 16 a 96 núcleos.

A AMD também apresentou os processadores EPYC “Siena” com custo otimizado que chegarão ao mercado ainda este ano.