A NVIDIA revelou na SC23 a próxima onda de tecnologias que elevarão os centros de pesquisa científica e industrial em todo o mundo a novos níveis de desempenho e eficiência energética. “As inovações de hardware e software da NVIDIA estão criando uma nova classe de supercomputadores de IA”, disse Ian Buck, vice-presidente do negócio de computação de alto desempenho e data center de hiperescala da empresa, em um discurso especial na conferência.
Alguns dos sistemas usarão aceleradores NVIDIA Hopper com memória aprimorada, enquanto outros usarão uma nova arquitetura de sistemas NVIDIA Grace Hopper. Todos eles usarão o paralelismo expandido para executar um conjunto completo de software acelerado para IA generativa, computação de alto desempenho (HPC) e computação quântica híbrida.
Buck descreveu o novo NVIDIA HGX H200 como “a plataforma de computação de IA líder mundial”¹. As GPUs NVIDIA H200 Tensor Core possuem memória HBM3e para executar modelos de IA generativa em crescimento. Ele possui até 141GB de HBM3e, sendo o primeiro acelerador de IA a usar a tecnologia ultra-rápida. Executando modelos como GPT-3, as GPUs NVIDIA H200 Tensor Core fornecem um aumento de desempenho de 18x em relação aos aceleradores da geração anterior. Entre outras referências de IA generativa, eles passam por 12.000 tokens por segundo em um modelo de linguagem grande Llama2-13B (LLM).
Buck também revelou uma plataforma de servidor que liga quatro Superchips NVIDIA GH200 Grace Hopper em um interconector NVIDIA NVLink. A configuração quad coloca em um único nó de computação impressionantes 288 núcleos Arm Neoverse e 16 petaflops de desempenho de IA com até 2,3 terabytes de memória de alta velocidade. Os nós de servidor baseados nos quatro Superchips GH200 fornecerão 16 petaflops de desempenho de IA.
Demonstrando sua eficiência, um Superchip GH200 usando a biblioteca de código aberto NVIDIA TensorRT-LLM é 100x mais rápido do que um sistema de CPU x86 de soquete duplo e quase 2x mais eficiente em termos de energia do que um servidor de GPU X86 + H100. “A computação acelerada é computação sustentável”, disse Buck. “Ao aproveitar o poder da computação acelerada e da IA generativa, juntos podemos impulsionar a inovação em várias indústrias, ao mesmo tempo que reduzimos nosso impacto no meio ambiente”.