Fabricantes de sistemas revelam servidores com tecnologia NVIDIA A100 para aceleração de IA, Ciência de Dados e Computação Científica

Supercomputador com Nvidia vai trabalhar em mudanças climáticas e projetos de coronavírus
Para aumentar os recursos do HiPerGator, a UF implantará os sistemas DGX A100 da Nvidia, projetados para criar e executar projetos de IA em larga escala.

A NVIDIA Enterprise e os principais fabricantes de servidores do mundo anunciam os sistemas equipados com tecnologia NVIDIA A100 em uma variedade de designs e configurações para enfrentar os desafios mais complexos em IA, ciência de dados e computação científica.

Mais de 50 servidores A100 dos principais fornecedores do mundo – incluindo ASUS, Atos, Cisco, Dell Technologies, Fujitsu, GIGABYTE, Hewlett Packard Enterprise, Inspur, Lenovo, One Stop Systems, Quanta / QCT e Supermicro – são esperados após o lançamento no mês de maio deste ano da arquitetura NVIDIA Ampere e da GPU NVIDIA A100.

Disponibilidade e adoção

A disponibilidade dos servidores varia, com 30 sistemas previstos para os próximos meses e mais de 20 até o final do ano.

“A adoção da GPU NVIDIA A100 nas ofertas dos principais fabricantes de servidores está superando tudo o que vimos anteriormente”, conta Ian Buck, vice-presidente e gerente geral de Computação Acelerada da NVIDIA. “A grande variedade de servidores NVIDIA A100 provenientes de nossos parceiros garante que os clientes possam escolher as melhores opções para acelerar seus data centers para alta utilização e baixo custo total de propriedade”.

Primeira GPU baseada na arquitetura Ampere da NVIDIA, a A100 pode aumentar o desempenho até 20x mais do que sua antecessora, sendo o maior salto da empresa no desempenho de GPUs até hoje. Ela conta com vários avanços técnicos, incluindo uma nova tecnologia de várias instâncias de GPU, em que uma única A100 pode ser dividida em até sete GPUs separadas para lidar com vários trabalhos de computação, a tecnologia NVIDIA® NVLink® de terceira geração, que possibilita unir várias GPUs para operar como uma GPU gigante, e novos recursos de dispersão estrutural, que podem ser usados para dobrar o desempenho da GPU.

A NVIDIA também apresentou um fator forma de PCIe para a A100, complementando as configurações de quatro e oito vias da NVIDIA HGXTM A100 lançadas no mês de maio deste ano. A inclusão de uma versão PCIe da A100 permite que os fabricantes de servidores disponibilizem aos clientes um conjunto variado de ofertas: desde sistemas de GPUs únicas até servidores com 10 ou mais GPUs. Esses sistemas aceleram uma ampla variedade de cargas de trabalho de computação intensa, da simulação do comportamento molecular para descoberta de medicamentos ao desenvolvimento de modelos financeiros melhores para aprovações de hipotecas.

“Essa nova tecnologia em diversos servidores auxiliará muitas empresas não só no Brasil, mas em toda a América Latina no que diz respeito ao avanço digital, gerando uma economia de energia e custos e aumentando a velocidade dos resultados obtidos”, explica Marcio Aguiar, diretor da NVIDIA Enterprise para América Latina.

O que dizem os fabricantes?

Os fabricantes de servidores que trazem sistemas equipados com NVIDIA A100 para seus clientes incluem:

  • ASUS oferecerá o ESC4000A-E10, que pode ser configurado com quatro GPUs A100 PCIe em um único servidor.
  • Atos oferece seu sistema BullSequana X2415 com quatro GPUs NVIDIA A100 Tensor Core.
  • Cisco planeja oferecer suporte a GPUs NVIDIA A100 Tensor Core em seus servidores Cisco Unified Computing System e em seu sistema de infraestrutura hiperconvergente, Cisco HyperFlex.
  • Dell Technologies planeja oferecer suporte a GPUs NVIDIA A100 Tensor Core em seus servidores PowerEdge e soluções que aceleram cargas de trabalho de ponta a ponta para nuvem, assim como oferecem suporte a outros aceleradores, software e tecnologias NVIDIA GPU em uma ampla gama de ofertas.
  • Fujitsu está trazendo GPUs A100 para sua linha de servidores PRIMERGY.
  • GIGABYTE oferecerá servidores G481-HA0, G492-Z50 e G492-Z51 que suportam até 10 GPUs A100 PCIe, enquanto o servidor G292-Z40 suporta até oito.
  • HPE suportará GPUs A100 PCIe no servidor HPE ProLiant DL380 Gen10 e, para cargas de trabalho aceleradas de HPC e IA, no sistema HPE Apollo 6500 Gen10
  • Inspur está lançando oito sistemas equipados com NVIDIA A100, incluindo o NF5468M5, NF5468M6 e NF5468A5 usando GPUs A100 PCIe, o NF5488M5-D, NF5488A5, NF5488M6 e NF5688M6 usando o NVLink de oito vias e o NF5888M6.
  • Lenovo irá suportar GPUs A100 PCIe em sistemas selecionados, incluindo o servidor pronto para o Lenovo ThinkSystem SR670 AI. A Lenovo expandirá a disponibilidade em seu portfólio ThinkSystem e ThinkAgile no outono.
  • One Stop Systems oferecerá seu sistema de expansão OSS 4UV Gen 4 PCIe com até oito GPUs NVIDIA A100 PCIe para permitir que os clientes de IA e HPC escalem seus servidores Gen 4.
  • Quanta/QCT oferecerá vários sistemas de servidor QuantaGrid, incluindo D52BV-2U, D43KQ-2U e D52G-4U que suportam até oito GPUs NVIDIA A100 PCIe.
  • Supermicro oferecerá seu sistema GPU 4U A +, suportando até oito GPUs NVIDIA A100 PCIe e até dois slots de expansão PCI-E 4.0 de alto desempenho adicionais, juntamente com outros servidores GPU 1U, 2U e 4U.

A NVIDIA Enterprise tem expandido seu portfólio de sistemas certificados NGC-ReadyTM. Trabalhando diretamente com a NVIDIA, os fornecedores de sistemas podem receber a certificação NGC-Ready para seus servidores A100. A certificação NGC-Ready garante aos clientes que os sistemas oferecerão o desempenho necessário para executar cargas de trabalho de IA.

Os sistemas prontos para NGC são testados com o software de IA otimizado para GPU do registro NGCTM da NVIDIA, que está disponível para sistemas com GPU da NVIDIA em data centers, na nuvem e em edge.

Software otimizado para NVIDIA A100 já disponível

A A100 é compatível com software otimizado por NVIDIA Ampere, incluindo o CUDA 11; novas versões de mais de 50 bibliotecas CUDA-XTMNVIDIA Jarvis, uma estrutura de serviços de IA multimodal e informal; NVIDIA Merlin, uma estrutura de aplicações muito recomendada; o conjunto de bibliotecas de software de ciência de dados de código aberto RAPIDSTM e o SDK DE HPC DA NVIDIA, que inclui compiladores, bibliotecas e ferramentas de software para maximizar a produtividade do desenvolvedor e o desempenho e a portabilidade de aplicações de HPC.

Essas poderosas ferramentas de software permitem que os desenvolvedores criem e acelerem aplicações em HPC, genômica, 5G, ciência de dados, robótica e muito mais. E se você gostar o assunto, que tal ler o artigo Os supercomputadores mais rápidos do mundo atingem velocidades mais altas do que nunca com o Linux.

Emanuel Negromonte Autor
Autor
Jornalista especialista em Linux a mais de 20 anos. Fundador do SempreUpdate e entusiasta do software livre.