Oito dos 10 supercomputadores mais rápidos da lista TOP500 têm maior aceleração e economizam energia com NVIDIA Enterprise. O novo ranking dos TOP500 supercomputadores mostra a grande tendência da computação científica moderna, expandida com IA e Data Analytics e acelerada com as tecnologias NVIDIA Enterprise. Esses oito melhores supercomputadores do mundo agora usam GPUs NVIDIA, rede InfiniBand, ou ambos. Eles incluem os sistemas mais poderosos de EUA, Europa e China.
A NVIDIA, após a aquisição da Mellanox, equipa dois terços (333) dos sistemas TOP500 na lista mais recente, de junho de 2020. Na lista de junho de 2017 as duas empresas separadas tinham menos da metade (203). As redes NVIDIA Mellanox InfiniBand e Ethernet conectam 305 sistemas (61%) dos supercomputadores TOP500, incluindo todos os 141 sistemas InfiniBand, e 164 (63%) dos sistemas que utilizam Ethernet.
Em eficiência energética, os sistemas que usam GPUs NVIDIA têm se destacado em relação aos demais. Os sistemas com GPUs NVIDIA, em média, são 2,8 vezes mais eficientes em termos de energia medidos em gigaflops/watt do que os sistemas que não o possuem. Essa é uma das razões pelas quais as GPUs NVIDIA agora são usadas por 20 dos 25 principais supercomputadores da lista TOP500.
Selene, o melhor exemplo
O melhor exemplo dessa eficiência de energia é o Selene, a mais recente adição ao cluster de pesquisa interno da NVIDIA. O sistema era o número 2 na lista mais recente do Green500 e o número 7 no TOP500 geral, com 27,5 petaflops no benchmark Linpack. Com 20,5 gigaflops/watt, Selene está a uma fração de um ponto do primeiro lugar na lista Green500, reivindicada por um sistema muito menor que ficou em 394 em termos de desempenho.
O Selene é o único sistema dos 100 melhores a quebrar a barreira dos 20 gigaflops/watt. É também o segundo supercomputador industrial mais poderoso do mundo, atrás do sistema número 6 da gigante de energia Eni S.p.A. da Itália, que também usa GPUs NVIDIA.
No uso de energia, o Selene é 6,8 vezes mais eficiente que a média dos sistemas que não usam GPUs NVIDIA da lista TOP500. O desempenho e a eficiência energética do Selene são graças aos Tensor Cores de terceira geração nas GPUs NVIDIA A100 que aceleram a matemática tradicional de 64 bits para simulações e o trabalho de menor precisão para IA.
A classificação do Selene é uma façanha impressionante para um sistema que levou menos de quatro semanas para ser construído. Os engenheiros puderam montar o Selene rapidamente porque usaram a arquitetura de referência modular da NVIDIA. O guia define o que a NVIDIA chama de DGX SuperPOD. Baseia-se em uma construção poderosa e flexível para data centers modernos: o sistema NVIDIA DGX A100.
A tendência atual é pesquisadores e empresas buscarem uma maior aceleração para inteligência artificial e analytics. Com GPUs e sistemas que ajudam a acelerar o processamento e economizar energia, a NVIDIA Enterprise auxilia no desenvolvimento da ciência, explica Marcio Aguiar, diretor da NVIDIA Enterprise para América Latina. É por isso também que a última lista TOP500 pode refletir os esforços da NVIDIA Enterprise para democratizar a IA e o HPC.
O caso do Brasil
Com a atualização do ranking TOP500, os supercomputadores Atlas e Fênix, ambos pertencentes a Petrobras e montados pela Atos, são os dois maiores da América Latina. Em operação desde abril deste ano, Atlas possui 136 servidores acelerados por GPUs NVIDIA V100, além da rede interna InfiniBand, gerando um desempenho medido de 4,4 petaflops Rmax. Em outras palavras, a capacidade de processamento do supercomputador Atlas equivale a cerca de 1,5 milhão de smartphones ou de 40 mil laptops de última geração. Ocupando a 56º posição no TOP500, Atlas é o supercomputador mais bem colocado de toda a América Latina no ranking mundial de computadores de alto desempenho.
Já o supercomputador Fênix, também da Petrobras, passou por uma atualização este ano e hoje figura como o segundo mais poderoso da América Latina, no lugar 82 da lista. São 360 servidores acelerados por GPUs NVIDIA V100 e com rede interna InfiniBand EDR 100gbps, que atingem um desempenho medido de 3,2 petaflops Rmax.
Até a última edição de 2019, o Santos Dumont era reconhecido como o maior supercomputador da América Latina. O supercomputador continua na lista graças a atualização com 376 GPUs Tesla V100.
Oito dos 10 supercomputadores mais rápidos do mundo economizam energia com NVIDIA Enterprise
Ao adicionar uma camada adicional de switches NVIDIA Mellanox InfiniBand, os engenheiros vincularam 14 dessas 20 unidades de sistema para criar o Selene, que possui:
- 280 sistemas DGX A100
- 240 NVIDIA GPUs A100
- 494 switches NVIDIA Mellanox Quantum 200G InfiniBand
- 56 TB/s network fabric
- 7PB of high-performance storage all-flash
Uma das especificações mais importantes do Selene é que ele pode oferecer mais de 1 exaflops de desempenho de IA. Outra é o Selene estabelecer um novo recorde usando apenas 16 dos seus sistemas DGX A100, uma referência de análise de dados chave – chamada TPCx-BB – oferecendo desempenho 20 vezes maior do que qualquer outro sistema.
Esses resultados são críticos no momento em que a IA e as análises estão se tornando parte dos novos requisitos para a computação científica. Em todo o mundo, os pesquisadores estão usando deep learning e análise de dados para prever as áreas mais frutíferas para a realização de experimentos. A abordagem reduz o número de experimentos caros e demorados que os pesquisadores precisam, acelerando os resultados científicos.
Por exemplo, seis sistemas ainda não incluídos na lista TOP500 estão sendo construídos hoje com as GPUs A100 da NVIDIA lançadas em maio passado. Eles vão acelerar uma mistura de HPC e IA que está definindo uma nova era na ciência.
TOP500 expande para computação científica. O futuro dos supercomputadores com GPU Nvidia
Um desses novos sistemas está no Laboratório Nacional de Argonne, onde os pesquisadores usarão um cluster de 24 sistemas NVIDIA DGX A100 para digitalizar bilhões de medicamentos na busca por tratamentos para a Covid-19. Já pesquisadores em Munique estão treinando modelos de linguagem natural em 6 mil GPUs no supercomputador Summit para acelerar a análise de proteínas do novo coronavírus.
À medida que os cientistas expandem para o deep learning e analytics, eles também acessam os serviços de computação em nuvem e até mesmo transmitindo dados de instrumentos remotos na edge da rede. Juntos, esses elementos formam quatro pilares da computação científica moderna acelerados pela NVIDIA:
- Simulação: na luta contra a Covid-19, os pesquisadores do Oak Ridge National Laboratory têm simulado mais de 2 bilhões de compostos em 24 horas, executando o AutoDock em GPUs no supercomputador Summit.
- IA e data analytics: a aceleração da GPU para Spark 3.0 agora oferece acelerações para o front-end crítico e demorado do pipeline de machine learning.
- Streaming científico na edge: o CERN anunciou recentemente que as GPUs NVIDIA permitirão uma redução de 500 vezes na enorme quantidade de dados produzidos por eventos de colisão de partículas dentro do Large Hadron Collider.
- Visualização: o software IndeX e Magnum IO da NVIDIA ajuda a fornecer uma visualização do Mars Lander, a maior visualização volumétrica interativa e em tempo real do mundo.