in

Microsoft construiu um dos cinco supercomputadores mais poderosos do planeta

Em termos de especificações, o novo supercomputador possui alguns números impressionantes.

Microsoft construiu um dos cinco supercomputadores mais poderosos do planeta
Imagem: Wikimedia commons.

A Microsoft anunciou um novo supercomputador construído pela empresa em parceria com a OpenAI para treinar modelos de IA em larga escala. A Microsoft investiu na OpenAI com o objetivo de construir supercomputadores poderosos que aproveitem os serviços em nuvem do Azure.

A empresa disse que o objetivo final é disponibilizar seus grandes modelos de IA, ferramentas de otimização de treinamento e recursos de supercomputação por meio dos serviços de IA do Azure e do GitHub para pesquisadores.

Microsoft construiu um dos cinco supercomputadores mais poderosos do planeta

A OpenAI, sediada em Seattle, disse que este é um dos cinco principais supercomputadores divulgados publicamente.

Em termos de especificações, o novo supercomputador possui alguns números impressionantes:

  • Mais de 285.000 núcleos de CPU;
  • 10.000 GPUs;
  • 400 gigabits por segundo de conectividade de rede para cada servidor de GPU.

No início deste ano, a gigante da tecnologia apresentou um modelo de geração de linguagem natural de 17 bilhões de parâmetros:

Microsoft construiu um dos cinco supercomputadores mais poderosos do planeta
Imagem: The Next Web.

Assim, com esse supercomputador e seu programa de IA, a Microsoft visa criar modelos genéricos e de código aberto.

Por fim, o diretor técnico da Microsoft, Kevin Scott, disse que se trata de treinar um modelo que aprende a fazer um conjunto geral de coisas e disponibilizá-lo aos desenvolvedores:

Até agora, a maioria das pessoas entende intuitivamente como os computadores pessoais são uma plataforma — você compra um e não é como se tudo que o computador fosse fazer estivesse embutido no dispositivo quando você o tira da caixa.

É exatamente isso que queremos dizer quando dizemos que a IA está se tornando uma plataforma. Assim, trata-se de pegar um conjunto muito amplo de dados e treinar um modelo que aprende a fazer um conjunto geral de coisas e disponibilizar esse modelo para milhões de desenvolvedores descobrirem como fazer coisas interessantes e criativas.

Fonte: The Next Web

Leia mais:

Estados Unidos coloca supercomputadores do país para combater a COVID-19

Honeywell deve lançar computador quântico mais poderoso do mundo

Escrito por Leonardo Santana

Profissional da área de manutenção e redes, astrônomo amador, eletrotécnico e apaixonado por TI desde o século passado.