Inteligência artificial

Google revela era da inferência com TPU Ironwood e IA musical Lyria

Google lança a TPU Ironwood de 7ª geração e destaca IA generativa com o modelo musical Lyria, Gemini 2.5 Flash e melhorias nos sistemas de voz e vídeo no Cloud Next 2025.

Google TPU Lyria

O Google surpreende no Cloud Next 2025 com uma série de inovações em IA, incluindo a TPU Ironwood de 7ª geração, o modelo musical Lyria e melhorias em geração de voz e vídeo com Chirp 3, Veo 2 e Imagen 3.

Google revela TPU Ironwood, IA Lyria e avanços em áudio e vídeo

O novo poder da inferência: TPU Ironwood

Durante o evento Cloud Next 2025, o Google apresentou a Ironwood, sua nova Unidade de Processamento Tensorial (TPU) de sétima geração, descrita como a mais eficiente, poderosa e escalável da empresa até agora.

Com foco exclusivo em inferência — ou seja, no uso prático dos modelos de IA para geração de respostas e insights — a Ironwood marca a transição para o que o Google chama de “era da inferência”, onde a IA age de forma proativa para entender e gerar informações, em vez de apenas reagir a comandos humanos.

Projetada para sustentar cargas pesadas de modelos avançados, como LLMs (Modelos de Linguagem de Grande Escala) e arquiteturas MoE (Mistura de Especialistas), a Ironwood se destaca por oferecer processamento paralelo intenso e acesso rápido à memória, otimizando o desempenho ao reduzir a movimentação de dados dentro do chip.

A arquitetura utiliza uma rede ICI de alta largura de banda e baixa latência para comunicação sincronizada entre milhares de chips. Disponível em configurações que variam de 256 até 9.216 unidades, um único pod com o total de chips atinge 42,5 Exaflops — mais de 24 vezes o desempenho do supercomputador El Capitan.

Além disso, cada chip oferece 4.614 TFLOPs e 192 GB de memória de banda larga, superando em 6x a geração anterior (Trillium). E o melhor: com o dobro de eficiência energética por watt.

Empresas já podem acessar o Ironwood por meio do Google Cloud, alimentado pelo ambiente Pathways, que suporta treinamentos e inferências em larga escala.

Gemini 2.5 Flash: IA rápida e econômica

Outra novidade é o Gemini 2.5 Flash, modelo otimizado para alta performance com baixo custo e latência. Esse sistema inteligente adapta seu tempo de processamento de acordo com a complexidade da consulta, tornando respostas simples ainda mais rápidas.

Ele também permite personalização do chamado “orçamento de pensamento”, possibilitando ajustes finos entre velocidade, precisão e custo. Essa abordagem é ideal para aplicações que exigem respostas em massa, como atendimentos automatizados e análises em tempo real.

Lyria: IA que compõe trilhas sonoras

Google TPU Lyria

No campo criativo, o Google lança o Lyria, seu modelo de conversão de texto em música. Disponível em versão prévia para empresas através do Vertex AI, o Lyria transforma descrições textuais em faixas musicais de alta fidelidade, adaptáveis a diferentes estilos e identidades de marca.

A proposta é permitir que equipes criativas criem trilhas personalizadas para vídeos, podcasts e campanhas publicitárias com maior agilidade e menos dependência de licenciamento musical.

Um exemplo de comando que pode ser usado no Lyria:
“Crie uma melodia bebop energética com solos rápidos de saxofone e trompete, acompanhados por um piano percussivo e um ritmo frenético de baixo e bateria.”

Edição avançada com Veo 2 e Imagen 3

O modelo de vídeo Veo 2 agora conta com ferramentas inteligentes de pintura, permitindo que editores removam elementos indesejados — como logos ou fundos — e reestruturem o enquadramento de vídeos para formatos otimizados para redes sociais.

Paralelamente, o Imagen 3 Editing aprimora a restauração de imagens danificadas e oferece remoção automática de objetos, ideal para fluxos de trabalho visuais dinâmicos.

Chirp 3: voz natural em 35 idiomas

Fechando os anúncios, o Chirp 3 expande as possibilidades de voz com áudio de alta definição em mais de 35 idiomas. Empresas podem escolher entre oito locutores e, com apenas 10 segundos de amostra, criar vozes personalizadas para serviços como call centers, vídeos institucionais ou narrativas acessíveis.

Um dos destaques do Chirp 3 é sua capacidade de identificar diferentes locutores dentro de uma única gravação — facilitando transcrições precisas e automáticas.

Para garantir segurança e uso ético, o recurso “Instant Custom Voice” requer verificação de permissões e inclui mecanismos contra uso indevido.

Segurança com marca-d’água invisível

Todos os conteúdos gerados por Lyria, Imagen e Veo agora contam com o SynthID, tecnologia da DeepMind que insere marcas-d’água invisíveis em imagens, vídeos e áudios. O objetivo é permitir a rastreabilidade e autenticidade do conteúdo criado por IA.