Nos esforços contínuos para melhorar a inteligência artificial conversacional, o Google está lançando uma nova atualização para o Gemini Live. Essa versão mais recente promete tornar as interações mais naturais e envolventes, além de ampliar a capacidade de compreensão de diversos idiomas, dialetos e sotaques.
Avanços na interação por voz
O Google notificou alguns usuários do Gemini Live por e-mail sobre a nova versão do modelo, que melhora significativamente a experiência de conversação por voz. Com essa atualização, o Gemini Live agora pode interpretar com mais precisão diferentes formas de fala e oferecer assistência aprimorada em tradução.
O avanço também é impulsionado pela Multimodal Live API introduzida com o Gemini 2.0. Essa API permite que desenvolvedores processem entradas em texto, áudio e vídeo, garantindo interações mais fluidas e integradas.
Novos recursos para uma experiência aprimorada
Além da melhoria no reconhecimento de fala, o Google também está trazendo novos recursos para o Gemini Live. Entre eles está a introdução do compartilhamento de tela e transmissão de vídeo ao vivo diretamente no aplicativo Gemini. Essa funcionalidade foi anteriormente demonstrada pelo Google com o Astra e agora está sendo incorporada ao serviço.
Armazenamento de dados e privacidade
Com essa evolução, também há mudanças na forma como os dados são armazenados. O Gemini Live passará a salvar áudio, vídeo e compartilhamentos de tela na seção “Gemini Apps Activity”, caso essa configuração esteja ativada pelo usuário. Os dados serão removidos conforme o período de exclusão automática definido.
Anteriormente, a política de privacidade do Gemini destacava que os dados de voz e áudio ao vivo não eram armazenados nos servidores do Google. No entanto, a empresa reforça que manterá total transparência sobre qualquer mudança futura nessa política.
Conclusão
O aprimoramento do Gemini Live reforça o compromisso do Google em tornar suas ferramentas de IA mais interativas e eficientes. Com suporte ampliado a idiomas e novos recursos como transmissão ao vivo e compartilhamento de tela, a experiência dos usuários promete ser ainda mais rica e intuitiva.