A OpenAI está avançando com o desenvolvimento de funcionalidades inovadoras para o ChatGPT, com sinais de que a aguardada função de “câmera ao vivo” no Modo Avançado de Voz pode estar prestes a ser liberada para mais usuários. Após demonstrar as impressionantes capacidades de visão ao vivo em uma versão alfa, a empresa agora parece se preparar para uma expansão em fase beta.
O que é a função câmera ao vivo?
Revelada como parte das atualizações do GPT-4 em maio de 2024, a função permite que o ChatGPT interaja com o mundo ao seu redor por meio de uma câmera. Em uma demonstração notável, o assistente de IA conseguiu reconhecer objetos como um cachorro e uma bola, relacionando-os em uma atividade simples como buscar o brinquedo. A experiência foi comparada a uma videochamada com um ser humano, dada a rapidez e a precisão nas respostas.
Avanços desde o lançamento alfa
Usuários que testaram a versão alfa relataram uma experiência igualmente impressionante. No entanto, a OpenAI não definiu um prazo para o lançamento global da funcionalidade. Recentemente, no entanto, strings de código na versão beta do ChatGPT sugerem que a função será chamada de “Live camera” (câmera ao vivo) e incluirá avisos para evitar seu uso em navegação ou decisões críticas relacionadas à saúde e segurança.
o que esperar do beta?
A integração no beta do ChatGPT indica que a OpenAI pode estar perto de disponibilizar a função para assinantes do plano ChatGPT Plus e outros níveis pagos. Ainda não há confirmação oficial, mas a expansão em beta sugere que a empresa está refinando a tecnologia para atender melhor às expectativas dos usuários.