A OpenAI, empresa por trás do ChatGPT, vem se destacando justamente por seu modelo de IA generativa. O sucesso do ChatGPT tem sido surpreendente, é claro, mas a empresa também anunciou recentemente o Sora, um sistema capaz de criar videoclipes de 60 segundos que parecem muito realistas. Agora, a OpenAI anunciou um novo sistema chamado Voice Engine, que pode recriar vozes humanas.
OpenAI e a tecnologia para recriar vozes humanas
Assim como Sora, a OpenAI não permite que o público use o Voice Engine. Por enquanto, a empresa está testando o sistema de forma privada com “um pequeno grupo de empresas”. Obviamente, a razão pela qual isto é feito é devido às enormes implicações éticas de um sistema que pode imitar a voz de uma pessoa real.
O The New York Times fez uma demonstração do sistema e compartilhou alguns clipes (Via: The Hacker News). O primeiro clipe é uma gravação de 16 segundos de um homem real com forte sotaque português. Ele se apresenta e diz que está fazendo este clipe para “ajudar as pessoas não-verbais a se expressarem de forma mais plena”. O próximo clipe é a recriação de sua voz pelo Voice Engine dizendo algo completamente diferente. Ainda outro clipe é uma recriação da voz do homem, mas falando em português em vez de inglês.
Ambos os clipes do Voice Engine não têm o mesmo som do clipe original. No entanto, eles estão absolutamente próximos o suficiente para que alguém que conhecesse a voz daquele homem provavelmente enganasse, fazendo-o pensar que ele realmente disse essas coisas.
Tecnologia assustadora
O que é assustador nessa tecnologia, é a possibilidade de usar uma ferramenta como essa para espalhar desinformação. Políticos, celebridades e jornalistas poderiam facilmente ter suas vozes cooptadas pelo Voice Engine e depois dizer o que quisessem. Com um pouco de edição e uma trilha de vídeo convincente, quem sabe o que poderia ser feito? Pois é, talvez as pessoas ainda não estejam prontas para lidarem com essa tecnologia ainda.
Além disso, existem também sistemas de autenticação de voz usados ??em todo o mundo para segurança. É muito possível que o Voice Engine permita que as pessoas enganem esses sistemas, colocando em risco informações confidenciais.
O gerente de produto da OpenAI, Jeff Harris, disse: “Isso é uma coisa delicada e é importante acertar”. A OpenAI está experimentando sistemas de marca d’água para ajudar a diferenciar as gravações reais das sintéticas. A equipe também está aberta sobre os problemas éticos que este sistema levanta.
No entanto, também argumenta que o Voice Engine pode fazer muito bem. Por exemplo, pessoas que antes conseguiam falar, mas perderam a voz mais tarde na vida, poderiam começar a comunicar novamente usando um fac-símile da sua própria voz. O físico Stephen Hawking é um exemplo famoso de pessoa que poderia ter se beneficiado de um serviço de voz como este.
Além disso, o Voice Engine também poderia preservar as vozes de pessoas que não estão mais vivas e também trabalhar em muitos ambientes comerciais, como na criação de audiolivros. A OpenAI afirma que ainda não tem planos para o lançamento público do Voice Engine. Assim como Sora, ele só quer demonstrar o que pode fazer.