Apesar de vermos muitas notícias sobre a IA vindo da Microsoft e do Google, por exemplo, muitas outras empresas também estão correndo para desenvolver produtos de IA, incluindo a Meta. Para esse fim, a gigante da mídia social acaba de apresentar sua primeira entrada no espaço. A Meta acaba de revelar uma ferramenta de IA poderosa!
Ferramenta de IA da Meta
A Meta revelou em uma postagem no blog (Via: Android Authority) que está trabalhando em uma ferramenta generativa de IA para fala. Chamada Voicebox, a empresa diz que sua ferramenta pode executar uma variedade de tarefas de geração de fala “que não foi treinada especificamente para fazer por meio do aprendizado no contexto”.
De acordo com a Meta, algumas dessas tarefas incluem síntese de texto para fala no contexto, edição de fala, redução de ruído, transferência de estilo multilíngue e amostragem de fala diversificada. Veja como a empresa descreve esses recursos:
- Text-to-speech (conversão de texto em fala) no contexto: usa amostras de áudio com apenas dois segundos de duração para combinar com o estilo de áudio e usar para geração de text-to-speech.
- Edição de fala e redução de ruído: a ferramenta pode recriar uma parte da fala que foi interrompida por um ruído ou substituir palavras mal ditas sem precisar regravar.
- Transferência de estilo multilíngue: a ferramenta pode obter uma amostra de fala e uma passagem de texto para produzir uma leitura do texto em inglês, francês, alemão, espanhol, polonês ou português.
Amostragem de fala diversificada: usa dados diversos para gerar uma fala mais representativa de como as pessoas falam nos seis idiomas mencionados anteriormente.
IA generativa e as pesquisas da Meta
De acordo com a empresa dona do Facebook, o Voicebox faz parte de sua pesquisa sobre IA generativa. Quanto à sua utilidade, Meta afirma:
No futuro, modelos de IA generativos multifuncionais, como o Voicebox, poderiam dar vozes com som natural a assistentes virtuais e personagens não-jogadores no metaverso. Eles poderiam permitir que pessoas com deficiência visual ouvissem mensagens escritas de amigos lidas por IA em suas vozes, fornecer aos criadores novas ferramentas para criar e editar facilmente faixas de áudio para vídeos e muito mais.
Se você quiser ver um exemplo de Voicebox, pode acessar o blog da Meta e assistir ao vídeo postado lá. A empresa está empenhada em trazer o metaverso nos próximos anos e, a IA pode ser de grande ajuda nesse processo também.