Conheça 14 excelentes ferramentas de síntese de fala gratuitas e de código aberto

Converta texto em fala

Sintetizadores de fala são sistemas de conversão de texto em fala usados ??com computadores. Este tipo de software é programado para incluir os fonemas e as regras gramaticais de uma língua, para que as palavras sejam pronunciadas corretamente. Neste artigo, você conhecerá 14 excelentes ferramentas de síntese de fala gratuitas e de código aberto para Linux.

Sintetizadores de fala

Um sistema de conversão de texto em fala (TTS) converte texto em idioma normal em fala. O processo inverso é o reconhecimento de fala. Algumas das ferramentas usam aprendizado de máquina para melhorar enormemente a qualidade da fala. As redes neurais usadas para texto neural em fala processam grandes conjuntos de dados para aprender os caminhos ideais da entrada à saída. Esta é uma forma de aprendizado de máquina, uma vez que essas redes usam um vocoder neural para sintetizar formas de onda de fala sem intervenção do usuário.

Com o benefício do aprendizado de máquina, o software pode fornecer fortes recursos multivoz e prosódia e entonação altamente realistas. Para fornecer uma visão sobre a qualidade do software disponível, o pessoal do Linux Links compilou uma lista de 14 ferramentas úteis de síntese de voz. Abaixo, uma lista que inclui apenas softwares gratuitos e de código aberto.

Ferramentas de síntese de fala

  • Piper: Sistema de texto para fala neural local e rápido. Um software gratuito e de código aberto escrito em C++ e Python;
  • Tartoise: Sistema de conversão de texto em fala multivoz treinado com ênfase na qualidade;
  • Coqui TTS: Oferece modelos pré-treinados em mais de 1.100 idiomas diferentes;
  • Bark: Modelo de texto para áudio baseado em transformador;
  • Festival: Sistema geral de síntese de fala multilíngue. O Festival oferece um sistema completo de conversão de texto em fala com diversas APIs, além de um ambiente para desenvolvimento e pesquisa de técnicas de síntese de fala;
  • Praat: Software para análise e síntese de fala;
  • Speech Note: Fala para texto, texto para fala e tradução automática;
  • Mímic 3 Mecanismo leve de conversão de texto em fala;
  • Orca: Leitor de tela programável;
  • Flite: Mecanismo de síntese de texto para fala pequeno e rápido;
  • RHVoice: Dá aos deficientes visuais uma voz de síntese com seu leitor de tela;
  • eSpeak NG: Continuação do projeto eSpeak;
  • eSpeak: Sintetizador de fala usando um método de síntese de formantes;
  • Gespeaker: Interface baseada em GTK para eSpeak. eSpeak é um sintetizador de voz de software compacto e multiplataforma. Ele usa um método de síntese de formantes, fornecendo vários idiomas em um tamanho de arquivo relativamente pequeno.
Share This Article
Follow:
Jardeson é Mestre em Tecnologia Agroalimentar e Licenciado em Ciências Agrária pela Universidade Federal da Paraíba. Entusiasta no mundo tecnológico, gosta de arquitetura e design gráfico. Economia, tecnologia e atualidade são focos de suas leituras diárias. Acredita que seu dia pode ser salvo por um vídeo engraçado.
Sair da versão mobile