Sintetizadores de fala são sistemas de conversão de texto em fala usados ??com computadores. Este tipo de software é programado para incluir os fonemas e as regras gramaticais de uma língua, para que as palavras sejam pronunciadas corretamente. Neste artigo, você conhecerá 14 excelentes ferramentas de síntese de fala gratuitas e de código aberto para Linux.
Sintetizadores de fala
Um sistema de conversão de texto em fala (TTS) converte texto em idioma normal em fala. O processo inverso é o reconhecimento de fala. Algumas das ferramentas usam aprendizado de máquina para melhorar enormemente a qualidade da fala. As redes neurais usadas para texto neural em fala processam grandes conjuntos de dados para aprender os caminhos ideais da entrada à saída. Esta é uma forma de aprendizado de máquina, uma vez que essas redes usam um vocoder neural para sintetizar formas de onda de fala sem intervenção do usuário.
Com o benefício do aprendizado de máquina, o software pode fornecer fortes recursos multivoz e prosódia e entonação altamente realistas. Para fornecer uma visão sobre a qualidade do software disponível, o pessoal do Linux Links compilou uma lista de 14 ferramentas úteis de síntese de voz. Abaixo, uma lista que inclui apenas softwares gratuitos e de código aberto.
Ferramentas de síntese de fala
- Piper: Sistema de texto para fala neural local e rápido. Um software gratuito e de código aberto escrito em C++ e Python;
- Tartoise: Sistema de conversão de texto em fala multivoz treinado com ênfase na qualidade;
- Coqui TTS: Oferece modelos pré-treinados em mais de 1.100 idiomas diferentes;
- Bark: Modelo de texto para áudio baseado em transformador;
- Festival: Sistema geral de síntese de fala multilíngue. O Festival oferece um sistema completo de conversão de texto em fala com diversas APIs, além de um ambiente para desenvolvimento e pesquisa de técnicas de síntese de fala;
- Praat: Software para análise e síntese de fala;
- Speech Note: Fala para texto, texto para fala e tradução automática;
- Mímic 3 Mecanismo leve de conversão de texto em fala;
- Orca: Leitor de tela programável;
- Flite: Mecanismo de síntese de texto para fala pequeno e rápido;
- RHVoice: Dá aos deficientes visuais uma voz de síntese com seu leitor de tela;
- eSpeak NG: Continuação do projeto eSpeak;
- eSpeak: Sintetizador de fala usando um método de síntese de formantes;
- Gespeaker: Interface baseada em GTK para eSpeak. eSpeak é um sintetizador de voz de software compacto e multiplataforma. Ele usa um método de síntese de formantes, fornecendo vários idiomas em um tamanho de arquivo relativamente pequeno.