Mesmo após a grande onde de demissões promovidas pela Mozilla recentemente, a empresa lança uma importante atualização do DeepSpeech, o mecanismo de voz para texto de código aberto. Na verdade, apesar do anúncio da versão 0.9, o projeto corre sério risco de ser descontinuado. Como o próprio nome diz, o DeepSpeech usa o deep learning para digitação de texto usando somente a voz. Felizmente, pelo menos por ora, DeepSpeech ainda está avançando.
Após as demissões da Mozilla, o futuro do DeepSpeech está em questão, mesmo com o projeto se aproximando de seu lançamento estável 1.0. Em agosto, eles disseram que o DeepSpeech 1.0 seria lançado “em breve”, isso ainda não aconteceu. Porém, hoje, chega a versão 0.9.
O DeepSpeech entrou em uma fase de incertezas após a demissão de cerca de 250 colaboradores. A ordem da Mozilla é se concentrar em atividades mais lucrativas. É um dos melhores mecanismos de fala para texto (se não o melhor, certamente o melhor entre as opções de código aberto). Suporta tradução em tempo real em um grande número de hardware. O DeepSpeech utiliza aprendizado profundo com base na pesquisa do Baidu e aproveita o TensorFlow do Google. Oferece excelentes resultados de fala em texto para traduzir áudio em texto preciso.
Mesmo com demissões, Mozilla lança atualização do DeepSpeech
O DeepSpeech 0.9 é a mais recente versão para este mecanismo de fala para texto licenciado MPL 2.0 multi-idioma, de aprendizado profundo. Esta versão corrige uma série de bugs diferentes, adiciona suporte para ElectronJS 9.2, suporte para aumentar a pontuação de palavras durante a decodificação, suporte opcional para norma de camada durante o treinamento e outras melhorias.
Esta é a versão 0.9.0 do Deep Speech, um mecanismo aberto de fala para texto. De acordo com o versionamento semântico , esta versão não é completamente compatível com versões anteriores. No entanto, os modelos exportados para 0.7.X e 0.8.X devem funcionar com esta versão, diz o comunicado de lançamento.
Tal como acontece com as versões anteriores, esta versão inclui o código-fonte:
Mais detalhes sobre ele – e downloads de plataforma cruzada para – DeepSpeech 0.9 via GitHub. Lá também existe toda uma explicação sobre como fazer a instalação do programa. Toda a documentação está disponível em deepspeech.readthedocs.io.