Codec de áudio Opus 1.5 pode fazer uso de Machine Learning

Codec de áudio Opus 1.5 pode fazer uso de Machine Learning

Codec de áudio Opus 1.5 pode fazer uso de Machine Learning. O formato de áudio de código aberto Opus da Xiph.Org para codificação de áudio com perdas lançou o Opus 1.5 como uma grande atualização que agora está fazendo maior uso do aprendizado de máquina.

O Opus 1.5 traz uma “atualização séria de aprendizado de máquina” de acordo com o anúncio de lançamento de agora. A página de demonstração 1.5 resume o maior uso de aprendizado de máquina como:

“Esta versão 1.5 é diferente de todas as anteriores. Ele traz muitos novos recursos que podem melhorar a qualidade e a experiência de áudio geral. Isso é conseguido por meio de aprendizado de máquina. Embora a Opus tenha incluído aprendizado de máquina – e até mesmo aprendizado profundo – antes (por exemplo, para detecção de fala/música), esta é a primeira vez que usa técnicas de aprendizado profundo para processar ou gerar os próprios sinais.

Em vez de projetar um novo codec baseado em ML do zero, preferimos melhorar o Opus de uma maneira totalmente compatível. Esse é um objetivo de design importante para o ML no Opus. Isso não apenas garante que o Opus continue funcionando em dispositivos mais antigos/lentos, mas também fornece um caminho de atualização fácil. A implantação de um novo codec pode ser um processo longo e doloroso. A compatibilidade significa que versões mais antigas e mais recentes do Opus podem coexistir, ao mesmo tempo em que fornecem os benefícios da nova versão quando disponíveis.

O aprendizado profundo também costuma ser associado a GPUs poderosas, mas no Opus, otimizamos tudo de tal forma que ele é executado facilmente na maioria das CPUs, incluindo telefones. Temos tido o cuidado de evitar modelos enormes (ao contrário dos LLMs com suas centenas de bilhões de parâmetros!). No final, a maioria dos usuários não deve notar o custo extra, mas as pessoas que usam telefones mais velhos (5+ anos) ou microcontroladores podem. Por esse motivo, todos os novos recursos baseados em ML são desabilitados por padrão no Opus 1.5. Eles exigem uma opção de tempo de compilação (por razões de tamanho) e, em seguida, uma opção de tempo de execução (por razões de CPU).”

Codec de áudio Opus 1.5 pode fazer uso de Machine Learning

Mas, como observado, a nova funcionalidade de aprendizado de máquina está desabilitada por padrão.

O Opus 1.5 também traz otimizações AVX2 aprimoradas, mais otimizações ARM NEON, robustez de perda de pacotes muito melhor, aprimoramentos de qualidade de fala de baixa taxa de bits e suporte para ambisônicos de 4ª e 5ª ordem.

Opus 1.5 downloads e mais informações via Opus-Codec.org.