Novo lançamento

Shotcut 24.10 traz Whisper para reconhecimento de fala e melhorias nas transições

Editor de vídeo Open-Source Shotcutlançado com suporte de áudio ambisonic

Foi lançada a nova versão 24.10 do editor de vídeo Shotcut, trazendo uma série de recursos e melhorias, com destaque para a adição de reconhecimento de fala utilizando o modelo Whisper da OpenAI. O Shotcut, conhecido por sua flexibilidade e compatibilidade com diversos formatos de mídia por meio do FFmpeg, continua a evoluir com novas funcionalidades que facilitam o fluxo de trabalho dos criadores de conteúdo audiovisual.

Reconhecimento de fala com Whisper

Pela primeira vez, o Shotcut introduz um recurso de IA baseado no Whisper, da OpenAI, facilitado pelo projeto whisper.cpp. O novo recurso está disponível no menu Subtitles > Speech to Text ou pelo botão dedicado. O Whisper permite que os usuários convertam automaticamente áudio em texto, gerando legendas diretamente no painel de legendas.

Por padrão, o Shotcut inclui um modelo básico que oferece um equilíbrio entre velocidade e precisão, ideal para a maioria dos projetos. No entanto, usuários que precisam de maior detalhamento podem optar por baixar e configurar um modelo mais avançado no formato ggml. Essa versão mais robusta, embora mais precisa, pode ser mais lenta dependendo das especificações do hardware.

Atualmente, a aceleração de GPU está disponível apenas para Apple Silicon, enquanto em outros sistemas o processamento é otimizado para CPUs com múltiplos threads. É importante notar que erros de sincronia podem ocorrer, como legendas iniciando antes do tempo esperado, devido às limitações do modelo e da ferramenta. A OpenAI, desenvolvedora do Whisper, emite um alerta sobre o uso de seus modelos em contextos de risco, como decisões críticas ou transcrições sem consentimento.

Melhorias nas transições

A nova versão 24.10 também traz aprimoramentos significativos nas transições de vídeo:

  • Ripple Delete: ao excluir uma transição com o Ripple Delete, os clipes incluídos na transição agora são restaurados por completo.
  • Lift: ao excluir uma transição sem Ripple, o espaço antes deixado em branco é automaticamente preenchido com os clipes adjacentes.
  • Ao mover um clipe adjacente, a duração da transição é aumentada em vez de criar uma lacuna.

Outras melhorias e novidades

  • Exportação: o botão Resample foi removido do menu de exportação de vídeo. Agora, avisos em linha podem ser ignorados quando certas alterações são feitas.
  • Navegação mais fácil: um novo item de menu foi adicionado em File > Show Project in Folder, facilitando a navegação entre projetos.
  • Filtro de vídeo GPS: uma nova opção de decimais foi adicionada para palavras-chave numéricas no filtro GPS Text.
  • Gerenciamento de projetos: a seção Recent Projects foi renomeada para Projects, e agora os itens antigos não desaparecem automaticamente ao atingir o limite máximo.
  • Contexto aprimorado: uma ação de remoção foi adicionada ao menu de contexto para facilitar a exclusão de elementos de projetos.
  • Filtros GPU: o filtro Reframe de vídeo e seu botão são ocultados se os efeitos de GPU estiverem ativados.

Atualização do FFmpeg e correções

O FFmpeg foi atualizado para a versão 7.1, proporcionando melhor suporte a formatos de vídeo e áudio. Além disso, várias correções foram implementadas, incluindo:

  • Correção de falhas durante a geração de slideshows com a opção “Adicionar Selecionados à Apresentação”.
  • Correção de problemas ao abrir projetos contendo trilhas de legendas sem itens.
  • Ajustes em dimensões calculadas de forma incorreta no filtro de saída Reframe.
  • Correção na taxa de quadros duplicada em vídeos AVCHD, que também pode resolver problemas com outros formatos.
  • Solução para vídeos gravados em iPhone 16 Pro com áudio espacial.
  • Diversos outros ajustes e correções para melhorar a estabilidade geral do Shotcut.

Com essas novas funcionalidades e correções, o Shotcut 24.10 se posiciona como uma ferramenta ainda mais poderosa e versátil para editores de vídeo, oferecendo uma experiência aprimorada tanto para usuários casuais quanto para profissionais.