O Reconhecimento Óptico de Caracteres, ou simplesmente OCR, é a conversão de imagens digitalizadas de texto manuscrito, datilografado ou impresso em documentos pesquisáveis ??e editáveis. O software OCR é capaz de reconhecer a diferença entre caracteres e imagens, e entre os próprios caracteres. Há muitas ferramentas que possibilitam captura de tela OCR. Neste post, você conhecerá 6 ótimas ferramentas de captura de tela OCR gratuitas e de código aberto para Linux.
Tecnologia OCR
Este artigo destaca ferramentas de captura de tela com tecnologia OCR para capturar informações em vez de imagens. Apresentamos apenas software de código aberto aqui, em uma lista elaborada pelo pessoal do Linux Links. As ferramentas abaixo elencadas realizam reconhecimento de texto offline usando o respeitado framework OCR Tesseract.
Ferramentas de captura de tela OCR
- NormaCap: Ferramenta de captura de tela com tecnologia OCR para capturar informações em vez de imagens. O reconhecimento de texto é realizado offline usando o framework OCR Tesseract. Os pacotes NormCap pré-construídos são enviados com os modelos tessdata-fast, que oferecem uma precisão muito boa para compromisso de velocidade;
- gImageReader: Front-end Gtk/Qt simples para Tesseract. Tesseract é um mecanismo popular de reconhecimento óptico de caracteres, gratuito e de código aberto;
- TextShot: Ferramenta Python para capturar texto por meio de captura de tela. O TextShot oferece a capacidade de fazer uma captura de tela e copiar para a área de transferência o conteúdo de texto da captura de tela. Esta é uma ferramenta multiplataforma que roda em Linux, macOS e Windows;
- dpScreenOCR: Desenvolvido com Tesseract, ele suporta mais de 100 idiomas. Uma ferramenta com ótimas características, como: fácil de usar; dividir blocos de texto – dividir blocos de texto independentes, como colunas. Caso contrário, o texto é tratado como um bloco contínuo; opção para copiar texto para a área de transferência; opção para adicionar texto ao histórico e muito mais!;
- Frog: Ferramenta intuitiva de extração de texto (OCR) para GNOME. A ferramenta permite que você extraia rapidamente texto não selecionável de qualquer lugar: vídeos, PDFs, screencasts, páginas da web, fotos, etc.;
- TextSnatcher: Execute operações de OCR em segundos. Este aplicativo usa o Tesseract OCR 4.x para reconhecimento de caracteres. Ele conta com: suporte a vários idiomas; copie texto de imagens arrastando; arraste sobre qualquer imagem e cole; rápido e fácil de usar.
Certamente, alguma das ferramentas acima vai atender sua necessidade quando o assunto é a captura de tela OCR no seu Linux.
Via: Linux Links