OCR

OCR (Reconhecimento Otico de Caracteres)

Tecnologia que converte diferentes tipos de documentos — como documentos digitalizados, imagens de camera ou PDFs — em dados pesquisaveis e editaveis, reconhecendo e extraindo texto de imagens.

Detalhe técnico

Os motores de OCR modernos utilizam redes neuronais convolucionais (CNN) e redes de memoria de longo prazo (LSTM) para reconhecimento de caracteres. O pipeline inclui pre-processamento de imagem (binarizacao, alinhamento por inclinacao), segmentacao de texto (detetar linhas, palavras, caracteres), reconhecimento (classificacao de caracteres), pos-processamento (verificacao de dicionario, correccao contextual) e exportacao (hOCR para HTML, ALTO para XML ou PDF com camada de texto invisivel). Tesseract 5.x e ABBYY FineReader sao motores proeminentes.

Exemplo

```javascript
// OCR: PDF manipulation example
import { PDFDocument } from 'pdf-lib';

const pdfDoc = await PDFDocument.load(fileBytes);
const pages = pdfDoc.getPages();
console.log(`Pages: ${pages.length}`);
```

Ferramentas relacionadas

M Mesclar PDF D Dividir PDF C Comprimir PDF G Girar PDF A Adicionar Números de Página P PDF para JPG M Marca d'Água em PDF R Reordenar Páginas de PDF A Achatar PDF E Editar Metadados de PDF A Assinar PDF J JPG para PDF E Extrair Texto de PDF D Delete PDF Pages R Reverse PDF E Extract PDF Pages E Extract Odd/Even Pages R Resize PDF Pages C Crop PDF I Insert Blank Pages D Duplicate PDF Pages P PDF to PNG A Add Header & Footer A Add Text to PDF A Add Image to PDF

Termos relacionados

Cross-Reference Table Digital Signature Annotation Bookmark Bates Numbering Content Stream AcroForm Color Management (PDF)