🍋
Menu
PDF

OCR

OCR (Reconhecimento Otico de Caracteres)

Tecnologia que converte diferentes tipos de documentos — como documentos digitalizados, imagens de camera ou PDFs — em dados pesquisaveis e editaveis, reconhecendo e extraindo texto de imagens.

Detalhe técnico

Os motores de OCR modernos utilizam redes neuronais convolucionais (CNN) e redes de memoria de longo prazo (LSTM) para reconhecimento de caracteres. O pipeline inclui pre-processamento de imagem (binarizacao, alinhamento por inclinacao), segmentacao de texto (detetar linhas, palavras, caracteres), reconhecimento (classificacao de caracteres), pos-processamento (verificacao de dicionario, correccao contextual) e exportacao (hOCR para HTML, ALTO para XML ou PDF com camada de texto invisivel). Tesseract 5.x e ABBYY FineReader sao motores proeminentes.

Exemplo

```javascript
// OCR: PDF manipulation example
import { PDFDocument } from 'pdf-lib';

const pdfDoc = await PDFDocument.load(fileBytes);
const pages = pdfDoc.getPages();
console.log(`Pages: ${pages.length}`);
```

Ferramentas relacionadas

Termos relacionados