OCR

OCR (Optische Zeichenerkennung)

Eine Technologie, die Bilder von gedrucktem oder handgeschriebenem Text analysiert und in maschinenlesbare, durchsuchbare und bearbeitbare Textdaten umwandelt.

Technisches Detail

Moderne OCR-Pipelines umfassen Bildvorverarbeitung (Entzerrung, Binarisierung, Rauschentfernung), Layoutanalyse zur Identifizierung von Textbereichen, Zeichensegmentierung und Mustererkennung. Engines wie Tesseract verwenden LSTM-Neuronale-Netze für die Erkennung. Für PDFs erstellt OCR eine unsichtbare Textebene, die über dem gescannten Bild positioniert wird, wodurch das Dokument durchsuchbar wird, während das ursprüngliche visuelle Erscheinungsbild erhalten bleibt.

Beispiel

```javascript
// OCR: PDF manipulation example
import { PDFDocument } from 'pdf-lib';

const pdfDoc = await PDFDocument.load(fileBytes);
const pages = pdfDoc.getPages();
console.log(`Pages: ${pages.length}`);
```

Categories

OCR

Technisches Detail

Beispiel

Verwandte Tools

Verwandte Begriffe