OCR

OCR (Nhận dạng Ký tự Quang học)

Công nghệ phân tích hình ảnh của văn bản in hoặc viết tay và chuyển đổi chúng thành dữ liệu văn bản có thể đọc được bằng máy, tìm kiếm được và chỉnh sửa được.

Chi tiết kỹ thuật

Các quy trình OCR hiện đại bao gồm tiền xử lý hình ảnh (chỉnh nghiêng, nhị phân hóa, loại bỏ nhiễu), phân tích bố cục để xác định vùng văn bản, phân đoạn ký tự và nhận dạng mẫu. Các công cụ như Tesseract sử dụng mạng nơ-ron LSTM để nhận dạng. Đối với PDF, OCR tạo một lớp văn bản ẩn được đặt chồng lên hình ảnh quét, giúp tài liệu có thể tìm kiếm được trong khi vẫn giữ nguyên hình ảnh gốc.

Ví dụ

```javascript
// OCR: PDF manipulation example
import { PDFDocument } from 'pdf-lib';

const pdfDoc = await PDFDocument.load(fileBytes);
const pages = pdfDoc.getPages();
console.log(`Pages: ${pages.length}`);
```

Công cụ liên quan

G Gộp PDF T Tách PDF N Nén PDF X Xoay PDF T Thêm Số Trang P PDF sang JPG W Watermark PDF S Sắp Xếp Lại Trang PDF L Làm Phẳng PDF C Chỉnh Sửa Siêu Dữ Liệu PDF K Ký PDF J JPG sang PDF T Trích Xuất Văn Bản Từ PDF D Delete PDF Pages R Reverse PDF E Extract PDF Pages E Extract Odd/Even Pages R Resize PDF Pages C Crop PDF I Insert Blank Pages D Duplicate PDF Pages P PDF to PNG A Add Header & Footer A Add Text to PDF A Add Image to PDF

Thuật ngữ liên quan

Cross-Reference Table Digital Signature Annotation Bookmark Bates Numbering Content Stream AcroForm Color Management (PDF)