OCR (Nhận Dạng Ký Tự Quang Học) Là Gì? - Amazon AWS
Có thể bạn quan tâm
Công cụ OCR hoặc phần mềm OCR hoạt động theo các bước sau:
Thu nhận hình ảnh
Một máy quét sẽ đọc tài liệu và chuyển đổi chúng thành dữ liệu nhị phân. Phần mềm OCR phân tích hình ảnh đã quét và phân loại vùng sáng làm nền và vùng tối làm văn bản.
Tiền xử lý
Trước tiên, phần mềm OCR sẽ làm sạch hình ảnh và loại bỏ các lỗi để chuẩn bị cho bước đọc. Sau đây là một số kỹ thuật làm sạch của phần mềm OCR:
- Chỉnh thẳng hoặc nghiêng nhẹ tài liệu đã quét để khắc phục lỗi về căn chỉnh trong quá trình quét.
- Khử nhiễu đốm hoặc loại bỏ mọi đốm ảnh kỹ thuật số hay làm mịn các viền của hình ảnh văn bản.
- Làm sạch đường viền khung và đường thẳng trong hình ảnh.
- Nhận dạng chữ viết cho công nghệ OCR đa ngôn ngữ
Nhận dạng văn bản
Hai loại thuật toán OCR hoặc quy trình phần mềm chính mà phần mềm OCR sử dụng để nhận dạng văn bản được gọi là so khớp mẫu và trích xuất đặc điểm.
So khớp mẫu
Cách thức hoạt động của so khớp mẫu là tách biệt một hình ảnh ký tự, được gọi là hình dạng chữ và so sánh với một hình dạng chữ tương tự được lưu trữ. Tính năng nhận dạng mẫu chỉ hoạt động hiệu quả khi hình dạng chữ được lưu trữ có phông chữ và tỷ lệ tương tự với hình dạng chữ đầu vào. Phương thức này hoạt động tốt đối với hình ảnh quét từ tài liệu được đánh máy bằng phông chữ đã biết.
Trích xuất đặc điểm
Trích xuất đặc điểm sẽ chia nhỏ hoặc phân tách hình dạng chữ thành các đặc điểm như nét thẳng, nét vòng khép kín, hướng nét và giao điểm nét. Sau đó, hệ thống sử dụng các đặc điểm này để tìm kết quả phù hợp nhất hoặc kết quả gần đúng nhất trong số các hình dạng chữ khác nhau được lưu trữ.
Hậu xử lý
Sau khi phân tích, hệ thống sẽ chuyển đổi dữ liệu văn bản được trích xuất thành tệp trên máy tính. Một số hệ thống OCR có thể tạo các tệp PDF có chú thích bao gồm cả phiên bản trước và sau của tài liệu được quét.
Từ khóa » Nhận Dạng Ký Tự Quang Học Tài Liệu
-
Nhận Dạng Ký Tự Quang Học – Wikipedia Tiếng Việt
-
OCR (Nhận Dạng Ký Tự Quang Học) (Trực Tuyến Miễn Phí) - Convertio
-
Tìm Hiểu Về Phần Mềm Nhận Dạng Quang Học (OCR) - IONE
-
OCR Là Gì? Nhận Dạng Ký Tự Quang Học Là Gì?
-
OCR - Nhận Dạng Ký Tự Quang Học Là Gì? | VBPO JSC
-
Giải Pháp Nhận Dạng Ký Tự - Dịch Vụ Số Hóa Tài Liệu
-
Nhận Dạng Ký Tự Quang Học - Viettel AI
-
Nhận Dạng Ký Tự Quang Học (OCR) Là Gì? - EYEWATED.COM
-
Nhận Dạng Ký Tự Quang Học - .vn
-
Cách Chuyển đổi Hình ảnh / PDF Sang Văn Bản Bằng Tính Năng Nhận ...
-
OCR Là Gì? - Những Tính Năng Nổi Bật Của OCR - DocEye
-
Áp Dụng Giải Pháp Nhận Dạng Ký Tự Quang Học (OCR) Trong Biên ...
-
OCR – Công Nghệ Nhận Dạng Ký Tự Quang Học - Knowledge Base
-
6 Phần Mềm OCR Trực Tuyến Miễn Phí Tốt Nhất - Diều Hâu - Dieuhau