Nhận Dạng Ký Tự Quang Học Là Gì?

Mặc dù thật dễ dàng để lấy một tài liệu trên máy tính của bạn và nhận một bản sao vật lý bằng máy in, nhưng nói chung là khó hơn để thực hiện theo cách khác. Mặc dù máy quét tồn tại và có thể lưu tài liệu đã quét dưới dạng hình ảnh, nhưng điều này không đặc biệt hữu ích nếu bạn muốn chỉnh sửa tài liệu. Để có thể chỉnh sửa tài liệu, bạn muốn sử dụng công nghệ có tên là Nhận dạng ký tự quang học hoặc OCR.

Nhận dạng ký tự quang học hoạt động như thế nào?

OCR sử dụng một loạt các kỹ thuật để đọc chính xác tài liệu. Phần mềm OCR điều chỉnh tài liệu và thậm chí cả các từ riêng lẻ để chúng được căn chỉnh chính xác. Hình ảnh được chuyển đổi thành định dạng đen trắng tinh khiết vì điều đó dễ dàng hơn so với việc phân biệt giữa các sắc thái của màu xám. Phân tích cũng được thực hiện để xác định và loại bỏ bất kỳ mục không phải văn bản nào.

Hai loại thuật toán OCR chính được sử dụng, so khớp ma trận và trích xuất tính năng. Đối sánh ma trận lấy hình ảnh của một ký tự đơn lẻ, sau đó so sánh nó với các thuật toán được định cấu hình phông chữ trên cơ sở từng pixel. Kỹ thuật này yêu cầu ký tự phải được cách ly chính xác khỏi tất cả các nội dung khác và để phông chữ được đưa vào phần mềm OCR. Loại OCR này cũng không hoạt động để nhận dạng chữ viết tay.

Các thuật toán trích xuất đối tượng địa lý chia nhỏ từng ký tự thành các đối tượng địa lý, chẳng hạn như đường thẳng, đường cong và giao điểm đường thẳng. Kỹ thuật này làm giảm đáng kể sự phụ thuộc vào thuật toán được đào tạo với các phông chữ đã biết. Tính năng trích xuất có khả năng nhận dạng các phông chữ mới và sao chép chúng, cũng như một số chữ viết tay, mặc dù độ chính xác không tốt như các phông chữ đã biết.

Một số phần mềm nâng cao hơn sử dụng ngữ cảnh của các chữ cái xung quanh để giúp xác định các chữ cái không rõ ràng. Ví dụ: nếu từ “dog” được in ra và thuật toán OCR không thể biết chắc chắn “o” là “a” hay “o”, nó có thể sử dụng từ điển để xem có bất kỳ sự kết hợp nào của các ký tự tiềm năng hay không. tạo ra một từ đã biết. Trong trường hợp này, thuật toán OCR sẽ giảm khả năng xuất hiện chữ “a”, vì “dag” không phải là một từ, trong khi “dog” thì có.

OCR được sử dụng ở đâu?

Một trong những ứng dụng chính của OCR là trong hệ thống bưu điện. OCR được sử dụng để tự động xác định địa chỉ của thư và bưu kiện, một nhiệm vụ mà nó có thể thực hiện nhanh hơn đáng kể so với con người. Trong trường hợp hệ thống OCR không thể đọc địa chỉ của nhãn, nó sẽ được tách ra để con người xử lý theo cách thủ công.

OCR hữu ích như một công cụ trợ năng cho người khiếm thị khi được kết hợp với công cụ chuyển văn bản thành giọng nói. Google dịch cũng triển khai OCR như một phần của quá trình dịch văn bản sang hình ảnh.

Từ khóa » Nhận Dạng Ký Tự Là Gì