Djvu là một định dạng phổ biến để phân phối tài liệu điện tử trên web. Nó là một tập hợp các hình ảnh được quét trong một tệp mà không có khả năng thay đổi dữ liệu được nhập vào đó. Bạn có thể sử dụng các tiện ích chuyên dụng để trích xuất văn bản từ tài liệu.
Hướng dẫn
Bước 1
Để nhận dạng djvu và lưu nội dung của tệp dưới dạng văn bản, bạn cần làm theo một số bước và sử dụng hai chương trình. Chương trình đầu tiên quét tài liệu mong muốn và chuyển nó thành tệp hình ảnh hoặc pdf. Ở giai đoạn thứ hai, tài liệu nhận được được công nhận trong các tiện ích OCR chuyên dụng.
Bước 2
Cài đặt DjView hoặc DjvuOCR trên máy tính của bạn. Để thực hiện việc này, hãy tìm tiện ích cần thiết trên Internet, tải xuống và chạy tệp kết quả, sau đó làm theo hướng dẫn trên màn hình.
Bước 3
Chuyển đến menu của tiện ích đã cài đặt và chọn "Mở djvu" hoặc "Giải mã tệp DjVu". Chỉ định đường dẫn đến tài liệu mong muốn, sau đó chọn menu thích hợp để chuyển đổi nó. Chỉ định đường dẫn để lưu tệp và chọn định dạng mong muốn.
Bước 4
Cài đặt ABBYY FineReader. Nó cho phép bạn quét các tệp hình ảnh, pdf và xuất chúng thành văn bản ở các định dạng docx, doc, txt và html. Bạn có thể tải xuống tiện ích từ trang web chính thức của ABBYY.
Bước 5
Mở FineReader đã cài đặt bằng phím tắt trên màn hình nền hoặc menu Bắt đầu. Chọn "Tệp" - "Mở" và chỉ định đường dẫn đến tệp pdf kết quả. Bạn cũng có thể sử dụng nút "Mở" trên thanh công cụ.
Bước 6
Sau khi chương trình mở tài liệu, hãy nhấp vào "Quét". Chờ cho đến khi quá trình nhận dạng văn bản và hình ảnh mong muốn hoàn tất. Sau đó nhấp vào nút Nhận dạng trên thanh công cụ để đánh dấu và xác nhận văn bản mong muốn. Trong trường "Ngôn ngữ tài liệu", hãy chọn mục bắt buộc, nếu cần.
Bước 7
Sau khi quét xong, chỉnh sửa văn bản nhận được ở phần bên phải của cửa sổ chương trình. Nếu mọi thứ được hiển thị chính xác, hãy nhấp vào nút "Lưu" và chọn định dạng lưu, cũng như thư mục bạn muốn đặt tài liệu. Sau khi lưu, bạn có thể chỉnh sửa tệp kết quả bằng bất kỳ trình soạn thảo văn bản nào.