Mã hóa văn bản trong tệp tài liệu kỹ thuật số đề cập đến cách thức mà chuỗi byte được ánh xạ thành các ký tự trong một ngôn ngữ. Có nhiều bảng mã khác nhau cho các ngôn ngữ khác nhau. Bạn có thể xác định mã hóa của một tệp văn bản bằng một số công cụ phần mềm.
Nó là cần thiết
- - Từ Microsoft Office;
- - KWrite;
- - Mozilla Firefox;
- - enca.
Hướng dẫn
Bước 1
Sử dụng Microsoft Office Word, nếu được cài đặt trên máy tính của bạn, để xác định mã hóa của tệp văn bản. Chạy ứng dụng này. Trong menu chính, chọn các mục "Tệp" và "Mở …" hoặc nhấn phím tắt Ctrl + O. Trong hộp thoại xuất hiện, điều hướng đến thư mục mong muốn và chọn tệp. Nhấp vào nút "Mở". Nếu mã hóa văn bản khác với CP1251, hộp thoại "Chuyển đổi tệp" sẽ tự động mở. Kích hoạt tùy chọn "Khác" trong đó và chọn kiểu mã hóa bằng cách sử dụng danh sách ở bên phải. Nếu mã hóa đúng được chọn, văn bản có thể đọc được sẽ được hiển thị trong trường "Mẫu".
Bước 2
Áp dụng các trình soạn thảo văn bản cho phép lựa chọn mã hóa văn bản nguồn. Một ví dụ điển hình về một ứng dụng như vậy là KWrite (chạy trên KDE trên các hệ thống giống UNIX). Tải tệp văn bản vào trình chỉnh sửa. Sau đó, chỉ cần lặp lại các mã hóa cho đến khi văn bản có thể đọc được hiển thị (trong KWrite, điều này được thực hiện bằng cách sử dụng phần Mã hóa của menu Công cụ).
Bước 3
Tương tự như trình soạn thảo văn bản, bạn có thể sử dụng trình duyệt để xác định mã hóa của tệp. Sử dụng Mozilla Firefox. Chạy ứng dụng này. Nếu chưa được cài đặt, hãy tải xuống bản phân phối thích hợp từ mozilla.org và cài đặt nó. Mở một tệp văn bản trong trình duyệt của bạn. Để thực hiện việc này, hãy chọn mục "Tệp" và "Mở tệp …" trong menu chính hoặc nhấn Ctrl + O. Nếu văn bản đã tải được hiển thị chính xác, hãy mở rộng phần "Mã hóa" của trình đơn "Xem" và tìm cách mã hóa từ tên của mục mà nhãn được đặt trên đó. Nếu không, hãy chọn thông số này bằng cách chọn các mục khác nhau của cùng một menu, cũng như phần "Bổ sung" của nó.
Bước 4
Áp dụng các tiện ích chuyên dụng để xác định bảng mã của tệp văn bản. Trên các hệ thống giống UNIX, bạn có thể sử dụng enca. Nếu cần, hãy cài đặt chương trình này bằng các trình quản lý gói có sẵn. Liệt kê các ngôn ngữ có sẵn bằng cách chạy lệnh:
enca - danh sách các ngôn ngữ
Xác định mã hóa của tệp văn bản bằng cách chỉ định tên của nó với tùy chọn -g và ngôn ngữ tài liệu với tùy chọn -L. Ví dụ:
enca -L nga -g /home/vic/tmp/aaa.txt.