Chọn Mã Hóa Văn Bản Khi Bạn Mở Và Lưu Tệp - Microsoft Support
Có thể bạn quan tâm
Thông thường, bạn có thể chia sẻ tệp văn bản mà không cần lo lắng về các chi tiết cơ bản về cách văn bản được lưu trữ. Tuy nhiên, bạn có thể cần chọn tiêu chuẩn mã hóa khi mở hoặc lưu tệp trong những trường hợp sau:
-
Chia sẻ tệp văn bản với những người làm việc bằng ngôn ngữ khác
-
Tải xuống tệp văn bản trên Internet
-
Chia sẻ tệp văn bản với các hệ thống máy tính khác
Các tiêu chuẩn mã hóa giúp Microsoft Word các chương trình khác xác định cách trình bày văn bản để văn bản dễ đọc. Điều này có thể cần thiết trên máy tính có phần mềm hệ thống bằng ngôn ngữ khác với ngôn ngữ đã tạo văn bản. Để tìm hiểu thêm, bạn có thể bung rộng và thu gọn bất kỳ chủ đề nào sau đây.
Hiểu rõ mã hóa văn bản
Những gì xuất hiện với bạn dưới dạng văn bản trên màn hình thực sự được lưu trữ dưới dạng giá trị số trong tệp văn bản. Máy tính của bạn sẽ chuyển các giá trị số thành ký tự hiển thị. Nó thực hiện điều này bằng cách sử dụng một tiêu chuẩn mã hóa.
Tiêu chuẩn mã hóa là lược đồ đánh số gán từng ký tự văn bản trong bộ ký tự thành giá trị số. Bộ ký tự có thể bao gồm các ký tự chữ cái, số và các ký hiệu khác. Các ngôn ngữ khác nhau thường bao gồm các bộ ký tự khác nhau, vì vậy tồn tại nhiều tiêu chuẩn mã hóa khác nhau để đại diện cho các bộ ký tự được sử dụng trong các ngôn ngữ khác nhau. '
Các tiêu chuẩn mã hóa khác nhau cho các bảng chữ cái khác nhau
Tiêu chuẩn mã hóa được lưu cùng với tệp văn bản sẽ cung cấp thông tin mà máy tính của bạn cần để hiển thị văn bản trên màn hình. Ví dụ: trong mã hóa Cyrillic (Windows), ký tự Й có giá trị số 201. Khi bạn mở tệp có chứa ký tự này trên máy tính sử dụng mã hóa Cyrillic (Windows), máy tính sẽ đọc giá trị số 201 và hiển thị Й trên màn hình.
Tuy nhiên, nếu bạn mở cùng một tệp trên máy tính sử dụng mã hóa khác, máy tính sẽ hiển thị bất kỳ ký tự nào tương ứng với giá trị số 201 trong tiêu chuẩn mã hóa mà máy tính sử dụng theo mặc định. Ví dụ: nếu máy tính của bạn sử dụng tiêu chuẩn mã hóa Tây Âu (Windows), ký tự trong tệp dựa trên Cyrillic gốc sẽ được hiển thị dưới dạng É thay vì Й vì trong mã hóa Tây Âu (Windows), giá trị 201 ánh xạ tới É. '
Unicode: Một tiêu chuẩn mã hóa cho nhiều bảng chữ cái
Để tránh các vấn đề về mã hóa và giải mã tệp văn bản, bạn có thể lưu tệp bằng mã hóa Unicode. Unicode chứa hầu hết các ký tự được đặt trên tất cả các ngôn ngữ thường được sử dụng giữa những người dùng máy tính hiện nay.
Vì Word dựa trên Unicode, Word tự động lưu tệp được mã hóa là Unicode. Bạn có thể mở và đọc các tệp được mã hóa Unicode trên hệ thống máy tính bằng tiếng Anh của mình bất kể ngôn ngữ của văn bản. Tương tự, khi bạn sử dụng hệ thống tiếng Anh của mình để lưu các tệp được mã hóa là Unicode, tệp có thể bao gồm các ký tự không tìm thấy trong bảng chữ cái Tây Âu, chẳng hạn như các ký tự tiếng Hy Lạp, Kirin, Tiếng Ả Rập hoặc Tiếng Nhật.
Chọn tiêu chuẩn mã hóa khi bạn mở tệp
Nếu khi bạn mở tệp, văn bản bị cắt xén hoặc xuất hiện dưới dạng dấu chấm hỏi hoặc hộp, Word có thể không phát hiện chính xác tiêu chuẩn mã hóa của văn bản trong tệp. Bạn có thể chỉ định tiêu chuẩn mã hóa mà bạn có thể sử dụng để hiển thị (giải mã) văn bản.
-
Bấm vào tab Tệp.
-
Bấm Tùy chọn.
-
Bấm Nâng cao.
-
Cuộn đến phần Chung , rồi chọn hộp kiểm Xác nhận chuyển đổi định dạng tệp khi mở.
Lưu ý: Khi chọn hộp kiểm này, Word sẽ hiển thị hộp thoại Chuyển đổi Tệp mỗi lần bạn mở tệp theo định dạng khác với định dạng Word (định dạng Word bao gồm các tệp .doc, .dot, .docx, .docm, .dotx hoặc .dotm). Nếu bạn thường xuyên làm việc với các tệp như vậy nhưng hiếm khi muốn chọn tiêu chuẩn mã hóa, hãy nhớ tắt tùy chọn này để ngăn hộp thoại này mở một cách không cần thiết.
-
Đóng rồi mở lại tệp.
-
Trong hộp thoại Chuyển đổi Tệp, chọn Văn bản mã hóa.
-
Trong hộp thoại Chuyển đổi Tệp, chọn Mã hóa khác, rồi chọn tiêu chuẩn mã hóa bạn muốn từ danh sách.
Bạn có thể xem trước văn bản trong khu vực Xem trước để kiểm tra xem tất cả văn bản có thể đọc được trong tiêu chuẩn mã hóa mà bạn đã chọn hay không.
Nếu hầu như tất cả văn bản trông giống nhau (ví dụ: tất cả các hộp hoặc tất cả các dấu chấm), phông chữ cần thiết để hiển thị các ký tự có thể không được cài đặt. Nếu phông chữ bạn cần không sẵn dùng, bạn có thể cài đặt phông bổ sung.
Để cài đặt phông chữ bổ sung, hãy làm như sau:
-
Trong Microsoft Windows, bấm nút Bắt đầu và sau đó bấm Pa-nen Điều khiển.
-
Thực hiện một trong những thao tác sau đây:
Trong Windows 7
-
Trong Panel điều khiển, bấm Gỡ cài đặt chương trình.
-
Trong danh sách các chương trình, bấm vào danh sách của Microsoft Office hoặc Microsoft Word, tùy thuộc vào việc bạn đã cài đặt Word như một phần của Office hay dưới dạng một chương trình riêng lẻ, rồi bấm Thay đổi.
Trong Windows Vista
-
Trong Panel điều khiển, bấm Gỡ cài đặt chương trình.
-
Trong danh sách các chương trình, bấm vào danh sách của Microsoft Office hoặc Microsoft Word, tùy thuộc vào việc bạn đã cài đặt Word như một phần của Office hay dưới dạng một chương trình riêng lẻ, rồi bấm Thay đổi.
Trong Microsoft Windows XP
-
Trong Panel điều khiển, hãy bấm Thêm hoặc Loại bỏ Chương trình.
-
Trong hộp Các chương trình hiện được cài đặt, bấm vào danh sách của Microsoft Office hoặc Microsoft Word, tùy thuộc vào việc bạn đã cài đặt Word như một phần của Office hay dưới dạng một chương trình riêng lẻ, rồi bấm Thay đổi.
-
-
Dưới Thay đổi cài đặt Microsoft Office của bạn, hãy bấm Thêm hoặc Loại bỏ Tính năng, rồi bấm Tiếp tục.
-
Bên dưới Tùy chọn Cài đặt, bung rộng Tính năng Chia sẻ của Office, rồi bung rộng Hỗ trợ Quốc tế.
-
Chọn bộ phông bạn cần, bấm vào mũi tên bên cạnh vùng chọn của bạn, rồi chọn Chạy từ Máy tính của Tôi.
Mẹo: Khi bạn mở một tệp văn bản được mã hóa, Word dụng phông chữ được xác định trong hộp thoại Tùy chọn Web. (Để đến hộp thoại Tùy chọn Web, hãy bấm Vào Microsoft Office Button, bấm Word Chọn, rồi bấm Nâng cao. Trong phần Chung , hãy bấm Tùy chọn Web.) Bạn có thể chọn các tùy chọn trên tab Phông chữ trong hộp thoại Tùy chọn Web để tùy chỉnh phông chữ cho từng bộ ký tự.
Chọn tiêu chuẩn mã hóa khi bạn lưu tệp
Nếu bạn không chọn tiêu chuẩn mã hóa khi lưu tệp, bạn Word mã hóa tệp dưới dạng Unicode. Thông thường, bạn có thể dùng mã hóa Unicode mặc định, vì nó hỗ trợ hầu hết các ký tự ở hầu hết các ngôn ngữ.
Nếu tài liệu của bạn sẽ được mở trong một chương trình không hỗ trợ Unicode, bạn có thể chọn một tiêu chuẩn mã hóa phù hợp với tiêu chuẩn của chương trình đích. Ví dụ: Unicode cho phép bạn tạo tài liệu ngôn ngữ Tiếng Trung Phồn thể trên hệ thống tiếng Anh của bạn. Tuy nhiên, nếu tài liệu sẽ được mở trong chương trình ngôn ngữ Tiếng Trung Phồn thể không hỗ trợ Unicode, bạn có thể lưu tài liệu bằng mã hóa Tiếng Trung Phồn thể (Big5). Khi tài liệu được mở trong chương trình ngôn ngữ Tiếng Trung Phồn thể, tất cả văn bản sẽ được hiển thị đúng cách.
Lưu ý: Vì Unicode là tiêu chuẩn toàn diện nhất, việc lưu văn bản trong bất kỳ mã hóa nào khác có thể dẫn đến một số ký tự không còn hiển thị được nữa. Ví dụ: một tài liệu được mã hóa trong Unicode có thể chứa văn bản tiếng Do Thái và chữ Kirin. Nếu tài liệu này được lưu bằng mã hóa Cyrillic (Windows), văn bản tiếng Do Thái không còn hiển thị và nếu tài liệu được lưu bằng mã hóa tiếng Do Thái (Windows), thì văn bản chữ Kirin không còn có thể được hiển thị.
Nếu bạn chọn tiêu chuẩn mã hóa không hỗ trợ các ký tự mà bạn đã sử dụng trong tệp, hãy Word dấu màu đỏ cho các ký tự mà nó không thể lưu. Bạn có thể xem trước văn bản trong tiêu chuẩn mã hóa mà bạn chọn trước khi lưu tệp.
Văn bản được định dạng trong phông chữ Ký hiệu hoặc trong mã trường sẽ bị loại bỏ khỏi tệp khi bạn lưu tệp dưới dạng văn bản được mã hóa. '
Chọn tiêu chuẩn mã hóa
-
Bấm vào tab Tệp.
-
Bấm vào Lưu như.
Nếu bạn muốn lưu tệp trong một thư mục khác, hãy định vị và mở thư mục đó.
-
Trong hộp Tên tệp, hãy gõ tên mới cho tệp.
-
Trong hộp Lưu dưới dạng , chọn Văn bản Thuần.
-
Bấm Lưu.
-
Nếu hộp thoại Bộ kiểm tra Tương Word Microsoft Office xuất hiện, hãy bấm Tiếp tục.
-
Trong hộp thoại Chuyển đổi Tệp, chọn tùy chọn cho tiêu chuẩn mã hóa mà bạn muốn sử dụng:
-
Để sử dụng tiêu chuẩn mã hóa mặc định cho hệ thống của bạn, hãy bấm Windows (Mặc định).
-
Để sử dụng tiêu chuẩn mã hóa MS-DOS, hãy bấm MS-DOS.
-
Để chọn một tiêu chuẩn mã hóa cụ thể, hãy bấm Mã hóa khác, rồi chọn tiêu chuẩn mã hóa bạn muốn từ danh sách. Bạn có thể xem trước văn bản trong khu vực Xem trước để kiểm tra xem tất cả văn bản có thể đọc được trong tiêu chuẩn mã hóa mà bạn đã chọn hay không.
Lưu ý: Bạn có thể đổi kích cỡ hộp thoại Chuyển đổi Tệp để có thể xem trước thêm tài liệu của mình.
-
-
Nếu bạn nhận được thông báo cho biết: "Văn bản được đánh dấu bằng màu đỏ sẽ không lưu chính xác trong mã hóa đã chọn", bạn có thể thử chọn mã hóa khác hoặc bạn có thể chọn hộp kiểm Cho phép thay thế ký tự.
Khi bạn cho phép thay thế ký tự, Word sẽ thay thế một ký tự không thể được hiển thị bằng ký tự tương đương gần nhất trong mã hóa mà bạn đã chọn. Ví dụ: ba dấu chấm sẽ thay thế dấu chấm lửng và dấu ngoặc kép thẳng thay thế dấu ngoặc kép cong.
Nếu mã hóa bạn chọn không có ký tự tương đương cho ký tự được đánh dấu màu đỏ, ký tự được đánh dấu màu đỏ sẽ được lưu thành ký tự ngoài ngữ cảnh, chẳng hạn như dấu chấm hỏi.
-
Nếu tài liệu sẽ được mở trong một chương trình không ngắt văn bản từ một dòng sang dòng tiếp theo, bạn có thể bao gồm dấu ngắt dòng cứng trong tài liệu bằng cách chọn hộp kiểm Chèn ngắt dòng, sau đó xác định xem bạn có muốn ngắt dòng được phân định bằng dấu xuống dòng (CR), nguồn cấp dòng (LF) hay không. hoặc cả hai, trong hộp Các dòng kết thúc có.
Tra cứu các tiêu chuẩn mã hóa sẵn có trong Word
Word nhận dạng một số tiêu chuẩn mã hóa và hỗ trợ các tiêu chuẩn mã hóa được cung cấp cùng với phần mềm hệ thống trên máy tính của bạn.
Danh sách các hệ thống viết sau đây cho thấy các tiêu chuẩn mã hóa (còn được gọi là các trang mã) liên kết với mỗi hệ thống viết.
Hệ thống viết | Tiêu chuẩn mã hóa | Phông chữ được áp dụng |
---|---|---|
Multilingual | Unicode (UCS-2 little-endian and big-endian, UTF-8, UTF-7) | Phông chữ mặc định dựa trên kiểu Thông thường cho phiên bản ngôn ngữ của Word |
Tiếng Ả rập | Windows 1256, ASMO 708 | Courier New |
Tiếng Trung Giản thể | GB2312, GBK, EUC-CN, ISO-2022-CN, HZ | SimSun |
Tiếng Trung Phồn thể | BIG5, EUC-TW, ISO-2022-TW | MingLiu |
Cyrillic | Windows 1251, KOI8-R, KOI8-RU, ISO8859-5, DOS 866 | Courier New |
Tiếng Anh, tiếng Tây Âu hoặc chữ La-tinh khác | Windows 1250, 1252-1254, 1257, ISO8859-x | Courier New |
Tiếng Hy Lạp | Windows 1253 | Courier New |
Tiếng Do Thái | Windows 1255 | Courier New |
Tiếng Nhật | Shift-JIS, ISO-2022-JP (JIS), EUC-JP | MS Mincho |
Tiếng Hàn | Wansung, Johab, ISO-2022-KR, EUC-KR | Malgun Gothic |
Tiếng Thái | Windows 874 | Tahoma |
Tiếng Việt | Windows 1258 | Courier New |
Ấn Độ: Tiếng Tamil | ISCII 57004 | Latha |
Ấn Độ: Nepal | ISCII 57002 (Devanagari) | Mangal |
Ấn Độ: Konkani | ISCII 57002 (Devanagari) | Mangal |
Ấn Độ: Tiếng Hindi | ISCII 57002 (Devanagari) | Mangal |
Ấn Độ: Tiếng Assam | ISCII 57006 | |
Ấn Độ: Bengali | ISCII 57003 | |
Ấn Độ: Gujarati | ISCII 57010 | |
Ấn Độ: Tiếng Kannada | ISCII 57008 | |
Ấn Độ: Malayalam | ISCII 57009 | |
Ấn Độ: Oriya | ISCII 57007 | |
Ấn Độ: Marathi | ISCII 57002 (Devanagari) | |
Ấn Độ: Punjabi | ISCII 57011 | |
Ấn Độ: Tiếng Phạn | ISCII 57002 (Devanagari) | |
Ấn Độ: Telugu | ISCII 57005 |
-
Việc sử dụng ngôn ngữ Ấn Độ yêu cầu hỗ trợ hệ thống và phông chữ OpenType thích hợp.
-
Chỉ hỗ trợ có giới hạn cho Nepal, Assamese, Bengali, Gujarati, Malayalam và Oriya.
Từ khóa » để Mã Hóa Thông Tin Bộ Máy Unicode Dùng
-
Bộ Mã Unicode Mã Hóa được Bao Nhiêu Ký Tự? - Luật Hoàng Phi
-
Bộ Mã Unicode Mã Hóa được:
-
De Cuong On Tap Tin Hoc 10 Hoc Ki 1 - Tài Liệu Text - 123doc
-
Hãy Phân Biệt Bộ Mã ASCII Và Bộ Unicode - Toploigiai
-
Câu 2 Trang 17 SGK Tin Học 10 - Học Tốt
-
Bảng Mã Unicode Dụng Máy Bit để Mã Hóa Ký Tự - MarvelVietnam
-
Hãy Phân Biệt Bộ Mã ASCII Và Bộ Unicode.
-
Tìm Hiểu Unicode - Viblo
-
Bộ Mã Unicode Dụng Bao Nhiêu Bit để Mã Hóa Kí Tự
-
Unicode – Wikipedia Tiếng Việt
-
Mã Hóa Thông Tin Là Cách
-
Giáo Trình Mạng Máy Tính: Vấn đề Số Hóa Thông Tin - VOER
-
Bộ Mã Unicode Mã Hóa được Bao Nhiêu Ký Tự?
-
Hãy Phân Biệt Bộ Mã ASCII Và Bộ Unicode....
-
Giải Thích Về Mã Hóa Ký Tự Unicode
-
Hãy Phân Biệt Bộ Mã ASCII Và Bộ Mã Unicode. - Hoc24