Unicode Là Gì? Bảng Mã Unicode Gồm Những Font Chữ Nào?
Có thể bạn quan tâm
Mục lục nội dung
- Unicode là gì?
- Đặc điểm của Unicode
- Unicode thường sử dụng nhất là gì?
- Bảng mã Unicode là gì?
- Bảng mã Unicode gồm những font chữ nào?
Unicode là gì? Bảng mã Unicode gồm những font chữ nào?
Unicode là gì?
Unicode là một tiêu chuẩn mã hóa ký tự phổ biến. Nó xác định cách các ký tự riêng lẻ được biểu diễn trong các file văn bản, trang web và các loại tài liệu khác.
Unicode (hay gọi là mã thống nhất; mã đơn nhất) là bộ mã chuẩn quốc tế được thiết kế để dùng làm bộ mã duy nhất cho tất cả các ngôn ngữ khác nhau trên thế giới, kể cả các ngôn ngữ sử dụng ký tự tượng hình phức tạp như chữ Hán của tiếng Trung Quốc, tiếng Nhật, chữ Nôm của tiếng Việt, v.v. Vì những điểm ưu việt đó, Unicode đã và đang từng bước thay thế các bộ mã truyền thống, kể cả bộ mã tiêu chuẩn ISO 8859. Unicode đang được sử dụng trên rất nhiều phần mềm cũng như các trình ứng dụng, chẳng hạn Windows (theo wikipedia).
Phiên bản mới nhất là Unicode® 13.0.0 công bố ngày 10 tháng 3 năm 2020.
Đặc điểm của Unicode
Một tiêu chuẩn trên toàn thế giới được phát triển để giúp khắc phục những hạn chế của ASCII đã được phát hành lần đầu tiên như một tiêu chuẩn vào tháng 10 năm 1991.
Không giống như ASCII, được thiết kế để chỉ đại diện cho các ký tự tiếng Anh cơ bản, Unicode được thiết kế để hỗ trợ các ký tự từ tất cả các ngôn ngữ trên thế giới. Bộ ký tự ASCII tiêu chuẩn chỉ hỗ trợ 128 ký tự, trong khi Unicode có thể hỗ trợ khoảng 1.000.000 ký tự. Trong khi ASCII chỉ sử dụng một byte để đại diện cho mỗi ký tự, Unicode hỗ trợ tối đa 4 byte cho mỗi ký tự.
Unicode thường sử dụng nhất là gì?
Một loại Unicode phổ biến là UTF-8, sử dụng mã hóa ký tự 8 bit. Nó thường được sử dụng trong môi trường Linux, để mã hóa các ký tự nước ngoài để chúng hiển thị đúng khi xuất ra tệp văn bản.
Với Unicode, mỗi ký tự sử dụng một số duy nhất từ U+0000 đến U+10FFFF, Unicode có thể là 8-bit, 16-bit hoặc 32-bit. Các số, ký hiệu toán học, các ký hiệu và ký tự phổ biến từ tất cả các ngôn ngữ đều được gán một điểm mã, ví dụ: U+0041 là một chữ cái tiếng Anh “A.”
Bảng mã Unicode là gì?
Unicode là một bảng mã, nó ánh xạ một số duy nhất đến một ký tự (ký tự này có thể là chữ cái tiếng Anh như “a”, “b” hoặc tiếng Việt “á”, “ớ”, tiếng Nhật hoặc là các ký tự đặc biệt như “$”, “%”, dấu chấm câu “.”, “,”…)
Mỗi số như vậy được gọi là một điểm mã (code point), một khái niệm mang tính lý thuyết. Còn việc điểm mã được biểu diễn trong bộ nhớ hay ổ đĩa là một câu chuyện hoàn toàn khác. Mỗi điểm mã được biểu diễn dưới dạng U+0639. “U+” tượng trưng cho “Unicode”, còn phần hệ số là hệ hexa. Ví dụ, điểm mã U+0041 là số hexa 0041 (tương đương số thập phân 65). Nó biểu diễn ký tự “A” trong chuẩn Unicode.
Mỗi ký tự được gán một tên duy nhất để phân biệt nó với ký tự khác. Chẳng hạn, U+0041 được gán tên là “LATIN CAPITAL LETTER A”. U+0A1B được gán với tên “GURMUKHI LETTER CHA”.
Lấy ví dụ một xâu ký tự:
Hello
trong Unicode, xâu ký tự này tương ứng với 5 điểm mã (lưu ý là 5 điểm mã chứ không phải 5 byte)
U+0048 U+0065 U+006C U+006C U+006F
Số chữ cái mà Unicode có thể định nghĩa là không giới hạn, trên thực tế nó vượt xa con số 65536. Phiên bản Unicode mới nhất là 9.0.0, biểu diễn tổng số 128172 ký tự.
Một số thuật ngữ thường dùng trong Unicode như: không gian mã (code space), plane, code unit, block…
Không gian mã là không gian chứa tất cả các điểm mã của Unicode. Một thuật ngữ khác là plane. Unicode chia thành 17 plane, mỗi plane chứa 65,536 ký tự (tương đương 16 bit), bởi vậy tổng kích thước không gian mã của Unicode là 17 × 65,536 = 1,114,112.
Bảng mã Unicode gồm những font chữ nào?
Bảng mã Unicode có rất nhiều font chữ, một số font chữ phổ biến thường dùng như: Times New Roman, Tahoma, Arial,…
Danh sách bảng mã Unicode đầy đủ gồm 172 font dưới đây:
- Arial
- Comic Sans
- Courier New
- Palatino
- Tahoma
- Times New Roman
- Trebuchet
- Verdana
- Aachen
- AGOldFace
- Algerian
- Allegie
- Amazone
- AmericanUnc
- Amherst
- Arabia
- Architecture
- Arial-Rounded
- Ariston
- Arrus
- Arrus-Black
- AvantGarde
- AvantGarde-Demi
- Aztek
- Bandit
- BankGothic
- Barmeno-ExtraBold
- Bauhaus-Heavy
- Bauhaus-Light
- Bauhaus-Medium
- Bedrock
- Bellevue
- Benguiat
- BertholdScript I
- Bodoni
- Bodoni BC
- Bodoni EB
- Bodoni-PosterCompressed
- Bookman
- Bookman-Demi
- Boton
- Boulevard
- Braggadocio
- Broad
- BrushScript
- Casablanca
- Casper OpenFace
- Centurion Old
- Chaucer
- Chelthm
- Clarendon
- Clearface Gothic
- Colonna
- Commerce Cond
- Commerce C
- Commercial Script
- Compacta
- Cooper
- Coporate
- CopperplateGothic
- Corsiva
- Courier
- Coutdown
- Dauphin Desdemona
- Digital
- Domcasual
- Dur
- Elephant
- ErasContour
- Erie-Black
- Exotic
- FetteFraktur
- Fillmore
- Frankfurter
- Frankfurt Gothic
- Freeform
- Freehand
- FreeStyle
- Frutiger
- Frutiger-Light
- Fujiyama
- Fujiyama-LightCondensed
- Futura
- Futura-Black
- Galleria
- Garamond
- Gatineau
- GeoSlab703 C
- GeoSlab703 E
- GillSans
- GillSans-Condensed
- GoudyOld
- GoudyText
- Harpoon
- Harrington
- Helvetica C
- Helvetica N
- Hobo
- Imago-ExtraBold
- Impact
- Isadora
- Jamai
- Joanna
- Jupiter
- Kaufmann
- Kids
- Korinna
- Kun Medium
- LatinWide
- LinoScript
- Linotext
- Lithosgraph
- Lucida HandWriting
- Lydian
- Memorandum
- Murray
- Mystical Nebraska
- New Century
- NewCentury-Narrow
- News Gothic
- Nueva
- Nueva-BoldExtended
- NuptialScript
- Officina Sans
- Officina Serif
- Onyx
- Optima
- Oranda
- Palatino
- Park Avenue
- Pepita
- Perpetua
- Post Antiqua
- President
- Revue
- Rockwell-ExtraBold
- Russell Square
- Salina Display
- Sans Serif
- Scribble
- Script
- Serpentine
- Serpentine Sans
- SerpentineSans L
- Shelley Allegro
- Signature Light
- Slogan
- Snell
- Souvenir
- Staccato
- Standout
- Stencil
- Stop
- Switzerland
- SwitzerlandCondensed
- Tekton
- Tiffany
- Tiffany Heavy
- Times
- Times-Narrow
- Tubes
- Umbra
- University
- Utopia
- Viva
- Viva B
- Vivienne
- Vogue-ExtraBold
- Walbaum
- Windsor
- WoodType Demi
- ZapfChancery
Nguồn: Unicode là gì? Bảng mã Unicode gồm những font chữ nào?
Bài viết này có hữu ích với bạn không?CóKhôngTừ khóa » Font Chữ Và Bảng Mã
-
Một Số Bảng Mã Và Font Chữ Dùng Gõ Tiếng Việt - Thủ Thuật
-
Phân Biệt Và Hiểu Rõ Về: "Bảng Mã", "Font Chữ" & "Kiểu Gõ"
-
Hiểu Rõ Về Bảng Mã & Font Chữ - Chuyển Mã Bằng Unikey
-
Bảng Mã Tương ứng Với Font Chữ - Dinhchop
-
Trang Hỗ Trợ Tiếng Việt Trên Internet - MangVN
-
Bảng Mã Font Là Gì? - O₂ Education
-
Font Chữ Và Bảng Mã Tương ứng
-
Chuyển đổi Font Chữ Dễ Dàng Với Bộ Gõ Tiếng Việt UNIKEY
-
Hướng Dẫn đổi Bảng Mã, Font Chữ Trong GoTiengViet - Thủ Thuật
-
1. Chuyển đổi Mã Font Chữ Bằng Unikey - Thủ Thuật Phần Mềm
-
Cách Chuyển Mã Phông Chữ Với Unikey
-
Phân Biệt Và Hiểu Rõ Về: " Bảng Mã Và Font Chữ " & "Kiểu Gõ"
-
Cách Chọn Bảng Mã Phù Hợp Với Phông Chữ để Gõ Tiếng Việt