Unicode Là Gì? Bảng Mã Unicode Gồm Những Font Chữ Nào?

Mục lục nội dung

Toggle
  • Unicode là gì?
  • Đặc điểm của Unicode
  • Unicode thường sử dụng nhất là gì?
  • Bảng mã Unicode là gì?
  • Bảng mã Unicode gồm những font chữ nào?
4.9/5 - (19 bình chọn)

Unicode là gì? Bảng mã Unicode gồm những font chữ nào?

Unicode là gì?

Unicode là một tiêu chuẩn mã hóa ký tự phổ biến. Nó xác định cách các ký tự riêng lẻ được biểu diễn trong các file văn bản, trang web và các loại tài liệu khác.

Unicode (hay gọi là mã thống nhất; mã đơn nhất) là bộ mã chuẩn quốc tế được thiết kế để dùng làm bộ mã duy nhất cho tất cả các ngôn ngữ khác nhau trên thế giới, kể cả các ngôn ngữ sử dụng ký tự tượng hình phức tạp như chữ Hán của tiếng Trung Quốc, tiếng Nhật, chữ Nôm của tiếng Việt, v.v. Vì những điểm ưu việt đó, Unicode đã và đang từng bước thay thế các bộ mã truyền thống, kể cả bộ mã tiêu chuẩn ISO 8859. Unicode đang được sử dụng trên rất nhiều phần mềm cũng như các trình ứng dụng, chẳng hạn Windows (theo wikipedia).

Phiên bản mới nhất là Unicode® 13.0.0 công bố ngày 10 tháng 3 năm 2020.

Đặc điểm của Unicode

Một tiêu chuẩn trên toàn thế giới được phát triển để giúp khắc phục những hạn chế của ASCII đã được phát hành lần đầu tiên như một tiêu chuẩn vào tháng 10 năm 1991.

Không giống như ASCII, được thiết kế để chỉ đại diện cho các ký tự tiếng Anh cơ bản, Unicode được thiết kế để hỗ trợ các ký tự từ tất cả các ngôn ngữ trên thế giới. Bộ ký tự ASCII tiêu chuẩn chỉ hỗ trợ 128 ký tự, trong khi Unicode có thể hỗ trợ khoảng 1.000.000 ký tự. Trong khi ASCII chỉ sử dụng một byte để đại diện cho mỗi ký tự, Unicode hỗ trợ tối đa 4 byte cho mỗi ký tự.

Unicode thường sử dụng nhất là gì?

Một loại Unicode phổ biến là UTF-8, sử dụng mã hóa ký tự 8 bit. Nó thường được sử dụng trong môi trường Linux, để mã hóa các ký tự nước ngoài để chúng hiển thị đúng khi xuất ra tệp văn bản.

Với Unicode, mỗi ký tự sử dụng một số duy nhất từ ​​U+0000 đến U+10FFFF, Unicode có thể là 8-bit, 16-bit hoặc 32-bit. Các số, ký hiệu toán học, các ký hiệu và ký tự phổ biến từ tất cả các ngôn ngữ đều được gán một điểm mã, ví dụ: U+0041 là một chữ cái tiếng Anh “A.”

Bảng mã Unicode là gì?

Unicode là một bảng mã, nó ánh xạ một số duy nhất đến một ký tự (ký tự này có thể là chữ cái tiếng Anh như “a”, “b” hoặc tiếng Việt “á”, “ớ”, tiếng Nhật hoặc là các ký tự đặc biệt như “$”, “%”, dấu chấm câu “.”, “,”…)

Unicode là gì? Bảng mã Unicode gồm những font chữ nào?
Unicode là gì? Bảng mã Unicode gồm những font chữ nào?

Mỗi số như vậy được gọi là một điểm mã (code point), một khái niệm mang tính lý thuyết. Còn việc điểm mã được biểu diễn trong bộ nhớ hay ổ đĩa là một câu chuyện hoàn toàn khác. Mỗi điểm mã được biểu diễn dưới dạng U+0639. “U+” tượng trưng cho “Unicode”, còn phần hệ số là hệ hexa. Ví dụ, điểm mã U+0041 là số hexa 0041 (tương đương số thập phân 65). Nó biểu diễn ký tự “A” trong chuẩn Unicode.

Mỗi ký tự được gán một tên duy nhất để phân biệt nó với ký tự khác. Chẳng hạn, U+0041 được gán tên là “LATIN CAPITAL LETTER A”. U+0A1B được gán với tên “GURMUKHI LETTER CHA”.

Lấy ví dụ một xâu ký tự:

Hello

trong Unicode, xâu ký tự này tương ứng với 5 điểm mã (lưu ý là 5 điểm mã chứ không phải 5 byte)

U+0048 U+0065 U+006C U+006C U+006F

Số chữ cái mà Unicode có thể định nghĩa là không giới hạn, trên thực tế nó vượt xa con số 65536. Phiên bản Unicode mới nhất là 9.0.0, biểu diễn tổng số 128172 ký tự.

Một số thuật ngữ thường dùng trong Unicode như: không gian mã (code space), plane, code unit, block…

Không gian mã là không gian chứa tất cả các điểm mã của Unicode. Một thuật ngữ khác là plane. Unicode chia thành 17 plane, mỗi plane chứa 65,536 ký tự (tương đương 16 bit), bởi vậy tổng kích thước không gian mã của Unicode là 17 × 65,536 = 1,114,112.

Bảng mã Unicode gồm những font chữ nào?

Bảng mã Unicode có rất nhiều font chữ, một số font chữ phổ biến thường dùng như: Times New Roman, Tahoma, Arial,…

Danh sách bảng mã Unicode đầy đủ gồm 172 font dưới đây:

  1. Arial
  2. Comic Sans
  3. Courier New
  4. Palatino
  5. Tahoma
  6. Times New Roman
  7. Trebuchet
  8. Verdana
  9. Aachen
  10. AGOldFace
  11. Algerian
  12. Allegie
  13. Amazone
  14. AmericanUnc
  15. Amherst
  16. Arabia
  17. Architecture
  18. Arial-Rounded
  19. Ariston
  20. Arrus
  21. Arrus-Black
  22. AvantGarde
  23. AvantGarde-Demi
  24. Aztek
  25. Bandit
  26. BankGothic
  27. Barmeno-ExtraBold
  28. Bauhaus-Heavy
  29. Bauhaus-Light
  30. Bauhaus-Medium
  31. Bedrock
  32. Bellevue
  33. Benguiat
  34. BertholdScript I
  35. Bodoni
  36. Bodoni BC
  37. Bodoni EB
  38. Bodoni-PosterCompressed
  39. Bookman
  40. Bookman-Demi
  41. Boton
  42. Boulevard
  43. Braggadocio
  44. Broad
  45. BrushScript
  46. Casablanca
  47. Casper OpenFace
  48. Centurion Old
  49. Chaucer
  50. Chelthm
  51. Clarendon
  52. Clearface Gothic
  53. Colonna
  54. Commerce Cond
  55. Commerce C
  56. Commercial Script
  57. Compacta
  58. Cooper
  59. Coporate
  60. CopperplateGothic
  61. Corsiva
  62. Courier
  63. Coutdown
  64. Dauphin Desdemona
  65. Digital
  66. Domcasual
  67. Dur
  68. Elephant
  69. ErasContour
  70. Erie-Black
  71. Exotic
  72. FetteFraktur
  73. Fillmore
  74. Frankfurter
  75. Frankfurt Gothic
  76. Freeform
  77. Freehand
  78. FreeStyle
  79. Frutiger
  80. Frutiger-Light
  81. Fujiyama
  82. Fujiyama-LightCondensed
  83. Futura
  84. Futura-Black
  85. Galleria
  86. Garamond
  87. Gatineau
  88. GeoSlab703 C
  89. GeoSlab703 E
  90. GillSans
  91. GillSans-Condensed
  92. GoudyOld
  93. GoudyText
  94. Harpoon
  95. Harrington
  96. Helvetica C
  97. Helvetica N
  98. Hobo
  99. Imago-ExtraBold
  100. Impact
  101. Isadora
  102. Jamai
  103. Joanna
  104. Jupiter
  105. Kaufmann
  106. Kids
  107. Korinna
  108. Kun Medium
  109. LatinWide
  110. LinoScript
  111. Linotext
  112. Lithosgraph
  113. Lucida HandWriting
  114. Lydian
  115. Memorandum
  116. Murray
  117. Mystical Nebraska
  118. New Century
  119. NewCentury-Narrow
  120. News Gothic
  121. Nueva
  122. Nueva-BoldExtended
  123. NuptialScript
  124. Officina Sans
  125. Officina Serif
  126. Onyx
  127. Optima
  128. Oranda
  129. Palatino
  130. Park Avenue
  131. Pepita
  132. Perpetua
  133. Post Antiqua
  134. President
  135. Revue
  136. Rockwell-ExtraBold
  137. Russell Square
  138. Salina Display
  139. Sans Serif
  140. Scribble
  141. Script
  142. Serpentine
  143. Serpentine Sans
  144. SerpentineSans L
  145. Shelley Allegro
  146. Signature Light
  147. Slogan
  148. Snell
  149. Souvenir
  150. Staccato
  151. Standout
  152. Stencil
  153. Stop
  154. Switzerland
  155. SwitzerlandCondensed
  156. Tekton
  157. Tiffany
  158. Tiffany Heavy
  159. Times
  160. Times-Narrow
  161. Tubes
  162. Umbra
  163. University
  164. Utopia
  165. Viva
  166. Viva B
  167. Vivienne
  168. Vogue-ExtraBold
  169. Walbaum
  170. Windsor
  171. WoodType Demi
  172. ZapfChancery

Nguồn: Unicode là gì? Bảng mã Unicode gồm những font chữ nào?

Bài viết này có hữu ích với bạn không?Không

Từ khóa » Bộ Mã Unicode