Unicode Là Gì? Bảng Mã Unicode Gồm Những Font Chữ Nào?
Có thể bạn quan tâm
Mục lục nội dung
- Unicode là gì?
- Đặc điểm của Unicode
- Unicode thường sử dụng nhất là gì?
- Bảng mã Unicode là gì?
- Bảng mã Unicode gồm những font chữ nào?
Unicode là gì? Bảng mã Unicode gồm những font chữ nào?
Unicode là gì?
Unicode là một tiêu chuẩn mã hóa ký tự phổ biến. Nó xác định cách các ký tự riêng lẻ được biểu diễn trong các file văn bản, trang web và các loại tài liệu khác.
Unicode (hay gọi là mã thống nhất; mã đơn nhất) là bộ mã chuẩn quốc tế được thiết kế để dùng làm bộ mã duy nhất cho tất cả các ngôn ngữ khác nhau trên thế giới, kể cả các ngôn ngữ sử dụng ký tự tượng hình phức tạp như chữ Hán của tiếng Trung Quốc, tiếng Nhật, chữ Nôm của tiếng Việt, v.v. Vì những điểm ưu việt đó, Unicode đã và đang từng bước thay thế các bộ mã truyền thống, kể cả bộ mã tiêu chuẩn ISO 8859. Unicode đang được sử dụng trên rất nhiều phần mềm cũng như các trình ứng dụng, chẳng hạn Windows (theo wikipedia).
Phiên bản mới nhất là Unicode® 13.0.0 công bố ngày 10 tháng 3 năm 2020.
Đặc điểm của Unicode
Một tiêu chuẩn trên toàn thế giới được phát triển để giúp khắc phục những hạn chế của ASCII đã được phát hành lần đầu tiên như một tiêu chuẩn vào tháng 10 năm 1991.
Không giống như ASCII, được thiết kế để chỉ đại diện cho các ký tự tiếng Anh cơ bản, Unicode được thiết kế để hỗ trợ các ký tự từ tất cả các ngôn ngữ trên thế giới. Bộ ký tự ASCII tiêu chuẩn chỉ hỗ trợ 128 ký tự, trong khi Unicode có thể hỗ trợ khoảng 1.000.000 ký tự. Trong khi ASCII chỉ sử dụng một byte để đại diện cho mỗi ký tự, Unicode hỗ trợ tối đa 4 byte cho mỗi ký tự.
Unicode thường sử dụng nhất là gì?
Một loại Unicode phổ biến là UTF-8, sử dụng mã hóa ký tự 8 bit. Nó thường được sử dụng trong môi trường Linux, để mã hóa các ký tự nước ngoài để chúng hiển thị đúng khi xuất ra tệp văn bản.
Với Unicode, mỗi ký tự sử dụng một số duy nhất từ U+0000 đến U+10FFFF, Unicode có thể là 8-bit, 16-bit hoặc 32-bit. Các số, ký hiệu toán học, các ký hiệu và ký tự phổ biến từ tất cả các ngôn ngữ đều được gán một điểm mã, ví dụ: U+0041 là một chữ cái tiếng Anh “A.”
Bảng mã Unicode là gì?
Unicode là một bảng mã, nó ánh xạ một số duy nhất đến một ký tự (ký tự này có thể là chữ cái tiếng Anh như “a”, “b” hoặc tiếng Việt “á”, “ớ”, tiếng Nhật hoặc là các ký tự đặc biệt như “$”, “%”, dấu chấm câu “.”, “,”…)
Mỗi số như vậy được gọi là một điểm mã (code point), một khái niệm mang tính lý thuyết. Còn việc điểm mã được biểu diễn trong bộ nhớ hay ổ đĩa là một câu chuyện hoàn toàn khác. Mỗi điểm mã được biểu diễn dưới dạng U+0639. “U+” tượng trưng cho “Unicode”, còn phần hệ số là hệ hexa. Ví dụ, điểm mã U+0041 là số hexa 0041 (tương đương số thập phân 65). Nó biểu diễn ký tự “A” trong chuẩn Unicode.
Mỗi ký tự được gán một tên duy nhất để phân biệt nó với ký tự khác. Chẳng hạn, U+0041 được gán tên là “LATIN CAPITAL LETTER A”. U+0A1B được gán với tên “GURMUKHI LETTER CHA”.
Lấy ví dụ một xâu ký tự:
Hello
trong Unicode, xâu ký tự này tương ứng với 5 điểm mã (lưu ý là 5 điểm mã chứ không phải 5 byte)
U+0048 U+0065 U+006C U+006C U+006F
Số chữ cái mà Unicode có thể định nghĩa là không giới hạn, trên thực tế nó vượt xa con số 65536. Phiên bản Unicode mới nhất là 9.0.0, biểu diễn tổng số 128172 ký tự.
Một số thuật ngữ thường dùng trong Unicode như: không gian mã (code space), plane, code unit, block…
Không gian mã là không gian chứa tất cả các điểm mã của Unicode. Một thuật ngữ khác là plane. Unicode chia thành 17 plane, mỗi plane chứa 65,536 ký tự (tương đương 16 bit), bởi vậy tổng kích thước không gian mã của Unicode là 17 × 65,536 = 1,114,112.
Bảng mã Unicode gồm những font chữ nào?
Bảng mã Unicode có rất nhiều font chữ, một số font chữ phổ biến thường dùng như: Times New Roman, Tahoma, Arial,…
Danh sách bảng mã Unicode đầy đủ gồm 172 font dưới đây:
- Arial
- Comic Sans
- Courier New
- Palatino
- Tahoma
- Times New Roman
- Trebuchet
- Verdana
- Aachen
- AGOldFace
- Algerian
- Allegie
- Amazone
- AmericanUnc
- Amherst
- Arabia
- Architecture
- Arial-Rounded
- Ariston
- Arrus
- Arrus-Black
- AvantGarde
- AvantGarde-Demi
- Aztek
- Bandit
- BankGothic
- Barmeno-ExtraBold
- Bauhaus-Heavy
- Bauhaus-Light
- Bauhaus-Medium
- Bedrock
- Bellevue
- Benguiat
- BertholdScript I
- Bodoni
- Bodoni BC
- Bodoni EB
- Bodoni-PosterCompressed
- Bookman
- Bookman-Demi
- Boton
- Boulevard
- Braggadocio
- Broad
- BrushScript
- Casablanca
- Casper OpenFace
- Centurion Old
- Chaucer
- Chelthm
- Clarendon
- Clearface Gothic
- Colonna
- Commerce Cond
- Commerce C
- Commercial Script
- Compacta
- Cooper
- Coporate
- CopperplateGothic
- Corsiva
- Courier
- Coutdown
- Dauphin Desdemona
- Digital
- Domcasual
- Dur
- Elephant
- ErasContour
- Erie-Black
- Exotic
- FetteFraktur
- Fillmore
- Frankfurter
- Frankfurt Gothic
- Freeform
- Freehand
- FreeStyle
- Frutiger
- Frutiger-Light
- Fujiyama
- Fujiyama-LightCondensed
- Futura
- Futura-Black
- Galleria
- Garamond
- Gatineau
- GeoSlab703 C
- GeoSlab703 E
- GillSans
- GillSans-Condensed
- GoudyOld
- GoudyText
- Harpoon
- Harrington
- Helvetica C
- Helvetica N
- Hobo
- Imago-ExtraBold
- Impact
- Isadora
- Jamai
- Joanna
- Jupiter
- Kaufmann
- Kids
- Korinna
- Kun Medium
- LatinWide
- LinoScript
- Linotext
- Lithosgraph
- Lucida HandWriting
- Lydian
- Memorandum
- Murray
- Mystical Nebraska
- New Century
- NewCentury-Narrow
- News Gothic
- Nueva
- Nueva-BoldExtended
- NuptialScript
- Officina Sans
- Officina Serif
- Onyx
- Optima
- Oranda
- Palatino
- Park Avenue
- Pepita
- Perpetua
- Post Antiqua
- President
- Revue
- Rockwell-ExtraBold
- Russell Square
- Salina Display
- Sans Serif
- Scribble
- Script
- Serpentine
- Serpentine Sans
- SerpentineSans L
- Shelley Allegro
- Signature Light
- Slogan
- Snell
- Souvenir
- Staccato
- Standout
- Stencil
- Stop
- Switzerland
- SwitzerlandCondensed
- Tekton
- Tiffany
- Tiffany Heavy
- Times
- Times-Narrow
- Tubes
- Umbra
- University
- Utopia
- Viva
- Viva B
- Vivienne
- Vogue-ExtraBold
- Walbaum
- Windsor
- WoodType Demi
- ZapfChancery
Nguồn: Unicode là gì? Bảng mã Unicode gồm những font chữ nào?
Bài viết này có hữu ích với bạn không?CóKhôngTừ khóa » Bộ Mã Ký Tự Unicode
-
Tìm Hiểu Unicode - Viblo
-
Bảng Mã Unicode - Gõ Tiếng Việt
-
Chèn Mã Ký Tự ASCII Hoặc Unicode Vào Word - Microsoft Support
-
Chèn Các Ký Hiệu Hoặc Ký Tự Hệ La-tinh ASCII Hoặc Unicode
-
Bài 6: Bảng Mã Unicode Và Bộ Gõ Tiếng Việt - HOC247
-
[DOC] Tiếng Việt Và Bộ Mã Unicode
-
Bảng Ký Tự Unicode - RT
-
Bộ Mã Unicode Mã Hóa được Bao Nhiêu Ký Tự? - Luật Hoàng Phi
-
Giải Thích Về Mã Hóa Ký Tự Unicode
-
Unicode Là Gì Và Nó được Sử Dụng Như Thế Nào? - EFERRIT.COM
-
Bảng Mã Unicode Dụng Máy Bit để Mã Hóa Ký Tự - MarvelVietnam
-
Bộ Mã Unicode Dụng Bao Nhiêu Byte để Mã Hóa 1 Ký Tự
-
Bộ Mã Unicode Mã Hóa được Bao Nhiêu Ký Tự
-
Mã Hóa Ký Tự Như ANSI Và Unicode Là Gì Và Chúng Khác ... - HTML
-
Trong Bảng Mã UNICODE, Mỗi Kí Tự Tiếng Việt Theo UTF-8 được ...