Bài 2: Thông Tin Và Dữ Liệu

1.1. Khái niệm thông tin và dữ liệu

  • Thông tin là những hiểu biết có thể có được về 1 thực thể nào đó
  • Dữ liệu là thông tin đưa vào máy tính để xử lý

1.2. Đơn vị đo lượng thông tin

  • Đơn vị cơ bản đo thông tin là bit (Binary Digital)
  • Bit là đơn vị nhỏ nhất được lưu trữ trong máy tính để biểu diễn hai trạng thái 0 và 1 (0: không có điện;  1: có điện) ta còn thường gọi là mã nhị phân

Hình 1. Biểu diến thông tin bằng dãy tám bit

  • Ngoài đơn vị bit, ta cũng thường dùng đơn vị đo lượng thông tin là Byte (đọc là bai)
  • 1 byte = 8 bit

Một số đơn vị bội của Byte

Kí hiệu

Đọc

Độ lớn

Byte Bai

8 bit

KB

Ki-lô-bai

1024 byte

MB

Mê-ga-bai

1024 KB

GB

Gi-ga-bai

1024 MB

TB

Tê-ra-bai

1024 GB

PB

Pê-ta-bai

1024 TB

Bảng 1. Một số đơn vị bội của Byte

1.3. Các dạng thông tin

Thông tin có 2 loại: số và phi số

  • Số: Số nguyên, số thực,… 
  • Phi số: Văn bản, hình ảnh, âm thành,…
    • Dạng văn bản: Tờ báo, cuốn sách, tấm bia,…
    • Dạng hình ảnh: Bức tranh vẽ, ảnh chụp, bản đồ, biển báo,…
    • Dạng âm thanh: Tiếng nói con người, tiếng sóng biển, tiếng đàn, tiếng chim hót,… 

1.4. Mã hóa thông tin trong máy tính

  • Để máy tính xử lí được, thông tin cần phải được biến đổi thành dãy bit (biểu diễn bằng các số 0, 1). Cách biến đổi như thế được gọi là mã hoá thông tin
  • Ví dụ:

Hình 2. Mã hóa thông tin trong máy tính

  • Để mã hoá thông tin dạng văn bản ta dùng bộ mã ASCII để mã hoá các ký tự. Mã ASCII các ký tự đánh số từ: 0 đến 255
  • Bộ mã Unicode: có thể mã hóa 65536 =216 ký tự, có thể mã hóa tất cả các bảng chữ cái trên thế giới

1.5. Biểu diễn thông tin trong máy tính

 a. Thông tin loại số

  • Hệ đếm:
    • Hệ thập phân: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9
    • Hệ nhị phân: 0, 1
    • Hệ cơ số mười sáu (hexa): 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F

Biểu diễn số trong các hệ đếm:

  • Hệ thập phân: Mọi số N có thể biểu diễn dưới dạng

\(N = a_{n} 10^{n} + a_{n-1} 10^{n-1} + …+ a_{1} 10^{1} + a_{0} 10^{0} + a_{-1} 10^{-1} +…+ a_{-m} 10^{-m}\)

\(0 \leq a_{i} \leq 9\)

  • Hệ nhị phân: Tương tự như trong hệ thập phân, mọi số N cũng có biểu diễn dạng

\(N = a_{n} 2^{n} + a_{n-1} 2^{n-1} + …+ a_{1} 2^{1} + a_{0} 2^{0} + a_{-1} 2^{-1} +…+ a_{-m} 2^{-m} \)

\(a_{i} = 0, 1 \)

 

  • Hệ hexa: Biểu diễn số trong hệ hexa cũng tương tự

\(N = a_{n} 16^{n} + a_{n-1} 16^{n-1} + …+ a_{1} 16^{1} + a_{0}16^{0} + a_{-1} 16 ^{-1} +…+ a_{-m} 16^{-m}\)

\(0 \leq a_{i} \leq15\)

Với quy ước:   A = 10,   B = 11,   C = 12, D = 13,   E = 14,   F = 15

Chuyển đổi giữa các hệ đếm:

Đổi số trong hệ cơ số 10 sang hệ cơ số 2 và hệ cơ số 16

Hình 3. Ví dụ minh họa đổi số trong hệ cơ số 10 sang hệ cơ số 2 và hệ cơ số 16

Biểu diễn số trong máy tính:

  • Biểu diễn số nguyên:

\( 7_{(10)} = 111_{(2)}\)

Hình 4. Ví dụ minh họa biểu diễn số nguyên

  • Trong đó: 
    • Phần nhỏ nhất của bộ nhớ lưu trữ số 0 hoặc 1: 1 bit
    • Một byte có 8 bit, bit cao nhất thể hiện dấu (bit dấu)
    • Có thể dùng 1 byte, 2 byte, 4 byte… để biểu diễn số nguyên
  • Biểu diễn số thực: 
    • Biểu diễn số thực dưới dạng dấu phẩy động:
      • Ví dụ: 13456,25 = 0.1345625 x 105
      • Dạng tổng quát: ±M x 10±K
      • Trong đó: 
        • M: Là phần định trị (\(0,1\leq M < 1\))
        • K: Là phần bậc (\(K \leq 0\))
    • Biểu diễn số thực trong một số máy tính:
      • Ví dụ:     0,007 = 0.7 x 10-2

Hình 5. Ví dụ minh họa biểu diễn số thực

 b. Thông tin loại phi số

Biểu diễn văn bản:

  • Mã hoá thông tin dạng văn bản thông qua việc mã hóa từng kí tự và thường sử dụng:
    • Bộ mã ASCII: Dùng 8 bit để mã hoá kí tự, mã hoá được 256 = 28 kí tự
    • Bộ mã Unicode: Dùng 16 bit để mã hóa kí tự, mã hoá được 65536 = 216 kí tự
  • Trong bảng mã ASCII mỗi kí tự được biểu diễn bằng 1 byte

Các dạng khác: Hình ảnh, âm thanh cũng phải mã hoá thành các dãy bit

*Nguyên lí mã hóa nhị phân:

Thông tin có nhiều dạng khác nhau như số, văn bản, hình ảnh, âm thanh,… Khi đưa vào máy tính, chúng đều biến đổi thành dạng chung - dãy bit. Dãy bit đó là mã nhị phân của thông tin mà nó biểu diễn. 

Từ khóa » Bộ Mã Thông Tin Trong Máy Tính