Khái Niệm Biến định Tính, định Lượng Trong Xử Lý Dữ Liệu

Việc xác định đúng dạng biến có vai trò quan trọng trong xử lý dữ liệu bởi nhiều kiểm định yêu cầu dữ liệu đầu vào là biến định lượng, nhưng chúng ta lại mắc lỗi đưa các biến định tính vào thực hiện chạy phân tích. Dù là biến định tính hay biến định lượng, dù là đưa biến vào sai hay đúng chúng ta đều chạy ra các bảng kết quả. Nhưng việc đưa biến vào sai, kết quả chạy ra chỉ đơn thuần là các con số vô nghĩa, nó không phản ánh đặc điểm của dữ liệu. Do vậy, các bạn cần phải hết sức lưu ý, luôn kiểm tra xem một phép kiểm định có yêu cầu đầu vào là gì: biến là loại gì, có được phép có missing value không, có yêu cầu điều kiện cỡ mẫu tối thiểu không,… Nếu dữ liệu thỏa điều kiện đầu vào, chúng ta mới được phép thực hiện kiểm định đó.

Bài viết này không đi vào khái niệm hàn lâm về biến định tính và biến định lượng, các bạn có thể tìm kiếm trên Google sẽ ra rất nhiều bài viết và cả Wikipedia đã đưa thông tin chi tiết về hai loại biến này. Dưới đây, mình sẽ giải thích về khái niệm biến định tính và định lượng trong xử lý dữ liệu một cách đơn giản để các bạn có thể hiểu và sử dụng đúng khi chạy các kiểm định mà loại biến là một điều kiện đầu vào quan trọng.

1. Biến định tính (biến phân loại) là gì?

Biến định tính (qualitative variable) còn gọi là biến phân loại (categorical variable) giúp cho việc phân loại các đối tượng nghiên cứu thành các nhóm khác nhau. Khi xử lý dữ liệu, nhà nghiên cứu sẽ mã hóa các giá trị của biến định tính thành các con số 1, 2, 3,… nhưng các con số này hoàn toàn chỉ mang tính chất quy ước chứ không phải là giá trị thực của biến.

Ví dụ: Biến độ tuổi chúng ta chia thành các nhóm tuổi: (1) dưới 22 tuổi, (2) từ 22 đến 30 tuổi, (3) từ 31 đến 50 tuổi, (4) trên 50 tuổi. Đây là một biến định tính bởi nó phân loại đối tượng thành các nhóm tuổi khác nhau. Bốn nhóm tuổi được quy ước thành các con số 1-2-3-4 trong xử lý dữ liệu, nó đơn thuần là giá trị quy ước chứ không phải là số tuổi chính xác của đáp viên. Đáp viên có tuổi là 25 được mã hóa thành giá trị 2 (từ 22 đến 30 tuổi) của biến độ tuổi thì con số 25 là giá trị thực (giá trị định lượng) còn số 2 trong dữ liệu là số quy ước (giá trị định tính).

2. Biến định lượng là gì?

Biến định lượng (quantiative variable) những biến mà các giá trị của chúng là các con số giá trị thực.

Ví dụ: Cũng là biến độ tuổi nhưng dữ liệu chúng ta thu thập là con số tuổi chính xác của đáp viên thì biến này sẽ là biến định lượng. Chúng ta hỏi đáp viên “Tuổi của anh chị là:…..”, đáp viên điền vào số tuổi của họ, đó là giá trị thực.

Cần phải nhớ rằng, hồi quy và SEM là các phép phân tích yêu cầu biến tham gia là biến định lượng. Nếu bạn tham khảo các bài luận, bài nghiên cứu mà tác giả sử dụng các biến như giới tính, tuổi, thu nhập, học vấn… trong kết quả hồi quy hoặc SEM thì các biến này trong dữ liệu mà tác giả sử dụng sẽ ở dạng định lượng.

– Biến Giới tính: nếu chỉ có hai giá trị Nam/Nữ thì nó vừa là định lượng và là định tính, bạn có thể sử dụng nó trong phân tích hồi quy, SEM

– Biến Độ tuổi: nếu độ tuổi bạn thu thập số tuổi thật của đáp viên (6 tuổi, 7 tuổi, 18 tuổi, 22 tuổi, 30 tuổi…) thì biến này ở dạng định lượng; ngược lại nếu độ tuổi bạn phân ra các nhóm tuổi (dưới 18, 19-30, 31-45, trên 45…) thì biến này ở dạng định tính.

– Biến Học vấn: nếu học vấn bạn thu thập số năm đi học của đáp viên (12 năm, 15 năm, 19 năm…) thì biến này ở dạng định lượng; ngược lại nếu học vấn bạn phân ra các nhóm trình độ học vấn (trung cấp, cao đẳng, đại học, trên đại học…) thì biến này ở dạng định tính.

– Biến Thu nhập: nếu thu nhập bạn lấy dữ liệu là mức tiền cụ thể của đáp viên (10tr, 12.5tr, 22tr, 25tr …) thì biến này ở dạng định lượng; ngược lại nếu thu nhập bạn phân ra các nhóm thu nhập (dưới 10tr, 11-20tr, 21-30tr, trên 30tr…) thì biến này ở dạng định tính.

Từ khóa » Khái Niệm định Lượng Là Gì