Bài 5: Phân Phối Chuẩn (Normal Distribution) - Nghiên Cứu Giáo Dục

1. Giới thiệu

Các thủ tục thống kê tham số dựa trên giả định về tính chuẩn (normality) cơ bản trong dân số, từ đó một mẫu được chọn. Trong khi nhiều thống kê kiểm định đơn biến như t-test và F-test được cho là mạnh mẽ (không bị ảnh hưởng nghiêm trọng bởi sự khác biệt vừa phải với các giả định cơ bản về tính chuẩn và tính đồng nhất của phương sai). Do mức độ mạnh mẽ chung của các t-test và F-test, nhiều nhà nghiên cứu không báo cáo thông tin về hình dạng của phân phối trong các bài báo của họ. Tuy nhiên, nhiều tác giả đã chỉ ra sự nguy hiểm của các suy luận thống kê sai lầm khi chỉ báo cáo trung bình và độ lệch chuẩn của các phân phối, còn độ lệch (skewness) và độ nhọn (kurtosis) bị bỏ qua, đặc biệt khi n là nhỏ hoặc alpha là cực nhỏ, và dữ liệu bị sai lệch.

Do đó, việc kiểm tra các ngoại lệ và tính chuẩn nên là một bước sơ bộ quan trọng đối với nhiều thủ tục thống kê suy luận. Cách đơn giản nhất để kiểm tra sự khác biệt so với mức tính chuẩn cơ bản trong dân số là vẽ biểu đồ phân phối của các điểm mẫu. Có thể xác định được các giá trị ngoại lệ và hình dạng chung của một phân phối cho biết liệu nó có bị lệch hay không và nó có độ lệch dương hay âm.

Cả trong thủ tục vẽ biểu đồ phân phối của các điểm mẫu, các giá trị của độ lệch và độ nhọn cũng được xác định thường xuyên trong nhiều bài thống kê. Các giá trị này có thể được sử dụng để kiểm tra xem liệu phân phối có khác xa mức chuẩn đáng kể hay không.

2. Nhận biết tính chuẩn

Có nhiều cách để đánh giá một phân phối chuẩn.

(1) Đơn giản nhất là xem biểu đồ với đường cong chuẩn (Histograms with normal curve) với dạnh hình chuông đối xứng với tần số cao nhất nằm ngay giữa và các tần số thấp dần nằm ở 2 bên. Giá trị trung bình (mean) và trung vị (mediane) gần bằng nhau và độ nghiêng (skewness) gần bằng zero.

(2) Vẽ biểu đồ xác suất chuẩn (normal Q-Q plot). Phân phối chuẩn khi biểu đồ xác suất này có quan hệ tuyến tính (đường thẳng).

(3) Dùng phép kiểm định Kolmogorov-Smirnov khi cỡ mẫu lớn hơn 50 hoặc phép kiểm Shapiro-Wilk khi cỡ mẫu nhỏ hơn 50. Được coi là có phân phối chuẩn khi mức ý nghĩa (p) lớn hơn “0.05”.

(4) Trong khi thử nghiệm Shapiro-Wilk và thử nghiệm Kolmogorov-Smirnov có thể được sử dụng để xác nhận phân phối chuẩn với các mẫu cỡ nhỏ đến trung bình (nhỏ hơn 300), chúng có thể không đáng tin cậy đối với các mẫu lớn. Thử nghiệm độ lệch (skewness) và độ nhọn kurtosis có thể được sử dụng để xác định phân phối chuẩn cho cỡ mẫu lớn. Giá trị tuyệt đối của skewness nhỏ hơn 2 và giá trị tuyệt đối của kurtosis (proper) nhỏ hơn 7 cho thấy dữ liệu chắc chắn được phân phối chuẩn. Trong đó, thử nghiệm SPSS cung cấp kurtosis dư thừa bằng cách trừ đi 3 từ proper kurtosis.

3. Nhận biết một phân phối chuẩn trong SPSS

Hiệu quả của việc giảng dạy đạo đức kỹ thuật thông qua một khóa học tâm lý học cho sinh viên đại học kĩ thuật đã được đo lường bằng điểm số (lần 1) và sau (lần 2) khi kiểm tra của 347 sinh viên. Chúng ta cần kiểm tra tính chuẩn của điểm lần 1 và điểm lần 2.

(1) Vẽ biểu đồ đường cong chuẩn

– Bước 1: Vào Analyze > Descriptive Statistics> Frequencies…

– Bước 2: Trong hộp thoại Frequencies. Chuyển biến Pre-testPost-test từ ô bên trái vào ô Variable(s). Nhấp vào nút Statistics… Vào màn hình Statistics, đánh dấu nháy vào 4 ô: Mean, Median, Std. deviation, Skewnesskurtosis, và nhấp Continue.

– Bước 3: Nhấp vào nút Charts. Đánh dấu vào ô tròn Histograms: và đánh dấy nháy vào ô With Normal curve, nhắp Continue. Nhấn OK sẽ cho kết quả sau.

Kết quả trong Bảng Statistics cho thấy điểm trung bình (mean) của lần 1 (Pre-test) là 3.01, trung vị (median)= 3.00 gần bằng nhau. Như vậy đây có thể là một phân phối chuẩn. Tương tự, điểm kiểm tra lần 2 cũng cụ thể là một phân phối chuẩn.

Các biểu đồ của điểm số lần 1 và lần 2 cho thấy dữ liệu có dạng hình chuông, và điểm số được phân bổ đồng đều ở cả hai phía của điểm trung bình. Điều này ngụ ý rằng khả năng của dữ liệu kiểm tra lần 1 và lần 2 là phân phối chuẩn.

(2) Vẽ biểu đồ xác suất chuẩn và kiểm tra Kolmogorov-Smirnov/Shapiro-Wilk

– Bước 1: Để vẽ biểu đồ xác suất chuẩn Q-Q (Normal QQ plot), chúng ta chọn: Analyze> Descriptive Statistics> Explore

– Bước 2: Khi xuất hiện màn hình Explore, chuyển Pre-testPost-test từ ô bên trái vào ô Dependent List:

– Bước 3:  Nhấn vào nút Plots. Sau khi màn hình Explore: Plots xuất hiện, nhấp vào ô Histogram và ô Normality plots with tests. Sau đó nhấp Continue và nhấp OK để hiển thị kết quả.

Xem biểu đồ Normal Q-Q Plot, các trị số quan sát và trị số mong đợi đều nằm gần trên đường thẳng.

Vì cỡ mẫu 345 (lớn hơn 50), chúng ta dùng kết quả kiểm định Kolmogorov-Smirnov với Sig.= 0.00 (nhỏ hơn 0.05) trong cả hai trường hợp. Chứng tỏ phân phối này là không chuẩn. Tuy nhiên, thử nghiệm Shapiro-Wilk và thử nghiệm Kolmogorov-Smirnov có thể được sử dụng để xác nhận phân phối chuẩn với các mẫu cỡ nhỏ đến trung bình (nhỏ hơn 300), chúng có thể không đáng tin cậy đối với các mẫu lớn. Vì vậy, kết quả thử nghiệm độ lệch (skewness) và độ nhọn (kurtosis) có thể được sử dụng để xác định phân phối chuẩn cho cỡ mẫu lớn.

Kết quả trong Bảng Statistics cho thấy, giá trị tuyệt đối của độ lệch (skewness) nhỏ hơn 2 và giá trị tuyệt đối của độ nhọn dư thừa (excess) nhỏ hơn 4 cho thấy rằng dữ liệu chắc chắn là phân phối chuẩn.

Kết luận, dữ liệu điểm số kiểm tra lần 1 và lần 2 là phân phối chuẩn.

Tài liệu tham khảo

  1. Coolican, H. (2018). Research methods and statistics in psychology. Routledge.
  2. Hanneman, R. A., Kposowa, A. J., & Riddle, M. D. (2012). Basic statistics for social research (Vol. 38). John Wiley & Sons.
  3. Jackson, S. L. (2015). Research methods and statistics: A critical thinking approach. Cengage Learning.
  4. McQueen, R. A., & Knussen, C. (2006). Introduction to research methods and statistics in psychology. Pearson education.
  5. Peers, I. (2006). Statistical analysis for education and psychology researchers: Tools for researchers in education and psychology. Routledge.
  6. Wagner III, W. E. (2019). Using IBM® SPSS® statistics for research methods and social science statistics. Sage Publications.
  7. Kim, H. Y. (2013). Statistical notes for clinical researchers: assessing normal distribution (2) using skewness and kurtosis. Restorative dentistry & endodontics, 38(1), 52-54. https://doi.org/10.5395/rde.2013.38.1.52

Từ khóa » Cách Tra Bằng Normal Distribution