Phân phối chuẩn (Normal Distribution) là một giả định quan trọng trong nhiều phương pháp kiểm định thống kê tham số. Nếu giả định này bị vi phạm, kết quả phân tích có thể bị sai lệch và thiếu độ tin cậy. Vì vậy, việc kiểm tra tính chuẩn của phân phối dữ liệu là một bước quan trọng cần thực hiện trước khi tiến hành các phân tích.
Trong phần mềm SPSS, hai kiểm định thường được sử dụng để đánh giá mức độ tuân theo phân phối chuẩn của dữ liệu là kiểm định Shapiro-Wilk (S-W) và Kolmogorov-Smirnov (K-S). Bài viết này sẽ trình bày chi tiết cách thực hiện hai kiểm định này trong SPSS, cách diễn giải kết quả cũng như những lưu ý cần thiết khi áp dụng.
1. Lý thuyết kiểm định Shapiro–Wilk và Kolmogorov-Smirnov
Theo Andy Field (2009), một trong những cách phổ biến để đánh giá xem dữ liệu có tuân theo phân phối chuẩn hay không là so sánh phân phối thực tế của dữ liệu với một phân phối chuẩn lý thuyết có cùng giá trị trung bình và độ lệch chuẩn. Hai kiểm định thường được sử dụng trong mục đích này là Kolmogorov–Smirnov (K–S) và Shapiro–Wilk (S–W).
Hiểu một cách đơn giản, ta giả định rằng đã có một phân phối chuẩn lý tưởng (gọi là A), và so sánh nó với phân phối của tập dữ liệu thực nghiệm (gọi là B). Cả hai phân phối này được chuẩn hóa sao cho cùng trung bình và độ lệch chuẩn, nhằm đảm bảo tính tương đồng trong hệ quy chiếu khi so sánh. Nếu phân phối B gần giống hoặc trùng khớp với A, có thể kết luận rằng dữ liệu tuân theo phân phối chuẩn. Ngược lại, nếu B khác biệt đáng kể so với A, điều đó cho thấy dữ liệu không phân phối chuẩn. Hai kiểm định K–S và S–W được sử dụng để đánh giá mức độ tương đồng này một cách định lượng.
- Nếu kết quả của hai kiểm định không có ý nghĩa thống kê (giá trị sig > 0.05), điều đó cho thấy không có sự khác biệt đáng kể giữa phân phối của dữ liệu và phân phối chuẩn. Khi đó, dữ liệu có thể được xem là tuân theo phân phối chuẩn.
- Ngược lại, nếu kết quả kiểm định có ý nghĩa thống kê (giá trị sig < 0.05), điều này cho thấy sự khác biệt đáng kể giữa phân phối dữ liệu và phân phối chuẩn. Khi đó, dữ liệu được xem là không tuân theo phân phối chuẩn.
Tới đây có thể thấy việc đánh giá phân phối chuẩn của dữ liệu bằng hai loại kiểm định này khá dễ dàng khi chỉ cần đọc kết quả giá trị sig là được, nhưng chúng lại tồn tại những hạn chế nhất định. Cụ thể, khi kích thước mẫu lớn, chỉ một sai lệch nhỏ so với phân phối chuẩn lý tưởng (phân phối A) cũng có thể dẫn đến giá trị sig < 0.05. Điều này đồng nghĩa với việc kiểm định cho rằng dữ liệu không tuân theo phân phối chuẩn, dù trên thực tế mức độ lệch này là không đáng kể và ít ảnh hưởng đến các phân tích thống kê tiếp theo.
Ví dụ: Giả sử chúng ta có dữ liệu độ tuổi của 200 người và tiến hành kiểm định Shapiro–Wilk, kết quả thu được là sig = 0.02 (< 0.05), dẫn đến kết luận dữ liệu không có phân phối chuẩn. Tuy nhiên, khi kiểm tra trực quan bằng biểu đồ Q-Q plot hoặc Histogram, ta nhận thấy dữ liệu chỉ hơi lệch nhẹ, không có sự xuất hiện của các giá trị ngoại lệ nghiêm trọng. Trong trường hợp này, mặc dù kiểm định cho kết quả “không chuẩn”, nhưng dữ liệu vẫn có thể được xem là đủ gần với phân phối chuẩn để sử dụng trong các phương pháp thống kê yêu cầu giả định này.
Lưu ý quan trọng từ Andy Field (2009):
Trong các mẫu có kích thước lớn, cả hai kiểm định Kolmogorov–Smirnov và Shapiro–Wilk đều có xu hướng cho ra kết quả có ý nghĩa thống kê (sig < 0.05) ngay cả khi dữ liệu chỉ lệch nhẹ so với phân phối chuẩn. Do đó, không nên chỉ dựa vào kết quả của các kiểm định này để đánh giá phân phối chuẩn của dữ liệu. Thay vào đó, nên kết hợp thêm các phương pháp khác như: biểu đồ Histogram, biểu đồ P–P plot hoặc Q–Q plot, cùng với các chỉ số mô tả như độ lệch (skewness) và độ nhọn (kurtosis), để có cái nhìn toàn diện và chính xác hơn về phân phối dữ liệu.
2. Shapiro-Wilk và Kolmogorov-Smirnov và cỡ mẫu
Theo Prabhakar Mishra và cộng sự (2019), cỡ mẫu là một yếu tố quan trọng ảnh hưởng đến hiệu quả và độ tin cậy của hai kiểm định phổ biến dùng để đánh giá phân phối chuẩn: Shapiro–Wilk và Kolmogorov–Smirnov.
-
Shapiro–Wilk được cho là phù hợp nhất với các mẫu có kích thước ≤ 50. Mặc dù vẫn có thể áp dụng cho mẫu lớn hơn (lên tới khoảng 2000 tùy phần mềm), nhưng kiểm định này phát huy ưu thế rõ rệt khi dùng với cỡ mẫu nhỏ, nhờ độ nhạy cao hơn trong việc phát hiện sự sai lệch so với phân phối chuẩn.
-
Kolmogorov–Smirnov thích hợp hơn cho các mẫu có kích thước ≥ 50. Đối với các mẫu nhỏ hơn, độ nhạy của kiểm định này thấp hơn, dễ dẫn đến kết quả thiếu chính xác hoặc sai lệch.
Tác giả cũng nhận định rằng dù cả hai kiểm định đều nhằm đánh giá mức độ phù hợp của dữ liệu với phân phối chuẩn, nhưng Shapiro–Wilk có khả năng phát hiện sai lệch tốt hơn, đặc biệt trong các trường hợp dữ liệu chỉ hơi lệch nhẹ. Do đó, trong thực tế, có thể gặp tình huống Shapiro–Wilk cho kết quả có ý nghĩa thống kê (sig < 0.05) trong khi Kolmogorov–Smirnov lại không.
KẾT LUẬN:
– Với cỡ mẫu ≤ 50: ưu tiên sử dụng Shapiro–Wilk.
– Với cỡ mẫu ≥ 50: có thể sử dụng cả Shapiro–Wilk và Kolmogorov–Smirnov, tuy nhiên Shapiro–Wilk vẫn được khuyến nghị hơn nhờ độ nhạy cao hơn.
– Trong mọi trường hợp, nên kết hợp kết quả kiểm định với các biểu đồ trực quan (như Histogram, Q–Q plot) và các chỉ số mô tả (skewness, kurtosis) để đưa ra nhận định toàn diện và chính xác hơn về tính chuẩn của dữ liệu.
3. Kiểm định phân phối chuẩn bằng Shapiro-Wilk và Kolmogorov-Smirnov trong SPSS
3.1 Cách thực hiện Shapiro-Wilk và Kolmogorov-Smirnov trong SPSS
Trong phần này, chúng ta sẽ sử dụng một tập dữ liệu thực hành với kích thước mẫu N = 200, bao gồm ba biến định lượng cần kiểm tra tính phân phối chuẩn:
-
Biến HaiLong: được tính bằng trung bình cộng của các biến quan sát thành phần, đo lường mức độ hài lòng thông qua thang đo Likert 1–5.
-
Biến DoTuoi: thể hiện độ tuổi của các đáp viên, dao động từ 19 đến 40 tuổi.
-
Biến ThuNhap: phản ánh thu nhập hàng tháng của các đáp viên, đơn vị tính là triệu đồng (VNĐ).
Các kiểm định Shapiro–Wilk và Kolmogorov–Smirnov sẽ được áp dụng trên từng biến để đánh giá xem các biến này có tuân theo phân phối chuẩn hay không.
Để thực hiện kiểm định phân phối chuẩn bằng Shapiro-Wilk và Kolmogorov-Smirnov trong SPSS, chúng ta vào Analyze > Descriptive Statistics > Explore…
Trong hộp thoại Explore, đưa biến định lượng cần kiểm định vào ô Dependent List (có thể kéo–thả hoặc sử dụng nút mũi tên). Nếu bạn muốn kiểm định phân phối chuẩn theo từng nhóm đối tượng (ví dụ: theo giới tính), hãy chuyển biến phân nhóm vào ô Factor List. Nhấp vào nút Plots… bên phải để thiết lập kiểm định.
Trong hộp thoại Plots, đánh dấu chọn các mục sau: Stem-and-leaf, Histogram, Normality plots with tests (đây là mục bắt buộc phải chọn, vì SPSS chỉ hiển thị kết quả kiểm định Shapiro–Wilk và Kolmogorov–Smirnov khi mục này được kích hoạt). Sau đó nhấn Continue.
Quay trở lại hộp thoại Explore, nhấn OK để SPSS tiến hành phân tích và hiển thị kết quả. Kết quả sẽ được hiển thị dưới dạng nhiều bảng và đồ thị trực quan hỗ trợ đánh giá phân phối chuẩn. Tuy nhiên, trong phạm vi bài viết này, chúng ta sẽ tập trung phân tích bảng Tests of Normality, nơi thể hiện rõ kết quả kiểm định Shapiro–Wilk và Kolmogorov–Smirnov cho từng biến.
3.2 Đọc kết quả kiểm định Shapiro-Wilk và Kolmogorov-Smirnov trong SPSS
Trong bảng Tests of Normality, chúng ta sẽ thấy hai phần chính là kết quả kiểm định Kolmogorov-Smirnov và Shapiro-Wilk với các thông số
- Statistic: Giá trị thống kê của kiểm định.
- df (Degrees of Freedom): Bậc tự do.
- Sig. (Asymp. Sig. (2-tailed)): Giá trị sig (mức ý nghĩa).
Với kích thước mẫu N = 200 (lớn hơn 50), cả hai kiểm định Kolmogorov–Smirnov và Shapiro–Wilk đều có thể được sử dụng để đánh giá tính phân phối chuẩn của các biến.
1. Biến HaiLong
- Kolmogorov–Smirnov: Sig. = 0.000 < 0.05
- Shapiro–Wilk: Sig. = 0.000 < 0.05
→ Kết luận: Cả hai kiểm định đều cho kết quả có ý nghĩa thống kê (sig < 0.05), cho thấy dữ liệu của biến HaiLong không tuân theo phân phối chuẩn.
2. Biến DoTuoi
- Kolmogorov–Smirnov: Sig. = 0.056 > 0.05
- Shapiro–Wilk: Sig. = 0.031 < 0.05
→ Kết luận: Hai kiểm định đưa ra kết quả trái ngược nhau. Trong khi Kolmogorov–Smirnov cho thấy có thể chấp nhận giả thuyết dữ liệu có phân phối chuẩn, thì Shapiro–Wilk lại cho kết quả ngược lại.
Trong trường hợp này, do cỡ mẫu lớn (N = 200), Kolmogorov–Smirnov có thể được ưu tiên hơn. Tuy nhiên, giá trị sig chỉ nhỉnh hơn ngưỡng 0.05 một cách nhẹ (0.056), đồng thời Shapiro–Wilk đã bác bỏ giả thuyết phân phối chuẩn. Vì vậy, cần kiểm tra các biểu đồ trực quan (Histogram, Q–Q plot, P–P plot) cũng như các chỉ số Skewness và Kurtosis để có cơ sở kết luận chính xác hơn.
Nếu các biểu đồ và chỉ số này cho thấy dữ liệu tiệm cận phân phối chuẩn, có thể tạm chấp nhận biến DoTuoi có phân phối gần chuẩn. Tuy nhiên, nếu ưu tiên thận trọng hoặc nếu kết quả Shapiro–Wilk được xem là chỉ báo mạnh hơn, thì nên kết luận rằng DoTuoi có thể không có phân phối chuẩn.
3. Biến ThuNhap
- Kolmogorov–Smirnov: Sig. = 0.200 > 0.05
- Shapiro–Wilk: Sig. = 0.300 > 0.05
→ Kết luận: Cả hai kiểm định đều cho giá trị sig lớn hơn 0.05, cho thấy không có sự khác biệt đáng kể giữa phân phối của biến ThuNhap và phân phối chuẩn. Do đó, có thể kết luận rằng ThuNhap có phân phối chuẩn.
KẾT LUẬN:
HaiLong: Không có phân phối chuẩn.
DoTuoi: Có khả năng không có phân phối chuẩn, cần kiểm tra thêm trực quan (biểu đồ) và chỉ số Skewness/Kurtosis để khẳng định chắc chắn.
ThuNhap: Có phân phối chuẩn.
Xem thêm: Chỉ số Skewness và Kurtosis đánh giá phân phối chuẩn trong SPSS
———-
Nguồn tham khảo:
Shapiro, S. S., & Wilk, M. B. (1965). An analysis of variance test for normality (complete samples). Biometrika, 52(3/4), 591–611.
Mishra P, Pandey CM, Singh U, Gupta A, Sahu C, Keshri A. Descriptive statistics and normality tests for statistical data. Ann Card Anaesth. 2019 Jan-Mar;22(1):67-72.
Field, A. (2009) Discovering Statistics Using SPSS. 3rd Edition, Sage Publications Ltd., London.