Độ lệch (Skewness) và độ nhọn (Kurtosis) là hai thống kê mô tả quan trọng được sử dụng để hiểu rõ hơn về hình dạng của phân phối dữ liệu. Trong SPSS, bạn có thể dễ dàng tính toán và diễn giải hai chỉ số này.
1. Chỉ số độ lệch Skewness là gì?
a. Khái niệm độ lệch Skewness
Skewness đo lường độ lệch của phân phối dữ liệu so với phân phối chuẩn. Nó cho biết mức độ không đối xứng của phân phối.
Hình thái độ lệch khái quát chung sẽ gồm 3 dạng như đồ thị phía trên:
- Skewness = 0: Phân phối đối xứng (như phân phối chuẩn). Có xu hướng đảm bảo phân phối chuẩn.
- Skewness > 0: Phân phối lệch phải (có đuôi dài về phía bên phải). Có xu hướng không đảm bảo phân phối chuẩn.
- Skewness < 0: Phân phối lệch trái (có đuôi dài về phía bên trái). Có xu hướng không đảm bảo phân phối chuẩn.
b. Đánh giá phân phối chuẩn dựa vào Skewness
Skewness đo lường mức độ đối xứng của phân phối một biến. Nếu phân phối kéo dài về phía đuôi bên phải hoặc bên trái, nó được coi là bị lệch. Độ lệch âm cho thấy phần lớn giá trị lớn hơn trung bình, trong khi độ lệch dương cho thấy phần lớn giá trị nhỏ hơn trung bình.
Hair và cộng sự (2022), đưa ra tiêu chuẩn đánh giá phân phối chuẩn của dữ liệu dựa vào Skewness như sau:
- Skewness từ -1 đến 1: mức lý tưởng để kết luận có phân phối chuẩn;
- Skewness từ -2 đến 2: mức chấp nhận để kết luận có phân phối chuẩn;
- Skewness vượt quá -2 và 2: dữ liệu không có phân phối chuẩn.
2. Chỉ số độ nhọn Kurtosis là gì?
a. Khái niệm độ nhọn Kurtosis
Kurtosis là một đại lượng thống kê đo lường hình dạng của phân phối dữ liệu, đặc biệt là độ nhọn của đỉnh và độ dày của đuôi so với phân phối chuẩn (phân phối có độ nhọn trung bình).
Công thức ban đầu tính toán Kurtosis bằng 3 sẽ cho thấy dữ liệu có phân phối chuẩn. Tuy nhiên, trong nhiều tài liệu, giáo trình và phần mềm thống kê, bao gồm cả SPSS, giá trị Kurtosis thường được quy về 0 để dễ dàng nhận xét và so sánh. Hệ số Kurtosis sau khi quy đổi này được gọi là Excess Kurtosis (độ nhọn dư thừa). Công thức quy đổi như sau:
Excess Kurtosis = Kurtosis – 3
Trong phần mềm SPSS, mặc dù được gọi là Kurtosis, nhưng giá trị này thực chất là Excess Kurtosis. Do đó, khi đọc kết quả trên SPSS, chúng ta cần so sánh giá trị Kurtosis với 0 thay vì 3.
Hình thái độ nhọn khái quát chung sẽ gồm 3 dạng như đồ thị phía trên:
- Excess Kurtosis > 0: Hình dạng này được gọi là phân phối nhọn hơn chuẩn (Leptokurtic). Đồ thị phân phối có đỉnh nhọn, cao.
- Excess Kurtosis = 0: Hình dạng này được gọi là phân phối chuẩn (Mesokurtic). Đồ thị phân phối có độ nhọn trung bình.
- Excess Kurtosis < 0: Hình dạng này được gọi là phân phối bẹt hơn chuẩn (Platykurtic). Đồ thị phân phối có đỉnh rộng, thấp.
b. Đánh giá phân phối chuẩn dựa vào Kurtosis
Kurtosis thể hiện mức độ nhọn hoặc dẹt của phân phối so với phân phối chuẩn. Giá trị dương cho thấy phân phối có đỉnh cao và nhọn hơn, trong khi giá trị âm cho thấy phân phối phẳng và trải rộng hơn.
Hair và cộng sự (2022), đưa ra tiêu chuẩn đánh giá phân phối chuẩn của dữ liệu dựa vào Kurtosis (đã trừ cho 3) như sau:
- Kurtosis gần bằng 0: mức lý tưởng để kết luận có phân phối chuẩn;
- Kurtosis từ -2 đến 2: mức chấp nhận để kết luận có phân phối chuẩn;
- Kurtosis vượt quá -2 và 2: dữ liệu không có phân phối chuẩn.
3. Cách chạy phân tích giá trị Skewness và Kurtosis trong SPSS
Để tính Skewness và Kurtosis trong SPSS, tại giao diện làm việc của SPSS chúng ta vào Analyze → Descriptive Statistics → Descriptives.
Cửa sổ Descriptives xuất hiện, đưa các biến cần kiểm tra skewness và kurtosis vào mục Variable(s). Sau đó nhấp vào tùy chọn Options.
Trong tùy chọn Options, tích chọn vào hai ô Skewness và Kurtosis. Sau đó nhấp Continue quay về cửa sổ ban đầu rồi chọn OK để xuất kết quả ra output.
SPSS sẽ trả về hai chỉ số Skewness và Kurtosis trong bảng kết quả Descriptive Statistics như ảnh bên dưới.
→ Các giá trị Skewness và Kurtosis của các biến đều nằm trong khoảng từ -2 đến 2, cho thấy dữ liệu của các biến này có phân phối xấp xỉ chuẩn.
Lưu ý:
-
Khi đánh giá phân phối chuẩn dựa trên Skewness và Kurtosis, ta không nên kết luận dữ liệu có phân phối chuẩn mà chỉ nên sử dụng thuật ngữ “phân phối xấp xỉ chuẩn”.
-
Việc đánh giá phân phối chuẩn thông qua Skewness và Kurtosis chỉ mang tính định tính. Do đó, cần kết hợp với các kiểm định định lượng như Shapiro-Wilk và Kolmogorov-Smirnov để có kết luận chính xác hơn.
———-
Nguồn tham khảo:
Hair và cộng sự (2022). A Primer on Partial Least Squares Structural Equation Modeling (PLS-SEM) (3 ed.). Thousand Oaks, CA: Sage.