Đảm bảo kích thước mẫu tối thiểu trong phân tích EFA là yếu tố vô cùng quan trọng để đảm bảo kết quả đạt độ tin cậy cao. Vậy tại sao kích thước mẫu lại đóng vai trò then chốt như vậy? Và kích thước mẫu như thế nào mới được xem là phù hợp cho phân tích EFA?
1. Tại sao kích thước mẫu lại quan trọng đối với EFA
Kích thước mẫu đóng vai trò vô cùng quan trọng trong phân tích nhân tố khám phá (EFA). Xác định một cỡ mẫu phù hợp giúp đảm bảo độ tin cậy và tính hợp lệ của kết quả nghiên cứu. Tuy nhiên, không tồn tại một con số “cỡ mẫu lý tưởng” áp dụng cho mọi nghiên cứu EFA, bởi kích thước mẫu còn phụ thuộc vào nhiều yếu tố như số lượng biến quan sát, số lượng nhân tố, đặc điểm dữ liệu và mức độ phức tạp của mô hình.
Để phân tích EFA đạt được kết quả chính xác và đáng tin cậy, việc đảm bảo kích thước mẫu đủ lớn là điều vô cùng cần thiết. Sau đây là một số lý do giải thích cho điều này:
a. Độ tin cậy của các ước lượng:
– Đảm bảo tính ổn định của tải trọng nhân tố: Một kích thước mẫu EFA đủ lớn giúp các tải trọng nhân tố (factor loadings) trở nên ổn định hơn. Tải trọng nhân tố biểu thị mức độ tương quan giữa các biến quan sát và các nhân tố tiềm ẩn. Với cỡ mẫu nhỏ, các tải trọng nhân tố dễ bị biến động khi thêm hoặc bớt một vài quan sát, dẫn đến kết quả thiếu ổn định.
– Ước lượng chính xác phương sai: Kích thước mẫu lớn hỗ trợ việc ước lượng chính xác hơn phương sai của các biến và nhân tố. Phương sai, đại diện cho mức độ phân tán của dữ liệu, là yếu tố quan trọng để đảm bảo độ tin cậy của kết quả phân tích. Việc ước lượng phương sai không chính xác có thể ảnh hưởng đến tính hợp lệ của mô hình.
b. Khả năng khám phá cấu trúc:
– Xác định các nhân tố tiềm ẩn: Kích thước mẫu lớn làm tăng khả năng nhận diện chính xác các nhân tố tiềm ẩn thực sự tồn tại trong dữ liệu. Với mẫu nhỏ, các nhân tố yếu hoặc các mối quan hệ phức tạp có thể không được phát hiện, dẫn đến kết quả thiếu toàn diện.
– Đánh giá độ phù hợp của mô hình: Cỡ mẫu lớn cải thiện độ chính xác trong việc đánh giá độ phù hợp của mô hình EFA. Các chỉ số như KMO và Bartlett’s Test of Sphericity sẽ cho kết quả đáng tin cậy hơn khi được áp dụng trên dữ liệu có kích thước mẫu đủ lớn.
c. Giảm lỗi mẫu:
– Đảm bảo tính đại diện cho tổng thể: Kích thước mẫu lớn giúp mẫu nghiên cứu phản ánh tốt hơn đặc điểm của tổng thể, từ đó giảm thiểu sai số do chọn mẫu và tăng khả năng khái quát hóa kết quả nghiên cứu.
– Giảm tác động của điểm dị biệt: Mẫu lớn giúp hạn chế ảnh hưởng của các điểm dị biệt (outliers) trong dữ liệu. Những giá trị bất thường này có thể làm sai lệch kết quả phân tích, đặc biệt khi kích thước mẫu nhỏ, nhưng với mẫu lớn, tác động của chúng sẽ được giảm thiểu.
2. Công thức tính cỡ mẫu phù hợp cho EFA
Nhiều nhà nghiên cứu đã đề xuất các khuyến nghị liên quan đến việc xác định kích thước mẫu trong phân tích EFA. Dưới đây là một số quan điểm tiêu biểu:
- Kaiser (1974): Kaiser cho rằng để đảm bảo kết quả EFA đáng tin cậy, kích thước mẫu tối thiểu nên gấp ít nhất 5 lần số biến quan sát.
- MacCallum et al. (1999): Nhóm tác giả đã phân tích chi tiết mối quan hệ giữa kích thước mẫu, số lượng biến, và độ tin cậy của EFA. Họ nhận thấy rằng không chỉ kích thước mẫu mà cả cấu trúc nhân tố và độ mạnh của các hệ số tải đều ảnh hưởng đến độ chính xác của kết quả.
- Tabachnick và Fidell (2007): Hai tác giả khuyến nghị kích thước mẫu nên đạt ít nhất 300 quan sát để đảm bảo độ chính xác cao trong EFA. Tuy nhiên, nếu hệ số tải nhân tố (factor loadings) mạnh (≥ 0.6), một mẫu với kích thước nhỏ hơn vẫn có thể được chấp nhận.
- Hair và cộng sự (2009): Theo Hair và đồng nghiệp cho rằng kích thước mẫu tối thiểu cho EFA là 50, nhưng tốt nhất nên từ 100 trở lên. Họ cũng gợi ý rằng kích thước mẫu nên ít nhất gấp 5 đến 10 lần số biến quan sát trong phân tích.
- Các nghiên cứu khác: Một số nghiên cứu khác cũng đưa ra khuyến nghị kích thước mẫu tối thiểu là 5 lần số biến quan sát, nhấn mạnh rằng cỡ mẫu đủ lớn là yếu tố then chốt để đảm bảo độ tin cậy của kết quả EFA.
Như vậy công thức mẫu tối thiểu EFA được đề xuất nhiều nhất trong các nghiên cứu là:
N = 5 * số biến quan sát tham gia EFA
Ví dụ: Một nghiên cứu có 20 biến quan sát. Tác giả muốn phân tích EFA cho 20 biến quan sát này thì cỡ mẫu tối thiểu cần có là 5*20 = 100.
3. Giải thích công thức cỡ mẫu EFA trường hợp chạy nhiều EFA trong một mô hình
Trong công thức lấy mẫu EFA, chúng ta nói đến số lượng biến quan sát tham gia vào phép EFA đó chứ không phải số lượng biến quan sát của toàn bộ nghiên cứu. Bởi vì sẽ có một số trường hợp bài nghiên cứu chia nhỏ thành nhiều lần chạy EFA, số lượng biến quan sát tham gia vào một lần chạy EFA sẽ ít hơn số lượng biến quan sát của toàn nghiên cứu.
Ví dụ: Xét một mô hình có 3 biến độc lập gồm 15 biến quan sát + 1 biến trung gian 5 biến quan sát + 1 biến phụ thuộc 8 biến quan sát.
– Nếu chúng ta triển khai EFA chung toàn mô hình: N tối thiểu = (15+5+8)*5 = 140.
– Nếu chúng ta triển khai EFA riêng độc lập, riêng trung gian, riêng phụ thuộc:
- N tối thiểu độc lập = 15*5 = 75
- N tối thiểu độc lập = 5*5 = 25
- N tối thiểu độc lập = 8*5 = 40
→ Chọn N tối thiểu lớn nhất làm N tối thiểu của nghiên cứu là 75.
Tổng kết lại, việc xác định kích thước mẫu trong phân tích EFA là một quyết định phức tạp, đòi hỏi nhà nghiên cứu phải cân nhắc nhiều yếu tố. Tuy vậy, phần lớn các khuyến nghị đều thống nhất rằng kích thước mẫu tối thiểu cần thiết cho EFA nên gấp ít nhất 5 lần số biến quan sát tham gia phân tích.
Xem thêm: Hướng dẫn phân tích nhân tố khám phá EFA trong SPSS