Phân tích nhân tố khám phá (Exploratory Factor Analysis – EFA) là một kỹ thuật thống kê được sử dụng để xác định cấu trúc tiềm ẩn trong một tập hợp các biến quan sát. Nó giúp xác định số lượng nhân tố tiềm ẩn (latent factors) và cách các biến quan sát (observed variables) liên kết với các nhân tố đó.
1. Mục đích và hạn chế của phân tích EFA
Phân tích nhân tố khám phá (Exploratory Factor Analysis – EFA) là phương pháp thống kê được sử dụng để rút gọn một tập hợp gồm k biến quan sát thành một tập nhỏ hơn gồm F nhân tố (F < k) mang ý nghĩa hơn. Trong nghiên cứu, thường có nhiều biến quan sát, và không ít trong số đó có mối tương quan với nhau. Thay vì phân tích riêng lẻ 20 đặc điểm nhỏ của một đối tượng, ta có thể tập trung vào 4 đặc điểm chính, trong đó mỗi đặc điểm chính bao gồm 5 đặc điểm nhỏ có mối liên hệ chặt chẽ. Cách tiếp cận này không chỉ giúp tối ưu hóa thời gian mà còn tiết kiệm chi phí cho quá trình nghiên cứu.
Phân tích nhân tố khám phá (EFA) được sử dụng trong các nghiên cứu khoa học xã hội, kinh tế, và quản trị để:
- Xác định cấu trúc tiềm ẩn: Phát hiện ra các nhóm biến có mối liên hệ chặt chẽ với nhau.
- Giảm số lượng biến quan sát: Gộp các biến có liên quan vào một số ít nhân tố để dễ phân tích hơn.
- Kiểm định độ hội tụ và phân biệt: Đánh giá xem các biến đo lường có thực sự phản ánh một khái niệm lý thuyết hay không.
EFA là một công cụ hữu ích trong nghiên cứu, nhưng cũng đi kèm với một số hạn chế nhất định. Dưới đây là một số hạn chế của EFA mà bạn cần lưu ý:
1. Tính chủ quan:
– Xác định số lượng nhân tố: Việc quyết định giữ lại bao nhiêu nhân tố đôi khi mang tính chủ quan, dựa trên các tiêu chí như eigenvalue, scree plot, hoặc parallel analysis. Tuy nhiên, không có tiêu chí nào là hoàn hảo và việc lựa chọn có thể ảnh hưởng đến kết quả phân tích.
– Giải thích nhân tố: Việc đặt tên và giải thích ý nghĩa của các nhân tố đòi hỏi kiến thức chuyên môn và kinh nghiệm của nhà nghiên cứu. Điều này có thể dẫn đến những diễn giải chủ quan và khác nhau.
2. Yêu cầu về dữ liệu:
– Kích thước mẫu: EFA yêu cầu một kích thước mẫu đủ lớn để đảm bảo kết quả phân tích ổn định. Mẫu quá nhỏ có thể dẫn đến kết quả không chính xác và không đáng tin cậy.
– Phân bố dữ liệu: EFA thường giả định dữ liệu tuân theo phân bố chuẩn. Nếu dữ liệu không tuân theo phân bố chuẩn, kết quả phân tích có thể bị sai lệch.
3. Hạn chế về mặt thống kê:
– Không kiểm định giả thuyết: EFA là một kỹ thuật khám phá, không phải kiểm định. Nó không cho phép kiểm định các giả thuyết cụ thể về cấu trúc nhân tố.
– Khả năng khái quát hóa: Kết quả EFA chỉ có thể khái quát hóa cho mẫu nghiên cứu cụ thể. Khả năng khái quát hóa cho các quần thể khác có thể bị hạn chế.
4. Các vấn đề khác:
– Xoay nhân tố: Việc lựa chọn phương pháp xoay nhân tố (ví dụ: varimax, promax) có thể ảnh hưởng đến kết quả phân tích.
– Giá trị ngoại lệ: Sự hiện diện của các giá trị ngoại lệ trong dữ liệu có thể làm sai lệch kết quả EFA.
– Tính ổn định của cấu trúc nhân tố: Cấu trúc nhân tố có thể thay đổi theo thời gian và giữa các mẫu khác nhau.
2. Tiêu chí đánh giá phân tích EFA trên SPSS
Để đánh giá phân tích nhân tố khám phá (EFA) trên SPSS, chúng ta cần xem xét nhiều tiêu chí khác nhau để đảm bảo kết quả phân tích là hợp lệ và đáng tin cậy. Dưới đây là các tiêu chí quan trọng cần được đánh giá:
a. Hệ số KMO (Kaiser-Meyer-Olkin):
KMO là chỉ số đo lường mức độ phù hợp của dữ liệu để phân tích nhân tố. Nó đánh giá xem liệu có đủ tương quan giữa các biến quan sát để tạo thành các nhân tố hay không. Trị số của KMO phải đạt giá trị 0.5 trở lên (0.5 ≤ KMO ≤ 1) là điều kiện đủ để phân tích nhân tố là phù hợp. Nếu trị số này nhỏ hơn 0.5, thì phân tích nhân tố có khả năng không thích hợp với tập dữ liệu nghiên cứu. Hutcheson & Sofroniou (1999) đề xuất một số ngưỡng giá trị KMO như sau:
- KMO ≥5: mức chấp nhận tối thiểu
- 5 < KMO ≤ 0.7: bình thường
- 7 < KMO ≤ 0.8: tốt
- 8 < KMO ≤ 0.9: rất tốt
- KMO >9: xuất sắc
b. Kiểm định Bartlett (Bartlett’s test of sphericity)
Đây là một kiểm định xem xét có mối tương quan xảy ra giữa các biến tham gia vào EFA. Giả định rất quan trọng trong EFA là các biến quan sát đưa vào phân tích cần có sự tương quan với nhau. Thay vì đánh giá dựa vào ma trận tương quan khá khó khăn, chúng ta sẽ dùng tới kiểm định Bartlett. Kiểm định này sẽ xem xét có mối tương quan xảy ra giữa các biến tham gia vào EFA hay không với giả thuyết Ho: Không có mối tương quan giữa các biến quan sát. Nếu sig kiểm định Bartlett nhỏ hơn 0.05, chúng ta bác bỏ Ho và kết luận các biến tham gia vào EFA có sự tương quan với nhau, ngược lại, nếu sig lớn hơn 0.05, chúng ta chấp nhận Ho và kết luận các biến quan sát không có sự tương quan với nhau, phân tích EFA là không phù hợp
c. Tổng phương sai trích (Total Variance Explained)
Giá trị tổng phương sai trích từ 50% trở lên cho thấy mô hình EFA là phù hợp. Coi biến thiên là 100% thì trị số này thể hiện các nhân tố được trích cô đọng được bao nhiêu % và bị thất thoát bao nhiêu % của các biến quan sát.
d. Hệ số tải nhân tố (Factor Loading)
Hệ số tải còn gọi là trọng số nhân tố, giá trị này biểu thị mối quan hệ tương quan giữa biến quan sát với nhân tố. Hệ số tải nhân tố càng cao, nghĩa là tương quan giữa biến quan sát đó với nhân tố càng lớn và ngược lại. Theo Hair & ctg (2009,116), Multivariate Data Analysis, 7th Edition thì:
- Factor Loading ở mức ± 0.3: Điều kiện tối thiểu để biến quan sát được giữ lại.
- Factor Loading ở mức ± 0.5: Biến quan sát có ý nghĩa thống kê tốt.
- Factor Loading ở mức ± 0.7: Biến quan sát có ý nghĩa thống kê rất tốt.
Thường chúng ta sẽ sử dụng mức 0.5 là mức phổ biến.
3. Cách phân tích nhân tố khám phá EFA trên SPSS
Với đề tài đã xác định được biến độc lập và biến phụ thuộc, chúng ta cần phân tích EFA riêng giữa độc lập và phụ thuộc. Lý do tại sao, bạn vui lòng xem tại bài viết Chạy EFA riêng hay chung giữa biến độc lập với biến phụ thuộc?.
Thực hiện phân tích nhân tố EFA với một tập data mẫu có sẵn. Lần lượt chạy phân tích nhân tố khám phá cho biến độc lập và biến phụ thuộc. Ví dụ bên dưới tác giả thực hành mẫu với các biến độc lập, biến phụ thuộc bạn đọc thực hiện tương tự.
Lưu ý, các biến quan sát bị loại ở bước Cronbach Alpha trước đó sẽ không được đưa vào để kiểm định EFA.
Để thực hiện phân tích nhân tố khám phá EFA trong SPSS, chúng ta vào Analyze > Dimension Reduction > Factor…
Đưa các biến quan sát cần thực hiện phân tích EFA vào mục Variables. Chú ý 4 tùy chọn được đánh số ở ảnh bên dưới.
– Descriptives: Tích vào mục KMO and Barlett’s test of sphericity để xuất bảng giá trị KMO và giá trị sig của kiểm định Barlett. Nhấp Continue để quay lại cửa sổ ban đầu.
– Extraction: Ở đây, chúng ta sẽ sử dụng phép trích PCA (Principal Components Analysis). Với SPSS 20 và các phiên bản 21, 22, 23, 24, PCA sẽ được viết gọn lại là Principal Components như hình ảnh bên dưới, đây cũng là tùy chọn mặc định của SPSS.
Khi các bạn nhấp chuột vào nút mũi tên hướng xuống sẽ có nhiều tùy chọn phép trích khác nhau. Số lượng nhân tố được trích ra ở ma trận xoay phụ thuộc khá nhiều vào việc lựa chọn phép trích, tuy nhiên, tài liệu này sẽ chỉ tập trung vào phần PCA.
– Rotation: Ở đây có các phép quay, thường chúng ta hay sử dụng Varimax và Promax. Riêng với dạng đề tài đã xác định được biến độc lập và biến phụ thuộc, chúng ta sử dụng phép quay Varimax. Nhấp Continue để quay lại cửa sổ ban đầu.
– Options: Tích vào 2 mục như hình bên dưới. Sorted by size giúp sắp xếp ma trận xoay thành từng cột dạng bậc thang để dễ đọc dữ liệu hơn. Suppress small coefficients giúp loại bỏ các hệ số tải không đạt tiêu chuẩn khỏi ma trận xoay, giúp ma trận gọn gàng, trực quan hơn. Tại mục này sẽ có hàng Absolute value below, bạn cần nhập vào giá trị hệ số tải nhân tố Factor Loading tiêu chuẩn. Kích thước mẫu file dữ liệu là 220 nên tác giả sẽ nhập vào 0.5. Nhấp Continue để quay lại cửa sổ ban đầu.
Tại cửa sổ tiếp theo, bạn chọn OK để xuất kết quả ra Output.

Có khá nhiều bảng ở Ouput, tuy nhiên, chúng ta chỉ cần quan tâm 3 bảng:
- KMO and Barlett’s Test: xem hệ số KMO và sig kiểm định Bartlett.
- Total Variance Explained: xem tổng phương sai trích Total Variance Explained và giá trị Eigenvalue.
- Rotated Component Matrix: xem ma trận xoay và kiểm tra hệ số tải Factor Loading của các biến quan sát (Lưu ý tránh nhầm lẫn với bảng Component Matrix)
Không phải lúc nào ma trận xoay có được từ kết quả phân tích EFA cũng tách biệt các nhóm một cách hoàn toàn, việc xuất hiện các biến xấu sẽ làm ma trận xoay bị xáo trộn so với các thang đo lý thuyết. Vậy cách khắc phục ma trận xoay lộn xộn như thế nào, bạn hãy xem tại bài viết này.
Nếu bạn gặp khó khăn khi kết quả EFA bị xáo trộn, không đạt tiêu chuẩn kiểm định, số biến bị loại quá nhiều. Bạn có thể tham khảo dịch vụ xử lý số liệu SPSS của Xử Lý Định Lượng để team có thể hỗ trợ bạn xử lý nhanh và hiệu quả nhất.