Phân tích nhân tố khám phá (Exploratory Factor Analysis – EFA) là một kỹ thuật thống kê được sử dụng nhằm khám phá cấu trúc tiềm ẩn bên trong một tập hợp các biến quan sát mà chưa có giả thuyết hay mô hình xác định từ trước. Mục tiêu chính của EFA là rút gọn số lượng biến bằng cách tìm ra các nhân tố tiềm ẩn (latent factors) – tức là những đại lượng không thể đo lường trực tiếp nhưng có ảnh hưởng đến các biến quan sát – và xác định cách các biến quan sát liên kết với các nhân tố này thông qua hệ số tải (factor loadings).
1. Mục đích của phân tích EFA
Phân tích nhân tố khám phá (Exploratory Factor Analysis – EFA) là một kỹ thuật thống kê mạnh mẽ, được sử dụng nhằm mục tiêu rút gọn và đơn giản hóa một tập hợp lớn các biến quan sát thành một số lượng nhỏ hơn các nhân tố (factors) mang tính đại diện và có ý nghĩa hơn về mặt lý thuyết. Cụ thể, EFA cho phép chuyển đổi một tập hợp gồm k biến quan sát thành F nhân tố tiềm ẩn (với F < k), trong đó mỗi nhân tố thể hiện một khía cạnh chung mà các biến có liên quan cùng phản ánh. Điều này đặc biệt hữu ích trong các nghiên cứu định lượng có nhiều biến đo lường, giúp nhà nghiên cứu dễ dàng phát hiện ra các mô hình tiềm ẩn trong dữ liệu.
Trong thực tế, khi tiến hành một nghiên cứu, chúng ta thường xây dựng bảng hỏi hoặc thu thập dữ liệu dựa trên nhiều đặc điểm, hành vi hoặc thái độ của đối tượng nghiên cứu. Các biến này không phải lúc nào cũng độc lập với nhau, mà thường có mối tương quan nhất định. Thay vì phân tích riêng lẻ từng biến (ví dụ như 20 đặc điểm nhỏ), EFA giúp nhóm các biến có mối liên hệ chặt chẽ thành các cụm, hay nhân tố. Ví dụ, 20 đặc điểm nhỏ có thể được nhóm lại thành 4 nhân tố chính, mỗi nhân tố bao gồm khoảng 5 đặc điểm có tính chất tương đồng. Cách tiếp cận này không những giúp tinh gọn dữ liệu, mà còn tối ưu hóa quá trình phân tích, tiết kiệm thời gian và chi phí, đồng thời nâng cao chất lượng và độ chính xác của mô hình nghiên cứu.
Phân tích EFA được ứng dụng rộng rãi trong nhiều lĩnh vực như khoa học xã hội, kinh tế, giáo dục, tâm lý học, marketing và quản trị. Những mục tiêu chính của EFA trong nghiên cứu bao gồm:
-
Xác định cấu trúc tiềm ẩn của dữ liệu: Phát hiện ra các nhóm biến quan sát có liên hệ chặt chẽ với nhau, từ đó làm sáng tỏ các yếu tố nền tảng chưa được xác định rõ ràng trước đó.
-
Rút gọn số lượng biến quan sát: Giúp giảm bớt số lượng biến cần phân tích bằng cách gộp các biến tương quan thành một số ít nhân tố đại diện, từ đó đơn giản hóa mô hình và tăng hiệu quả phân tích.
-
Kiểm định độ hội tụ và phân biệt: Đánh giá xem các biến quan sát có thực sự đo lường đúng khái niệm lý thuyết mà chúng được thiết kế để phản ánh hay không, đồng thời kiểm tra tính phân biệt giữa các nhóm khái niệm.
2. Tiêu chí đánh giá phân tích EFA trên SPSS
Để đánh giá phân tích nhân tố khám phá (EFA) trên SPSS, chúng ta cần xem xét nhiều tiêu chí khác nhau để đảm bảo kết quả phân tích là hợp lệ và đáng tin cậy. Dưới đây là các tiêu chí quan trọng cần được đánh giá:
a. Hệ số KMO (Kaiser-Meyer-Olkin):
KMO là chỉ số đo lường mức độ phù hợp của dữ liệu để phân tích nhân tố. Nó đánh giá xem liệu có đủ tương quan giữa các biến quan sát để tạo thành các nhân tố hay không. Trị số của KMO phải đạt giá trị 0.5 trở lên (0.5 ≤ KMO ≤ 1) là điều kiện đủ để phân tích nhân tố là phù hợp. Nếu trị số này nhỏ hơn 0.5, thì phân tích nhân tố có khả năng không thích hợp với tập dữ liệu nghiên cứu. Hutcheson & Sofroniou (1999) đề xuất một số ngưỡng giá trị KMO như sau:
- KMO ≥5: mức chấp nhận tối thiểu
- 5 < KMO ≤ 0.7: bình thường
- 7 < KMO ≤ 0.8: tốt
- 8 < KMO ≤ 0.9: rất tốt
- KMO >9: xuất sắc
b. Kiểm định Bartlett (Bartlett’s test of sphericity)
Đây là một kiểm định xem xét có mối tương quan xảy ra giữa các biến tham gia vào EFA. Giả định rất quan trọng trong EFA là các biến quan sát đưa vào phân tích cần có sự tương quan với nhau. Thay vì đánh giá dựa vào ma trận tương quan khá khó khăn, chúng ta sẽ dùng tới kiểm định Bartlett.
Kiểm định này sẽ xem xét có mối tương quan xảy ra giữa các biến tham gia vào EFA hay không với giả thuyết Ho: Không có mối tương quan giữa các biến quan sát. Nếu sig kiểm định Bartlett nhỏ hơn 0.05, chúng ta bác bỏ Ho và kết luận các biến tham gia vào EFA có sự tương quan với nhau, ngược lại, nếu sig lớn hơn 0.05, chúng ta chấp nhận Ho và kết luận các biến quan sát không có sự tương quan với nhau, phân tích EFA là không phù hợp
c. Tổng phương sai trích (Total Variance Explained)
Phương sai trích thể hiện mức độ các nhân tố trích được giải thích bao nhiêu phần trăm tổng phương sai của toàn bộ tập biến quan sát đưa vào phân tích:
- Tổng phương sai = 100% → là toàn bộ lượng thông tin (sự biến thiên) trong dữ liệu gốc.
- Mỗi nhân tố sau khi trích sẽ giải thích một phần phương sai này.
- Khi cộng dồn tất cả các nhân tố giữ lại, ta có tổng phương sai trích (Cumulative %) – thể hiện tỷ lệ phần trăm thông tin của dữ liệu ban đầu được mô hình nhân tố giữ lại.
Giá trị tổng phương sai trích từ 50% trở lên cho thấy mô hình EFA là phù hợp. Coi biến thiên là 100% thì trị số này thể hiện các nhân tố được trích cô đọng được bao nhiêu % và bị thất thoát bao nhiêu % của các biến quan sát.
d. Hệ số tải nhân tố (Factor Loading)
Hệ số tải còn gọi là trọng số nhân tố, giá trị này biểu thị mối quan hệ tương quan giữa biến quan sát với nhân tố. Hệ số tải nhân tố càng cao, nghĩa là tương quan giữa biến quan sát đó với nhân tố càng lớn và ngược lại. Theo Hair & ctg (2009,116), Multivariate Data Analysis, 7th Edition thì:
- Factor Loading ở mức ± 0.3: Điều kiện tối thiểu để biến quan sát được giữ lại.
- Factor Loading ở mức ± 0.5: Biến quan sát có ý nghĩa thống kê tốt.
- Factor Loading ở mức ± 0.7: Biến quan sát có ý nghĩa thống kê rất tốt.
Mặc dù hệ số tải Factor Loading có trị tuyệt đối ở mức 0.3 đến 0.4 đạt điều kiện tối thiểu biến được chấp nhận biến có ý nghĩa. Tuy nhiên, mức 0.5 trở lên sẽ là ngưỡng tốt và phù hợp nhất khi đánh giá chất lượng biến quan sát trên thực nghiệm.
3. Cách phân tích nhân tố khám phá EFA trên SPSS
Với đề tài đã xác định được biến độc lập và biến phụ thuộc, chúng ta cần phân tích EFA riêng giữa độc lập và phụ thuộc. Lý do tại sao, bạn vui lòng xem tại bài viết Chạy EFA riêng hay chung giữa biến độc lập với biến phụ thuộc?.
Thực hiện phân tích nhân tố EFA với một tập data mẫu có sẵn. Lần lượt chạy phân tích nhân tố khám phá cho biến độc lập và biến phụ thuộc. Lưu ý, các biến quan sát bị loại ở bước Cronbach Alpha trước đó sẽ không được đưa vào để kiểm định EFA.
Để thực hiện phân tích nhân tố khám phá EFA trong SPSS, chúng ta vào Analyze > Dimension Reduction > Factor…

3.1 Phân tích EFA cho biến độc lập
Ngoại trừ biến LD7 đã bị loại ở bước kiểm định Cronbach’s Alpha, ta đưa tất cả các biến quan sát độc lập còn lại vào ô Variables. Lưu ý phần tùy chọn ở bên phải, chúng ta sẽ lần lượt xem xét và thiết lập từng mục trong đó.

– Descriptives: Tích vào mục KMO and Barlett’s test of sphericity để xuất bảng giá trị KMO và giá trị sig của kiểm định Barlett. Nhấp Continue để quay lại cửa sổ ban đầu.

– Extraction: Ở đây, chúng ta sẽ sử dụng phép trích PCA (Principal Components Analysis). Trong SPSS, PCA được viết gọn lại là Principal Components như hình ảnh bên dưới, đây cũng là tùy chọn mặc định của SPSS.

Khi bạn nhấp vào mũi tên hướng xuống, SPSS sẽ hiển thị nhiều phương pháp trích khác nhau. Số lượng nhân tố được rút trích trong ma trận xoay phụ thuộc khá nhiều vào phép trích mà bạn chọn. Tuy nhiên, trong phạm vi bài viết này, chúng ta chỉ tập trung vào phương pháp PCA (Principal Component Analysis).
– Rotation: Trong mục này có nhiều phép xoay nhân tố khác nhau, phổ biến nhất là Varimax và Promax. Đối với những đề tài đã xác định rõ biến độc lập và biến phụ thuộc, chúng ta nên sử dụng phép xoay Varimax. Sau khi chọn xong, nhấn Continue để quay lại cửa sổ chính.

– Options: Tại đây, hãy tích chọn hai ô như hình minh họa bên dưới.
- Sorted by size: Sắp xếp các hệ số tải trong ma trận xoay theo thứ tự giảm dần, giúp bảng hiển thị gọn gàng và dễ đọc hơn.
- Suppress small coefficients: Ẩn các hệ số tải nhỏ hơn ngưỡng tiêu chuẩn, giúp ma trận trở nên rõ ràng và trực quan.
Trong trường hợp bạn chỉ muốn ma trận xoay hiển thị các hệ số tải từ 0.3, 0.4, 0.5… trở lên, hãy tích chọn ô Suppress small coefficients. Khi đó, dòng Absolute value below sẽ được kích hoạt, cho phép bạn nhập ngưỡng hệ số tải nhân tố. Các hệ số nhỏ hơn ngưỡng này sẽ không hiển thị trong bảng ma trận xoay.
Trong ví dụ thực hành này, để dễ dàng quan sát kết quả, tác giả chọn chỉ hiển thị các hệ số tải từ 0.3 trở lên, nên nhập giá trị 0.3. Sau khi thiết lập xong, nhấn Continue để đóng cửa sổ và quay lại màn hình chính.

Tại cửa sổ tiếp theo, bạn chọn OK để xuất kết quả ra Output.

Có khá nhiều bảng ở output, tất cả các bảng này đều đóng góp vào việc đánh giá kết quả phân tích EFA là tốt hay tệ. Tuy nhiên, ở đây tác giả tập trung vào ba bảng kết quả chính: KMO and Barlett’s Test, Total Variance Explained và Rotated Component Matrix, bởi sử dụng ba bảng này chúng ta đã có thể đánh giá được kết quả phân tích EFA phù hợp hay không phù hợp.



Kết quả lần EFA đầu tiên: KMO = 0.887 > 0.5, sig Bartlett’s Test = 0.000 < 0.05, như vậy phân tích nhân tố khám phá EFA là phù hợp. Có 6 nhân tố được trích với tiêu chí eigenvalue lớn hơn 1 với tổng phương sai tích lũy là 63.109%. Tác giả mong muốn chọn ra các biến quan sát chất lượng nên sẽ sử dụng ngưỡng hệ số tải là 0.5 thay vì chọn hệ số tải tương ứng theo cỡ mẫu. So sánh ngưỡng này với kết quả ở ma trận xoay, có hai biến xấu là DN4 và LD5 cần xem xét loại bỏ:
- Biến DN4 tải lên ở cả hai nhân tố là Component 4 và Component 6 với hệ số tải lần lượt là 0.612 và 0.530, mức chênh lệch hệ số tải bằng 0.612 – 0.530 = 0.082 < 0.2.
- Biến LD5 có hệ số tải ở tất cả các nhân tố đều nhỏ5.
Tác giả sử dụng phương thức loại một lượt các biến xấu trong một lần phân tích EFA. Từ 28 biến quan sát ở lần phân tích EFA thứ nhất, loại bỏ DN4 và LD5 và đưa 26 biến quan sát còn lại vào phân tích EFA lần thứ hai.

Hệ số KMO = 0.879 > 0.5, sig Barlett’s Test = 0.000 < 0.05, như vậy phân tích nhân tố là phù hợp.

Có 6 nhân tố được trích dựa vào tiêu chí eigenvalue lớn hơn 1, như vậy 6 nhân tố này tóm tắt thông tin của 26 biến quan sát đưa vào EFA một cách tốt nhất. Tổng phương sai mà 6 nhân tố này trích được là 63.357% > 50%, như vậy, 6 nhân tố được trích giải thích được 63.357% biến thiên dữ liệu của 26 biến quan sát tham gia vào EFA.

Kết quả ma trận xoay cho thấy, 26 biến quan sát được phân thành 6 nhân tố, tất cả các biến quan sát đều có hệ số tải nhân tố Factor Loading lớn hơn 0.5 và không còn các biến xấu.
Như vậy, phân tích nhân tố khám phá EFA cho các biến độc lập được thực hiện hai lần. Lần thứ nhất, 28 biến quan sát được đưa vào phân tích, có 2 biến quan sát không đạt điều kiện là DN4 và LD5 được loại bỏ để thực hiện phân tích lại. Lần phân tích thứ hai (lần cuối cùng), 26 biến quan sát hội tụ và phân biệt thành 6 nhân tố gồm các biến quan sát được trình bày trong bảng bên dưới:

3.2 Phân tích EFA cho biến phụ thuộc
Tương tự với các thao tác trên biến độc lập, tiến hành thực hiện phân tích nhân tố khám phá EFA cho biến phụ thuộc.

Hệ số KMO = 0.712 > 0.5, sig Barlett’s Test = 0.000 < 0.05, như vậy phân tích nhân tố là phù hợp.

Kết quả phân tích cho thấy có 1 nhân tố được trích tại eigenvalue bằng 2.170 > 1. Nhân tố này giải thích được 72.339% biến thiên dữ liệu của 3 biến quan sát tham gia vào EFA.

Như đã đề cập trước đó ở mục 9.7. Nếu chỉ có một nhân tố được trích, ma trận xoay sẽ không hiển thị, chính vì vậy chúng ta sẽ đánh giá kết quả qua bảng ma trận nhân tố chưa xoay. Kết quả cho thấy 3 biến quan sát hội tụ về 1 cột và tất cả các biến quan sát đều có hệ số tải nhân tố lớn hơn 0.5.

Lưu ý rằng, nếu sau bước phân tích nhân tố EFA, cấu trúc thang đo bị thay đổi so với thang đo gốc: hình thành nhân tố mới, nhân tố giảm biến quan sát, nhân tố tăng biến quan sát… Chúng ta nên thực hiện kiểm định độ tin cậy thang đo Cronbach’s Alpha để đánh giá lại các thang đo mới được hình thành sau EFA.
Không phải lúc nào ma trận xoay có được từ kết quả phân tích EFA cũng tách biệt các nhóm một cách hoàn toàn, việc xuất hiện các biến xấu sẽ làm ma trận xoay bị xáo trộn so với các thang đo lý thuyết. Vậy cách khắc phục ma trận xoay lộn xộn như thế nào, bạn hãy xem tại bài viết này.
Nếu bạn gặp khó khăn khi kết quả EFA bị xáo trộn, không đạt tiêu chuẩn kiểm định, số biến bị loại quá nhiều. Bạn có thể tham khảo dịch vụ xử lý số liệu SPSS của Xử Lý Định Lượng để team có thể hỗ trợ bạn xử lý nhanh và hiệu quả nhất.
