Phân tích nhân tố khám phá EFA trên SPSS

NGÀY ĐĂNG: 08/12/2019 |DANH MỤC: EFA

Phân tích nhân tố khám phá (EFA) là một công cụ không thể thiếu trong quá trình phân tích dữ liệu định lượng. Nhờ EFA, chúng ta có thể tối ưu hóa cấu trúc các thang đo, đảm bảo tính hội tụ và phân biệt của các biến, đồng thời loại bỏ những biến nhiễu để nâng cao chất lượng kết quả nghiên cứu.

Phân tích nhân tố EFA SPSS

1. Khái niệm về phân tích nhân tố khám phá EFA?

Phân tích nhân tố khám phá (Exploratory Factor Analysis – EFA) là phương pháp thống kê được sử dụng để rút gọn một tập hợp gồm k biến quan sát thành một tập nhỏ hơn gồm F nhân tố (F < k) mang ý nghĩa hơn. Trong nghiên cứu, thường có nhiều biến quan sát, và không ít trong số đó có mối tương quan với nhau. Thay vì phân tích riêng lẻ 20 đặc điểm nhỏ của một đối tượng, ta có thể tập trung vào 4 đặc điểm chính, trong đó mỗi đặc điểm chính bao gồm 5 đặc điểm nhỏ có mối liên hệ chặt chẽ. Cách tiếp cận này không chỉ giúp tối ưu hóa thời gian mà còn tiết kiệm chi phí cho quá trình nghiên cứu.

– Kiểm định độ tin cậy thang đo Cronbach’s Alpha tập trung đánh giá mức độ liên hệ giữa các biến trong cùng một nhóm hoặc cùng một nhân tố, mà không xem xét mối quan hệ giữa các biến quan sát thuộc các nhân tố khác. Ngược lại, phân tích nhân tố khám phá (EFA) xem xét mối quan hệ giữa các biến trên tất cả các nhóm (nhân tố) khác nhau, nhằm phát hiện những biến quan sát có tải trọng lên nhiều nhân tố hoặc bị phân bổ sai nhân tố so với dự kiến ban đầu.

VIDEO

2. Các tiêu chí trong phân tích EFA

– Hệ số KMO (Kaiser-Meyer-Olkin) là một chỉ số dùng để xem xét sự thích hợp của phân tích nhân tố. Trị số của KMO phải đạt giá trị 0.5 trở lên (0.5 ≤ KMO ≤ 1) là điều kiện đủ để phân tích nhân tố là phù hợp. Nếu trị số này nhỏ hơn 0.5, thì phân tích nhân tố có khả năng không thích hợp với tập dữ liệu nghiên cứu. Hutcheson & Sofroniou (1999) đề xuất một số ngưỡng giá trị KMO như sau:

  • KMO ≥5: mức chấp nhận tối thiểu
  • 5 < KMO ≤ 0.7: bình thường
  • 7 < KMO ≤ 0.8: tốt
  • 8 < KMO ≤ 0.9: rất tốt
  • KMO >9: xuất sắc

– Kiểm định Bartlett (Bartlett’s test of sphericity) là một kiểm định xem xét có mối tương quan xảy ra giữa các biến tham gia vào EFA. Giả định rất quan trọng trong EFA là các biến quan sát đưa vào phân tích cần có sự tương quan với nhau. Thay vì đánh giá dựa vào ma trận tương quan khá khó khăn, chúng ta sẽ dùng tới kiểm định Bartlett. Kiểm định này sẽ xem xét có mối tương quan xảy ra giữa các biến tham gia vào EFA hay không với giả thuyết Ho: Không có mối tương quan giữa các biến quan sát. Nếu sig kiểm định Bartlett nhỏ hơn 0.05, chúng ta bác bỏ Ho và kết luận các biến tham gia vào EFA có sự tương quan với nhau, ngược lại, nếu sig lớn hơn 0.05, chúng ta chấp nhận Ho và kết luận các biến quan sát không có sự tương quan với nhau, phân tích EFA là không phù hợp

– Trị số Eigenvalue là một tiêu chí sử dụng phổ biến để xác định số lượng nhân tố  trong phân tích EFA. Với tiêu chí này, chỉ có những nhân tố nào có Eigenvalue > 1 mới được giữ lại trong mô hình phân tích.

– Tổng phương sai trích (Total Variance Explained) ≥ 50% cho thấy mô hình EFA là phù hợp. Coi biến thiên là 100% thì trị số này thể hiện các nhân tố được trích cô đọng được bao nhiêu % và bị thất thoát bao nhiêu % của các biến quan sát.

– Hệ số tải nhân tố (Factor Loading) hay còn gọi là trọng số nhân tố, giá trị này biểu thị mối quan hệ tương quan giữa biến quan sát với nhân tố. Hệ số tải nhân tố càng cao, nghĩa là tương quan giữa biến quan sát đó với nhân tố càng lớn và ngược lại. Theo Hair & ctg (2009,116), Multivariate Data Analysis, 7th Edition thì:

  • Factor Loading ở mức ± 0.3: Điều kiện tối thiểu để biến quan sát được giữ lại.
  • Factor Loading ở mức ± 0.5: Biến quan sát có ý nghĩa thống kê tốt.
  • Factor Loading ở mức ± 0.7: Biến quan sát có ý nghĩa thống kê rất tốt.

Tuy nhiên, giá trị tiêu chuẩn của hệ số tải Factor Loading cần phải phụ thuộc vào kích thước mẫu. Trên thực tế, việc nhớ từng mức hệ số tải với từng khoảng kích thước mẫu là khá khó khăn, do vậy người ta thường lấy hệ số tải 0.5 làm mức tiêu chuẩn với cỡ mẫu từ 120 đến dưới 350; lấy tiêu chuẩn hệ số tải là 0.3 với cỡ mẫu từ 350 trở lên.

3. Cách phân tích nhân tố khám phá EFA trên SPSS

Với đề tài đã xác định được biến độc lập và biến phụ thuộc, chúng ta cần phân tích EFA riêng giữa độc lập và phụ thuộc. Lý do tại sao, bạn vui lòng xem tại bài viết Chạy EFA riêng hay chung giữa biến độc lập với biến phụ thuộc?.

Thực hiện phân tích nhân tố EFA với một tập data mẫu có sẵn. Lần lượt chạy phân tích nhân tố khám phá cho biến độc lập và biến phụ thuộc. Ví dụ bên dưới tác giả thực hành mẫu với các biến độc lập, biến phụ thuộc bạn đọc thực hiện tương tự.

Lưu ý, các biến quan sát bị loại ở bước Cronbach Alpha trước đó sẽ không được đưa vào để kiểm định EFA.

Để thực hiện phân tích nhân tố khám phá EFA trong SPSS, chúng ta vào Analyze > Dimension Reduction > Factor…

phan tich nhan to kham pha EFA

Đưa các biến quan sát cần thực hiện phân tích EFA vào mục Variables. Chú ý 4 tùy chọn được đánh số ở ảnh bên dưới.

phan tich nhan to kham pha EFA

 Descriptives: Tích vào mục KMO and Barlett’s test of sphericity để xuất bảng giá trị KMO và giá trị sig của kiểm định Barlett. Nhấp Continue để quay lại cửa sổ ban đầu.

phan tich nhan to kham pha EFA

– Extraction: Ở đây, chúng ta sẽ sử dụng phép trích PCA (Principal Components Analysis). Với SPSS 20 và các phiên bản 21, 22, 23, 24, PCA sẽ được viết gọn lại là Principal Components như hình ảnh bên dưới, đây cũng là tùy chọn mặc định của SPSS.

phan tich nhan to kham pha EFA

Khi các bạn nhấp chuột vào nút mũi tên hướng xuống sẽ có nhiều tùy chọn phép trích khác nhau. Số lượng nhân tố được trích ra ở ma trận xoay phụ thuộc khá nhiều vào việc lựa chọn phép trích, tuy nhiên, tài liệu này sẽ chỉ tập trung vào phần PCA.

– Rotation: Ở đây có các phép quay, thường chúng ta hay sử dụng Varimax và Promax. Riêng với dạng đề tài đã xác định được biến độc lập và biến phụ thuộc, chúng ta sử dụng phép quay Varimax. Nhấp Continue để quay lại cửa sổ ban đầu.

phan tich nhan to kham pha EFA

– Options: Tích vào 2 mục như hình bên dưới. Sorted by size giúp sắp xếp ma trận xoay thành từng cột dạng bậc thang để dễ đọc dữ liệu hơn. Suppress small coefficients giúp loại bỏ các hệ số tải không đạt tiêu chuẩn khỏi ma trận xoay, giúp ma trận gọn gàng, trực quan hơn. Tại mục này sẽ có hàng Absolute value below, bạn cần nhập vào giá trị hệ số tải nhân tố Factor Loading tiêu chuẩn. Kích thước mẫu file dữ liệu là 220 nên tác giả sẽ nhập vào 0.5. Nhấp Continue để quay lại cửa sổ ban đầu.

phan tich nhan to kham pha EFA

Tại cửa sổ tiếp theo, bạn chọn OK để xuất kết quả ra Output.

phan tich nhan to kham pha EFA

Có khá nhiều bảng ở Ouput, tuy nhiên, chúng ta chỉ cần quan tâm 3 bảng:

  1. KMO and Barlett’s Test: xem hệ số KMO và sig kiểm định Bartlett.
  2. Total Variance Explained: xem tổng phương sai trích Total Variance Explained và giá trị Eigenvalue.
  3. Rotated Component Matrix: xem ma trận xoay và kiểm tra hệ số tải Factor Loading của các biến quan sát (Lưu ý tránh nhầm lẫn với bảng Component Matrix)

Không phải lúc nào ma trận xoay có được từ kết quả phân tích EFA cũng tách biệt các nhóm một cách hoàn toàn, việc xuất hiện các biến xấu sẽ làm ma trận xoay bị xáo trộn so với các thang đo lý thuyết. Vậy cách khắc phục ma trận xoay lộn xộn như thế nào, bạn hãy xem tại bài viết này.

Nếu bạn gặp khó khăn khi kết quả EFA bị xáo trộn, không đạt tiêu chuẩn kiểm định, số biến bị loại quá nhiều. Bạn có thể tham khảo dịch vụ xử lý số liệu SPSS của Xử Lý Định Lượng để team có thể hỗ trợ bạn xử lý nhanh và hiệu quả nhất.