Một trong các chỉ số rất quan trọng mà chúng ta sẽ đọc kết quả ở bước phân tích hồi quy là giá trị R bình phương hiệu chỉnh. Vậy R bình phương hiệu chỉnh là gì? Ý nghĩa của chỉ số này ra sao? Chúng ta sẽ lần lượt đi vào từng chủ đề nội dung bên dưới.

1. Giá trị R bình phương là gì?
Một thước đo sự phù hợp của mô hình tuyến tính thường dùng là hệ số xác định R bình phương (R Square). Công thức tính R bình phương xuất phát từ ý tưởng xem toàn bộ biến thiên quan sát được của biến phụ thuộc được chia thành 2 phần: phần biến thiên do Hồi quy (Regression) và phần biến thiên do Phần dư (Residual). Nếu phần biến thiên do Phần dư càng nhỏ, nghĩa là khoảng cách từ các điểm quan sát đến đường ước lượng hồi quy càng nhỏ thì phần biến thiên do Hồi quy sẽ càng cao, khi đó giá trị R bình phương sẽ càng cao.
Hệ số R bình phương được chứng mình là hàm không giảm theo số biến độc lập được đưa vào mô hình, nếu chúng ta đưa thêm càng nhiều biến độc lập vào phương trình, chỉ số R bình phương sẽ càng tăng. Việc tăng giá trị R bình phương bằng cách đưa thêm biến vào mô hình không phải lúc nào cũng là tốt, bởi có thể xảy ra nhiều vấn đề như đa cộng tuyến, biến thừa, nhiều biến phức tạp cho khâu phân tích.
2. Giá trị R bình phương hiệu chỉnh là gì?
Cũng là chỉ số phản ánh mức độ phù hợp của mô hình như R bình phương, ý nghĩa của R bình phương hiệu chỉnh có chút khác biệt bởi R bình phương hiệu chỉnh không nhất thiết tăng lên khi chúng ta đưa thêm các biến độc lập vào mô hình. Chính vì vậy, R bình phương hiệu chỉnh thường được sử dụng hơn vì giá trị này phản ánh sát hơn mức độ phù hợp của mô hình hồi quy.
2 giá trị R bình phương (R Square) và R bình phương hiệu chỉnh (Adjusted R Square) nằm trong bảng Coefficients trong kết quả phân tích hồi quy tuyến tính trên SPSS. R bình phương hiệu chỉnh luôn nhỏ hơn hoặc bằng R bình phương.
3. Ý nghĩa của R bình phương hiệu chỉnh
R bình phương hiệu chỉnh dao động trong khoảng từ 0 đến 1, tuy nhiên việc đạt được mức giá trị bằng 1 là không thể, bởi luôn luôn xuất hiện phần dư trong mô hình.
Về ý nghĩa của R bình phương hiệu chỉnh, như đã đề cập ở trên. Chỉ số này phản ánh mức độ giải thích của các biến độc lập đối với biến phụ thuộc trong mô hình hồi quy.
Trong ví dụ đọc kết quả hồi quy trên SPSS ở trên, giá trị R bình phương hiệu chỉnh là 0.725. Như vậy, các biến độc lập giải thích được 72.5% sự biến thiên của biến phụ thuộc. Phần còn lại 27.5% được giải thích bởi các biến ngoài mô hình và sai số ngẫu nhiên.
4. R bình phương hiệu chỉnh dưới 50% (dưới 0.5)
R bình phương hiệu chỉnh dưới 0.5 có thể cho thấy mô hình hồi quy không giải thích được nhiều về phương sai của biến phụ thuộc. Tuy nhiên, việc này có thực sự là vấn đề hay không còn phụ thuộc vào bối cảnh nghiên cứu và lĩnh vực ứng dụng. Quan điểm cho rằng mức R bình phương hoặc R bình phương hiệu chỉnh dưới 0.5 thì kết quả hồi quy không có ý nghĩa là không chính xác.
Xem thêm: Cách tăng R2 và R2 hiệu chỉnh trong hồi quy SPSS
Khi R bình phương hiệu chỉnh có giá trị quá thấp (gần 0), điều này có thể gợi ý một số vấn đề sau:
- Mô hình chưa phù hợp: Có thể mô hình hồi quy chưa thực sự phù hợp với dữ liệu. Các biến độc lập được sử dụng chưa giải thích được nhiều sự biến thiên của biến phụ thuộc.
- Thiếu biến quan trọng: Có thể mô hình thiếu các biến độc lập quan trọng, ảnh hưởng đến biến phụ thuộc.
- Mối quan hệ phức tạp: Mối quan hệ giữa các biến có thể phức tạp hơn so với giả định của mô hình hồi quy tuyến tính.
- Sai số lớn: Sai số của mô hình có thể lớn, làm giảm độ chính xác của các ước lượng.
Không có tiêu chuẩn quy định R bình phương hay R bình phương hiệu chỉnh ở mức bao nhiêu thì mô hình mới đạt yêu cầu. Hai giá trị này chấp nhận được phụ thuộc vào nhiều yếu tố, bao gồm:
- Lĩnh vực nghiên cứu: Trong một số lĩnh vực, R bình phương trên 0.3 đã được coi là tốt, trong khi ở các lĩnh vực khác, giá trị này trên 0.9 mới được coi là chấp nhận được.
- Mục đích của nghiên cứu: Nếu mục đích của nghiên cứu là dự đoán, R bình phương cao là quan trọng hơn. Nếu mục đích là giải thích mối quan hệ giữa các biến, R bình phương có thể thấp hơn.
- Độ phức tạp của mô hình: Mô hình càng phức tạp (có nhiều biến độc lập), R bình phương càng có xu hướng cao hơn. Tuy nhiên, điều này không có nghĩa là mô hình đó tốt hơn.
Nếu bạn gặp khó khăn khi kết quả hồi quy không có ý nghĩa, giá trị R2 quá thấp, các biến độc lập bị loại nhiều, vi phạm đa cộng tuyến, vi phạm các giả định hồi quy. Bạn có thể tham khảo dịch vụ xử lý số liệu SPSS của Xử Lý Định Lượng để team có thể hỗ trợ bạn xử lý nhanh và hiệu quả nhất.