Một trong những chỉ số quan trọng cần lưu ý khi phân tích hồi quy là giá trị R bình phương hiệu chỉnh (R Square Adjusted). Vậy R bình phương hiệu chỉnh là gì và nó có ý nghĩa như thế nào trong mô hình hồi quy? Chúng ta sẽ cùng tìm hiểu chi tiết qua các nội dung tiếp theo.
1. Giá trị R bình phương là gì?
Một trong những thước đo phổ biến và quan trọng để đánh giá mức độ phù hợp của một mô hình hồi quy tuyến tính là hệ số xác định, còn được gọi là R bình phương (R Square). Chỉ số này phản ánh tỷ lệ phần trăm của tổng phương sai (tức là mức độ biến thiên) của biến phụ thuộc có thể được giải thích bởi các biến độc lập trong mô hình.
Khi mô hình hồi quy giải thích được phần lớn sự biến thiên của biến phụ thuộc – tức là phần dư nhỏ – thì điều đó có nghĩa là các điểm dữ liệu quan sát gần với đường hồi quy ước lượng. Khi đó, phần biến thiên do hồi quy sẽ chiếm tỷ lệ lớn, dẫn đến giá trị R bình phương cao. Nói cách khác, mô hình càng giải thích tốt mối quan hệ giữa các biến, thì chỉ số R bình phương càng gần giá trị 1.
Giá trị R bình phương, hay còn gọi là hệ số xác định cho biết bao nhiêu phần trăm biến thiên của biến phụ thuộc (Y) có thể được giải thích bởi các biến độc lập (X) trong mô hình.
Cách hiểu đơn giản:
- R² có giá trị từ 0 đến 1.
- R² = 0: mô hình hoàn toàn không giải thích được sự biến thiên của Y (các biến X không có ý nghĩa).
- R² = 1: mô hình giải thích hoàn toàn sự biến thiên của Y (các biến X giải thích 100% sự thay đổi của Y).
Ví dụ: nếu R² = 0.75, nghĩa là 75% sự biến động của biến phụ thuộc được giải thích bởi mô hình hồi quy, còn lại 25% là do các yếu tố khác hoặc sai số ngẫu nhiên.
2. Giá trị R bình phương hiệu chỉnh là gì?
Giá trị R bình phương luôn có xu hướng tăng hoặc ít nhất không giảm khi chúng ta thêm nhiều biến độc lập vào mô hình, bất kể những biến này có thực sự có ý nghĩa thống kê hay không. Do đó, chỉ số R bình phương không phải lúc nào cũng là một tiêu chí đáng tin cậy để đánh giá chất lượng mô hình. Việc thêm quá nhiều biến có thể dẫn đến các vấn đề như đa cộng tuyến, sự dư thừa biến không cần thiết, và làm cho mô hình trở nên phức tạp, khó diễn giải. Chính vì vậy, trong thực tiễn phân tích, người ta thường sử dụng một chỉ số khác gọi là R bình phương hiệu chỉnh (Adjusted R Square) – một phiên bản điều chỉnh của R bình phương nhằm khắc phục hạn chế này, giúp đánh giá tốt hơn mức độ phù hợp thực sự của mô hình khi có sự thay đổi về số lượng biến độc lập.
Hai giá trị R bình phương (R Square) và R bình phương hiệu chỉnh (Adjusted R Square) nằm trong bảng Coefficients trong kết quả phân tích hồi quy tuyến tính trên SPSS. R bình phương hiệu chỉnh luôn nhỏ hơn hoặc bằng R bình phương.
Trong ví dụ đọc kết quả hồi quy trên SPSS ở trên, giá trị R bình phương là 0.733 và R bình phương hiệu chỉnh là 0.725. Như vậy, nếu đánh giá theo R bình phương hiệu chỉnh, các biến độc lập giải thích được 72.5% sự biến thiên của biến phụ thuộc. Phần còn lại 27.5% được giải thích bởi các biến ngoài mô hình và sai số ngẫu nhiên.
3. R bình phương hiệu chỉnh dưới 50% (dưới 0.5)
Giá trị R bình phương hiệu chỉnh (Adjusted R²) dưới 0.5 thường được hiểu là mô hình hồi quy chưa giải thích được nhiều về phương sai (biến thiên) của biến phụ thuộc. Điều này có nghĩa là phần lớn sự biến động của biến phụ thuộc vẫn chưa được lý giải thông qua các biến độc lập được đưa vào mô hình. Tuy nhiên, cần lưu ý rằng một giá trị Adjusted R² thấp không nhất thiết đồng nghĩa với việc mô hình là “vô nghĩa” hay không có giá trị phân tích.
Xem thêm: Cách tăng R2 và R2 hiệu chỉnh trong hồi quy SPSS
Việc đánh giá một mô hình có “tốt” hay không dựa trên giá trị Adjusted R² cần phải được đặt trong bối cảnh cụ thể của nghiên cứu và lĩnh vực ứng dụng. Trong các lĩnh vực khoa học xã hội, tâm lý học, hành vi người tiêu dùng hay kinh tế học vi mô, các hiện tượng thường chịu ảnh hưởng của nhiều yếu tố không thể quan sát hoặc định lượng hết được. Do đó, các mô hình hồi quy trong các lĩnh vực này thường có R bình phương hiệu chỉnh ở mức khiêm tốn (thậm chí dưới 0.5) nhưng vẫn được xem là hợp lý và có giá trị về mặt khoa học.
Ngược lại, trong các lĩnh vực kỹ thuật, vật lý hay khoa học tự nhiên – nơi các mối quan hệ giữa các biến thường tuyến tính và ít nhiễu – người ta kỳ vọng R bình phương hiệu chỉnh sẽ ở mức cao hơn. Chính vì vậy, việc áp đặt một ngưỡng cứng nhắc, chẳng hạn như R bình phương hoặc R bình phương hiệu chỉnh phải lớn hơn 0.5 mới được coi là mô hình “có ý nghĩa”, là một quan điểm không chính xác và có thể gây hiểu lầm trong thực hành phân tích dữ liệu.
Ngoài ra, một mô hình có thể có giá trị Adjusted R Square thấp nhưng vẫn cung cấp thông tin quan trọng về mối quan hệ giữa các biến, ý nghĩa thống kê của từng hệ số hồi quy, hoặc kiểm chứng một giả thuyết nghiên cứu cụ thể. Do đó, giá trị của một mô hình hồi quy không chỉ phụ thuộc vào mức độ giải thích của nó (tức là R²), mà còn vào việc mô hình đó phục vụ tốt đến đâu cho mục tiêu nghiên cứu.
Nếu bạn gặp khó khăn khi kết quả hồi quy không có ý nghĩa, giá trị R2 quá thấp, các biến độc lập bị loại nhiều, vi phạm đa cộng tuyến, vi phạm các giả định hồi quy. Bạn có thể tham khảo dịch vụ xử lý số liệu SPSS của Xử Lý Định Lượng để team có thể hỗ trợ bạn xử lý nhanh và hiệu quả nhất.