Tương quan tuyến tính và Hồi quy tuyến tính là hai phân tích khác biệt nhau. Nếu tương quan là phép phân tích cho phép chúng ta biết mối quan hệ giữa hai biến không có sự phân biệt vai trò độc lập và phụ thuộc thì hồi quy dự đoán giá trị của biến phụ thuộc Y dựa trên giá trị đã biết của một hay nhiều biến độc lập (hồi quy đơn biến hoặc đa biến).
Chúng ta đã đề cập đến sự khác nhau của mối liên hệ tương quan và nhân quả ở phần trước. Chúng khác nhau về mặt ý nghĩa thực tế cũng như khi biểu diễn bằng công thức toán học. Tương quan là phép phân tích cho phép chúng ta biết được mối quan hệ giữa hai biến không có sự phân biệt vai trò độc lập hay phụ thuộc. Trong khi đó, phân tích hồi quy dự đoán giá trị của biến phụ thuộc dựa trên giá trị đã biết của một hay nhiều biến độc lập.
Tương quan | Hồi quy | |
---|---|---|
Mục đích | Tìm ra một con số biểu thị mối quan hệ giữa hai biến A và B với nhau. | Tìm một phương trình mà khi biểu diễn nó trên đồ thị, chúng ta có một đường thẳng phù hợp nhất và ước tính được biến phụ thuộc Y dựa vào những thay đổi của biến độc lập X. |
Sự liên hệ | - Phản ánh mức độ liên kết hay độ mạnh trong sự liên kết giữa biến A với biến B. Nếu A thay đổi sẽ kéo theo sự thay đổi của B và ngược lại. - Là mối quan hệ hai chiều, A với B cũng như B với A, hệ số tương quan của A đối với B bằng với hệ số tương quan của B đối với A. | - Phản ánh sự ảnh hưởng của việc thay đổi giá trị của biến độc lập X lên biến phụ thuộc Y. Chúng ta sẽ ước tính Y dựa vào những giá trị của X. - Là mối quan hệ một chiều từ X lên Y. Hệ số hồi quy sẽ khác nhau nếu đổi X thành biến phụ thuộc, đổi Y thành biến độc lập. |
Chiều quan hệ | - Khi 2 biến A và B di chuyển cùng hướng, tức A tăng sẽ làm B tăng và ngược lại B tăng làm A tăng, hai biến này sẽ được coi là có tương quan thuận. Nếu hai biến di chuyển theo hai hướng khác nhau, A tăng làm B giảm, hoặc B tăng làm A giảm, hai biến sẽ có tương quan nghịch. - Lượng thay đổi của X bằng lượng thay đổi của Y. | - Việc tăng X làm Y tăng nghĩa là biến X có sự tác động thuận chiều lên Y. Nếu X tăng làm Y giảm nghĩa là biến X có sự tác động nghịch chiều lên Y. - Lượng thay đổi của X không bằng lượng thay đổi của Y. |
Vai trò biến | Không có sự phân biệt biến độc lập và biến phụ thuộc, vai trò của A và B là như nhau. | Có sự phân biệt biến độc lập X và biến phụ thuộc Y, hồi quy chỉ xem xét sự tác động của biến độc lập lên biến phụ thuộc. |
Số lượng biến | Xem xét mối quan hệ giữa từng cặp biến với nhau. | Xem xét sự tác động của một hoặc nhiều biến độc lập lên một biến phụ thuộc. |
Chính vì sự khác biệt giữa tương quan và hồi quy, hai phân tích này không đóng vai trò thay thế cho nhau hoặc suy diễn cho nhau. Khi phân tích dữ liệu, biến A không có sự tương quan tuyến tính với biến B ở tương quan Pearson nhưng khi phân tích hồi quy, A lại có tác động lên B là điều hoàn toàn bình thường. Ngược lại, A và B có sự tương quan tuyến tính với nhau nhưng kết quả hồi quy A lại không có tác động lên B cũng là điều rất dễ hiểu.
Trong cấu trúc phân tích định lượng của luận văn, báo cáo hiện nay, chúng ta thường thực hiện phân tích tương quan Pearson trước bước phân tích hồi quy. Giả sử xảy ra tình huống một biến độc lập X không có tương quan tuyến tính với biến phụ thuộc Y, thì ở bước phân tích hồi quy sau đó, chúng ta vẫn cần thiết đưa biến X này vào thực hiện phép hồi quy để đánh giá sự tác động nhân quả từ X lên Y.