1. Lý thuyết về biến trung gian (mediator)
Biến trung gian (mediator) được xem là một biến số thứ ba tham gia vào mối quan hệ giữa biến độc lập và biến phụ thuộc. Sự tham gia này diễn ra theo chuỗi nhân quả: biến độc lập tác động đến biến trung gian, và biến trung gian tiếp tục truyền tải tác động đó đến biến phụ thuộc (MacKinnon và cộng sự, 2007; Nitzl và cộng sự, 2016).
Phân tích mô hình trung gian chính là xem xét mức độ và cơ chế mà biến trung gian can thiệp vào mối liên hệ giữa các biến. Sự can thiệp này tạo ra một dạng tác động đặc biệt, gọi là tác động gián tiếp (indirect effect).
Một mô hình trung gian cơ bản có thể minh họa như sơ đồ dưới đây, trong đó: X: biến độc lập, M: biến trung gian, Y: biến phụ thuộc.

a. Đánh giá mô hình biến trung gian theo phương pháp truyền thống
Cách tiếp cận kinh điển và được sử dụng rộng rãi đầu tiên trong nghiên cứu về biến trung gian là phương pháp của Baron & Kenny (1986). Theo các tác giả này, một biến được xác định là trung gian khi đồng thời thỏa mãn ba điều kiện sau:
- 
Điều kiện 1: Biến độc lập (X) có ảnh hưởng đến biến trung gian (M).
 - 
Điều kiện 2: Biến trung gian (M) có ảnh hưởng đến biến phụ thuộc (Y).
 - 
Điều kiện 3: Biến độc lập (X) có ảnh hưởng đến biến phụ thuộc (Y), nhưng khi thêm biến M vào mô hình, tác động của X lên Y sẽ suy giảm (c’ < c).
 
Để kiểm định ba điều kiện trên, Baron & Kenny đề xuất tiến hành ba bước hồi quy:

Bước 1: Hồi quy đơn X → M
Yêu cầu: hệ số a ≠ 0 hoặc sig (t-test) < 0.05.
Đáp ứng điều kiện 1.
Bước 2: Hồi quy bội X, M → Y
Yêu cầu: hệ số b ≠ 0 hoặc sig (t-test) < 0.05.
Kết quả hồi quy đồng thời cung cấp hệ số c’ (tác động trực tiếp X → Y khi có M).
Đáp ứng điều kiện 2.
Bước 3: Hồi quy đơn X → Y
Yêu cầu 1: hệ số c ≠ 0 hoặc sig (t-test) < 0.05.
Yêu cầu 2: hệ số c’ < c.
Đáp ứng điều kiện 3.
Nếu bất kỳ điều kiện nào không thỏa mãn, kết luận rằng M không đóng vai trò trung gian trong mối quan hệ X → Y.
b. Đánh giá mô hình biến trung gian theo phương pháp mới

Trong mô hình trung gian, ba dạng tác động được quan tâm gồm:
- 
c’ (Direct effect): tác động trực tiếp từ X đến Y.
 - 
a × b (Indirect effect): tác động gián tiếp thông qua biến trung gian M.
 - 
c = a × b + c’ (Total effect): tác động tổng hợp từ X đến Y.
 
Các nghiên cứu sau này (Collins, Graham & Flaherty, 1998; Kenny và cộng sự, 1998; MacKinnon, 2000; Shrout & Bolger, 2002; Preacher & Hayes, 2008…) đã chỉ ra rằng điều kiện total effect có ý nghĩa thống kê (điều kiện 3 trong cách tiếp cận của Baron & Kenny) không phải lúc nào cũng cần thiết để khẳng định sự tồn tại của quan hệ trung gian. Vì vậy, cần có phương pháp đánh giá chính xác và linh hoạt hơn.
Theo Preacher & Hayes (2008), bootstrapping là một kỹ thuật hiệu quả: bằng cách lặp lại việc lấy mẫu từ dữ liệu gốc và ước lượng tác động gián tiếp (a × b) trong mỗi lần lấy mẫu, ta có thể xây dựng phân phối của tác động gián tiếp và kiểm tra ý nghĩa thống kê của nó.
Nhiều nghiên cứu đã chứng minh bootstrapping vượt trội so với các kỹ thuật truyền thống khi kiểm định biến trung gian (Williams & MacKinnon, 2008; Preacher & Hayes, 2008; Zhao, Lynch & Chen, 2010) nhờ:
- 
Không yêu cầu giả định phân phối chuẩn.
 - 
Thích hợp cho cả mẫu nhỏ.
 
Cách tiếp cận này đặc biệt phù hợp với PLS-SEM, và các phần mềm như SMARTPLS cũng sử dụng bootstrapping để đánh giá quan hệ trung gian.
Tóm lại: trong khi phương pháp truyền thống yêu cầu có tác động trực tiếp X → Y thì phương pháp mới cho phép đánh giá quan hệ trung gian ngay cả khi đường tác động trực tiếp không tồn tại hoặc không có ý nghĩa.

2. Phân tích biến trung gian mediator trên SMARTPLS 3
Để giúp việc giải thích trở nên trực quan hơn, chúng ta cùng xem xét một mô hình nghiên cứu minh họa với các biến tiềm ẩn và biến quan sát cụ thể như sau:
- 
CLDV – Chất lượng dịch vụ: đo bằng 4 chỉ báo CLDV1, CLDV2, CLDV3, CLDV4.
 - 
GTCN – Giá trị cảm nhận: đo bằng 2 chỉ báo GTCN1, GTCN2.
 - 
SHL – Sự hài lòng khách hàng: đo bằng 1 chỉ báo SHL1.
 - 
YDQL – Ý định quay lại: đo bằng 3 chỉ báo YDQL1, YDQL2, YDQL3.
 

Trong mô hình, tất cả các mối tác động trực tiếp đều giả định là dương (thuận chiều). Mục tiêu là đánh giá tác động gián tiếp từ CLDV lên YDQL thông qua hai biến trung gian là GTCN và SHL.
2.1. Total Indirect Effects và Specific Indirect Effects
Trong mô hình trên, mối quan hệ từ CLDV → YDQL đi qua hai biến trung gian:
- 
CLDV → GTCN → YDQL
 - 
CLDV → SHL → YDQL
 
Do đó, có hai cách xem xét tác động gián tiếp:
- 
Tác động gián tiếp tổng hợp (Total Indirect Effects): là toàn bộ tác động gián tiếp của CLDV lên YDQL khi xét chung qua tất cả các biến trung gian.
 - 
Tác động gián tiếp riêng biệt (Specific Indirect Effects): là tác động gián tiếp của CLDV lên YDQL khi xét riêng lẻ qua từng biến trung gian.
 
Tác động gián tiếp tổng hợp được tính bằng tổng của các tác động gián tiếp riêng biệt.
2.2 Đánh giá mối quan hệ gián tiếp trên SMARTPLS
Thực hiện phân tích bootstrap trên SMARTPLS theo hướng dẫn tại bài viết này. Trong output kết quả, dễ dàng nhìn thấy 2 lựa chọn Total Indirect Effects và Specific Indirect Effects.

a. Specific Indirect Effects
Chúng ta sẽ tích vào Specific Indirect Effects để đánh giá từng mối quan hệ gián tiếp riêng biệt trước.

Tại phần này sẽ hiển thị kết quả của các mối quan hệ gián tiếp riêng biệt, cụ thể trong ví dụ là:
- 
CLDV → GTCN → YDQL
 - 
CLDV → SHL → YDQL
 
Các thông số được trình bày gồm:
- 
Original Sample: Hệ số hồi quy chuẩn hóa của mối tác động trên mẫu gốc. Dấu của hệ số phụ thuộc vào tích của a (X → M) và b (M → Y). Nếu a×b dương thì hệ số dương, ngược lại nếu a×b âm thì hệ số âm.
 - 
Sample Mean: Trung bình các hệ số hồi quy chuẩn hóa từ toàn bộ mẫu bootstrap. Ví dụ với cỡ mẫu gốc 200, chạy bootstrap 1000 lần sẽ sinh ra 1000 tập dữ liệu (mỗi tập 200 quan sát). Mỗi tập cho một hệ số Original Sample, và trung bình của 1000 hệ số đó chính là Sample Mean.
 - 
Standard Deviation: Độ lệch chuẩn của các hệ số hồi quy thu được từ bootstrap.
 - 
T Statistics: Giá trị kiểm định T, dùng để xét ý nghĩa thống kê của hệ số.
 - 
P Values: Mức ý nghĩa của kiểm định. Nếu P < 0.05 thì mối tác động gián tiếp có ý nghĩa thống kê; ngược lại, P > 0.05 nghĩa là mối tác động không có ý nghĩa (ở mức tin cậy 95%).
 
Trong ví dụ này, cả hai tác động gián tiếp riêng biệt đều có P Value < 0.05, chứng tỏ GTCN và SHL đều đóng vai trò trung gian trong mối quan hệ từ CLDV đến YDQL.
So sánh hệ số, ta thấy CLDV → GTCN → YDQL = 0.126 lớn hơn CLDV → SHL → YDQL = 0.107. Như vậy, biến GTCN có vai trò trung gian mạnh hơn so với SHL.
b. Total Indirect Effects
Tại kết quả output, nhấp vào Total Indirect Effects. Giao diện kết quả như sau:

Như đã nêu ở mục 2.1, tác động gián tiếp tổng hợp (Total Indirect Effect) được tính bằng tổng các tác động gián tiếp riêng biệt (Specific Indirect Effects). Trong ví dụ này, tác động gián tiếp tổng hợp từ CLDV → YDQL có P Value = 0.000 < 0.05, cho thấy tồn tại quan hệ gián tiếp có ý nghĩa thống kê.
Cần lưu ý rằng trong phân tích thống kê, mỗi loại tác động (trực tiếp, gián tiếp, riêng biệt, tổng hợp, điều tiết) đều có kiểm định riêng. Không được suy diễn từ kết quả của một loại sang loại khác. Ví dụ, việc các Specific có ý nghĩa không đồng nghĩa với Total cũng có ý nghĩa, và ngược lại.
Ở đây, hệ số hồi quy chuẩn hóa Original Sample = 0.233, đúng bằng tổng của hai Specific là 0.126 + 0.107. Trong một số trường hợp, giá trị cộng lại có thể chênh lệch đôi chút ở phần thập phân (thứ 2 hoặc thứ 3), do cơ chế làm tròn số của phần mềm – điều này là hoàn toàn bình thường.
Nếu bạn đang gặp khó khăn trong xử lý biến trung gian và cần hỗ trợ từ dịch vụ SMARTPLS của Xử Lý Định Lượng, bạn có thể truy cập vào đường dẫn này: https://xulydinhluong.com/dich-vu-xu-ly-smartpls/
