Mã hóa, nhập liệu câu hỏi khảo sát vào SPSS – Phần 1

NGÀY ĐĂNG: 22/12/2019 |DANH MỤC: Research

Từ kết quả khảo sát thô thu được trên các phiếu khảo sát giấy hoặc khảo sát online. Chúng ta cần xử lý chúng để có được các con số, văn bản có thể thực hiện phân tích được. Việc làm này gọi là mã hóa và nhập liệu. Bài viết này sẽ chia làm 3 phần hướng dẫn cho từng dạng câu hỏi khảo sát khác nhau. Đây là phần đầu tiên của chuỗi bài viết, 2 dạng câu hỏi được trình bày trong bài này là: Câu hỏi định tính một trả lời và Câu hỏi định tính nhiều trả lời.

1. Câu hỏi định tính một trả lời

Ví dụ với một tập data gồm các biến bên dưới, chúng ta có câu hỏi phần thông tin cá nhân như phòng ban làm việc, trình độ học vấn, độ tuổi… là điển hình cho dạng câu hỏi định tính 1 trả lời.

Mã hóa nhập liệu câu hỏi spss

Ở bước tạo khuôn dữ liệu Variable View, đối với câu hỏi định tính một trả lời, các bạn chỉ tạo 1 biến cho 1 câu hỏi. Bảng khảo sát có 6 câu hỏi định tính một trả lời nên tác giả tạo tương ứng 6 biến như hình trên. Các bạn nhập các mục Type, Values, Missing, Measure… bình thường cho các biến.

ma hoa cau hoi mot tra loi spss

Ví dụ, người thứ nhất và người thứ hai trả lời các đáp án như hình ảnh bên dưới:

Người 1: Đáp án 6 câu lần lượt là 2 1 3 3 2 2

Người 2: Đáp án 6 câu lần lượt là 2 2 3 4 2 1

Chuyển sang giao diện nhập liệu Data View, tiến hành nhập liệu với mỗi hàng tương ứng với 1 người trả lời (1 phiếu khảo sát).

Mã hóa nhập liệu câu hỏi spss

Tóm tắt:

Đối với dạng câu hỏi định tính một trả lời các bạn cần chú ý những điểm dưới đây:

  • Số biến: Một câu hỏi tương ứng với 1 biến.
  • Giá trị (Values): Mỗi lựa chọn trong đáp áp tương ứng với một giá trị.
  • Thang đo (Measure): Thường là Nominal.

2. Câu hỏi định tính nhiều trả lời

Đối với câu hỏi nhiều trả lời, các bạn có 2 cách mã hóa. Trong tệp dữ liệu mẫu không có dạng câu hỏi định tính nhiều trả lời nên tác giả sẽ sử dụng một ví dụ ở ngoài như sau:

Ví dụ: Anh chị đã và đang dùng điện thoại thương hiệu gì?

  1. iPhone
  2. Samsung
  3. Sony
  4. Oppo
  5. Huawei
  6. Nokia
  7. Khác

Cách mã hóa 1:

Ở bước tạo khuôn dữ liệu Variable View, câu hỏi này có 7 đáp án, chúng ta tạo 7 câu hỏi nhỏ từ C1.1 đến C1.7.

Mã hóa nhập liệu câu hỏi spss

Các mục Type, Missing, Measure (nên chọn Nominal)… các bạn vẫn nhập bình thường, mục Values các bạn nhập 7 giá trị tương ứng với 7 đáp án.

Mã hóa nhập liệu câu hỏi spss

Chúng ta tạo 7 câu nhỏ trong câu hỏi của ví dụ 1 để phòng cho trường hợp có những người họ đã/đang sử dụng cả 7 thương hiệu máy kể trên. Khi đó câu C1.1 họ sẽ chọn máy số 1, câu C1.2 họ chọn máy số 2,… câu C1.7 họ chọn máy số 7. Giả sử chúng ta chỉ tạo 6 câu C1.1 đến C1.6 thì khi đó, đến máy số 7 họ không có mục nào để điền vào.

Có 4 người tương ứng chọn như sau:

– Người 1 chọn: 1, 2, 5 (iPhone, Samsung, Huawei)

– Người 2 chọn: 1, 3, 4, 5, 6

– Người 3 chọn: 1, 2, 3, 4, 5, 6, 7

– Người 4 chọn: 2, 3 ,7

Chuyển sang giao diện nhập liệu Data View, tiến hành nhập liệu như hình:

Mã hóa nhập liệu câu hỏi spss

Người đầu tiên chỉ chọn 3 dòng máy, chúng ta nhập vào 3 câu đầu từ C1.1 đến C1.3, phần còn lại để trống, không nhập liệu. Cho hiển thị chế độ Value/Label thì giao diện sẽ thế này:

Mã hóa nhập liệu câu hỏi spss

Nếu bạn thấy kiểu mã hóa và nhập liệu như ví dụ 1 khó hiểu, chúng ta sẽ đi đến kiểu mã hóa số 2.

Cách mã hóa 2:

Ở bước tạo khuôn dữ liệu Variable View, chúng ta cũng cần tạo 7 câu hỏi nhỏ từ C1.1 đến C1.7 bởi câu hỏi ví dụ có 7 đáp án trả lời. Nếu các đáp án của bạn ngắn, bạn có thể lồng tên đáp án vào ngay tên biến như hình. Lý do tại sao nên chèn đáp án vào tên biến làm kéo dài tên biến mất thẩm mỹ như vậy, tác giả sẽ giải thích ở phần dưới.

Mã hóa nhập liệu câu hỏi spss

Các mục Type, Missing, Measure… các bạn vẫn nhập bình thường, mục Values các bạn nhập 2 giá trị là 0 (không sử dụng) và 1 (có sử dụng).

Mã hóa nhập liệu câu hỏi spss

Có 4 người tương ứng chọn như sau:

– Người 1 chọn: 1, 2, 5 (iPhone, Samsung, Huawei)

– Người 2 chọn: 1, 3, 4, 5, 6

– Người 3 chọn: 1, 2, 3, 4, 5, 6, 7

– Người 4 chọn: 2, 3 ,7

Chuyển sang giao diện nhập liệu Data View, tiến hành nhập liệu như hình:

Mã hóa nhập liệu câu hỏi spss

Người số 1 chọn 3 dòng máy là iPhone, Samsung, Huawei, tương ứng chúng ta nhập giá trị 1 (có sử dụng) cho 3 cột này, các cột còn lại nhập 0 (không sử dụng). Như ban đầu tác giả đề cập, nếu đáp án trả lời ngắn, các bạn nên chèn đáp án vào tên biến. Điều này giúp cho giao diện nhập liệu trực quan hơn, các bạn nhìn vào tiêu đề cột có thể thấy được tên đáp án, nhờ vậy khi nhập liệu sẽ nhanh và ít sai sót hơn rất nhiều. Cho hiển thị chế độ Value/Label thì giao diện sẽ thế này:

Đây là 2 cách mã hóa và nhập liệu cho câu hỏi định tính nhiều trả lời. Các bạn thấy cách nào dễ thực hiện và tiện lợi cho quá trình xử lý, các bạn nên sử dụng cách đó.

Tóm tắt:

Đối với dạng câu hỏi định tính nhiều trả lời các bạn cần chú ý những điểm dưới đây:

  • Số biến: Có bao nhiêu lựa chọn trong đáp án trả lời sẽ có bấy nhiêu biến.
  • Giá trị (Values): Tùy theo cách mã hóa giá trị value sẽ là lựa chọn Có/Không hoặc lựa chọn là tên các đáp án.
  • Thang đo (Measure): Thường là Nominal hoặc Ordinal tùy dạng câu hỏi.

3. Câu hỏi định tính mở

Câu hỏi mở là dạng câu hỏi không có các đáp án lựa chọn có sẵn mà người được khảo sát sẽ tự điền đáp án theo ý kiến của bản thân. Để dễ hiểu hơn, mời các bạn xem qua ví dụ dưới đây:

Ví dụ: Anh/Chị có đóng góp gì để công ty cải thiện sự hài lòng của nhân viên trong công việc:

…………………………………………………………………………………………………………………………………………….

Thường trong bảng khảo sát, câu hỏi mở sẽ được trình bày với hình thức giống như ví dụ. Kết thúc câu hỏi sẽ là một vài dòng trống để người được khảo sát ghi vào ý kiến của mình.

Người 1: Công ty cần cải thiện hệ thống máy lạnh do máy hay hỏng; mở thêm nhiều chương trình đào tạo để nâng cao trình độ nhân viên.

Người 2: Công ty cần đổi ghế cứng sang ghế dựa xoay để nhân viên làm việc thoải mái hơn; hỗ trợ cho nhân viên đi học các khóa học chuyên môn; đẩy mạnh hoạt động ngoại khóa team building để tăng tính gắn kết giữa các nhân viên; thưởng cuối năm của công ty rất thấp, có người không có thưởng.

Người 3: Cấp quản lý đang có vấn đề, cách quản lý và giám sát nhân viên quá khắt khe chi li tới mức không cần thiết, làm cho nhân viên bị tâm lý, không có được sự thoải mái khi làm việc; chính sách phúc lợi công ty chưa tốt so với mặt bằng các công ty hiện tại.

Đây là dạng câu hỏi yêu cầu quá trình mã hóa phức tạp nhất, mất thời gian nhiều nhất. Các bạn cần liệt kê ngắn gọn câu trả lời của người được hỏi thành từng tiêu chí riêng biệt, sau đó đặt tên chung cho những tiêu chí thuộc cùng một nhóm. Để dễ hiểu hơn, chúng ta sẽ đi vào thực hành với ví dụ ở trên và câu trả lời của 3 người.

Người 1: Liệt kê tiêu chí chúng ta sẽ có ý của người số 1 gồm: cải thiện máy lạnh; đào tạo nhân viên.

Người 2: Tương tự, ý của người số 2 gồm: cải thiện ghế làm việc; hỗ trợ nhân viên học tập; tăng cường teambuilding; thưởng cuối năm thấp.

Người 3: Ý của người số 3 gồm: xem xét lại cách giám sát của quản lý; cải thiện chính sách phúc lợi.

Sau khi đã liệt kê ra thành từng tiêu chỉ nhỏ, các bạn sẽ tìm điểm chung của tất cả các tiêu chí của 3 người và gom thành nhóm.

Mã hóa nhập liệu câu hỏi spss

Như vậy sẽ có 5 nhóm tiêu chí chung bao gồm:

  1. Đào tạo
  2. Quan hệ với đồng nghiệp
  3. Quan hệ với lãnh đạo
  4. Thưởng, phúc lợi

Chúng ta sẽ gán cho mỗi nhóm 1 value giống như câu hỏi đóng, như vậy chúng ta đã chuyển câu hỏi mở thành câu hỏi có đáp án giới hạn (gán 1: cơ sở vật chất, 2: đào tạo…). Ví dụ trong hình ảnh bên dưới là biến GopY.

Mã hóa nhập liệu câu hỏi spss

Trong quá trình gom nhóm các tiêu chí cùng một nhóm ý nghĩa lại với nhau, các bạn cần chú ý giữ cho số lượng nhóm càng ít càng tốt. Tác giả đã từng gặp phải các câu hỏi mở được mã hóa nhưng số value lên tới 15, 20,… trong khi có nhiều value vẫn có thể gom lại thành nhóm chung để rút gọn số value lại. Hãy cố gắng tinh giản số value để số phiếu trả lời cho một value là đủ nhiều, khi đó các kiểm định mới càng trở nên chính xác hơn.

Nên có một nhóm giá trị là Khác sau khi đã có được danh sách các value được rút gọn. Nhóm này chứa những ý kiến được ít người đề xuất, những tiêu chí không nằm trong hoặc rất ít liên quan đến những nhóm value đã được rút gọn.

Tóm lại, quy trình mã hóa cho câu hỏi mở sẽ là:

Mã hóa nhập liệu câu hỏi spss

Liệt kê các tiêu chí ngắn gọn từ câu trả lời của người được khảo sát > Gom nhóm các tiêu chí chung ý nghĩa vào một nhóm > Đặt tên mới cho các nhóm vừa gom > Các nhóm mới chính là value của câu hỏi mở, gán giá trị vào nhóm như câu hỏi đóng.

Tóm tắt:

Đối với dạng câu hỏi định tính mở các bạn cần chú ý những điểm dưới đây:

  • Số biến: Một câu hỏi tương ứng với 1 biến.
  • Giá trị (Values): Là số nhóm các tiêu chí sau khi đã rút gọn, giá trị cuối cùng nên để một nhóm Khác đại diện cho các tiêu chí nhỏ, không nằm trong các nhóm giá trị đã có.
  • Thang đo (Measure): Thường là Nominal.

** Xem tiếp phần 2: Mã hóa, nhập liệu câu hỏi khảo sát vào SPSS – Phần 2