Việc nghiên cứu trên tổng thể là điều bất khả thi với các nhà nghiên cứu vì thời gian, tiền bạc và nhân lực là có giới hạn. Do vậy, các nhà nghiên cứu chỉ tiến hành điều tra trên 1 số đơn vị gọi là mẫu nghiên cứu và dựa trên các đặc điểm và tính chất của mẫu khảo sát, để thể suy ra được các đặc điểm và tính chất của cả tổng thể đó. Vấn đề quan trọng nhất là nhà nghiên cứu phải đảm bảo mẫu nghiên cứu phải có khả năng đại diện được cho tổng thể chung.
1. Sai số trong chọn mẫu
Quá trình chọn mẫu và thực hiện khảo sát khó có thể đạt được kết quả hoàn hảo, sẽ có những sai số nhất định:
a. Sai số do chọn mẫu: các sai số phát sinh do việc chọn mẫu nghiên cứu. Như đã đề cập ở mục 1.1, tổng thể là quá lớn nên chúng ta sẽ mẫu để nghiên cứu, và từ tính chất của mẫu để suy ra tính chất của tổng thể. Sai số do chọn mẫu luôn tồn tại khi chọn mẫu nghiên cứu nếu kích thước mẫu nhỏ hơn tổng thể nghiên cứu (một số nghiên cứu vì tổng thể khá nhỏ nên kích thước mẫu bằng kích thước tổng thể). Kích thước mẫu càng tăng, sai số do chọn mẫu càng giảm và khi mẫu nghiên cứu tăng dần tới kích thước tổng thể, sai số này tiến về 0, nghĩa là không có sai số do chọn mẫu.
b. Sai số không do chọn mẫu: các sai số phát sinh không do chọn mẫu như các sai số do việc phỏng vấn, do việc thu thập phiếu khảo sát, do ghi chép lại kết quả khảo sát, do nhập liệu, hiệu chỉnh,… Sai số không do chọn mẫu càng tăng nếu kích thước mẫu càng tăng.
2. Kỹ thuật chọn mẫu
Có 2 kỹ thuật chọn mẫu chính là: phi xác suất và theo xác suất:
1. Chọn mẫu phi xác suất: phương pháp chọn mẫu mà trong đó người nghiên cứu chọn đối tượng khảo sát một cách ngẫu nhiên. Người nghiên cứu có thể chọn theo cảm tính, theo ý muốn chủ quan, theo sự thuận tiện,… Chính vì vậy, các tham số thu được từ kỹ thuật chọn mẫu này không thể dùng để ước lượng, suy ra tính chất tham số của tổng thể.
2. Chọn mẫu theo xác suất: phương pháp chọn mẫu mà trong đó người nghiên cứu đã biết được xác suất lượng đối tượng tham gia khảo sát. Với cách chọn mẫu này, các tham số thu về có thể dùng để ước lượng, suy ra tính chất của tham số tổng thể.
Mỗi kỹ thuật chọn mẫu có những ưu nhược điểm cũng như tính ứng dụng khác nhau, cùng xem qua bảng so sánh giữa 2 phương pháp này dưới đây.
Tiêu chí | Chọn mẫu phi xác suất | Chọn mẫu theo xác suất |
Ưu điểm | Thuận tiện, ít tốn thời gian và chi phí | Thể hiện được tính chất của tổng thể nghiên cứu |
Nhược điểm | Ít thể hiện được tính chất của tổng thể nghiên cứu | Tốn nhiều thời gian và chi phí |
Ứng dụng | Áp dụng cho các nghiên cứu sơ bộ, khám phá, các nghiên cứu không quá phức tạp | Áp dụng cho các nghiên cứu chính thức, các nghiên cứu quy mô lớn |
Trong mỗi kỹ thuật chọn mẫu theo xác suất và phi xác suất bao gồm nhiều phương pháp chọn mẫu chi tiết. Mỗi phương pháp sẽ có tính ứng dụng và điểm mạnh, điểm hạn chế khác nhau.
2.1 Các phương pháp chọn mẫu phi xác suất
a. Thuận tiện
Người nghiên cứu tiếp cận với đối tượng khảo sát dựa trên tính thuận lợi, ở những nơi mà người nghiên cứu có khả năng tiếp cận được đối tượng khảo sát. Ví dụ, chúng ta cần nghiên cứu sự hài lòng của nhân viên trong một công ty. Trong phương pháp chọn mẫu thuận tiện, người nghiên cứu có thể khảo sát bất kỳ một nhân viên nào trong công ty khi gặp, nếu người đó không đồng ý thì chuyển sang người khác.
b. Phán đoán
Người nghiên cứu dựa vào phán đoán của mình để chọn đối tượng khảo sát thích hợp. Do đó, tính đại diện của mẫu phụ thuộc nhiều vào kinh nghiệm và sự hiểu biết của người tổ chức việc khảo sát và cả người trực tiếp thực hiện việc khảo sát, phỏng vấn. Ví dụ, chúng ta cần nghiên cứu sự hài lòng của nhân viên trong một công ty. Trong phương pháp chọn mẫu phán đoán, người nghiên cứu cảm thấy nhân viên A thích hợp sẽ mời nhân viên A tham gia làm khảo sát; người nghiên cứu thấy nhân viên B không thích hợp sẽ không mời.
c. Định mức
Người nghiên cứu chia tổng thể theo một tiêu chí nào đó (địa lý, độ tuổi, giới tính,…) sau đó dùng phương pháp thuận tiện hoặc phán đoán để chọn mẫu. Ví dụ, chúng ta cần nghiên cứu sự hài lòng của nhân viên trong một công ty. Trong phương pháp chọn mẫu định mức, giả sử nghiên cứu cần mẫu là 200 nhân viên trong tổng thể gồm 400 nhân viên, người nghiên cứu chia mẫu theo tiêu chí độ tuổi rồi dựa trên tính thuận tiện hoặc phán đoán chọn ra ngẫu nhiên 60 nhân viên từ 18 – 25 tuổi, 70 nhân viên từ 26 – 35 tuổi, 50 nhân viên từ 36 – 45 tuổi và 20 nhân viên trên 45 tuổi, miễn là đủ kích thước mẫu.
2.2 Các phương pháp chọn mẫu theo xác suất
a. Ngẫu nhiên đơn giản
Người nghiên cứu cần lập danh sách đối tượng khảo sát của tổng thể theo một trật tự nào đó như vần của tên, theo quy mô, hoặc theo địa chỉ,… Sau đó đánh số thứ tự các đối tượng trong danh sách, rồi dùng các phương pháp ngẫu nhiên như bốc thăm, dùng bảng số ngẫu nhiên, dùng hàm random của các phần mềm hỗ trợ như Excel để chọn ra các đối tượng cần khảo sát trong tổng thể. Ví dụ, chúng ta cần nghiên cứu sự hài lòng của nhân viên trong một công ty. Trong phương pháp chọn mẫu ngẫu nhiên đơn giản, giả sử nghiên cứu cần mẫu là 200 nhân viên trong tổng thể gồm 400 nhân viên. Người nghiên cứu lập danh sách và đánh số thứ tự 400 nhân viên của công ty, sau đó dùng hàm random của Excel chọn ra ngẫu nhiên 200 trong số 400 nhân viên để khảo sát.
b. Ngẫu nhiên hệ thống
Người nghiên cứu cần lập danh sách đối tượng khảo sát của tổng thể theo một trật tự quy ước nào đó, sau đó đánh số thứ tự các đối tượng trong danh sách. Bước xuất phát, chọn ngẫu nhiên 1 đơn vị trong danh sách, sau đó cứ cách đều m đơn vị lại chọn ra 1 đơn vị vào mẫu,…lặp lại như thế cho đến khi chọn đủ số đơn vị của mẫu. Ví dụ, chúng ta cần nghiên cứu sự hài lòng của nhân viên trong một công ty. Trong phương pháp chọn mẫu ngẫu nhiên hệ thống, giả sử nghiên cứu cần mẫu là 200 nhân viên trong tổng thể gồm 400 nhân viên. Người nghiên cứu lập danh sách và đánh số thứ tự 400 nhân viên của công ty, chọn đối tượng đầu tiên trong danh sách, sau đó cứ cách đều 2 đối tượng lại chọn 1 đối tượng, lặp lại quá trình này đến khi chọn đủ 200 người.
c. Phân tầng
Người nghiên cứu cần phân chia tổng thể thành nhiều tầng dựa trên các tiêu chí như khu vực địa lý, giới tính, độ tuổi, nghề nghiệp,… Trong cùng một tầng, các đối tượng khảo sát có tính đồng nhất cao, tương tự nhau về tiêu chí phân tầng; giữa các tầng khác nhau có tính phân biệt, khác biệt nhau về tiêu chí phân tầng. Sau đó trong từng tầng, dùng phương pháp chọn mẫu ngẫu nhiên đơn giản hay chọn mẫu ngẫu nhiên hệ thống để chọn ra các đối tượng khảo sát. Đối với chọn mẫu phân tầng, số đối tượng khảo sát được chọn ra ở mỗi tầng có thể tuân theo tỷ lệ số đối tượng tầng đó chiếm trong tổng thể, hoặc có thể không tuân theo tỷ lệ. Ví dụ, chúng ta cần nghiên cứu sự hài lòng của nhân viên trong một công ty. Trong phương pháp chọn mẫu phân tầng, giả sử nghiên cứu cần mẫu là 200 nhân viên trong tổng thể gồm 400 nhân viên. Người nghiên cứu chia tổng thể nhân viên thành 4 tầng tương ứng với 4 phòng ban của công ty là: Nhân sự, Kế toán, Sản xuất, Marketing. Dựa trên số lượng nhân viên của từng phòng ban, người nghiên cứu chọn ra 200 nhân viên của công ty, cụ thể: 3 người phòng Nhân sự, 3 người phòng Kế toán, 185 người phòng Sản xuất, 9 người phòng Marketing.
d. Theo nhóm
Người nghiên cứu cần lập danh sách tổng thể theo nhóm (như làng, xã, lớp, khu vực…). Sau đó, chọn ngẫu nhiên một số nhóm và điều tra tất cả các đơn vị trong nhóm đã chọn. Chúng ta thường dùng phương pháp này khi không có sẵn danh sách đầy đủ của các đối tượng khảo sát trong tổng thể cần nghiên cứu. Ví dụ: Tổng thể chung là học sinh của một trường trung học. Khi đó ta sẽ lập danh sách các lớp chứ không lập danh sách học sinh, sau đó chọn ra một số lớp đảm bảo đủ cỡ mẫu để khảo sát.