Tải bản đầy đủ

Bài giảng chọn mẫu ngẫu nhiên NCDL (bổ sung mới) trong nghiên cứu xã hội học

VẤN ĐỀ MẪU KHẢO SÁT
(mẫu ngẫu nhiên)


NHỮNG CƠ SỞ CỦA LÝ THUYẾT CHỌN MẪU

Tổng thể
Các thành phần

Tổng thể đích

Đơn vị chọn mẫu

Khung mẫu


CÁC YẾU TỐ CẦN CÂN NHẮC KHI THIẾT KẾ MẪU

Các mục tiêu của nghiên cứu

Mức độ chính xác


Nguồn lực

Khung thời gian

Kiến thức về tổng thể

Phạm vị nghiên cứu

Các nhu cầu phân tích thống kê


Tổng thể điều tra là gì?


Tổng thể (population of interest) là toàn bộ các khách thể/đơn vị
nghiên cứu.



Mỗi nghiên cứu có thể có tổng thể khác nhau hoặc trùng nhau. Thí
dụ: sinh viên, nông dân, cư dân đô thị v.v.



Các tổng thể có độ phức tạp/tính thuần nhất khác nhau



Dung lượng/kích thước/qui mô tổng thể thường được ký hiệu bằng
chữ N



Tổng thể nghiên cứu hoàn toàn phụ thuộc vào vấn đề nghiên cứu,
thiết kế nghiên cứu, vấn đề quản lý



Một số cơ sở để xác định tổng thể là:





Khu vực địa lý



Đặc điểm nhân khẩu



Lối sống/tập quán



Sự nhận thức


Điều tra tổng thể
• Là dạng điều tra thực hiện với tất cả
các đơn vị của tổng thể
• Ưu điểm: Không phải quan tâm đến
tính đại diện
• Hạn chế: Tốn kém; thông tin ít tính thời
sự; độ tin cậy thấp
• Những trường hợp cần điều tra tổng
thể: Tổng thể nhỏ; vấn đề hiếm gặp


Điều tra không tổng thể
Điều tra trường hợp
•Điều tra thực hiện với 1, một vài đơn vị
•Ưu, nhược điểm: Tiết kiệm, thông tin sâu, chi tiết;
không thể nói gì về tính đại diện
•Sử dụng trong trường hợp: Nghiên cứu tìm kiếm,
phát hiện và nghiên cứu sơ bộ
Điều tra chọn mẫu
•Điều tra thực hiện với tất cả các đơn vị trong mẫu


Mẫu điều tra là gì
 Là một phần của tổng
thể (tập con – subset)
đươc lựa chọn ra theo
một cách nhất định
 Thông tin thu được từ
mẫu trong nghiên cứu
định lượng được dùng để
suy luận về tông thể
 Dung
lượng/kích
thước/qui

mẫu
thưừong được ký hiệu
bằng chữ n

Tổng thể

Mẫu


Tại sao chọn mẫu?
 Ít tốn kém kinh phí
 Nhanh chóng có kết quả
 Tổ chức điều tra, tập huấn
điều tra viên thuận lợi hơn
 Chính xác hơn (sai số phi
chọn mẫu nhỏ hơn)
 Có thể dùng để tổng hợp
nhanh kết quả tổng điều tra

Định luật
số lớn?


Quan hệ giữa tổng thể –
khung mẫu – mẫu, đơn vò
Tổng
thể

Khung
Mẫu

(thực
tế)

(danh
sách
dân
cư)

Mẫu
Đơn
vò vò
mẫu

bản

Đơn
vò vò
mẫu

bản
Đơn vò
mẫu thứ
cấp


CÁC BƯỚC CỦA CHỌN MẪU

1.
2.
3.
4.
5.

Làm rõ tổng thể
Làm rõ khung chọn mẫu (nếu có thể)
Lựa chọn phương pháp chọn mẫu
Tính toán qui mô/kích thước của mẫu
Tiến hành việc chọn mẫu


Khung mẫu (sampling frame)
 Là cơ sở để chọn mẫu ngẫu nhiên
 Là danh sách chứa đựng toàn bộ các đơn
vị nghiên cứu trong tổng thể.
 Những yêu cầu đối với khung mẫu này là:






Đầy đủ
Chính xác
Thích hợp
Các đơn vị trong danh sách không lặp lại
Thuận tiện cho sử dụng


Đơn vò mẫu
 Nếu mẫu được lựa chọn
trực tiếp trong khung mẫu
mà không cần xem xét
các thành phần, các
yếu tố trong tổng thể thì
mỗi một lần chọn các
thành viên của mẫu sẽ
là một đơn vò.


HAI CÂU HỎI THƯỜNG GẶP
1. Điều tra bao nhiêu là đủ? Hoặc điều
tra với số lượng là X đã đủ hay chưa?
2. Cách chọn như thế nào mới là đúng?
ngẫu nhiên là thế nào?


I.2.Caực phửụng phaựp
choùn maóu:

Caực loaùi
maóu
xaực
suaỏt.

Caực
maóu phi
xaực
suaỏt


Caùc loaïi maãu xaùc
suaát.


KÍCH THƯỚC MẪU (SAMPLE SIZE)
 Các yếu tố cần suy tính đến





Sai số tối thiểu là bao nhiêu?
Độ tin cậy tối thiểu là bao nhiêu?
Cơ cấu tổng thể có phức tạp không?
Kinh phí khảo sát là bao nhiêu?


Công thức tính qui mô mẫu
(Không biết kích thước của tổng thể)
Tính theo tỷ lệ
(với các đặc trưng định tính)

Tính theo giá trị trung bình
(với các đặc trưng định lượng)

t2*p*q
n=
ε2
t2*δ2
n=
ε2

t=1 khi độ tin cậy là 68.2%, t=2 khi độ tin cậy là 95.4% và t=3 khi
đô tin cây là 99.7%


Công thức tính qui mô mẫu
(Khi biết kích thước của tổng thể)
N*t2*p*q
Tính theo tỷ lệ
(với các đặc trưng định tính)

n=
N*ε2+t2*p*q

Tính theo giá trị trung bình
(với các đặc trưng định
lượng)

N*t2*δ2
n=
N*ε2+t2*δ2


Kính thước mẫu

Sai số mẫu ở mức … và độ tin cậy: 95%

p=
n=
50
75
100
125
150
175
200
225
250
300
350
400
450
500
600
700
800
900
1000
1200
1250
1500
1750
2000
2250
2500

5%
6.0%
4.9%
4.3%
3.8%
3.5%
3.2%
3.0%
2.8%
2.7%
2.5%
2.3%
2.1%
2.0%
1.9%
1.7%
1.6%
1.5%
1.4%
1.4%
1.2%
1.2%
1.1%
1.0%
1.0%
0.9%
0.9%

10%
8.3%
6.8%
5.9%
5.3%
4.8%
4.4%
4.2%
3.9%
3.7%
3.4%
3.1%
2.9%
2.8%
2.6%
2.4%
2.2%
2.1%
2.0%
1.9%
1.7%
1.7%
1.5%
1.4%
1.3%
1.2%
1.2%

15%
9.9%
8.1%
7.0%
6.3%
5.7%
5.3%
4.9%
4.7%
4.4%
4.0%
3.7%
3.5%
3.3%
3.1%
2.9%
2.6%
2.5%
2.3%
2.2%
2.0%
2.0%
1.8%
1.7%
1.6%
1.5%
1.4%

20%
11.1%
9.1%
7.8%
7.0%
6.4%
5.9%
5.5%
5.2%
5.0%
4.5%
4.2%
3.9%
3.7%
3.5%
3.2%
3.0%
2.8%
2.6%
2.5%
2.3%
2.2%
2.0%
1.9%
1.8%
1.7%
1.6%

25%
12.0%
9.8%
8.5%
7.6%
6.9%
6.4%
6.0%
5.7%
5.4%
4.9%
4.5%
4.2%
4.0%
3.8%
3.5%
3.2%
3.0%
2.8%
2.7%
2.5%
2.4%
2.2%
2.0%
1.9%
1.8%
1.7%

30%
12.7%
10.4%
9.0%
8.0%
7.3%
6.8%
6.4%
6.0%
5.7%
5.2%
4.8%
4.5%
4.2%
4.0%
3.7%
3.4%
3.2%
3.0%
2.8%
2.6%
2.5%
2.3%
2.1%
2.0%
1.9%
1.8%

35%
13.2%
10.8%
9.3%
8.4%
7.6%
7.1%
6.6%
6.2%
5.9%
5.4%
5.0%
4.7%
4.4%
4.2%
3.8%
3.5%
3.3%
3.1%
3.0%
2.7%
2.6%
2.4%
2.2%
2.1%
2.0%
1.9%

40%
13.6%
11.1%
9.6%
8.6%
7.8%
7.3%
6.8%
6.4%
6.1%
5.5%
5.1%
4.8%
4.5%
4.3%
3.9%
3.6%
3.4%
3.2%
3.0%
2.8%
2.7%
2.5%
2.3%
2.1%
2.0%
1.9%

45%
13.8%
11.3%
9.8%
8.7%
8.0%
7.4%
6.9%
6.5%
6.2%
5.6%
5.2%
4.9%
4.6%
4.4%
4.0%
3.7%
3.4%
3.3%
3.1%
2.8%
2.8%
2.5%
2.3%
2.2%
2.1%
2.0%

50%
13.9%
11.3%
9.8%
8.8%
8.0%
7.4%
6.9%
6.5%
6.2%
5.7%
5.2%
4.9%
4.6%
4.4%
4.0%
3.7%
3.5%
3.3%
3.1%
2.8%
2.8%
2.5%
2.3%
2.2%
2.1%
2.0%


Bài tập
1. Tính toán dung lượng mẫu cho một điều
tra toàn quốc ở Việt Nam với độ tin cậy là
95% và 99%, sai số chọn mẫu là 3%
2. Nếu một xã có 2000 hộ dân, với độ tin cậy
là 95% và 99%, sai số là 3%, cần phải chọn
bao nhiêu
3. Nếu một trường ĐH có 5000 SV với độ tin
cậy là 95%, sai số là 5%, kết quả học tập
học kỳ trước của SV là: Giỏi và XS: 20%,
khá: 30%, TB: 40%, kém: 10%, cần phải
chọn bao nhiêu SV


Vấn đề mẫu dự trữ
 Mẫu dự trữ dùng để bổ sung cho
trường hợp từ chối hoặc vì lý do khách
quan không gặp được đúng người đã
chọn
 Kích thước của mẫu dự trữ tuỳ thuộc
vào tổng thể và tỷ lệ rủi ro có thể có
 Ở Việt Nam kích thước mẫu dự trữ
khoảng dưới 10% mẫu chính


CÁC CÁCH CHỌN MẪU
Ngẫu nhiên đơn giản (Simple Randon
Sampling)
 Ngẫu nhiên hệ thống (Systematic Sampling)
 Phân tầng ngẫu nhiên (Stratified Random
Sampling)
1. theo tỷ lệ (Proportional type)
2. không theo tỷ lệ (Disproportional type)
 Mẫu ngẫu nhiên theo cụm (Cluster sampling)
1. Một giai đoạn
2. nhiều giai đoạn (multistage cluster
sampling)



Ngẫu nhiên đơn giản
1. Lập danh sách tổng thể
2. Gán cho mỗi đơn vị của tổng thể một
mã (số thứ tự)
3. Dùng bảng số ngẫu nhiên để chọn đủ
số lượng cần thiết (căn cứ theo số
thứ tự)


Thí dụ một phần của bảng số ngẫu
nhiều (contingency table)
1

2

4

5

6

7

8

9

10097 32533

76520 13586

34673 54876

80959 09117

37542 04805

64894 74296

24805 24037

20636 10402

08422 68953

19645 09303

23209 02560

15953 34764

99019 02529

09376 70715

38311 31165

88676 74397

12807 99970

80157 36147

64032 36653

98951 16877

39292 74945

66065 74717

34072 76850

36697 36170

00822 91665

31060 10805

45571 82406

35303 42614

35080 33606

85269 77602

02051 65692

68665 74818

04436 27659

63573 32135

05325 47048

90553 57548

12171 76833

73796 45753

03529 64778

35808 34282

65813 39885

11199 29170

98520 17767

14905 68607

86799 07439

23403 09732

11805 05431

39808 27732

73053 85247

18623 88579

83452 99634

06288 98083

28468 28709

83491 25624

88635 40200

86507 58401

60935 20344

35273 88435

99594 67348

87517 64969


Ví dụ


Trong một xã có 1700 hộ, cần chọn ngẫu nhiên 16 hộ:


Các hộ này sẽ có số thứ tự từ 0001 cho đến 2000 trong khung
mẫu



Lấy một phần bất kỳ của bảng số ngẫu nhiên để bắt đầu ví dụ
cột thứ 1;



Xem xét các số trong bảng, có thể chọn theo hàng hoặc theo
cột, nếu số nào lớn hơn các số thứ tự trong khung mẫu sẽ bị
loại bỏ, số nào trùng lặp thì chỉ lấy một lần, lấy cho tới khi nào
đủ số lượng mẫu cần chọn thì dừng lại



Trường hợp đầu tiện được chọn có số thứ tự là 0097, tiếp là
0822; 0935; 1665; 0344; 0157; 1060; 1199; 0715; 0805; 1805;
1165 (bỏ); 0200; 0959; 0636; 0553; 0402.


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay

×