Tải bản đầy đủ

Bài tập Thống kê sinh học

THỐNG KÊ SINH HỌC

BÀI TẬP CÓ HƯỚNG DẪN GIẢI
Bài 1.
1. Trong các cột C1, C2 và C3 hãy tạo ra 25 hàng của các số ngẫu nhiên tuân theo
phân bố Poisson với trung bình là 25.
2. Tính căn bậc hai của các giá trị trong C1 và lưu các giá trị mới tính trong C4.
3. Tính tổng các cột C1, C2, C3 và lưu trữ kết quả trong C5.
4. Tìm trung vị của mỗi hàng và lưu kết quả trong C6.
5. Tìm tất cả các ô trong cột C1 có giá trị lớn hơn giá trị của ô cùng hàng trong C2.
Lưu kết quả trong C7.
6. Tìm tổng giá trị của tất cả các ô trong C1 và lưu kết quả trong C8.
Hướng dẫn
1. Tạo các số ngẫu nhiên.
– Mở một bảng tính (worksheet) mới.
– Từ thanh menu chọn Calc > Random Data > Poisson . . .

Trong cửa sổ Poisson Distribution, điền vào các hộp
– Number of row of data to generate:
– Store in column(s):
– Mean:

Nhấp OK
Kết quả là 3 cột đầu tiên C1, C2, C3 sẽ xuất hiện 25 số ngẫu nhiên có phân bố
Poisson.
149


BÙI TẤN ANH

2. Tính căn bậc 2 của C1 và lưu kết quả trong C4.
Từ thanh menu chọn Calc > Calculator . . .

Cửa sổ Calculator xuất hiện.
– Trong hộp “Store result in variable:” gỏ C4.
– Chọn “Arithmetic” từ phần xổ xuống của “Functions” .
– Chọn “Square root” từ hộp liệt kê các hàm. “SQRT(number)” xuất hiện trong hộp
“Expression” , gỏ “C1” vào vị trí thay cho number.
– Nhấp nút “OK”.
Các giá trị căn bậc 2 của cột C1 bây giờ sẽ xuất hiện trong cột C4.
3. Tính tổng của 3 cột và lưu kết quả trong C5.
Có 2 cách:
Cách 1.
– Trong hộp “Store result in variable:” gỏ C5.
– Trong hộp “Expression:” gỏ C1 + C2 + C3.
– Nhấp nút “OK”.
Cách 2.
– Chọn “Row Statistics” từ hộp “Functions”
– Chọn “Sum” từ hộp danh sách các hàm. “RSUM(number, number, . . . )” sẽ xuất
hiện trong hộp “Expression” , thay number bằng C1, C2, C3. Nhấp chọn “OK”.
150


THỐNG KÊ SINH HỌC

4. Tìm trung vị cho mỗi hàng và lưu kết quả trong C6.
Cần lưu ý rằng chúng ta không tìm trung vị của từng cột mà là của từng hàng ngang
qua cả 3 cột.
– Chọn “Row Statistics” từ hộp “Functions”
– Chọn “Median” từ hộp danh sách các hàm. “RMEDIA(number, number, . . . )” sẽ
xuất hiện trong hộp “Expression” , thay number bằng C1, C2, C3. Nhấp chọn
“OK”.

5. Chọn tất cả các ô trong cột C1 có giá trị lớn hơn giá trị trong cột C2 cùng
hàng.
– Trong hộp “Store result in variable:” gỏ “C7.
– Trong hộp “Expression” , gỏ “C1 > C2,” nhấp chọn “OK”
Cột C7 sẽ liệt kê các giá trị 0 và 1. Số 1 cho biết các giá trị của C1 lớn hơn của C2
cùng hàng.
6. Tìm tổngcủa tất cả các ô trong C1 và lưu kết quả trong C8.
– Trong hộp “Store result in variable:” gỏ “C8.”
– Chọn “Statistics” từ hộp “Functions”.
– Chọn “Sum” từ hộp danh sách các hàm. “SUM(number)” sẽ xuất hiện trong hộp.
Bài 2. Hãy tạo 1000 số ngẫu nhiên có giá trị từ 0 đến 9 và lưu kết quả trong các cột
từ 1 đến 50.
Hướng dẫn
– Chọn Calc > Random Data > Integer… Trong hộp thoại Integer Distribution:
– Number of rows of data to generate: gỏ 20
– Store in column(s): C1– C50
– Minimum value: 0; Maximum value: 9.→ OK.
151


BÙI TẤN ANH

Bài 3. Một giống cỏ mới được chọn lọc để trồng ở mặt sân golf với yêu cầu phải đạt
là tỉ lệ nẩy mầm 85%. Để đánh giá giống cỏ mới này, người ta đã gieo trồng 20 hạt
trong nhà kính. Nếu tỉ lệ nảy mầm đạt 85% thì xác xuất để có từ 18 hạt trở lên nảy
mầm là bao nhiêu?
Hướng dẫn:
1. Tính theo công thức
P( x) =

n!
π x (1 − π ) n − x
x !(n − x)!

Thay n = 20, π = 0.85, x = 18, 18, 29 ta được

18!
0.8518 (1 − 0.85) 20−18 = 190(0.85)18 (0.15)18 = 0.229
18!(20 − 18)!
19!
P ( x = 19) =
0.8519 (1 − 0.85) 20−19 = 20(0.85)19 (0.15)1 = 0.137
19!(20 − 19)!
20!
P ( x = 20) =
0.8520 (1 − 0.85) 20− 20 = (0.85) 20 = 0.388
20!(20 − 20)!
P ( x ≥ 18) = P ( x = 18) + P ( x = 19) + P( x = 20) = 0.405
P ( x = 18) =

2. Áp dụng Minitab
Cal > Probability Distribution > Binomial...

Tính xác xuất (P x ≤ 17). Lưu dưới dạng hằng số k

152


THỐNG KÊ SINH HỌC

Tính xác xuất (P ≥ 18): Cal > Calculator

Bài 4. Tính P (X ≤ 18) khi X có phân bố chuẩn với µ = 23 và σ = 5
Hướng dẫn:
– Chọn Calc > Probability > Normal
– Chọn Cumulative probability.
– Nhập giá trị của µ: Mean: 23
– Nhập giá trị của σ : Standard deviation: 5
153


BÙI TẤN ANH

– Chọn Input constant. Nhập giá trị của x: 18 → OK

Bài 5. Từ một tổng thể có phân bố chuẩn với µ = 60 và σ = 5, hãy tạo một phân bố
mẫu của x dựa trên 500 mẫu có cở mẫu n = 16.
Hướng dẫn
– Chọn Calc > Random Data > Normal
– Nhập số mẫu: Generate 500 rows
– Nhập cở mẫu: Storre in column(s): C1 – C16
– Nhập các giá trị của µ và σ : Mean: 60, Standard devation: 5
– OK

154


THỐNG KÊ SINH HỌC

Kết quả là các số ngẫu nhiên được tạo ra trong worksheet, từ cột C1 đến C16, mỗi
cột có 500 hàng (mỗi hàng đại diện cho một mẫu, 16 cột là cở mẫu).
– Tính trung bình của từng mẫu cho cả 500 mẫu
+ Chọn Calc > Row Statistics > mean.
+ Nhập vị trí của dữ liệu: Input Variables: C1 – C16
+ Nhập tên cột để lưu 500 giá trị trung bình: Store Results in: C17
+ Graph > Histogram. Trong Graph box gỏ C17 → OK

155


BÙI TẤN ANH

– Tính trung bình của 500 x :
+ Calc > Column Statistics > mean
+ Nhập vị trí của 500 trung bình: Input Variable C17
+ OK
Nếu không chọn store results in thì kết quả sẽ hiển thị trong cửa số Session
– Tính độ lêch chuẩn của 500 x :
+ Calc > Column Statistics > standard deviation
+ Nhập vị trí của 500 trung bình: Input Variable C17
+ OK
– Tìm phân bố mẫu của x :
+ Chọn Graph > Histogram/Simple → OK
+ Trong box Histogram-Simple: Graph Variables nhập C17 → OK
Histogram of C17
50

Frequency

40

30

20

10

0

156

57

58

59

60
C17

61

62

63


THỐNG KÊ SINH HỌC

BÀI TẬP THỰC HÀNH
Chương 2.
Bài 1.
a) Hãy tạo 100 số ngẫu nhiên có phân bố chuẩn với giá trị trung bình là 10 và độ
lệch chuẩn là 0.5. Tính các giá trị thống kê mô tả cơ bản.
b) Tóm tắt các dữ liệu thống kê bằng biểu đồ (graphical summary).
c) Lập biểu đồ cột và biểu đồ stem and leaf.
d) Từ 100 biến trên, hãy chọn ngẫu nhiên một mẫu gồm 30 biến số. Copy sang
worksheet mới. Thực hiện các công việc a, b, c với mẫu.
Bài 2. Dựa vào số liệu trong bảng 2.1 hãy dùng cách tóm tắt biểu đồ để phân tích
xem dữ liệu có phân bố chuẩn hay không. Biểu diễn dữ liệu bằng biểu đồ thích hợp.
Bảng 2.1. Trọng lượng gà (g) sau 8 tuần nuôi bằng khẩu phần có bổ sung kháng
sinh.
3.7
4.2
4.7
4.0
4.9
4.3
4.0
4.2
4.7
4.1

4.2
3.8
4.2
4.2
3.8
4.7
3.9
4.7
4.1
4.9

4.4
4.2
4.2
4.0
4.3
4.1
4.5
3.8
4.8
4.3

4.4
4.4
4.8
4.5
4.3
4.0
4.3
4.5
4.1
4.4

4.3
4.6
4.5
4.4
3.9
4.6
3.8
4.0
4.3
4.4

4.2
3.9
3.6
4.1
3.8
4.4
4.1
4.2
4.7
4.3

4.4
4.3
4.1
4.0
4.7
4.6
4.3
4.1
4.2
4.6

4.8
4.5
4.3
4.0
3.9
4.4
4.2
4.0
4.1
4.5

4.9
4.8
3.9
3.8
4.0
4.9
4.5
4.7
4.4
4.6

4.4
3.9
4.2
4.6
4.2
4.4
4.4
4.1
4.8
4.0

Bài 3. Trong bài báo "Viral load and heterosexual transmission of
human immunodeficiency virus type 1" [New England Journal of
Medicine (2000) 342:921-929], nghiên cứu về khả năng lây nhiễm HIV-1ghi nhận
số liệu về mức HIV-1 RNA trong nhóm người ban đầu không bị lây nhiễm trở
thành HIV dương tính trong quá trình nghiên cứu (đơn vị tính là RNA copies / mL).
79725
6081

12862
50397

18022
11020

76712 256440
13633
1064

14013
49643
3

46083
25308

6808
6616

85781
11210

1251
13900

a) Xác định trung bình, trung vị, và độ lệch chuẩn.
b) Tìm các giá trị Q1, Q2, Q3.
c) Vẽ biểu đồ boxplot và histogram.
d) Mô tả hình dạng của phân bố.
Bài 4. Theo tiêu chuẩn của cơ quan y tế thì mức độ flouride không được vượt quá
1.5 parts per million (ppm). Bảng 2.2 dưới đây ghi nhận mức độ flouride của một
mẫu đo được trong 25 ngày.
157


BÙI TẤN ANH

Bảng 2.2. Mức flouride của một mẫu đo trong 25 ngày
0.75
0.86
0.84
0.85
0.97

0.94
0.89
0.84
0.83
0.89

0.88
0.78
0.77
0.76
0.82

0.72
0.92
1.05
0.94
0.83

0.81
0.85
0.97
0.93
0.79

a) Tóm tắt số liệu dưới dạng số và biểu đồ.
b) Chọn biểu đồ thích hợp để biểu diễn số liệu trên.
Bài 5. Trong bài báo "Posidonia oceanica: A biological indicator of past and present
mercury contamination in the Mediterranean Sea" các nhà nghiên cứu đã báo cáo
nồng độ của Hg trong thời kỳ 20 năm ở hai vị trí khác nhau của Địa Trung hải. Ở
mỗi vị trí, 45 mẫu của loài P. oceanica được thu thập ở độ sâu 10m và mang về
phòng thí nghiệm để xác định nồng độ Hg. Nồng độ Hg trung bình (ng/ g trọng
lượng khô) của các mẫu ở mỗi vị trí được ghi nhận theo từng năm như trong bảng
2.3
Bảng 2.3. Nồng độ thuỷ ngân đo ở 2 vị trí trong 20 năm
Năm
1992
1991
1990
1989
1988
1987
1986
1985
1984
1983
1982
1981

Nồng độ thủy ngân (ng/g trọng lượng khô)
Vị trí 1
Vị trí 2
Năm
Vị trí 1
14.80
70.20
1980
25.80
12.90
160.50
1979
11.00
18.00
102.80
1978
16.50
8.70
100.30
1977
28.10
18.30
103.10
1976
50.50
10.30
129.00
1975
60.10
19.30
156.20
1974
96.70
12.70
117.60
1973
100.40
15.20
170.60
1972
*
24.60
139.60
1971
*
21.50
147.80
1970
*
18.20
197.70
1969
*

Vị trí 2
262.10
123.30
363.90
329.40
542.60
369.90
705.10
462.00
556.10
461.40
628.80
489.2

a) Trình bày các giá trị thống kê mô tả cho nồng độ Hg trung bình ở mỗi vị trí. So
sánh sự biến đổi của nồng độ Hg ở hai vị trí (dùng CV để so sánh và hãy giải thích
vì sao nó thích hợp hơn dung độ lệch chuẩn).
b) Biểu diễn nồng độ trung bình của Hg tại mỗi vị trí trên từng biểu đồ riêng. Nhận
xét về xu hướng biến đổi nồng độ Hg theo thời gian ở từng vị trí.
c) Biểu diễn nồng độ trung bình của Hg tại mỗi vị trí trong cùng một biểu đồ. Biểu
đồ với hai trục Y có gì khác so với biểu đồ có một trục Y?
d) Khi so sánh các số đo định tâm và độ biến động của hai vị trí, có nên dùng các số
đo từ 1969 – 1972 ở vị trí 2 hay không? Giải thích.

158


THỐNG KÊ SINH HỌC

Bài 6. Các nhà nghiên cứu về giáo dục của một trường đại học đã tiến hành tổng kết
điểm (theo thang điểm SAT) của các thí sinh nam và nữ đạt được qua các kỳ thi văn
và toán trong 10 năm , kết quả ghi nhận trong bảng 2.4.
Bảng 2.4. Kết quả các kỳ thi văn và toán từ 1967 – 1996
Giới
Môn
Nam/Văn
Nữ/Văn
Nam/Toán
Nữ/Toán

1967
540
545
535
495

1970
536
538
531
493

1975
515
509
518
479

1980
506
498
515
473

Giới
Môn
Nam/Văn
Nữ/Văn
Nam/Toán
Nữ/Toán

Năm
1985 1990
514
505
503
496
522
521
480
483

2000
507
504
533
498

Năm
2001
509
502
533
498

1993
504
497
524
484

1994
501
497
523
487

1995
505
502
525
490

1996
507
503
527
492

2002
507
502
534
500

a) Hãy trình bày kết quả điểm theo từng giới/môn trên bốn biểu đồ riêng. Qua đó
nhận xét về xu hướng của kết quả ở nam và nữ.
b) Hãy trình bày kết quả điểm theo từng giới/môn chung trong một biểu đồ. Cho
biết sự khác biệt về kết quả giữa hai giới theo môn học.
Bài 7. Số người tình nguyện hiến máu tại một bệnh viện trung tâm được ghi nhận
sau 20 ngày Thứ Sáu liên tiếp:
320

370

386

334

325

315

334

301

270

310

274

308

315

368

332

260

295

356

333

250

a) Xây dựng biểu đồ stem-and-leaf từ dữ liệu trên.
b) Vẽ biểu đồ boxplot. Dựa vào biểu đồ hãy mô tả hình dạng của phân bố.

Chương 3.
159


BÙI TẤN ANH

Bài 8. Xét một phân bố chuẩn.
1. Tính xác suất để nhận được một giá trị z:
(a) ít nhất là 1.25.
(b) ít nhất là – 0.84
(c) giữa –1.96 và 1.96
(d) giữa 1.22 và 1.85
(e) giữa –0.84 và 1.28
(f) nhỏ hơn 1.72
2. Tìm một giá trị z để xác suất nhận được lớn hơn:
(a) 0.05.
(b) 0.025.
(c) 0.20.
Bài 9. Giả sử rằng điểm kiểm tra trong một lớp đông sinh viên có phân bố chuẩn
với trung bình là 74 và độ lệch chuẩn là 10.
a) Giả sử điểm kiểm tra của bạn là 88. Tỉ lệ sinh viên trong lớp có điểm cao hơn
điểm của bạn là bao nhiêu?
b) Giả sử giáo viên muốn giới hạn số đạt điểm A trong lớp không quá 20%. Người
đạt điểm A có điểm thấp nhất là bao nhiêu?
Bài 10. Các nghiên cứu cho thấy mức cholesterol huyết thanh cao có liên quan đến
sự gia tăng của bệnh mạch vành. Biết rằng logarit tự nhiên của mức cholesterol
huyết thanh ở nam giới trong một độ tuổi xác định có phân bố chuẩn với trung bình
5,35 và độ lệch chuẩn của 0,12.
a) Hãy dự đoán xem bao nhiêu phần trăm nam giới trong độ tuổi trên có thể có mức
cholesterol huyết thanh lớn hơn 250 mg / ml (giới hạn trên của mức bình thường)?
b) Bao nhiêu phần trăm nam giới có thể có mức cholesterol huyết thanh
trong giới hạn bình thường là 150 – 250 mg / ml?
c) Bao nhiêu phần trăm nam giới có mức cholesterol huyết thanh cao hơn 300 mg /
ml?
Bài 11. Các mẫu nước được lấy (cở mẫu bằng nhau) từ một con sông bị nghi ngờ ô
nhiễm do rác thải. Khi đếm số lượng các trực khuẩn gây bệnh trong các mẫu thì số
lượng trung bình của trực khuẩn trên mỗi mẫu là 15. Giả sử rằng số lượng trực
khuẩn có phân bố Poisson, tìm xác suất để:
a) Mẫu kế tiếp có ít nhất 20 trực khuẩn.
b) Mẫu kế tiếp có không nhiều hơn 5 trực khuẩn.
Bài 12. Qua kiểm tra, xác suất để một linh kiện điện tử đạt chuẩn là 0.98. Các mẫu
dùng để kiểm tra được lấy ngẫu nhiên trong quá trình sản xuất hàng loạt. Trong một
mẫu có 5 linh kiện, tính xác suất số mẫu không đạt chuẩn là:
a) không mẫu
b) đúng 1 mẫu
c) đúng 2 mẫu
d) 2 hoặc nhiều hơn 2 mẫu
Bài 13. Một công ty nhận khoan 4 giếng dầu. Xác suất thành công khi khoan một
giếng là 0.4, độc lập với kết quả khoan của các giếng khác. Chi phí cho mỗi giếng
khoan là 200.000 $. Mỗi giếng khoan thành công sẽ thu được 600.000$.
a) Xác suất khoan thành công một hoặc nhiều hơn 1 giếng?
160


THỐNG KÊ SINH HỌC

b) Số giếng khoan được kỳ vọng sẽ thành công là bao nhiêu?
c) Lãi ròng hy vọng thu được là bao nhiêu?
d) Nếu chỉ khoan được một giếng thì thu nhập sẽ như thế nào?
Bài 14. Trong một cuộc kiểm tra xe ô tô tại Los Angeles, 60% các xe ô tô có lượng
khí thải không đáp ứng được tiêu chuẩn quy định. Với một mẫu ngẫu nhiên gồm 10
xe ô tô, hãy tính xác suất:
a) Cả 10 xe đều không đạt chuẩn.
b) Đúng 6 xe không đạt chuẩn.
c) Có từ 6 xe trở lên không đạt chuẩn.
d) Cả 10 xe đều đạt chuẩn.

Chương 4.
161


BÙI TẤN ANH

Bài 15. Vào ngày 7/1/1992, một ống dẫn dầu dưới mặt đất bị vỡ và dầu tràn ra đã
làm ô nhiễm một vùng đầm lầy dọc theo bờ sông Chitipin, Texas. Chính quyền đã
xử lý bằng cách cho đốt vùng bị ô nhiễm ở đầm lầy này. Một năm sau, để đánh giáï
ảnh hưởng của sự tràn dầu lên hệ thực vật, các nhà nghiên cứu đã tiến hành trồng
cây (Distichlis spicata) ở vùng ô nhiễm và một vùng đối chứng (không ô nhiễm) tại
40 điểm/vùng với kích thước bằng nhau. Mật độ của cây tại mỗi điểm được ghi
nhận như trong bảng 4.1.
Bảng 4.1. Mật độ cây tại hai vùng ô nhiễm và đối chứng
Vùng đối chứng

Vùng ô nhiễm

7
24
11
53
51
27
31
50
23
31

57
42
41
38
56
5
24
17
14
29

43
42
50
45
57
17
22
25
31
19

43
16
0
36
52
41
26
33
38
24

59
54
0
37
29
25
32
27
19
52

42
30
40
41
42
11
35
9
22
34

35
47
58
41
51
37
26
17
4
24

40
40
54
35
0
38
22
25
27
34

Hãy so sánh mật độ trung bình của cây ở hai vùng, tính hệ số tin cậy 95%. Rút ra
nhận xét và kết luận.
Bài 16. Thí nghiệm được tiến hành nhằm đánh giá hiệu quả của loại thuốc trị sán
dây kí sinh trong ruột cừu. Một mẫu gồm 24 cừu non bị nhiễm sán có cùng độ tuổi
và sức khỏe được phân bố ngẫu nhiên thành hai nhóm. Một nhóm được tiêm thuốc
còn một nhóm không tiêm. Sau 6 tháng, các con cừu bị mổ thịt và số lượng sán
được ghi nhận trong bảng 4.2.
Bảng 4.2. Số lượng sán dây trong 2 nhóm cừu có và không có tiêm thuốc
Cừu có tiêm thuốc
18 43 28 50 16 32 13 35 38 33 6 7
Cừu không tiêm thuốc
40 54 26 63 21 37 39 23 48 58 28 39
Hãy kiểm tra xem lượng sán trung bình trong ruột của cừu có tiêm thuốc có ít hơn
so với trong cừu không tiêm thuốc hay không. Mức ý nghĩa của kiểm tra này là bao
nhiêu %? Xác định khoảng tin cậy 95%.
Bài 17. Bảng 4.3 là số đo chiều ngang xương càm (cm) của 15 bé gái lúc 5 tuổi và 6
tuổi. Hãy xác định xem giá trị trung bình của các số đo có thay đổi theo độ tuổi
không.
Bảng 4.3. Chiều ngang xương càm (cm) của 15 bé gái ở độ tuổi 5 và 6.
5T

7.3
3

7.49 7.27

6T 7.53 7.7

162

7.4
6

7.9
3

7.56

8.21

7.8
1

7.8
1
8.0
1

7.4
6

6.9
4
7.1
7.72
3

7.49 7.44 7.95 7.47 7.04 7.1
7.6
8

7.6
6

8.1
1

7.6
6

7.6
4

7.20 7.25 7.79


THỐNG KÊ SINH HỌC

Bài 18. Một thanh tra viên môi trường nghi ngờ rằng các hộ dân sống hai bên bờ
sông đã thải rác làm thay đổi mức oxygen hòa tan của nước sông. Để kiểm tra, anh
ta đã thu ngẫu nhiên 15 mẫu ở đầu và 15 mẫu ở cuối con sông trong tỉnh đem về
phòng thí nghiệm. Lượng oxy hòa tan (ppm) được ghi nhận trong bảng 4.4.
Bảng 4.4. Lượng oxy hòa tan trong nước sông ở hai vị trí thu mẫu
Đầu sông

5.2 4.8 5.1 5.0 4.9 4.8 5.0 4.7 4.7 5.0 4.7 5.1 5.0 4.9 4.9

Cuối sông 4.2 4.4 4.7 4.9 4.
6

4.8 4.9 4.
6

5.1 4.
3

5.5 4.7 4.9 4.8 4.7

Dữ liệu có cung cấp đủ bằng chứng cho thấy sự sai khác về hàm lượng oxy hòa tan
trung bình của hai điểm thu mẫu hay không?
Bài 19. Nhằm tìm ra mối liên hệ giữa nhiệt độ môi trường và bệnh tăng huyết áp ở
người, một thí nghiệm đã được tiến hành trên chuột. 12 con chuột được phân bố
ngẫu nhiên thành hai nhóm: một nhóm giữ ở nhiệt độ bình thường (26 0C), nhóm
còn lại giữ ở nhiệt độ 50C. Huyết áp của cả hai nhóm được ghi nhận trong bảng 4.5.
Bảng 4.5. Huyết áp của chuột nuôi ở hai môi trường có nhiệt độ khác nhau
260C
Chuột Huyết áp
1
2
3
4
5
6

152
157
179
182
176
149

50C
Chuộ Huyết áp
t
7
384
8
369
9
354
10
375
11
366
12
423

Dữ liệu trong bảng trên có cung cấp đủ bằng chứng cho thấy chuột nuôi ở môi
trường 50C có huyết áp trung bình cao hơn chuột nuôi ở 26 0C hay không?Tìm
khoảng tin cậy 95% cho sự sai khác giữa huyết áp trung bình của hai quần thể.
Bài 20. Một nhà nông học muốn so sánh năng suất trung bình của 2 giống lúa. Vì
ông cho rằng năng suất lúa cũng thay đổi tùy nơi canh tác nên cả hai giống đều
được bố trí ngẫu nhiên vào 7 ruộng khác nhau, mỗi ruộng đều rộng 1 công. Lúa
được thu hoạch lúc chín và kết quả (giạ/công) được ghi nhận trong bảng 4.6. Hãy
kiểm tra xem năng suất trung bình của 2 giống lúa có khác nhau hay không.
Bảng 4.6. Năng suất 2 giống lúa trên 7 ruộng khác nhau
Ruộng
1
Giống
48.2
A
Giống B 41.5

2
44.6

3
49.7

4
40.5

5
54.6

6
47.1

7
51.4

40.1

44

41.2

49.8

41.7

46.8
163


BÙI TẤN ANH

Bài 21. Kết quả nghiên cứu chất lượng cây trồng ở ba khu vực khác nhau được ghi
nhận như sau:
Khu vực A
40 xấu
170 trung bình
90 tốt
Khu vực B
50 xấu
180 trung bình
120 tốt
Khu vực C
60 xấu
150 trung bình
80 tốt
Hãy xác định xem chất lượng cây trồng trong trường hợp này có phụ thuộc vào khu
vực canh tác hay không.
Bài 22. Một nhà sinh thái thực vật nghiên cứu một mẫu gồm 100 cây của một loài
quí hiếm trên một vùng có diện tích 400 dặm. Ở mỗi cây ông ghi nhận đặc điểm của
lá (lá có lông tơ hoặc không có) và đặc điểm của đất nơi cây mọc (có khoáng chất
serpentine hoặc không có). Kết quả như sau:
Đất
Có serpentine
Không có

Lá cây
Có lông tơ
Không có lông tơ
12
16

22
50

Hãy kiểm tra xem đặc điểm của lá có phụ thuộc vào đặc điểm của loại đất nơi cây
mọc hay không.
Bài 23. Hãy dùng kết quả ghi nhận trong bảng dưới đây để kiểm tra xem màu sắc
của loài bọ Cicindela fulgida có thay đổi tùy theo mùa không.
Mùa
Đầu mùaxuân
Cuối mùa
xuân
Đầu mùa hè
Cuối mùa hè

Màu sắc bọ
Đỏ sáng
Không đỏ sáng
29
273
8
64

11
191
31
64

Bài 24. Khi nghiên cứu về mức độ nhiễm bệnh của đàn heo nhập nội tại hai cơ sở
chăn nuôi, người ta ghi nhận được kết quả như sau: trại A không bị nhiễm 86 con,
bị nhiễm 15 con và trại B có 32 heo không bị nhiễm, 12 heo bị nhiễm. Sự khác nhau
về mức độ nhiễm bệnh giữa hai trại có ý nghĩa về mặt thống kê hay không?

164


THỐNG KÊ SINH HỌC

Chương 5.
Bài 25. Hàm lượng Oxygen trong nước là một chỉ tiêu để xem xét mức độ ô nhiễm
môi trường. Trong một lần khảo sát người ta lấy ngẫu nhiên 24 mẫu ở 4 khu vực
khác nhau, ký hiệu là KV1, KV2, KV3, KV4. Mẫu được đem phân tích và đo hàm
lượng oxygen hòa tan (đơn vị tính theo phần triệu). Kết quả ghi nhận ở bảng 5.1.
Bốn khu vực có thật sự khác nhau về hàm lượng oxygen hòa tan hay không? Từ đó
kết luận về mức độ ô nhiễm của mỗi khu vực.
Bảng 5.1. Hàm lượng oxygen hòa tan ở 4 khu vực (đơn vị phần triệu)

KV1
KV2
KV3
KV4

Mẫu số 1

Mẫu số
2

Mẫu số
3

Mẫu số
4

Mẫu số
5

Mẫu số
6

6.3
6.9
4.8
4.8

6.8
6.3
4.7
4.9

6.5
6.2
4.5
5.2

5.9
5.4
4.8
5.6

5.8
5.7
4.9
5.8

5.7
5.9
4.6
5.7

Bài 26. Nghiên cứu năng suất của 5 giống bắp lai được thụ phấn ngẫu nhiên, thí
nghiệm được lặp lại 5 lần trên mỗi giống, kết quả ghi nhận trong bảng 12. Hãy kiểm
tra xem năng suất của 5 giống bắp nầy có phụ thuộc vào phẩm chất giống hay
không.
Bảng 5.2. Kết quả năng suất của 5 giống bắp lai được thụ phấn ngẫu nhiên
(tấn/ha)
Giống 1
4.5
4.6
4.8
4.6
4.1

Giống 2
3.8
4.2
3.8
3.9
4.1

Giống 3
4.4
6.3
4.5
5.3
5.9

Giống 4
4.7
4.3
4.6
4.6
3.8

Giống 5
3.5
4.2
4.3
4.2
3.2

Bài 27. Khối lượng lúc 6 tháng tuổi của bốn giống heo ngoại được vỗ béo tại xí
nghiệp chăn nuôi và thức ăn gia súc An Khánh năm 2000 được ghi nhận trong bảng
5.3. Hãy so sánh khối lượng của bốn giống heo này (Ba máu DLY là tổ hợp lai ba
máu giữa Duroc, Landrace và Yorkshire).
Bảng 13. Khối lượng (kg) lúc sáu tháng tuổi của bốn giống heo
Ba máu DLY Giống Duroc Giống Landrace Giống Yorkshire
78 82
78 81
79 78
77 84
88 81
78 81
73 80
68 80
87 80
85 82
79 78
75 75
88 80
81 76
75 83
70 76
83 89
78 74
77 84
74 75

Bài 28. Một nhà nông học khảo sát hàm lượng phosphorus của lá cây từ 3 giống táo
(1, 2 và 3). Mẫu được lấy ngẫu nhiên từ 5 lá của mỗi giống đem phân tích hàm
165


BÙI TẤN ANH

lượng phosphorus. Dữ liệu được trình bày trong bảng 5.4. Hãy kiểm tra giả thuyết
"hàm lượng phosphorus trung bình của ba giống táo là giống nhau"
Bảng 5.4. Hàm lượng phosphorus của 3 giống táo
Giống
1
2
3

.35
.65
.60

Hàm lượng phosphorus
.40
.58
.50
.70
.90
.84
.80
.75
.73

.47
.79
.66

Bài 29. Một phòng thí nghiệm lớn có 4 loại thiết bị để đo độ pH của các mẫu đất.
Họ muốn xác định liệu có sự sai khác về giá trị trung bình đọc được từ bốn thiết bị
này hay không nên đã bố trí thí nghiệm như sau: 24 mẫu đất có độ pH đã biết được
phân bố ngẫu nhiên thành 4 nhóm ứng với 4 thiết bị, mỗi nhóm gồm 6 mẫu đất. Các
mẫu đất được đo pH bằng thiết bị và sự sai khác giữa pH đọc từ thiết bị với pH đã
biết được ghi nhận. Kết quả được trình bày trong bảng 5.5. Hãy xác định xem trung
bình pH đọc được từ bốn thiết bị có sai khác nhau hay không?
Bảng 5.5. Sai khác giữa pH đọc từ thiết bị với pH đã biết của 24 mẫu đất
Thiết bị
A
B
C
D

Các mẫu đất
1
2
3
4
-.307 -.294 .079 .019
-.176 .125 -.013 .082
.137 -.063 .240 -.050
-.042 .690 .201 .166

5
-.136
.091
.318
.219

6
-.324
.459
.154
.407

Bài 30. Các nhà nghiên cứu tiến hành thí nghiệm để so sánh hàm lượng tinh bột của
khoai tây trồng trên đất cát được bổ sung chất dinh dưỡng A, B, C. Nhóm A là
nhóm đối chứng (tưới bằng nước cất), nhóm B được cung cấp chất dinh dưỡng
Hoagland với nồng độ thấp và nhóm C được cung cấp chất dinh dưỡng Hoagland
với nồng độ cao. 18 cây khoai tây cùng một giống được bố trí ngẫu nhiên vào ba
nhóm và hàm lượng tinh bột ở cuống lá (µg/mg) được ghi nhận sau 25 ngày trồng
(bảng 5.6). Hãy phân tích phương sai để kiểm tra sự khác biệt về hàm lượng tinh
bột của cây thuộc ba nhóm.
Bảng 5.6. Hàm lượng tinh bột ở cuống lá khoai tây (µg/mg)
Chất dinh dưỡng
A

22

20

21

18

16

14

Chất dinh dưỡng B

12

14

15

10

9

6

Chất dinh dưỡng C

7

9

7

6

5

3

Bài 31. Bảng 5.7 trình bày số lượng trứng đẻ/ngày (trong 14 ngày đầu của chu kỳ
sống) của 75 con ruồi giấm cái (Drosophila melanogaster) thuộc 3 dòng. RS và SS

166


THỐNG KÊ SINH HỌC

là 2 dòng được chọn lọc cho tính kháng và tính mẫn cảm đối với DDT. NS là dòng
đối chứng không được chọn lọc.
Hãy kiểm tra hai giả thuyết:
a) Các dòng được chọn lọc (RS và SS) và dòng đối chứng (NS) không có sự khác
biệt về độ mắn đẻ (fecundity).
b) Dòng RS và dòng SS không có sự khác biệt về độ mắn đẻ.
Bảng 5.7. Số lượng trứng/ngày của 75 ruồi giấm cái thuộc 3 dòng
Kháng DDT (RS) Mẫn cảm với DDT (SS) Đối
(NS)
12.8
21.6
14.8
23.1
34.6
19.7
22.6
29.6
16.4
20.3
29.3
14.9
27.3

22.4
27.5
20.3
38.7
26.4
23.7
26.1
29.5
38.6
44.4
23.2
23.6

38.4
32.9
48.5
20.9
11.6
22.3
30.2
33.4
26.7
39
12.8
14.6
12.2

23.1
29.4
16
20.1
23.3
22.9
22.5
15.1
31
16.9
16.1
10.8

35.4
27.4
19.3
41.8
20.3
37.6
36.9
37.3
28.2
23.4
33.7
29.2
41.7

chứng
22.6
40.4
34.4
30.4
14.9
51.8
33.8
37.9
29.5
42.4
36.6
47.4

Bài 32.
Ba kiểu
gen khác nhau BB, Bb, bb của loài bọ cánh cứng Trilobium castaneum được nuôi ở
mật độ 20 con/1 gram bột. Trọng lượng khô (mg) của mỗi kiểu gen được ghi nhận ở
4 thời điểm khác nhau, mỗi thời điểm cách nhau vài tháng (bảng 5.8)
Bảng 5.8. Trọng lượng khô của 3 kiểu gen của bọ ghi nhận ở 4 thời điểm khác
nhau.
Thời điểm

Kiểu gen ( a = 3)

(b = 4)

BB

Bb

bb

1

0.958

0.986

0.925

2

0.971

1.051

0.952

3

0.927

0.891

0.829

4

0.971

1.01

0.955

Từ kết quả này hãy kiểm tra xem nhân tố A (kiểu gen) và nhân tố B (khối) có
ảnh hưởng đến trọng lượng bọ hay không.
Bài 33. Nhằm khảo sát sự sai khác trong tiêu thụ thức ăn khi mỡ tươi được thay
bằng mỡ ôi trong khẩu phần ăn của chuột, người ta bố trí thí nghiệm trên 12 con
chuột (6 đực, 6 cái) có độ tuổi từ 30 đến 34 ngày, mỗi khẩu phần ăn cho mỗi giới
167


BÙI TẤN ANH

gồm 3 chuột. Lượng thức ăn tiêu thụ (gram) trong suốt 73 ngày được ghi nhận trong
bảng 5.9.
Bảng 5.9. Lượng thức ăn được chuột tiêu thụ
Giới tính
Khẩu phần ăn
Mỡ tươi
Mỡ ôi
709
592

679
538
699
476
657
508

594
505
677
539
Bài 34. Thí nghiệm được tiến hành nhằm khảo sát 4 giống thủy tiên hoa vàng
(daffodil) trồng trên 6 địa điểm khác nhau. Số liệu ghi nhận là số ngày từ khi trồng
đến khi có 50% cây được thu hoạch. Kết quả được trình bày trong bảng 5.10
Bảng 5.10. Số ngày từ lúc trồng cây Thủy Tiên đến khi thu hoạch được 50%
Địa điểm
1
2
3
4
5
6

Giống A
43
46
46
42
40
37

Giống B
34
30
33
25
32
22

Giống C
36
35
28
27
29
28

Giống D
37
43
40
33
39
35

Bài 35. Để nghiên cứu ảnh hưởng của acid đến sự tăng trưởng của cỏ linh lăng
(alfalfa), người ta tiến hành trồng các cây cỏ linh lăng trong 15 chậu nhựa, và bố trí
thành 3 nghiệm thức: đối chứng, acid thấp, acid cao. Đồng thời để khảo sát ảnh
hưởng của lượng ánh sáng đến sự tăng trưởng của cây, người ta chia 15 chậu thành
5 nhóm và bố trí ngẫu nhiên 3 nghiệm thức vào mỗi nhóm. Chiều cao trung bình
của các cây trong mỗi chậu được ghi nhận sau 5 ngày trồng như trong bảng 5.11
Bảng 5.11 . Chiều cao trung bình của cỏ linh lăng sau 5 ngày trồng (cm)
Nhóm
1
2
3
4
5

Acid thấp
1.58
1.15
1.27
1.25
1.00

Acid cao
1.10
1.05
0.50
1.00
1.50

Đối chứng
2.47
2.15
1.46
2.36
1.00

Bài 36. Nhằm khảo sát ảnh hưởng của stress và cường độ sáng lên tăng trưởng của
cây đậu nành, thí nghiệm được bố trí ngẫu nhiên thành 4 nghiệm thức, mỗi nghiệm
168


THỐNG KÊ SINH HỌC

thức gồm 13 hạt đậu trồng trong 13 chậu. Để gây stress người ta cho chậu vào máy
lắc, mỗi ngày lắc 2 lần, mỗi lần 20 phút. Có thể tóm tắt bố trí thí nghiệm như sau:
Nghiệm thức 1: đối chứng, ánh sáng yếu
Nghiệm thức 2: stress, ánh sáng yếu
Nghiệm thức 3: đối chứng, ánh sáng trung bình
Nghiệm thức 4: stress, ánh sáng trung bình
Sau 16 ngày trồng, các cây được thu hoạch và đo tổng diện tích lá (cm 2) của mỗi
cây. Kết quả ghi nhận trong bảng sau:
NT 1

NT 2

NT 3

NT 4

264

235

314

283

200

188

320

312

225

195

310

291

268

205

340

259

215

212

299

216

241

214

268

201

232

182

345

267

256

215

271

326

229

272

285

241

288

163

309

291

256

230

337

269

288

255

282

282

230

202

273

257

Chương 6.
169


BÙI TẤN ANH

Bài 37. Webber (1955) nghiên cứu về tương quan giữa trọng lượng nhộng (mg) và
số lượng trứng có trong con cái của loài ruồi nhặng Lucilia cuprina, đã thu được kết
quả như sau:
Trọng lượng nhộng
Số lượng trứng

6.3
21.7
62
184

7.91
23.12
76
186

8.2
21.88
81
182

8.25
28.82
80
230

8.65
26.2
83
193

9.48
32
105
260

16.08

18.15

142

152

Trong trường hợp này, việc thiết lập phương trình hồi quy rất cần thiết để dự đoán
số lượng trứng từ trọng lượng nhộng vì về mặt kỹ thuật, việc cân để xác định trọng
lượng nhộng dễ dàng hơn việc mổ ruồi và đếm số lượng trứng.
a. Hãy xác định phương trình hồi quy tuyến tính đơn giản, kiểm tra độ tin cậy
thống kê của phương trình và các hệ số.
b. Ước lượng số trứng có ở nhộng cái cân nặng 25 mg. Xác định giới hạn tin cậy
95% (95% confidence limits) cho ước lượng của bạn.
Bài 38. Số liệu dưới đây là thân nhiệt của thỏ ghi nhận được ở những thời gian khác
nhau sau khi bị nhiễm virus.
Thời gian sau khi nhiễm (giờ) 24
Thân nhiệt (0F)
102.8

32
104.5

48
106.5

56
107

72
103.9

80
96
103.2 103.1

a) Biểu diễn tương quan giữa thân nhiệt và thời gian bằng biểu đồ XY. Nhận xét.
b) Ở bốn thời điểm đầu hãy thiết lập phương trình hồi quy. Vẽ đường hồi quy vào
biểu đồ ban đầu (xem hình bên dưới). Ước lượng xem thân nhiệt của thỏ là bao
nhiêu sau 50 giờ bị nhiễm virus.

Bài 39. Thí nghiệm được tiến hành trên loài bọ cánh cứng Tribolium castaneum.
Trứng bọ được cho vào trong cùng một môi trường ở bốn mật độ khác nhau (X = số

170


THỐNG KÊ SINH HỌC

lượng trứng /g môi trường) và tỉ lệ bọ sống sót ở từng mật độ (Y) được ghi nhận
như sau: (Y là % sống sót đã được chuyển dạng arcsine)

Sống
độ)

sót

5/g
61.68
58.37
69.3
61.68
69.3

(theo

Mật độ (X)
20/g
50/g
68.21
58.69
66.72
58.37
63.44
58.37
60.84

100/g
53.13
49.89
49.82

Hãy phân tích hồi quy và giải thích kết quả.
Bài 40. Bảng dưới đây ghi nhận sản lượng của cà chua (giạ) trồng trên 14 lô đất
giống nhau nhưng được bón phân với liều lượng khác khau (pound/lô). Hãy tìm mô
hình hồi quy thích hợp để biểu diễn mối quan hệ giữa sản lượng và với lượng phân
bón.

Sản
lượng
Lượng
phân

1

2

3

4

5

6

7

8

9

10

11

12

13

14

24

18

31

33

26

30

20

25

25

27

21

29

29

26

12

5

15

17

20

14

6

23

11

13

8

18

22

25

Bài 41. Trong một thí nghiệm về miễn dịch phóng xạ, một hormone có đồng vị
phóng xạ được cho vào ống nghiệm có chứa kháng thể đặc hiệu. Cả hai sẽ kết hợp
tạo thành phức hệ kháng nguyên-kháng thể. Để xác định mức độ phản ứng, người ta
đo số lượng hormone gắn vào kháng thể so với lượng hormone còn tự do. Với mỗi
lượng hormone cho vào (X), người ta ghi nhận tỉ lệ hormone gắn/hormone tự do
(Y). Kết quả được ghi nhận như sau:
X
0.00
0.25
0.50
0.75
1.00
1.25
1.50
1.75
2.00
2.25
2.50

Y
9.900
10.465
10.312
13.633
20.784
36.164
62.045
78.327
90.307
97.348
102.686

Hãy thiết lập biểu đồ cho dữ liệu trên và xác định phương trình hồi quy thích hợp.
Bài 42. Để nghiên cứu khả năng lan truyền bệnh trong không khí người ta bố trí
một thí nghiệm như sau: xịt dung dịch có chứa vi sinh vật gây bệnh vào một buồng
kín có sinh vật. Khả năng bình phục sau một thời gian xác định được tính dựa vào
171


BÙI TẤN ANH

% sống sót của sinh vật sau thí nghiệm. Thí nghiệm được tiến hành 13 lượt. Trong
mỗi lượt thí nghiệm, tỉ lệ sống sót của sinh vật được ghi nhận ở những thời gian
khác nhau. Kết quả thu được như trong bảng sau:
Thời 0
5
10
15
20
25
30
35
40
gian
% sống 70.6 52.0 33.4 22.0 18.3 15.1 13.0 10.0 9.1
sót

45

50

55

60

8.3

7.9

7.7

7.7

a. Dùng biểu đồ thích hợp để biểu diễn kết quả trên.
b. Do đồ thị không có dạng tuyến tính, hãy dùng phương pháp chuyển dạng số
liệu và xây dựng phương trình tuyến tính dựa trên số liệu đã chuyển dạng.(logY)
c. Kiểm tra giả thuyết tung độ gốc a = 0.

172



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay

×