Tải bản đầy đủ

phân tích hiệp phương sai và ứng dụng

TRƢỜNG ĐẠI HỌC CẦN THƠ
KHOA KHOA HỌC TỰ NHIÊN
BỘ MÔN TOÁN
------------

LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC

PHÂN TÍCH HIỆP PHƢƠNG SAI
VÀ ỨNG DỤNG

Giáo viên hƣớng dẫn

Sinh viên thực hiện

Ts. VÕ VĂN TÀI

NGUYỄN THỊ QUỲNH NHƢ

Bộ môn Toán-Khoa KHTN

Ngành: Toán Ứng Dụng K36


Cần Thơ-12/2013


Ket-noi.com
Ket-noi.com kho
kho tai
tai lieu
lieu mien
mien phi
phi

TRƢỜNG ĐẠI HỌC CẦN THƠ
KHOA KHOA HỌC TỰ NHIÊN
BỘ MÔN TOÁN
------------

LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC

PHÂN TÍCH HIỆP PHƢƠNG SAI
VÀ ỨNG DỤNG

Giáo viên hƣớng dẫn

Sinh viên thực hiện

Ts. VÕ VĂN TÀI

NGUYỄN THỊ QUỲNH NHƢ

Bộ môn Toán-Khoa KHTN

Ngành: Toán Ứng Dụng K36

Cần Thơ-12/2013


MỤC LỤC
Trang
LỜI CẢM ƠN .......................................................................................... iii


DANH MỤC CÁC BẢNG ...................................................................... iv
PHẦN MỞ ĐẦU ...................................................................................... 1
Chƣơng 1. PHÂN TÍCH PHƢƠNG SAI .................................................. 3
1.1 GIỚI THIỆU ................................................................................... 3
1.2 PHÂN TÍCH PHƢƠNG SAI ĐƠN BIẾN ...................................... 3
1.2.1 Phân tích phƣơng sai đơn biến một nhân tố ............................. 3
1.2.2 Phân tích phƣơng sai đơn biến hai nhân tố không tƣơng tác .... 5
1.2.3 Phân phƣơng sai đơn biến hai nhân tố tƣơng tác ..................... 8
1.3 PHÂN TÍCH PHƢƠNG SAI ĐA BIẾN ....................................... 11
1.3.1 Phân tích phƣơng sai đa biến một nhân tố .............................. 11
1.3.2 Phân tích phƣơng sai đa biến hai nhân tố .............................. 14
Chƣơng 2. PHÂN TÍCH HIỆP PHƢƠNG SAI ...................................... 18
2.1 GIỚI THIỆU ................................................................................ 18
2.2 PHÂN TÍCH HIỆP PHƢƠNG SAI ĐƠN BIẾN .......................... 19
2.2.1 Phân tích hiệp phƣơng sai đơn biến một nhân tố với một
biến covariate ......................................................................... 19
2.2.2 Phân tích hiệp phƣơng sai đơn biến hai nhân tố không tƣơng
tác và một biến covariate ........................................................ 27
2.2.3 Phân tích hiệp phƣơng sai đơn biến hai nhân tố tƣơng tác
và một biến covariate .............................................................. 31
2.3 PHÂN TÍCH HIỆP PHƢƠNG SAI ĐA BIẾN ............................. 41
2.3.1 Phân tích hiệp phƣơng sai đa biến một nhân tố với q biến
Covariates ............................................................................... 41
i


Ket-noi.com
Ket-noi.com kho
kho tai
tai lieu
lieu mien
mien phi
phi

2.3.2 Phân tích hiệp phƣơng sai đa biến hai nhân tố ....................... 45
Chƣơng 3. ỨNG DỤNG ......................................................................... 51
3.1 GIỚI THIỆU ................................................................................. 51
3.2 ỨNG DỤNG TRONG NÔNG NGHIỆP ...................................... 52
3.2.1 Bài toán 1 ................................................................................ 52
3.2.2 Giải quyết bài toán 1 ............................................................... 52
3.3 ỨNG DỤNG TRONG KINH TẾ ................................................. 54
3.3.1 Bài toán 2 ................................................................................ 54
3.3.2 Giải quyết bài toán 2 ............................................................... 54
3.4 ỨNG DỤNG TRONG Y HỌC ..................................................... 56
3.4.1 Bài toán 3 ................................................................................ 56
3.4.2 Giải quyết bài toán 3 ............................................................... 57
3.5 ỨNG DỤNG TRONG GIÁO DỤC .............................................. 59
3.5.1 Bài toán 4 ................................................................................ 59
3.5.2 Giải quyết bài toán 4 ............................................................... 59
KẾT LUẬN VÀ ĐỊNH HƢỚNG NGHIÊN CỨU ................................. 63
TÀI LIỆU THAM KHẢO ...................................................................... 64
PHỤ LỤC ............................................................................................... 65

ii


LỜI CẢM ƠN
----------

Qua thời gian dài học tập tại trƣờng Đại học Cần Thơ, Em đã đƣợc trang bị
những kiến thức bổ ích và quý báu từ quý Thầy Cô và bạn bè.
Em xin bầy tỏ lòng biết ơn và kính trọng nhất đến thầy Võ Văn Tài, ngƣời
đã trực tiếp hƣớng dẫn, chỉ bảo và động viên Em trong suốt quá trình thực hiện đề
tài.
Bên cạnh đó, Em xin gởi lời cảm ơn đến toàn thể quý Thầy Cô của bộ môn
Toán-Khoa Khoa học Tự nhiên. Em xin gởi lời cảm ơn đến thầy Trần Phƣớc Lộc,
Cố vấn học tập và các bạn sinh viên ngành Toán Ứng dụng đã trợ giúp rất nhiều
trong việc hoàn thành đề tài này.
Em xin cảm ơn hội đồng bảo vệ luận văn đã xem xét và điều chỉnh những
sai sót cũng nhƣ đóng góp ý kiến về những mặt còn hạn chế để đề tài đƣợc hoàn
thiện hơn.
Dù đã có nhiều cố gắng cùng với sự hƣớng dẫn tận tình của Thầy hƣớng
dẫn, song do trình độ còn hạn chế nên khó tránh khỏi sai sót. Rất mong nhận
đƣợc sự thông cảm và góp ý từ Thầy Cô và các bạn.

Cần Thơ, ngày 2 tháng 12 năm 2013

Nguyễn Thị Quỳnh Nhƣ

iii


Ket-noi.com
Ket-noi.com kho
kho tai
tai lieu
lieu mien
mien phi
phi

DANH MỤC CÁC BẢNG
Trang
Bảng 1.1 Bảng dữ liệu phân tích ANOVA một nhân tố ........................... 4
Bảng 1.2 Bảng tóm tắt phân tích ANOVA một nhân tố ........................... 5
Bảng 1.3 Bảng dữ liệu phân tích ANOVA hai nhân tố không
tƣơng tác .................................................................................... 6
Bảng 1.4 Bảng tóm tắt phân tích ANOVA hai nhân tố không
tƣơng tác .................................................................................... 8
Bảng 1.5 Bảng dữ liệu phân tích ANOVA hai nhân tố tƣơng tác ............ 8
Bảng 1.6 Bảng tóm tắt phân tích ANOVA hai nhân tố tƣơng tác .......... 11
Bảng 1.7 Bảng dữ liệu phân tích MANOVA một nhân tố ..................... 12
Bảng 1.8 Bảng tóm tắt phân tích MANOVA một nhân tố ..................... 14
Bảng 1.9 Bảng dữ liệu phân tích MANOVA hai nhân tố ....................... 15
Bảng 1.10 Bảng tóm tắt kết quả phân tích MANOVA hai nhân tố ........ 17
Bảng 2.1 Bảng dữ liệu phân tích ANCOVA một nhân tố ...................... 19
Bảng 2.2 Chiều cao và cân nặng trẻ em đƣợc phân theo giới tính ......... 24
Bảng 2.3 Bảng số liệu phân tích ANCOVA hai nhân tố không
tƣơng tác .................................................................................. 27
Bảng 2.4 Bảng số liệu phân tích ANCOVA hai nhân tố tƣơng tác ........ 31
Bảng 2.5 Bảng số liệu về năng suất lúa .................................................. 37
Bảng 2.6 Bảng dữ liệu phân tích MANCOVA hai nhân tố .................... 45
Bảng 3.1 Bảng kiểm định giá trị phƣơng sai sai số ................................ 52
Bảng 3.2 Bảng kiểm định giả thiết H 01 , H 02 trong ANCOVA ............... 52
Bảng 3.3 Bảng kiểm định H 03 sự tƣơng tác giữa nhân tố và biến
Covariate ................................................................................. 53
Bảng 3.4 Bảng kiểm định giả thiết trong phân tích ANOVA................. 53

iv


Bảng 3.5 Bảng kiểm định bằng nhau của ma trận hiệp phƣơng sai ....... 54
Bảng 3.6 Bảng kiểm định giả thiết phân tích MANCOVA một
nhân tố ..................................................................................... 54
Bảng 3.7 Bảng kiểm định của nhân tố với biến x1 .................................. 55
Bảng 3.8 Bảng kiểm định của nhân tố với biến x2 .................................. 56
Bảng 3.9 Bảng kiểm định phƣơng sai sai số ........................................... 57
Bảng 3.10 Bảng kiểm định giả thiết H 01 , H 02 trong phân tích
MANCOVA ........................................................................... 57
Bảng 3.11 Bảng kiểm định ảnh hƣởng tƣơng tác giữa nhóm và x1 ........ 58
Bảng 3.12 Bảng kiểm định ảnh hƣởng tƣơng tác giữa nhóm và x2 ........ 58
Bảng 3.13 Bảng kiểm định sự bằng nhau của ma trận hiệp phƣơng sai . 60
Bảng 3.14 Bảng kiểm định các giả thiết thống kê MANCOVA ............ 60
Bảng 3.15 Bảng kiểm định sự tƣơng tác giữa giới tính và độ tuổi ......... 61
Bảng 3.16 Bảng kiểm định sự tƣơng tác giữa năm và độ tuổi ............... 61
Bảng 3.17 Bảng kiểm định tƣơng tác giữa nhân tố năm, giới tính
và tuổi .................................................................................... 62

v


Ket-noi.com
Ket-noi.com kho
kho tai
tai lieu
lieu mien
mien phi
phi

PHẦN MỞ ĐẦU
GIỚI THIỆU
Trong phân tích và xử lý số liệu, ta thƣờng quan tâm đến mô hình phân tích
hồi qui và phân tích phƣơng sai. Trong đó phân tích phƣơng sai đƣợc xem nhƣ
một công cụ để thực hiện việc so sánh trung bình của hai hay nhiều tổng thể dựa
trên giá trị trung bình của mẫu quan sát. Các tính toán trong phân tích phƣơng sai
liên quan đến sự phân chia tổng phƣơng sai tổng thể thành các thành phần
phƣơng sai bên trong nhóm và phƣơng sai giữa các nhóm. Thành phần bên trong
nhóm cho ta ƣớc lƣợng phƣơng sai sai số, trong khi các thành phần giữa các
nhóm ƣớc lƣợng phƣơng sai do ảnh hƣởng của các nhân tố đang xét. Tỷ số
phƣơng sai giữa các nhóm với phƣơng sai bên trong nhóm cho ta một kiểm
nghiệm đối với giả thiết cho rằng tất cả các trung bình đều bằng nhau. Trái lại,
phân tích hồi qui chủ yếu đƣợc sử dụng để tìm mối quan hệ giữa các biến, chúng
ta có thể ƣớc lƣợng hình thức mối quan hệ giữa một biến đáp ứng và một biến
độc lập.
Phân tích hiệp phƣơng sai là sự kết hợp cả hai phƣơng pháp trên. Phƣơng
pháp này đƣợc R.A.Fisher sử dụng lần đầu tiên trong bài báo nghiên cứu (1932),
Ông xem đây là một kỹ thuật “kết hợp những ƣu điểm và dung hòa các yêu cầu
của hai phƣơng thức đƣợc áp dụng rộng rãi và đƣợc biết dƣới tên là hồi qui và
phân tích phƣơng sai”.
Phân tích hiệp phƣơng sai là một hƣớng nghiên cứu mới trong nhiều lĩnh
vực do nó là sự mở rộng của mô hình phân tích phƣơng sai. Mục tiêu chính của
phân tích hiệp phƣơng sai là đạt đƣợc độ chính xác bởi giảm tổng bình phƣơng
sai số và mục tiêu thứ hai là giảm tác động của các nhân tố mà ngƣời thực hiện thí
nghiệm không kiểm soát đƣợc. Từ đó, việc nghiên cứu ảnh hƣởng của các nhân tố
đến biến đáp ứng chính xác hơn.
I.

BỐ CỤC LUẬN VĂN
Bố cục luận văn gồm phần mở đầu, phần nội dung, phần kết luận, phần tài
liệu tham khảo và phần phụ lục. Phần nội dung luận văn gồm 3 chƣơng:
II.

Chương 1. Phân Tích Phương Sai
Trình bày một số mô hình phân tích phƣơng sai thông dụng nhƣ phân tích
phƣơng sai một nhân tố, phân tích phƣơng sai hai nhân tố,… Đây cũng là cở sở
cho việc hình thành phƣơng pháp phân tích hiệp phƣơng sai.

1


Chương 2. Phân tích hiệp phương sai
Trình bày cở sở lý thuyết của các mô hình phân tích hiệp phƣơng sai nhƣ
phân tích hiệp phƣơng sai đơn biến, phân tích hiệp phƣơng sai đa biến,… Bên
cạnh đó còn trình bày một vài ví dụ đƣợc thực hiện thủ công dựa trên cở sở lý
thuyết đã trình bày.
Chương 3. Ứng dụng
Dựa vào những mô hình đã phân tích ở chƣơng 2, chƣơng này đƣa ra một
số ứng dụng của phân tích hiệp phƣơng sai dựa trên số liệu thực tế trong các lĩnh
vực nhƣ giáo dục, nông nghiệp, y học và kinh tế.

2


Ket-noi.com
Ket-noi.com kho
kho tai
tai lieu
lieu mien
mien phi
phi

Chƣơng 1

PHÂN TÍCH PHƢƠNG SAI
1.1 GIỚI THIỆU
Giả sử chúng ta cần nghiên cứu, phân tích sự biến động của một tổng thể
thông qua một biến ngẫu nhiên (chỉ tiêu nghiên cứu). Thông thƣờng chúng ta có
các bài toán ƣớc lƣợng, kiểm định giả thiết về giá trị tham số và quy luật phân
phối xác suất của biến ngẫu nhiên, tuy nhiên phƣơng pháp kiểm định, so sánh
tham số đó chỉ sử dụng đƣợc khi sự biến động của biến ngẫu nhiên đó chỉ chịu tác
động của một nhân tố và cũng ở một hoặc tối đa hai mức cố định. Nếu biến đó
đƣợc tạo nên do nhiều nhân tố cùng tác động hoặc do nhiều nhân tố nhƣng ở mức
tác động khác nhau thì phải tiến hành phân tích phƣơng sai mới thấy đƣợc vai trò
ảnh hƣởng của từng mức nhân tố (nếu có) trong việc tạo nên sự biến đổi, sự sai
khác đó.
Nhân tố đƣợc hiểu là các yếu tố, điều kiện khách quan (thời tiết, khí hậu,
thiên tai,…) hoặc chủ quan (phƣơng pháp thí nghiệm, giống cây trồng,…) có tác
động trực tiếp đến sự biến động của biến ngẫu nhiên mà ta nghiên cứu.
Quan điểm của phân tích phƣơng sai là việc khai triển phƣơng sai của biến
ngẫu nhiên (X) thành tổng của những phƣơng sai của những biến ngẫu nhiên
thành phần độc lập, mà mỗi cái trong chúng đặc trƣng cho sự ảnh hƣởng của yếu
tố này hay yếu tố khác hoặc tác dụng chung giữa chúng. So sánh những phƣơng
sai này cho phép ta đánh giá sự tồn tại ảnh hƣởng của các yếu tố đó với biến ngẫu
nhiên (X) đang xét.
1.2 PHÂN TÍCH PHƢƠNG SAI ĐƠN BIẾN
1.2.1 Phân tích phƣơng sai đơn biến một nhân tố
Phân tích phƣơng sai đơn biến một nhân tố đƣợc dùng để kiểm định giả thiết
các tổng thể nhóm (tổng thể bộ phận) có giá trị trung bình bằng nhau. Kỹ thuật
này dựa trên cơ sở tính toán mức độ biến thiên trong nội bộ các nhóm và biến
thiên giữa các trung bình nhóm. Dựa trên hai ƣớc lƣợng này của mức độ biến
thiên ta có thể rút ra kết luận về mức độ khác nhau giữa các trung bình nhóm.
Hay nói cách khác ta phân tích ảnh hƣởng của một nhân tố nguyên nhân đến một
nhân tố kết quả.

3


a) Mô hình
Giả sử xét mẫu ngẫu nhiên đƣợc tạo bởi một yếu tố A tác động gồm m mức
đƣợc cho bởi bảng sau:
Bảng 1.1 Bảng dữ liệu phân tích ANOVA một nhân tố
STT quan sát

A1

A2

A3



Am

1

X 11

X 21

X 13



X 1m

2

X 21

X 22

X 23



X 2m

3

ni

X 31

X n11

X 23

X n2 2

X 33

X n3 3





X 3m

Xnmm

Giả thiết rằng các quan sát X ij ( i  1,..., n j ; j  1, m ) có phân phối chuẩn N ( , 2 ) .
Ứng với mỗi mức nhân tố i ta có biến ngẫu nhiên X i và chúng cũng tuân theo quy
luật phân phối chuẩn. Khi đó mô hình phân tích ANOVA một nhân tố có dạng:
X ij   +i   ij
Trong đó
X ij là biến đáp ứng,

 là trung bình tất cả các X ij ,

 i là mức tác động thứ i của nhân tố A,
 ij là phần dƣ.

b) Các bƣớc thực hiện
* Chọn giả thiết và đối thiết:
H 0 : 1  2  ...  m  

H1 : Có ít nhất một cặp kỳ vọng khác nhau
* Tính các tham số đặc trưng:
1 n
X i   X ij : Trung bình mẫu thứ i,
ni j 1
i

ni

m

X .. 

 X
i 1 j 1
m

n

: Trung bình tất cả các X ij .

i

i 1

m

ij

ni

SST   ( X ij  X .. )2 : Tổng bình phƣơng chung, phản ánh biến thiên của
i 1 j i

biến đáp ứng do chịu ảnh hƣởng của tất cả các nhân tố.

4


Ket-noi.com
Ket-noi.com kho
kho tai
tai lieu
lieu mien
mien phi
phi

m

SSB   ni ( X i  X .. )2 : Tổng bình phƣơng giữa các mẫu, phản ánh biến
i 1

thiên của biến đáp ứng do chịu ảnh hƣởng của nhân tố đang nghiên cứu.
m

ni

SSE   ( X ij  X i )2 : Tổng bình phƣơng trong nội bộ mẫu, phản ánh biến
i 1 j 1

thiên của biến đáp ứng do chịu ảnh hƣởng của các nhân tố không nghiên cứu.
Khi đó SST  SSB  SSE .
SSB
MSFB
* Giá trị quan sát: F 
 m 1
SSE
MSE
N m
Trong đó
SSB
, với n-1 là bậc tự do của nhân tố,
MSFB 
n 1
SSE
MSE 
, với N-m là bậc tự do của sai số.
N m
* Trả lời:
Bác bỏ giả thiết H 0 nếu F  F ( m1, N m) .
Trong đó F ( m1, N m) là phân vị Fisher với mức ý nghĩa  và bậc tự do

 m  1, N  m  .
Bảng 1.2 Bảng tóm tắt phân tích ANOVA một nhân tố
Nguồn biến
động

Tổng bình phƣơng

Giữa các mẫu
(nhân tố)

SSB   ni ( X i  X .. )2

Trong nội bộ
mẫu (sai số)

SSE   ( X ij  X i )2

Bậc tự
do

Trung
bình bình
phƣơng

m-1

MSFB

N-m

MSE

Giá trị quan sát

m

i 1
m

ni

i 1 j 1

SSB
MSFB
F
 n 1
SSE
MSE
N m

 Chú ý: Để thực hiện được phân tích phương sai một nhân tố, ta cần quan tâm
một số điều kiện sau:
+  ij có phân phối chuẩn N (  , 2 ) ,
+ Các nhóm so sánh phải đƣợc đƣợc chọn một cách ngẫu nhiên và độc lập,
+ Các nhóm so sánh phải có phân phối chuẩn hoặc cỡ mẫu đủ lớn,
+ Phƣơng sai các nhóm so sánh phải đồng nhất.

5


1.2.2 Phân tích phƣơng sai đơn biến hai nhân tố không tƣơng tác
Phƣơng pháp phân tích phƣơng sai hai nhân tố là phƣơng pháp ƣớc tính sự
ảnh hƣởng của hai nhân tố thay vì một nhân tố nhƣ trƣớc đó.
a) Mô hình
Giả sử ta có biến ngẫu nhiên X ij có phân phối chuẩn chịu sự ảnh hƣởng
của nhân tố A có m mức ( i  1, m ) và nhân tố C có n mức ( j  1, n ). Cụ thể ta có
bảng số liệu sau:
Bảng 1.3 Bảng dữ liệu phân tích ANOVA hai nhân tố không tƣơng tác
Nhân tố C
C2
C1

Nhân tố A
X 11
A1
X 12

A2
X 21
X 22


Am


X m1


X m2




Cn

X 1n
X 2n

X mn

Giả thiết rằng A và C cùng tác động lên X nhƣng theo một cách riêng rẽ. Ta có
mô hình ANOVA 2 nhân tố không tƣơng tác nhƣ sau:
X ij    ij  ij   ij
Trong đó
X ij là biến đáp ứng,

 là trung bình của tất cả các giá trị X ij ,
 ij là mức tác động thứ i của nhân tố A,

 ij là mức tác động thứ j của nhân tố B,
 ij là phần dƣ và  ij ~ N (0, 2 ) .

b) Các bƣớc thực hiện
* Chọn giả thiết và đối thiết:
H 0A : 1   2  ...   m  

; H1A :  i  

H 0C : 1   2  ...   n  

; H1C :  j  

* Tính các tham số đặc trưng:
Ta đặt
1 n
X i.   X ij : Trung bình hàng thứ i,
n j 1

X. j 

1 m
 X ij : Trung bình cột thứ j,
m i 1
6


Ket-noi.com
Ket-noi.com kho
kho tai
tai lieu
lieu mien
mien phi
phi

X .. 

1 m
1 n
1 n m
X

X

 i. n 
 X ij : Trung bình tất cả số liệu.
.j
m i 1
n.m j 1 i 1
j 1
m

n

SST   ( X ij  X .. )2 : Tổng bình phƣơng chung, SST phản ánh biến thiên
i 1 j i

của biến đáp ứng do chịu ảnh hƣởng của tất cả các nhân tố.
m

n

m

SSA   ( X i.  X .. )2  n ( X i.  X .. )2 : Tổng bình phƣơng giữa các hàng.
i 1 j 1

i 1

SSA phản ánh biến thiên của biến đáp ứng do chịu ảnh hƣởng của nhân tố A.
m

n

n

SSC   ( X . j  X .. )2  m ( X . j  X .. )2 : Tổng bình phƣơng giữa các cột.
i 1 j 1

j 1

SSC phản ánh biến thiên của biến đáp ứng do chịu ảnh hƣởng của nhân tố C.
m

n

SSE   ( X ij  X i.  X . j  X .. )2 : Sai số ngẫu nhiên. SSE phản ánh biến
i 1 j 1

thiên của biến đáp ứng do chịu ảnh hƣởng của các nhân tố không nghiên cứu.
Khi đó SST  SSA  SSC  SSE .
MSFA
m 1
* Giá trị quan sát cho H 0A là FA 
MSE
(m  1)(n  1)

MSFC
n 1
* Giá trị quan sát cho H 0C là FC 
MSE
(m  1)(n  1)
Trong đó

SSA
, với (m  1) là bậc tự do của A,
m 1
SSC
MSFC 
, với (n  1) là bậc tự do của C,
n 1
SSE
MSE 
, với (m  1)(n  1) là bậc tự do của sai số.
(m  1)(n  1)
MSFA 

* Trả lời:

Bác bỏ giả thiết H 0A nếu FA  F

Trong đó F

 m 1),( m 1)( n 1

( m1),( m1)( n 1)

.

là phân vị Fisher với mức ý nghĩa  và bậc tự do

(m  1),(m  1)(n  1) .
Bác bỏ giả thiết H 0C nếu FC  F

( n 1),( m 1)( n 1)

7

.


Trong đó F( n1),( m1)( n1) là phân vị Fisher với bậc tự do  và bậc tự do

(n  1),(m  1)(n  1) .
Bảng 1.4 Bảng tóm tắt phân tích ANOVA hai nhân tố không tƣơng tác
Nguồn
Tổng bình phƣơng
Bậc tự do
Giá trị quan sát
biến động
MSFA
m
Nhân tố
m 1
FA 
SSA  n ( X i.  X .. )2
m-1
MSE
hàng (A)
i 1
(m  1)(n  1)
MSFC
n
Nhân tố
n 1
FC 
SSC  m ( X . j  X .. )2
n-1
MSE
cột (C)
j 1
(m  1)(n  1)
m

n

SSE   ( X ij  X i.  X . j  X .. )2

Sai số

i 1 j 1

m

ni

SST   ( X ij  X .. )2

Tổng

(m-1)(n-1)
N-1

i 1 j i

1.2.3 Phân tích phƣơng sai đơn biến hai nhân tố tƣơng tác
a) Mô hình
Giả sử có hai yếu tố A, C tác động. Yếu tố A có m mức tác động, yếu tố C có
n mức tác động và giả sử mỗi ô (i,j) chịu tác động bởi AC
i j có số quan sát nhƣ





nhau. Với X ijk i  1, m; j  1, n; k  1, l là quan sát thứ k trên hàng i và cột j.
Giả sử các X ijk có phân phối chuẩn N (  , 2 ) , kỳ vọng EXijk   , DX ijk   2 .
Ta có bảng dữ liệu sau:
Bảng 1.5 Bảng dữ liệu phân tích ANOVA hai nhân tố tƣơng tác
Nhân tố C
C2
C1

Nhân tố A
X121... X12l
A1
X111... X11l

A2
X 211... X 21l
X 221... X 22l


Am


X m11... X m1l


X m 21... X m 2l




Mô hình phân tích ANOVA hai nhân tố tƣơng tác có dạng:
X ij    i   j   ij   ij
Trong đó

8

Cn

X1n1... X1nl
X 2 n1... X 2 nl

X mn1... X mnl


Ket-noi.com
Ket-noi.com kho
kho tai
tai lieu
lieu mien
mien phi
phi

X ij là biến đáp ứng,

 là trung bình của tác cả các giá trị của X ij ,

 i là mức tác động thứ i của nhân tố A,
 j là mức tác động thứ j của nhân tố C,

 ij là mức tác động thức ij của nhân tố tƣơng tác AC,
 ij là phần dƣ và  ij ~ N (0,  2 ) .
Để kiểm tra sự tƣơng tác giữa hai nhân tố, ta đặt:
ij .  EXij : Trung bình của AC
i j,

i.. 

1 n
 ij . : Trung bình của Ai ,
n j 1

. j . 

1 m
 ij. : Trung bình của Ci ,
m i 1



1 m
1 n


. j . : Trung bình của biến đáp ứng đang nghiên cứu,
 i.. n 
m i 1
j 1

i  i..   : Ảnh hƣởng của nhân tố hàng,
i  . j .   : Ảnh hƣởng của nhân tố cột,

 ij  ij.  [  (i..   )  (. j.   )] : Tƣơng tác giữa hàng i và cột j.
Khi đó ij .  i   j   ij   và X ijk ~ N (i   j   ij   , 2 ) .
b) Các bƣớc thực hiện
* Chọn giả thiết và đối thiết:

H 0A : 1   2  ...   m  0; H1A : i  0
H 0C : 1  2  ...  n  0; H1C :  j  0
H 0AC :  ij  0;

H1AC :  ij  0

* Tính các tham số đặc trưng:

1 l
X ij .   X ijk : Trung bình các phần tử ở hàng i cột j,
l i 1
1 n l
X i ..   X ijk : Trung bình tất cả các phần tử ở hàng i,
n.l j 1 k 1
1 m l
X . j. 
 X ijk : Trung bình tất cả các phần tử tử cột j,
m.l i 1 k 1

9


1 m n l
 X ijk : Trung bình tất cả các phần tử.
m.n.l i 1 j 1 i 1

X ... 

 Chú ý:

X i..  X ... : Ƣớc lƣợng của  i .
X . j .  X ... : Ƣớc lƣợng của  j .
X ij .  X i.  X . j .  X ... : Ƣớc lƣợng của  ij .
m

n

l

SST   ( X ijk  X ... )2 : Tổng bình phƣơng chung,
i 1 j 1 i 1
m

n

l

m

SSA   ( X i..  X ... )2  nl  ( X i..  X ... )2 : Tổng bình phƣơng giữa các hàng,
i 1 j 1 i 1

m

n

i 1

l

n

SSC   ( X . j .  X ... )2  ml  ( X i..  X ... )2 : Tổng bình phƣơng giữa các cột,
i 1 j 1 i 1
m

n

j 1

l

m

n

SSAC   ( X ij .  X i..  X . j .  X ... )2  l  ( X ij .  X i..  X . j .  X ... ) 2 : Tổng
i 1 j 1 i 1

i 1 j 1

bình phƣơng tƣơng tác,
m

n

l

SSE   ( X ijk  X ij . )2 : Tổng bình phƣơng sai số.
i 1 j 1 i 1

Khi đó SST  SSA  SSA  SSAE  SSE .

SSA
(m  1)
* Giá trị quan sát cho H 0A là FA 
SSE
mn(l  1)
SSC
(n  1)
* Giá trị quan sát cho H 0C là FC 
SSE
mn(l  1)
SSAC
(m  1)(n  1)
* Giá trị quan sát cho H 0AC là FAC 
SSE
mn(l  1)
Trong đó

MSFA 

SSA
, (m  1) : Bậc tự do của A,
m 1
10


Ket-noi.com
Ket-noi.com kho
kho tai
tai lieu
lieu mien
mien phi
phi

SSC
, (n  1) : Bậc tự do của C,
n 1
SSE
, m.n(l  1) : Bậc tự do của sai số,
MSE 
m.n(l  1)

MSFC 

MSFAC 

SSAC
, (m  1)(n  1) : Bậc tự do của AC.
(m  1)(n  1)

*Trả lời:
Bác bỏ giả thiết H 0A và H 0C nếu FA  F
Trong đó F

( m 1)( mn ( l 1)

và F

( n 1),( mn ( l 1)

( m1)( mn ( l 1)

và FC  F

( n 1),( mn ( l 1)

.

có phân vị Fisher với mức ý nghĩa  và

bậc tự do lần lƣợt là (m  1), mn(l  1) và (n  1), mn(l  1) .
Bác bỏ giả thiết H 0AC nếu FAC  F
Trong đó F

( m 1)( n 1), mn ( l 1)

( m 1)( n 1), mn ( l 1)

.

có phân vị Fisher với mức ý nghĩa  và bậc tự do

(m  1)(n  1), mn(l  1) .
Bảng 1.6 Bảng tóm tắt phân tích ANOVA hai nhân tố tƣơng tác
Nguồn biến động Tổng bình phƣơng
Độ tự do
Giá trị quan sát F
SSA
(m  1)
FA 
Nhân tố A
SSA
m-1
SSE
mn(l  1)
SSC
(n  1)
FC 
Nhân tố C
SSC
n-1
SSE
mn(l  1)
SSAC
(m  1)(n  1)
Nhân tố AC
SSAC
(m-1)(n-1) FAC 
SSE
mn(l  1)

1.3 PHÂN TÍCH PHƢƠNG SAI ĐA BIẾN (MANOVA)
1.3.1 Phân tích phƣơng sai đa biến một nhân tố
Phân tích phƣơng sai đa biến một nhân tố là phân tích ảnh hƣởng của một
nhân tố nguyên nhân đến nhiều yếu tố kết quả.

11


a) Mô hình
Giả sử có m mẫu ngẫu nhiên với cỡ mẫu tƣơng ứng là n1 , n2 ,..., nm và các dữ
m

liệu lấy từ N   ni biến ngẫu nhiên độc lập. Trong đó X ij ~ N p ( i , ) ,
i 1

(i  1, m; j  1, ni ) . Ta có bảng dữ liệu sau:
Bảng 1.7 Bảng dữ liệu phân tích MANOVA một nhân tố
Mẫu 1

Mẫu 2



Mẫu m

X 111 , X 112 ,... X 11 p

X 211 , X 212 ,... X 21 p



X m11 , X m12 ,... X m1 p

X 121 , X 122 ,... X 11 p

X 221 , X 222 ,... X 22 p



X m 21 , X m 22 ,... X m 2 p









X 1n 1 , X 1n 2 ,... X 1n p
1

1

1

X 2 n 1 , X 2 n 2 ,... X 2 n p
2

2

2



X mn 1 , X mn 2 ,... X mn
m

m

mp

Mô hình phân tích MANOVA một nhân tố có dạng:

X ij    i   ij
Trong đó mỗi quan sát X ij là một véc tơ ngẫu nhiên p chiều, có cùng  là ma trận
hiệp phƣơng sai. Cụ thể X ij có dạng:

 X ij1 


X ij2 

,   Cov( X ij , X ijT )  E[X ij  EX ij ][X ij  EX ij ]T ,
X ij 
 ... 


X 
 ijp 
 1 
 
2
    : Véc tơ trung bình của tất cả các véc tơ X ij ,
 ... 
 
 p 
  i1 
 
i2
 i    : Mức tác động thứ i của nhân tố đang xét,
 ... 
 
  ip 

 ij : Sai số ngẫu nhiên.

12


Ket-noi.com
Ket-noi.com kho
kho tai
tai lieu
lieu mien
mien phi
phi

b) Các bƣớc thực hiện
* Chọn giả thiết và đối thiết:

H 0 : 1  2  ...  m  
H 1 : i  
Cụ thể

 m1 
 11   21 

  
12   22 
m 2 


H0 :

 ... 
 ... 
 ...   ... 


  

 1 p   2 p 
 mp 
* Tính các tham số đặt trưng:

X i. 

1 n
 X ij : Trung bình mẫu thứ i,
ni j 1
i

1 m n
X  X 2.  ...  X m.
X ..   X ij  1.
: Trung bình tất cả số liệu.
N i 1 j 1
m
i

X i . , X .. là các véc tơ ngẫu nhiên p chiều có dạng:

 X i.1 


X i.2 

X i.  
,
... 


X 
 i. p 
m

 X ..1 


X ..2 

X ..  
... 


X 
 .. p 

ni

m

B   ( X i.  X .. )( X i.  X .. )T   ni ( X i.  X .. )( X i.  X .. )T : Ma trận tổng
i 1 j 1

i 1

bình phƣơng và tích chéo giữa các mẫu. Ma trận B có độ tự do m-1.
m

ni

E   ( X ij  X i . )( X ij  X i . )T : Ma trận tổng bình phƣơng và tích chéo
i 1 j 1

trong nội bộ mẫu. Ma trận E có độ tự do là N-m.
* Giá trị quan sát cho H 0 là  

E
EB

Trong đó E là định thức của ma trận E, E  B là ma trận tổng bình phƣơng và
tích chéo chung.
 Chú ý: Việc đưa ra thống kê kiểm định giả thiết H 0 trên là dựa vào định lý
kiểm định tỷ số hợp lý của thống kê Wilk sau đây:

13


 Định lý kiểm định tỷ số hợp lý của thống kê Wilk
Nếu Yij (i  1,2,..., k ; j  1,2,..., n) là các quan sát độc lập từ N p ( i , ) thì tỷ số
hợp lý cho thống kê kiểm định H 0  1  2  ...  m   có thể được biểu diễn:



E
EB

Trong đó
k

n

E   (Yij  Yi . )(Yij  Yi . )T ,
i 1 j 1
k

B  n (Yi.  Y.. )(Yi.  Y.. )T ,
i 1

1 n
 Yij (i  1, k ),
n j 1
1 k n
1 k
Y..   Yij   Yi . .
kn i 1 j 1
k i 1
Yi . 

* Trả lời: Bác bỏ giả thiết H 0 nếu   p ,m1, N m .
Trong đó p ,m1, N m là phân vị Wilk với mức ý nghĩa  và bậc tự do là
( p, m  1, N  m ).

 Nhận xét: Ta có thể đưa bài toán MANOVA một nhân tố về p bài toán ANOVA
một nhân tố.
Bảng 1.8 Bảng tóm tắt phân tích MANOVA một nhân tố
Ma trận tổng bình
Nguồn biến động
Độ tự do Giá trị quan sát 
phƣơng và tích chéo
Giữa các mẫu

B

m-1

Trong nội bộ mẫu

E

N-m



E
EB

1.3.2 Phân tích phƣơng sai đa biến hai nhân tố
Phân tích phƣơng sai đa biến hai nhân tố là phân tích ảnh hƣởng của hai
nhân tố nguyên nhân ảnh hƣởng đến nhiều kết quả.
a) Mô hình
Tƣơng tự nhƣ phân tích ANOVA hai nhân tố, ta giả sử biến đáp ứng X ij chịu
ảnh hƣởng bởi hai nhân tố A và C. Nhân tố A đƣợc xem xét ở các mức
A1 , A2 ,..., Am và nhân tố C đƣợc xem xét ở các mức C1 , C2 ,..., Cn .

14


Ket-noi.com
Ket-noi.com kho
kho tai
tai lieu
lieu mien
mien phi
phi

Bảng 1.9 Bảng dữ liệu phân tích MANOVA hai nhân tố
Nhân tố C
C1
C2
Nhân tố A

A1
A2

X 111... X 11l
X 211... X 21l

X 121... X 12l
X 221... X 22l

...





Am

X m11... X m1l

X m 21... X m 2l

...

Cn



X 1n1... X 1nl
X 2 n1... X 2 nl







X mn1... X mnl

Mô hình phân tích MANCOVA hai nhân tố có dạng:
X ijk    i   j   ij   ijk
Trong đó

X ijk

 X ijk 1 


X ijk 2 

i  1, m ; j  1, n ; k  1, l : Véc tơ ngẫu nhiên có phân phối

... 


X 
 ijkp 





chuẩn p chiều, độc lập và có cùng ma trận hiệp phƣơng sai  .

 1 
 
2
    : Véc tơ trung bình của tất cả các véc tơ X ij ,
 ... 
 
 p 
  i1 
 
i2
 i    : Mức tác động thứ i của nhân tố A,
 ... 
 
  ip 

  j1 


 j2 

 j    : Mức tác động thứ j của nhân tố C,
...


 
 jp 
  ij1 
 
 ij2
 ij    : Mức tác động thứ i của nhân tố A và mức tác động thứ j của
...
 
 
 ijp 
15


nhân tố C,

 ijk : Véc tơ sai số ngẫu nhiên.
b) Các bƣớc thực hiện
* Chọn giả thiết và đối thiết:

  m1   0 
 11    21 



 


 22 
 m2   0 
A  12 


H0 :

 ... 
   ; H1A :  ip   0
 ...   ... 
 ...   ... 

  

 




1
p
2
p
mp

 


 0 
  n1   0 
 11    21 



    22 
n2   0 
C  12 

H0 :

 ... 
   ; H1C :   jp   0
 ...   ... 
 ...   ... 

  

 

 1 p    2 p 
  np   0 

  ij1   0 
   

0
AC  ij2 
H0 :     ;
 ... 
...
   
   0 
 ijp 

H1AC :   ijp   0

* Tính các tham số đặc trưng:
1 l
X ij   X ijk : Trung bình các phần tử ở hàng i cột j,
l k 1

X i.. 

1 n l
 X ijk : Trung bình tất cả các phần tử ở hàng i,
n.l j 1 k 1

X . j. 

1 m l
 X ijk : Trung bình tất cả các phần tử ở cột j,
m.l i 1 k 1

X ... 

1 m n l
 X ijk : Trung bình tất cả các phần tử.
m.n.l i 1 j 1 k 1
m

A   ( X i..  X ... )( X i..  X ... )T  nl  ( X i..  X ... )( X i..  X ... )T : Ma trận
i

j

i 1

k

tổng bình phƣơng và tích chéo giữa các hàng. Ma trận A có bậc tự do là (m  1) .
n

C   ( X . j .  X ... )( X . j .  X ... )T  ml  ( X . j .  X ... )( X . j .  X ... )T : Ma trận
i

j

j 1

k

tổng bình phƣơng và tích chéo giữa các cột. Ma trận C có bậc tự do là (n  1) .
16


Ket-noi.com
Ket-noi.com kho
kho tai
tai lieu
lieu mien
mien phi
phi

AC   ( X ijk  X i..  X . j .  X ... )( X ijk  X i..  X . j .  X ... )T
i

j
m

k
n

 l  ( X ijk  X i..  X . j .  X ... )( X ijk  X i..  X . j .  X ... )T : Ma trận tổng
i 1 j 1

bình phƣơng và tích chéo tƣơng tác. Ma trận AC có bậc tự do là (m  1)(n  1) .

E   ( X ijk  X ij. )( X ijk  X ij. )T : Ma trận sai số. Ma trận E có bậc tự do
i

j

k

là mn(l  1) .

T   ( X ijk  X ... )( X ijk  X ... )T : Ma trận tổng bình phƣơng và tích chéo
i

j

k

chung. Ma trận T có bậc tự do là mnl .
Ma trận T đƣợc phân tích nhƣ sau: T  A  C  AC  E .
Ta có bảng tóm tắt kết quả phân tích MANOVA hai nhân tố nhƣ sau:
Bảng 1.10 Bảng tóm tắt kết quả phân tích MANOVA hai nhân tố
Nguồn
Ma trận tổng
Giá trị quan
biến
Bậc tự do bình phƣơng
Miền bác bỏ
sát 
động
và tích chéo
E
A 
 A  p,( m1),mn(l 1)
Hàng
m-1
A
EA
Cột

n-1

C

Tƣơng
tác

(m-1)(n-1)

AC

Sai số

mn(l-1)

E

C 
  AC

17

E
E C
E
E  AC

C  p ,( n1),mn(l 1)

 AC  p,( m1)( n1),mn(l 1)


Chƣơng 2

PHÂN TÍCH HIỆP PHƢƠNG SAI
2.1 GIỚI THIỆU
Phân tích hiệp phƣơng sai là phƣơng pháp phân tích tích sử dụng cả hai mô
hình hồi qui tuyến tính và phân tích phƣơng sai. Ngoài biến đáp ứng, có một hoặc
nhiều biến có khả năng ảnh hƣởng đến kết quả, những biến đó đƣợc xem nhƣ các
biến Covariates. Phân tích hiệp phƣơng sai xác định sự tƣơng quan giữa các biến
Covariates và biến đáp ứng. Từ đó loại bỏ phƣơng sai liên kết với các biến
Covariates trong biến đáp ứng trƣớc khi so sánh giữa các nhóm.
Trong giới hạn của một biến đáp ứng và một biến Covariate, phân tích hiệp
phƣơng sai sẽ thành công nếu thỏa mãn 3 giả thiết sau:
i) Biến đáp ứng có mối quan hệ tuyến tính đến biến Covariate(s).
Nếu giữ giả định này, một phần sai số trong mô hình là dự đoán đƣợc và có
thể đƣợc loại bỏ để giảm phƣơng sai sai số. Giả định này, ta có thể kiểm tra bởi
giả thiết H 0 :   0 , trong đó  là hệ số dốc từ mô hình hồi qui của biến đáp ứng
trên biến Covariate(s). Phân tích hiệp phƣơng sai sẽ luôn cho sai số nhỏ hơn phân
tích phƣơng sai.
ii) Các nhóm có hệ số dốc bằng nhau.
Chúng ta có thể kiểm tra giả định này bằng giả thiết:
H 0 : 1  2  ...  k
Trong đó  i có hệ số dốc trong nhóm thứ i. Nếu giả định này đƣợc giữ, nghĩa là
các đƣờng thẳng hồi qui trong mỗi nhóm là song song nhau. Hay nói cách khác,
nhân tố và biến Covariate không có ảnh hƣởng tƣơng tác nhau.
iii) Biến Covariate X cố định và độc lập với các nhóm mức của nhân tố.
Nếu biến Covariate đƣợc đo trƣớc khi thử nghiệm, sự độc lập của các nhóm
mức và biến Covariate đƣợc thỏa mãn theo định nghĩa. Tuy nhiên, nếu biến
Covariate đƣợc đo sau thử nghiệm, sự độc lập của các nhóm mức Covariate nên
đƣợc kiểm định. Để kiểm tra giả thiết này, ta có thể sử chạy ANOVA sử dụng
biến Covariate X là biến đáp ứng. Với giả thiết là không có sự khác biệt đáng kể
trong X giữa các nhóm mức và ta mong đợi để tìm thấy không có sự khác biệt
đáng kể để có thể thực hiện một phân tích hiệp phƣơng sai tiêu chuẩn.

18


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay

×