Tải bản đầy đủ

Tin sinh hoc (ỨNG DỤNG TIN HỌC TRONG SH)

PHẦN I. XỬ LÝ SỐ LIỆU THỐNG KÊ SINH HỌC
CHƯƠNG I. GIỚI THIỆU VỀ EXCEL
1.1. Giới thiệu về Excel
1.1.1. Giới thiệu
Excel là chương trình ứng dụng bảng tính trong Windows, thuộc bộ công cụ
văn phòng Microsoft Office. Excel là ứng dụng đa văn bản – nghĩa là có thể mở
đồng thời nhiều hơn một cửa sổ văn bản. Các thao tác trong Excel tuân theo tiêu
chuẩn của Windows, như: làm việc với cửa sổ, các hộp đối thoại, hệ thống menu,
sử dụng mouse, các biểu tượng lệnh... Excel có thể được cài đặt một cách độc lập,
nhưng thông thường là qua bộ cài đặt Microsoft Office.
1.1.2. Các chức năng chính của Excel
Là một ứng dụng bảng tính, mỗi cửa sổ văn bản của Excel là một WorkBook,
trong đó gồm nhiều Sheet – mỗi Sheet có thể là bảng tính, biểu đồ hoặc macro bảng
tính. Các Sheet có thể độc lập hoặc phụ thuộc nhau tùy vào sự tổ chức của người sử
dụng. Khi lưu (save) WorkBook, Excel tự động thêm phần mở rộng là XLS.
Chức năng chính của Excel bao gồm:
- Tính toán, phân tích, tạo biểu đồ, lập báo cáo... trên các dữ liệu được tổ chức theo
dạng bảng 2 chiều (mô hình quan hệ).
- Chia sẻ dữ liệu với các ứng dụng khác
Các chức năng này một phần được thực hiện thông qua các hàm đã được thiết kế
sẵn hoặc hàm do người sử dụng tự tạo; phần khác thông qua các công cụ được tổ

chức trong hệ thống menu hoặc biểu tượng lệnh.
Là ứng dụng trong bộ Microsoft Office nên Excel được tối ưu hóa để sử dụng các
tính năng bổ sung, như nhập văn bản từ Word, tạo chữ nghệ thuật từ WordArt, chèn
văn bản toán học từ Equation, bổ sung hình ảnh từ ClipArt Gallery... Ngược lại,
Excel cũng cung cấp các phương thức để các ứng dụng khác có thể sử dụng được
các chức năng mạnh của nó.
1.1.3. Khởi động và kết thúc Excel
a. Khởi động

1


Có nhiều cách khởi động chương trình Excel, dưới đây là một số cách thông dụng:
+ Chọn biểu tượng Excel từ thanh Shortcut Bar hoặc thanh Quick Launch (nếu có)
+ Từ nút Start : [START]\Programs\(Microsoft Office)\Microsoft Office Excel
+ Hoặc khởi động từ biểu tượng Excel trong cửa sổ Windows Explorer
b. Kết thúc
Sau khi hoàn tất phiên làm việc trong Excel, ta kết thúc nó bằng một trong các
cách sau:
+ Chọn lệnh từ menu: [FILE]\Exit
+ Nhấn vào nút đóng cửa sổ [X] ở góc trên phải, hoặc nhấn Alt–F4...
Nếu các WorkBook có sửa đổi và chưa ghi lại sự thay đổi, thì Excel sẽ yêu cầu ta
xác nhận việc có ghi hay không trước khi kết thúc. Chọn [Yes] để ghi, [No] để kết
thúc và không ghi, nhấn [Cancel] để hủy lệnh và tiếp tục làm việc với Excel.
1.1.4. Các thành phần và khái niệm cơ bản
a. Cửa sổ ứng dụng
Cửa sổ chính của Excel là vùng màn hình chứa chương trình Excel khi nó được
khởi động, tương tự như các cửa sổ ứng dụng khác trong Windows. Gồm các thành
phần như: các đường viền giới hạn kích thước cửa sổ; thanh tiêu đề chứa tiêu đề
chương trình và tên WorkBook đang làm việc; thanh menu ngang, các thanh công
cụ (Toolbar) chứa các biểu tượng lệnh; các nút lệnh của cửa sổ (hộp điều khiển, nút
Minimize, Maximize/Restore, Close); thanh công thức; vùng làm việc (desktop) và
cuối cùng là dòng trạng thái chứa thông báo và trạng thái làm việc.
Thanh tiêu đề

Thanh thực đơn

Thanh công cụ
Thanh
công thức


Vùng
làm việc

2


b. Cửa sổ workbook (văn bản)
Ngay sau khi khởi động, thông thường Excel đưa ra một workbook mới để người
sử dụng có thể bắt đầu làm việc. WorkBook này được đặt trong một cửa sổ văn bản
nằm trong vùng desktop của cửa sổ ứng dụng.
Khi được maximize (cực đại hóa), tiêu đề của cửa sổ workbook nằm chung với tiêu
đề của chương trình. Mỗi Workbook bao gồm nhiều Sheet. Mỗi Sheet là một lưới
các ô (cell) được tổ chức thành hàng (row) và cột (column).
Ngay phía trên vùng bảng tính có 2 thành phần: một là hộp tên (Name Box) chứa
tên của ô (hoặc dãy các ô) hiện thời đang được chọn; hai là thanh công thức
(Formula Bar) chứa nội dung hoặc cho phép nhập nội dung của ô đang chọn. Phía
dưới là thanh chứa tên các sheet trong workbook và thanh cuốn ngang, bên phải là
thanh cuốn dọc.
c. Tổ chức bảng tính (sheet) trong Excel
* Đánh địa chỉ hàng, cột và ô
Trong Excel, hàng được đánh số (gán nhãn) từ 1, 2,.. đến 16384 (hoặc 65536); cột
được đánh thứ tự từ A, B, ..., Z, AA, ..., IV (256 cột). Giao của cột và hàng là ô
(cell) với địa chỉ xác định là: [nhãn cột][nhãn dòng], ví dụ: ô F15 là giao của cột F
và dòng 15, hoặc được xác định theo cách R[số hiệu dòng]C[số hiệu cột], như
R5C8 là ô tại dòng 5 cột 8 (tức cột H).
Miền (Vùng, Khoảng các ô) là tập hợp các ô có dạng: một dãy liên tục các ô (giới
hạn trong một khung hình chữ nhật) và/hoặc các ô rời rạc. Trong đó các ô liên tục
(khoảng các ô) được viết theo dạng ô đầu tiên trên trái:ô cuối cùng dưới phải, ví
dụ: A4:C7 là khoảng liên tục 12 ô giới hạn bởi 3 cột (A, B, C) và 4 hàng (4, 5, 6,
7); các ô rời rạc cách nhau bởi dấu phân cách (thông thường là dấu phẩy), ví dụ:
C5, E9, F12 là dãy 3 ô rời nhau.
* Nội dung của các ô
Mỗi ô có thể chứa dữ liệu hoặc công thức tính toán.
Kiểu dữ liệu có thể là :
- Kiểu chữ: Họ và tên
- Kiểu số (numeric) 125
- Kiểu ngày tháng (date) 08/12/1998

3


- Giờ (time) 8:15:25
- Kiểu logic
Công thức tính toán có dạng: ký tự đầu tiên là dấu bằng (=) tiếp theo là một biểu
thức. Ví dụ: tại ô A3 nếu ta nhập =5+3 thì sau khi nhấn Enter, nội dung của A3 sẽ
là 8.
+ Biểu thức tính toán được định nghĩa là một tập hợp các toán tử và toán hạng
được viết theo quy tắc (cú pháp) do Excel quy định.
Trong đó:
- Toán tử là các phép toán số học: + (cộng), - (trừ), * (nhân), / (chia), % (phần
trăm), ^ (lũy thừa); hoặc các toán tử so sánh: < (nhỏ hơn: less than), > (lớn hơn:
greater than), = (bằng: equal to), <= (nhỏ hơn hoặc bằng: less than or equal to), >=
(lớn hơn hoặc bằng: greater than or equal to), <> (không bằng: not equal to), và
toán tử nối chuỗi & (ví dụ: “HO”&“TEN”).
- Toán hạng có thể là giá trị hằng (constant), một tham chiếu ô, một nhãn (label),
tên (name) hoặc là một hàm (function) của workbook. Các hằng chuỗi được bao
trong cặp nháy kép “ ”.
Hàm (function) có dạng: Tên hàm(danh sách đối số – nếu có), trong đó cặp ngoặc
đơn là bắt buộc. Do hàm thực hiện một quá trình xử lý hay tính toán và trả về một
kết quả nên nó có thể xuất hiện bất kỳ ở đâu trong một biểu thức mà ở đó có thể có
một toán hạng. Ngoài ra, Excel còn cho phép khả năng các hàm lồng nhau, nghĩa là
một hàm có thể xuất hiện trong danh sách đối số của một hàm khác. Ví dụ:
SUM(A1, SUM(C5:F7))
Ví dụ về công thức: = 15 + (4 * A6) – SUM(B2:B4)
Trong đó: 5, 4 là các hằng; A6, B2:B4 là các tham chiếu ô; SUM là tên hàm; + * –
là các toán tử.
Giá trị của công thức được Excel tự động cập nhật khi có sự thay đổi liên quan đến
mỗi một giá trị của toán hạng trong đó.
* Tham chiếu (địa chỉ ô) tương đối và tuyệt đối
Để tham chiếu đến các ô, có hai cách: tham chiếu tương đối và tham chiếu tuyệt
đối.

4


Tham chiếu tương đối xác định vị trí tương đối từ ô chứa tham chiếu đến ô được
tham chiếu. Ví dụ: trong công thức tại ô C3 có chứa tham chiếu đến ô A2 được
hiểu như là: xuất phát tại ô hiện thời (C3) sang trái 2 cột (từ C sang A) và di chuyển
lên 1 hàng (từ hàng thứ 3 lên 2) để lấy dữ liệu tại đó.
- Với tham chiếu tương đối, khi người sử dụng sao chép công thức từ ô này sang ô
khác thì giá trị tham chiếu tự động thay đổi. Ví dụ, nếu sao chép công thức trong
C3 ở trên sang K5 thì tham chiếu đến A2 sẽ đổi lại là I4 (giữ nguyên sự tương đối
từ K5 đến I4: sang trái 2 và lên 1).
- Từ đây suy ra, nếu sao chép công thức theo chiều dọc thì số hiệu hàng sẽ bị thay
đổi, số hiệu cột được giữ nguyên. Tương tự, nếu sao chép theo chiều ngang thì giá
trị cột bị thay đổi, giữ lại số hiệu dòng.
- Ví dụ: xét bảng sau:
12
13
14
15

C
5
6
4
=SUM(C12:C14)

D
7
8
9
=SUM(D12:D14)

F
=SUM(C12:D12)
=SUM(C13:D13)

Tại ô F12 nhập công thức tính tổng các ô từ C12 đến D12, khi đó nếu sao chép
công thức đến ô F13 thì tham chiếu sẽ thay đổi thành tổng các ô từ C13 đến D13,
sao chép đến F14 thì sẽ thành =SUM(C14:D14). Tương tự, khi chép ngang từ C15
sang D15 thì số hiệu 12 và 14 không đổi, mà đổi giá trị cột từ C sang D.
Tham chiếu tuyệt đối xác định sự tuyệt đối trong cách tham chiếu, nghĩa là luôn
hướng đến các vị trí cố định (theo hàng và/hoặc theo cột) nào đó của bảng tính khi
sao chép công thức. Vì ô được xác định bởi hàng và cột, nên sự tuyệt đối ở đây có
thể chỉ tác động đến hàng, đến cột hoặc cả hai. Excel dùng ký tự $ đặt trước tên
hàng hoặc tên cột để chỉ sự tuyệt đối. Ví dụ, E1 chứa công thức = $A$1 + $B1 +
C$1 + D1, bao gồm tuyệt đối ở A1, tuyệt đối theo hàng ở B1, theo cột ở C1 và
tương đối ở D1. Khi đó nếu sao chép công thức này đến ô H5 thì sẽ tự động đổi lại
là: = $A$1 + $B5 + F$1 + G5.
Tên của một khoảng các ô được xem là một tham chiếu tuyệt đối.
Trong thực hành, sau khi nhập tham chiếu ô ta dùng phím F4 để chuyển đổi giữa
các loại tham chiếu.

5


1.2. Các thao các cơ bản
1.2.1. Chọn các ô, hàng, cột
- Chọn 1 ô: click vào ô muốn chọn
- Chọn nhiều ô liên tục: chọn ô đầu tiên (góc trên trái) của khoảng cần chọn, sau đó
drag (kéo lê) mouse (hoặc shift-click) đến vị trí cuối (góc dưới phải).
- Để chọn thêm các ô rời rạc nhấn giữ phím Ctrl trong khi click vào các ô.
Ngoài ra, còn có thể chọn nhanh bằng cách nhập khoảng cần chọn vào hộp tên.
- Việc chọn hàng hoặc cột tương tự như chọn ô. Thay cho click vào ô, ta click vào
nhãn cột hoặc số hiệu hàng để chọn 1 cột hoặc 1 hàng. Chọn nhiều liên tục bằng kỹ
thuật drag hoặc shift-click. Chọn rời rạc bằng Ctrl-click.
1.2.2. Chèn, xóa các ô, hàng, cột
1- Chọn các ô, hàng, cột cần tác động
2- Click mouse phải (Right-click) làm xuất hiện shortcut menu
3- Chọn lệnh thích hợp từ shortcut menu:
Insert để chèn thêm
Delete để xóa
Clear contents để xóa nội dung các ô (hoặc nhấn phím Del)
Có thể dùng menu thay cho việc nhấn R-click. Menu [Edit]\Del hoặc [Edit]\Clear
để xóa. Menu [Insert]\Cells, Rows hoặc Columns để chèn thêm.
Số đối tượng chèn thêm vào hoặc xóa đi bằng với số đối tượng đã chọn (ví dụ, nếu
đang chọn 3 hàng thì lệnh Insert sẽ chèn 3 hàng)
1.2.3. Nhập và sửa chữa nội dung của ô
Nhập: Chọn ô, sau đó nhập nội dung. Kết thúc việc nhập nội dung bằng phía Enter.
Nếu không muốn thay đổi nội dung đã có trước đó thì nhấn Esc.
Sửa: Nhấn Double-click (D-click) hoặc F2 vào một ô đang chọn để sửa chữa nội
dung, nếu chỉ click vào ô thì dữ liệu nhập vào sẽ thay dữ liệu đã có trước đó. Trong
chế độ sửa chữa có thể dùng các phím Home, End để di chuyển. Dùng dấu bằng (=)
để bắt đầu nhập công thức. Nếu trong công thức cần tham chiếu ô thì hoặc là tự
nhập tên các ô cần tham chiếu, hoặc là dùng mouse để chọn.

6


Tạo dạng ô (Format Cells): Excel cung cấp nhiều khả năng trong việc thay đổi
dạng thức của một ô. Ví dụ: đối với 1 con số có thể được biểu diễn bằng nhiều
dạng: nó có thể là số, là ngày, giờ, biểu diễn phần trăm, tiền tệ với ký hiệu $, đ...
Để tạo dạng một hoặc nhiều ô, đầu tiên ta chọn chúng, sau đó dùng menu
[Format]Cells hoặc nhấn phím phải và chọn Format Cells.
Trong hộp thoại có chứa nhiều mục phục vụ cho việc tạo dạng. Chúng bao gồm:
- Mục [Number] dùng để tạo dạng số, gồm: Number tạo dạng các con số,
Currency tạo dạng tiền tệ; Date, Time tạo dạng ngày giờ; Percentage tạo dạng phần
trăm; Fraction tạo dạng phân số; Text tạo dạng văn bản...
- Mục [Alignment] dùng để chỉnh sắp dữ liệu theo 2 hướng: ngang (Horizontal),
đứng (Vertical); và điều khiển việc cho phép văn bản xuống dòng (Wrap text) hay
trải lấp sang các ô bên cạnh. Ngoài ra còn cho phép quay văn bản theo các góc
quay khác nhau.
- Mục [Font] dùng để tạo dạng về font chữ.
- Mục [Border] dùng cho việc thiết lập đường viền của các ô với rất nhiều lựa
chọn.
1.2.4. Tạo dãy tự động
Một dãy số liệu liên tục (ví dụ: a1, a2,...) có thể được tạo ra một cách tự động bằng
cách nhập 2 số liệu đầu tiên, sau đó bôi đen và đưa chuột xuống góc dưới phía bên
phải đến khi xuất hiện một nút vuông nhỏ, di chuyển mouse đến vị trí này (mouse
có hình dấu cộng) kéo lê nút vuông đến ô cuối của dãy số liệu sẽ tạo ra một dãy
liên tục. Nếu dãy là dãy số (ví dụ: 1, 2, ...) thì phải nhấn thêm phím Ctrl để tạo dãy
liên tục. Nếu ô đầu tiên là công thức thì việc kéo nút điều khiển sẽ sao chép công
thức đến các ô, khi đó các tham chiếu sẽ được điều chỉnh tự động.
1.3. Các thành phần của biểu đồ
+ Vùng dữ liệu: một khoảng liên tục hoặc rời rạc các ô bảng tính được chọn để
dùng làm dữ liệu cho biểu đồ, có thể tổ chức theo hàng hay cột gọi là dãy (series)
dữ liệu. Mỗi ô tạo thành một điểm dữ liệu trên biểu đồ và được đánh dấu (markers)
bởi các kí hiệu khác nhau. Vùng dữ liệu có thể bao gồm một hàng (hoặc cột) chứa
các nhãn (label).

7


+ Trục tọa độ: hệ thống các đường thẳng đứng hoặc ngang xác định tỉ lệ biểu diễn
các điểm dữ liệu, trên các trục có chứa các vạch đánh dấu tỉ lệ (tick mark). Các trục
thường có hai loại: trục chủ đề (category) và trục giá trị (value).
+ Hộp ghi chú (legend): chứa các dấu hiệu biểu diễn các dãy số liệu có mặt trong
biểu đồ. Có thể đặt legend tại một vị trí tùy ý trong biểu đồ.
+ Tiêu đề (title): dòng văn bản tạo nhãn cho biểu đồ (chart title) và các trục.
1.4. Sử dụng Chart Wizard
Bước 1: Nhập dữ liệu vào bảng tính
Bước 2: Click vào biểu tượng Chart Wizard hoặc chọn [Insert]\Chart.

Bước 3: Thực hiện 4 bước đã được chỉ ra là:
Step 1 of 4 (chọn kiểu đồ thị)

Nhấn Next để thực tiện tiếp
Step 2 of 4 (quét dữ liệu vào data range)

8


Nhấn Next để thực tiện tiếp
Step 3 of 4 (ghi tên đồ thị và tên trục)

Nhấn Next để thực tiện tiếp
Step 4 of 4 (ghi vị trí lưu đồ thị)

Nhấn nút Finish

9


Bước 4: Chỉnh sửa lại đồ thị (nếu cần)
1.5. Định dạng trang: [File]→ Page Setup
Trong mục này có các chức năng giống với Word như khai báo giấy (Page), thiết
lập các lề (Margins), tạo các dòng tiêu đề đầu và chân trang (Header/Footer).
Ngoài ra, trong Excel có bổ sung một tính năng đặc thù của bảng biểu, đó là cho
phép tạo ra các hàng lặp lại ở đỉnh (Rows to repeat at top) và các cột lặp lại ở bên
trái (Columns to repeat at left) khi sang trang mới. Nghĩa là có thể tạo các hàng/cột
thống nhất trên các trang.
Để chọn các hàng/cột sẽ lặp lại khi sang trang, ta chọn hộp thích hợp sau đó dùng
mouse chọn các hàng trong bảng tính.
Ngoài ra, nếu bảng tính có nhiều trang thì ta có thể chỉ định hướng in: in xuống rồi
sang phải (Down, then over) hay ngược lại (Over, then down).
1.6. Xem trước khi in: [File]→Print Preview
Chức năng này cho phép kiểm tra bảng tính một cách tổng thể trước khi quyết định
in chính thức. Ở đây, ta có thể tiến hành nhiều phép hiệu chỉnh, như: thay đổi lề,
cột để bảng tính có thể vừa khít trên một trang... Nhấn ESC hoặc [Close] để kết
thúc xem.
1.7. Chức năng in: [File]→Print
Các thông số in trong Excel hầu hết đều sử dụng theo chuẩn của Windows, như
chọn loại máy in, có muốn in ra file để sau đó đưa đi in ở một máy khác hay không
([] Print to file), chọn khoảng trang sẽ in (All: in toàn bộ, From..To để chỉ định các
trang sẽ in)... Các mục trong vùng Print what (In cái gì?) có chứa một số mục
riêng của Excel. Nếu muốn in chỉ một vùng bảng tính thì chọn vùng này trước khi
thực hiện lệnh in, sau đó đánh dấu vào mục Selection. Để in bảng tính ở Sheet đang
làm việc thì chọn mục Active sheet(s) và chọn mục Entire workbook để in toàn bộ
file (gồm tất cả các sheet).
Ngoài ra có thể chọn số bản sao trên một trang (Number of copies) và cách sắp khi
in (Collate).
a. Thiết đặt trang in: Chọn File→Page Setup
Portrait: in dọc; Landscape: in ngang
Margins: căn lề

10


Header/Footer: tiêu đề trang in

b. Thực hiện in
Chọn File→Print→OK

Name: lựa chọn máy in
Print range: chọn vùng in
Copies: chọn số bản cần in
8. Bảo vệ dữ liệu
Ngoài việc kiểm tra dữ liệu, Excel còn cung cấp các tính năng bảo mật dữ liệu. Có
nhiều cấp độ bảo mật: từ bảo vệ workbook đến sheet và cả nội dung từng ô (cell).

11


Tùy theo mục đích, ta chọn kiểu bảo vệ (Protection) phù hợp. Trong các kiểu,
người sử dụng đều nhập một mật khẩu bảo vệ và thiết lập các tùy chọn về quyền
của người dùng trên các đối tượng được bảo vệ.
Cách 1:
Chọn Tools→Protection→Protect Sheet→Nhập password

Cách 2: File→Save as→Tools→General Options→Nhập password

12


CHƯƠNG II. XỬ LÝ SỐ LIỆU TRONG NGHIÊN CỨU SINH HỌC
2.1. MỘT SỐ KHÁI NIỆM
2.1.1. Tổng thể nghiên cứu
a. Định nghĩa: Tổng thể nghiên cứu là toàn bộ tập hợp các phần tử đồng nhất theo
một dấu hiệu nghiên cứu định tính hoặc định lượng nào đó.
Số lượng các phần tử của tổng thể được gọi là kích thước của tổng thể, ký hiệu là n.
Với mỗi tổng thể, ta không nghiên cứu trực tiếp tổng thể đó mà thông qua một hay
nhiều dấu hiệu đặc trưng cho tổng thể đó, chúng được gọi là dấu hiệu nghiên cứu
và được ký hiệu χ.
b. Các phương pháp mô tả tổng thể


Mô tả tổng thể theo bảng phân phối tần số:

Giả sử trong tổng thể dấu hiệu nghiên cứu định lượng χ nhận các giá trị x 1,
x2, ...xk với các tần số tương ứng n1, n2, ...nk. Lúc đó, tổng thể được mô tả như
sau:
Giá trị của χ
Tần số

x1
n1

x2 ... xi ...
n2 ... ni ...

xk
nk

ni là số phần tử của tổng thể có chung giá trị x i.
Hiển nhiên:

0 ≤ n i ≤n
k

∑ni = n
i =1

• Mô tả tổng thể theo bảng phân phối tần suất
Nếu kí hiệu pi (i=1,k) là tần suất của xi , tức là tỷ số giữa tần số của xi và kích
ni
thước của tổng thể thì pi = n ;

i=1,k

Lúc đó, tổng thể được mô tả như sau:
Giá trị của χ
Tần số
0 ≤ p i ≤1; ∀i

x1
p1

x2 ... xi ...
p2 ... pi ...

k

∑pi =1
i =1

• Mô tả tổng thể theo tần suất tích lũy:

13

xk
pk


Nếu kí hiệu wi (i=1,k) là tần số tích lũy của x i, tức là tổng số các phần tử có giá
trị nhỏ hơn xi thì wi =

∑ nj

xj
và F(xi) (i=1,k) là tần suất tích lũy của x i, tức là tỷ số giữa tần số tích lũy của nó và
kích thước của tổng thể, thì:

F ( xi) =

wi
=
n

nj

∑ ni

xj < xi

Tần suất tích lũy là một hàm của x i có tính chất giống như hàm phân phối xác xuất
của đại lượng ngẫu nhiên rời rạc.
2.1.2. Các phương pháp chọn mẫu
- Mẫu được chọn phải mang tính đại diện cho tổng thể, tức là phản ánh đúng đặc
điểm của tổng thể theo dấu hiệu nghiên cứu đó.
- Để đảm bảo tính đại diện của mẫu, mẫu phải được tạo lập với những bước sau:
+ Lấy lần lượt từng phần tử vào mẫu.
+ Mỗi phần tử được lấy vào mẫu một cách hoàn toàn ngẫu nhiên tức là mọi phần
tử của tổng thể đều có thể được lấy vào mẫu với khả năng như nhau.
+ Các phần tử được lấy vào mẫu theo phương thức hoàn lại, tức là trước khi lấy
một phần tử thứ k thì trả lại phần tử thứ (k-1) mà đã nghiên cứu xong (k=2,n).
Trong thực tế, nếu kích thước của tổng thể khá lớn còn mẫu chỉ chiếm một phần
nhỏ của tổng thể thì phương thức lấy mẫu hoàn lại và không hoàn lại cho ta kết quả
sai lệch không đáng kể.
2.1.3. Mẫu ngẫu nhiên hai chiều
Trên cùng một tổng thể nghiên cứu đồng thời hai dấu hiệu định tính hoặc định
lượng, trong đó dấu hiệu nghiên cứu thứ nhất có thể xem như đại lượng ngẫu nhiên
X, còn dấu hiệu nghiên cứu thứ hai có thể xem như đại lượng ngẫu nhiên Y. Như
vậy, nghiên cứu đồng thời hai dấu hiệu trong tổng thể tương tự như nghiên cứu một
đại lượng ngẫu nhiên hai chiều.
a. Định nghĩa: Mẫu ngẫu nhiên hai chiều kích thước n là tập hợp của n đại
lượng ngẫu nhiên độc lập (X1, Y1), (X2, Y2),... (Xn, Yn), được thành lập từ đại lượng
ngẫu nhiên hai chiều (X,Y) và có cùng quy luật phân phối xác suất với (X, Y).

14


b. Phương pháp mô tả mẫu ngẫu nhiên hai chiều:
Giả sử từ tổng thể rút ra một mẫu kích thước n, trong đó thành phần X nhận
các giá trị x1, x2 ... , xi ... , xh còn thành phần Y nhận các giá trị y 1, y2 ..., ,yj ... , yk.
Trong đó, giá trị (xi, yj) xuất hiện với tần số nij (i=1,h; j=1,k). Các giá trị của xi và yj
được sắp xếp theo thứ tự tăng dần thì giá trị cụ thể của mẫu được mô tả theo bảng
sau:
Y

y1 y2 ... yj ... yk

ni

X
x1

n11 n12 ... n1j ... n1k

n1

x2

n21 n22 ... n2j ... n2k

n2

ni1 ni2 ... nij ... nik

ni

.
.

xi

nh

.
.

xh
mj

nh1 nh2 ... nhj ... nhk
m1 m2 ... mj ... mk



=n

Trong đó, ni là ký hiệu tổng các tần số mẫu mang giá trị x i của thành phần X, mj ký
hiệu tổng các tần số của mẫu mang giá trị yj của thành phần Y.
2.2. HÀM THỐNG KÊ VÀ CÁCH SỬ DỤNG
2.2.1. Một số hàm thống kê thường dùng trong sinh học
AVERAGE (n1, n2, ...): tính trung bình cộng của các số n1, n2, ...
COUNT (dc): đếm số các ô có dữ liệu loại số trong vùng dc
COUNTA (dc): đếm các ô không rỗng trong vùng dc
FTEST (mẫu 1, mẫu 2): so sánh phương sai của mẫu 1 và mẫu 2
LARGE (dc,k): phần tử lớn thứ k của vùng dc
MAX (n1,n2,...): giá trị lớn nhất của các số n1, n2, ...
MIN (n1,n2,...): giá trị nhỏ nhất của các số n1, n2, ...
MEDIAN (n1,n2,...): cho ra số gần với giá trị trung bình của dãy số n 1, n2, ...
MODE (dc): lấy giá trị hay gặp nhất trong vùng dc
SMALL (dc,k): phần tử nhỏ thứ k trong vùng dc

15


STDEV (n1,n2,...): độ lệch tiêu chuẩn của dãy số n1, n2, ...
VAR (n1,n2,...): phương sai của dãy số n1, n2, ...
IF (Biểu thức logic, biểu thức 1, biểu thức 2): Hàm điều kiện, nếu biểu thức logic
đúng thì thực hiện biểu thức 1, nếu biểu thức logic sai thì thực hiện biểu thức 2
SUM (n1,n2,...): cho giá trị tổng của dãy n1, n2, ...
2.2.2. Cách sử dụng hàm
a. Nhập hàm thông qua bảng chọn
Các bước thực hiện:
-

Chọn f(x) trên thanh công cụ hoặc chọn Insert / Function

-

Trong hộp thoại Insert Function chọn hàm cần dùng

-

Trong hộp thoại Function Arguments, quét dữ liệu cần xử lý

-

Nhấn OK

Ví dụ:
Giả sử cần tính phương sai của các số trong vùng A2:A20 cần thực hiện như
sau:
-

Chọn f(x) trên thanh công cụ hoặc chọn Insert / Function

-

Trong hộp thoại Insert Function chọn hàm VAR

-

Trong hộp thoại Function Arguments, quét dữ liệu trong vùng A2:A20

-

Nhấn OK

b. Nhập trực tiếp từ bàn phím
Các bước thực hiện:
-

Nhập dữ liệu vào bảng tính Excel

-

Chọn một ô trống để ghi kết quả

-

Nhập dấu = và ghi tên hàm

-

Quét dữ liệu vào sau tên hàm

-

Nhấn ENTER
Ví dụ:
Giả sử cần tính giá trị trung bình của các số trong vùng A2:A20 cần thực hiện
như sau: Nhấn chuột vào ô A21, nhập dấu = AVERAGE(A2:A20) và nhấn
ENTER, kết quả sẽ hiện ở ô A21.

c. Sử dụng tên hàm trong biểu thức

16


Có thể sử dụng tên hàm trong các biểu thức
Ví dụ:
Cột dữ liệu Lương ghi từ ô E2:E9. Để tính chênh lệch lương cao nhất với lương
thấp nhất, ta thực hiện: Tại ô E10 nhập =MAX(E2:E9)-MIN(E2:E9)
2.3. PHƯƠNG PHÁP SO SÁNH
2.3.1. Trường hợp các mẫu độc lập
Mẫu độc lập hoặc thí nghiệm độc lập nếu một quá trình thí nghiệm được tiến
hành một cách độc lập với những thí nghiệm khác, các thí nghiệm được bố trí khác
nhau về không gian, thời gian để có thể loại bỏ những tác dụng giống nhau như
điều kiện môi trường, thổ nhưỡng, khí hậu,...
2.3.1.1. Trường hợp hai mẫu độc lập
Trong nghiên cứu sinh học, chúng ta thường so sánh hai môi trường nuôi cấy
khác nhau, hai chế độ dinh dưỡng khác nhau, ... vì vậy cần phải chọn một trong hai
giả thuyết. Để kiểm tra và so sánh hai giả thuyết này cần đặt giả thiết H 0: μ1=μ2 và
đối thiết H1: μ1≠μ2.
Phương pháp kiểm tra phương sai:
Các bước thực hiện:
- Nhập số liệu của hai mẫu vào bảng tính
- Chọn hàm fx trên thanh công cụ hoặc chọn Insert → Function
- Chọn hàm FTEST
- Chọn OK và có 2 dãy khai báo

+ Dãy 1 (Array1): Quét vùng dữ liệu của mẫu 1

17


+ Dãy 2 (Array2): Quét vùng dữ liệu của mẫu 2
- Chọn OK
Nếu kết quả cho P>0,05 thì xem như phương sai hai tổng thể bằng nhau. Ngược lại,
nếu P<0,05 thì xem như phương sai hai tổng thể khác nhau.
a. Số mẫu n≤30: Kiểm tra giả thiết H0 và đối thiết H1 bằng tiêu chuẩn t của
Student. Tiêu chuẩn này dùng khi biết trước luật phân bố của hai tổng thể, hai
mẫu có phân bố chuẩn. Trường hợp này cần kiểm tra sự bằng nhau của hai trung
bình tổng thể qua việc kiểm tra sai khác của hai trung bình mẫu nhờ công thức:


t=




X 1− X 2
( S 2 c / n1) + ( S 2 c / n 2)



Trong đó: X 1 và X 2 là hai trung bình của hai mẫu quan sát 1 và 2
n1 và n2 là kích thước của hai mẫu quan sát 1 và 2
n1

S 2c =

∑ (x
i =1

1i



n2



− x1 ) + ∑ ( x 2 j − x 2 ) 2
j =1

n1 + n 2 − 2

Đại lượng t được xác định theo quy luật phân bố t với bậc tự do k=n1+n2-2.
* Nếu hai phương sai bằng nhau thì sử dụng phương pháp tính sau:
Cách 1:
- Nhập dữ liệu của hai mẫu vào bảng tính
- Chọn hàm fx trên thanh công cụ hoặc chọn Insert → Function
- Chọn hàm TTEST
- Chọn OK và có 4 dãy khai báo

18


+ Dãy 1 (Array1): Quét vùng dữ liệu của mẫu 1
+ Dãy 2 (Array2): Quét vùng dữ liệu của mẫu 2
+ Dãy 3 (Tail): ghi 2 (với ý nghĩa kiểm tra 2 chiều)
+ Dãy 4 (Type): ghi 2
-

Chọn OK
Nếu kết quả cho P<0,05, bác bỏ giả thiết Ho, chấp nhận đối thiết H1
Nếu P>0,05 thì bác bỏ đối thiết H1, chấp nhận giả thiết Ho
Cách 2:
- Nhập dữ liệu của hai mẫu vào bảng tính
- Chọn Tools → Data analysis
- Chọn t-test: Two sample assuming equal variances trong bảng Data analysis

- Nhấn OK và khai báo vào hộp thoại

19


+ Khai báo dữ liệu mẫu 1 vào khung Variable 1 Range
+ Khai báo dữ liệu mẫu 2 vào khung Variable 2 Range
+ Ghi 0 vào khung Hypothesized Mean Difference
+ Nếu quét cả tiêu đề thì nhấn vào ô Label
+ Alpha: ghi mức ý nghĩa
+ Chọn 1 ô trống để ghi kết quả vào Output Range
Nếu P(T<=t) two-tail<0.05 thì bác bỏ giả thiết Ho, chấp nhận đối thiết H1
Nếu P(T<=t) two-tail>0.05 thì bác bỏ đối thiết H1, chấp nhận giả thiết Ho
Bài tập ví dụ:
Để so sánh hai loại phân bón khác nhau, người ta trồng lúa tại hai ruộng, ruộng
1 bón phân A, ruộng 2 bón phân B. Lúa được trồng cùng thời gian, cùng mật độ,
cùng điều kiện nông hóa thổ nhưỡng, chỉ khác nhau về phân bón. Kết quả thu
hoạch lúa như sau:
Năng suất ruộng 1 3.2

4.3 5.1

3.4

3.1 4.2

5.0

4.5

4.7

(tạ/ha)
Năng suất ruộng 2 5.6

5.1 6.3

6.1

5.9 5.4

6.7

4.9

5.2

(tạ /ha)

Hãy cho biết phân bón loại nào tốt hơn và năng suất lúa trên hai ruộng có
thực sự khác nhau hay không?
Bài giải:

20


Đặt giả thiết H0: Năng suất lúa trên 2 ruộng là như nhau
Đối thiết H1: Năng suất lúa trên 2 ruộng thực sự khác nhau
Kiểm tra phương sai bằng hàm F-TEST kết quả cho P=0,5239
Vì P>0,05 nên chấp nhận sự bằng nhau của 2 phương sai.
Vậy cần so sánh năng suất lúa trên hai ruộng với trường hợp hai phương sai
bằng nhau.
Sử dụng t-test: Two sample assuming equal variances trong Data analysis
kết quả ở bảng dưới đây:
t-Test: Two-Sample Assuming Equal Variances
Năng suất
Mean
Variance
Observations
Pooled Variance
Hypothesized Mean

ruộng 1 (tạ/ha)
4.166666667
0.58
9
0.471805556

Difference
df
t Stat
P(T<=t) one-tail
t Critical one-tail
P(T<=t) two-tail
t Critical two-tail

Năng suất
ruộng 2 (tạ /ha)
5.688888889
0.363611111
9

0
16
-4.701135721
0.000120145
1.745883669
0.00024029
2.119905285

Vì P<0,05 nên bác bỏ giả thiết H0, tức năng suất lúa ở 2 ruộng thực sự khác
nhau. Vì năng suất trung bình ở ruộng 2 (5,6888) cao hơn ruộng 1 (4,1666)
nên phân bón B tốt hơn phân bón A.
* Nếu hai phương sai khác nhau thì sử dụng phương pháp tính sau:
Cách 1:
- Nhập dữ liệu của hai mẫu vào bảng tính
- Chọn hàm fx trên thanh công cụ hoặc chọn Insert → Function
- Chọn hàm TTEST

21


- Chọn OK và có 4 dãy khai báo

+ Dãy 1 (Array1): Quét vùng dữ liệu của mẫu 1
+ Dãy 2 (Array2): Quét vùng dữ liệu của mẫu 2
+ Dãy 3 (Tail): ghi 2 (với ý nghĩa kiểm tra 2 chiều)
+ Dãy 4 (Type): ghi 3
-

Chọn OK
Nếu kết quả cho P<0,05, bác bỏ giả thiết Ho, chấp nhận đối thiết H1
Nếu P>0,05 thì bác bỏ đối thiết H1, chấp nhận giả thiết Ho
Cách 2:
- Nhập dữ liệu của hai mẫu vào bảng tính
- Chọn Tools → Data analysis
- Chọn t-test: Two sample assuming unequal variances trong bảng Data
analysis

22


- Nhấn OK và khai báo vào hộp thoại

+ Khai báo dữ liệu mẫu 1 vào khung Variable 1 Range
+ Khai báo dữ liệu mẫu 2 vào khung Variable 2 Range
+ Ghi 0 vào khung Hypothesized Mean Difference
+ Nếu quét cả tiêu đề thì nhấn vào ô Label
+ Alpha: ghi mức ý nghĩa
+ Chọn 1 ô trống để ghi kết quả vào Output Range
Nếu P(T<=t) two-tail<0.05 thì bác bỏ giả thiết Ho, chấp nhận đối thiết H1
Nếu P(T<=t) two-tail>0.05 thì bác bỏ đối thiết H1, chấp nhận giả thiết Ho
b. Số mẫu n>30: Để so sánh trung bình 2 mẫu với số mẫu lớn hơn 30 thì kiểm
tra theo tiêu chuẩn U của hàm phân bố chuẩn.

23


U =




S2

d
Sd

S2

Trong đó: d = x1 − x 2 ; S d = ( 1 + 2 )
n1 n2




x1 và x 2 là hai trung bình của hai mẫu quan sát 1 và 2

n1 và n2 là kích thước của hai mẫu quan sát 1 và 2
S12 và S 22 là hai phương sai của hai mẫu quan sát 1 và 2

Các bước thực hiện:
- Nhập dữ liệu của hai mẫu vào bảng tính
- Chọn f(x)→VAR để tính phương sai cho 2 mẫu cần so sánh
- Chọn Tools → Data analysis
- Chọn z-Test: Two Sample for Means trong bảng Data analysis

-

Nhấn OK và khai báo vào hộp thoại

24


+ Khai báo dữ liệu mẫu 1 vào khung Variable 1 Range
+ Khai báo dữ liệu mẫu 2 vào khung Variable 2 Range
+ Ghi 0 vào khung Hypothesized Mean Difference
+ Variable 1 Variance(known): khai báo phương sai của mẫu 1
+ Variable 2 Variance(known): khai báo phương sai của mẫu 2
+ Nếu quét cả tiêu đề thì nhấn vào ô Label
+ Alpha: ghi mức ý nghĩa
+ Chọn 1 ô trống để ghi kết quả vào Output Range

25


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay

×