Tải bản đầy đủ

BAI 2 NHAP VA LOC SO LIEU

TIN HỌC ỨNG DỤNG

NHẬP, LỌC VÀ MÃ HÓA
SỐ LIỆU
TRƯỜNG ĐẠI HỌC Y DƯỢC HUẾ
BỘ MÔN THỐNG KÊ – DÂN SỐ - SỨC KHỎE SINH SẢN

1


Mục tiêu
1/ Xác định được ý nghĩa của việc kiểm tra số liệu, lọc số liệu và mã hóa lại các số
liệu thường gặp trong nghiên cứu y tế.
2/ Thực hiện được các lệnh lọc, mã hóa số liệu cơ bản
3/ Nhập và kiểm tra một bộ số liệu hoàn chỉnh.

2


Một số lỗi thông thường


1)
2)
3)

Lỗi bỏ trống dữ liệu.
Lỗi logic.
Lỗi nhập sai giá trị đã mã hóa, outlier ( ví dụ : code 1: nam , 2: nữ nhưng số
liệu lại có 3,4,5…).

3


Phương pháp kiểm tra số liệu



Dùng các lệnh sắp xếp dữ liệu ( sort case: ascending/ descending)  hiển
thị các giá trị missing hay outline.



Chạy các bảng tần suất hoặc trung bình  xác định giá trị missing/ lớn
nhất , nhỏ nhất.



Chạy bảng chéo  các lỗi logic đơn giản.

4


Biến cần sắp xếp

Tăng dần
Giảm dần

5


Giá trị bổ trống thường xuất hiện trên


cùng bộ số liệu ( ascending)

Giá trị bỏ trống thường xuát hiện
cuối cùng bộ số liệu
(Descending)

6


Lệnh lọc số liệu cơ bản

1.
2.

Select case (Lựa chọn các trường hợp theo điều kiện )
Split file (chia tách dữ liệu)

 2 lệnh này sẽ chỉ hiển thị kết quả khi chạy phân tích số liệu trên của số hiên
thị kết quả ( out put)

7


Mã hóa số liệu ( Recode)

Thông thường sẽ có 2 dạng



Mã hóa  mớithực hiện ngay trên biến ban đầu ( lưu ý số liệu gốc sẽ thay đổi theo)
Recode into same variable



Mã hóa  tạo thành biến Recode into different variable)

8


Recode into same variables
 TransVí dụ: Chia tuổi của bệnh nhân thành 3 nhóm : (60 – 70); (71- 80); và >80.
form / Recode into same variables

Đưa biến cần mã hõa vào

9


Giá trị mỡi cần mã hóa

Giá trị cũ

Khoảng

Thấp hơn từ …

Cao hơn từ

Giá trị khác ngoài khoãng đa mã hóa

Lưu ý: Sau khi code cần nhấn add để việc mã hóa thực hiện
Và continue để hoàn tất
10


Ví dụ chia nhóm tuổi

11


Lệnh sẽ được thực hiện ngay trên biến tuổi ban đầu  Lưu ý khi sử dụng lệnh này
12


Recode into different variables




Về nguyên tắc thực hiện giống với recode into same variables.
Tuy nhiên lệnh này sẽ tạo ra một biến mới và nằm cuối cùng của bộ số
liệu (không thay đổi số liệu gốc ban đầu)



Chú ý thay đổi tên biến mới khi thực hiện

13


Transform/ recode into different variables

Gõ tên biến mới

Thực hiện tương tự như mã hóa
same into variables
14


Kết quả tạo một biến mới nằm sau
cùng của bộ số liệu

15


Kiểm tra kết quả sau mã hóa số liệu


Để xem kết quả sau khi mã hóa dữ liệu có thể sử dụng lệnh Analyze/ Descriptive statistics /
Frequencies  xem tần số, tỷ lệ ( cửa số output)



Ví dụ trường hợp biến tuổi

16


BÀI TẬP 1

1.
2.

Dùng lệnh Sort cases phát hiện số liệu sai của biến số cân nặng.
Dùng lệnh Find phát hiện số liệu sai của biến số tuổi mẹ (tuổi mẹ có giá trị 8
hoặc 9 tuổi là sai).

3.

Frequency để tìm số liệu sai của biến số Gan to

17


4. Frequency tìm số liệu sai của biến số lách to
5. Crosstabs: Tìm mối liên quan giữa tuổi và cân nặng , phát hiện số liệu bất
hợp lý
6. Select cases: Phân tich số liệu cho nữ giới: Tìm tỷ lệ % lách to theo độ cho
nữ giới

18


BÀI TẬP 2
Chia tuổi thành 8 nhóm tuổi:






nhóm 1: 15-19

nhóm 2 : 20-24

nhóm 3: 25-29

nhóm 4: 30-34

nhóm 5: 35-39

nhóm 6 : 40-44

nhóm 7: 45-49

nhóm 8 : > 49 tuổi

1.Hãy cho biết số lượng và tỷ lệ mỗi nhóm?
2.Hãy cho biết số lượng và tỷ lệ mỗi nhóm theo giới tính (nam/nữ)?

19


BÀI TẬP 3
Chia 5 nhóm thể lực theo cân nặng (cannang)




1.
2.
3.
4.

nhóm 1: < 40 kg

nhóm 2 : 40-50 kg

nhóm 3: 51-60

nhóm 4: 61-70

nhóm 5: > 70

Hãy cho biết số lượng và tỷ lệ mỗi nhóm?
Tỷ lệ cao nhất thuộc nhóm nào?
Tỷ lệ người nặng trên 60kg là bao nhiêu?
Hãy cho biết số lượng và tỷ lệ mỗi nhóm theo giới tính (nam/nữ)?

20


BÀI TẬP 4






Chia trình độ học vấn (tdhv) thành 3 nhóm:
HV thấp

: mù chữ + cấp 1

HV trung bình : cấp 2 + cấp 3
HV cao

: > cấp 3

1.Hãy cho biết số lượng và tỷ lệ mỗi nhóm?
2.Hãy cho biết số lượng và tỷ lệ mỗi nhóm theo giới tính (nam/nữ)?

21



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay

×