Tải bản đầy đủ

Bài giảng xử lí số liệu SPSS

BÀI GIẢNG XỬ LÍ SỐ LIỆU
THỐNG KÊ BẰNG PHẦN MỀM
SPSS


Bố cục bài trình bày
I. Tổng quan về SPSS
II. Cách mã hóa, nhập và chỉnh sửa dữ liệu
III. Một số câu lệnh biến đổi dữ liệu
IV. Một số phép phân tích cơ bản và cách đọc kết quả
V. Vẽ biểu đồ


I. Tổng quan về SPSS
 SPSS

là gì?
 Ứng dụng của SPSS
 Cách mở, tạo và lưu file SPSS
 Cửa sổ Variable View, Data View



SPSS là gì?
SPSS là tên viết tắt của “Statistical Product and
Service Solutions”
 Năm 1968, Norman H. Nie, C. Hadlai (Tex) Hull và
Dale H. Bent đã phát triển SPSS
 Hiện nay, SPSS là một trong những phần mềm phân
tích số liệu phổ biến và mạnh nhất với trên 250.000
khách hàng trên toàn thế giới



1.2. Ứng dụng của SPSS
- SPSS giúp lưu trữ và quản lý dữ liệu
- SPSS là công cụ hữu hiệu để thực hiện phân tích các số
liệu trong khoa học xã hội, khoa học tự nhiên và kinh tế.
- SPSS có thể đọc được các file dữ liệu dạng .xls, .txt,
.dat, …


1.3. Cách mở, tạo và lưu file trong
SPSS
Mở file SPSS:
File  Open  Data…
 Tạo file SPSS:
File  Open  New  Data
 Lưu file SPSS:
File  Save as…



1.4. Cửa sổ Data View, Variable View


Cửa sổ Variable View:
 Sử

dụng cửa sổ Variable View: Chọn Variable
View tab
 Biểu diễn các thông tin về biến như tên biến,

dạng biến, các giá trị, thang đo
 Dùng để mã hóa biến
 Các dòng là các biến số
 Các cột là các thuộc tính của biến số: ví dụ: tên
biến, nhãn biến, kiểu dữ liệu
 Có thể chỉnh sửa trực tiếp vào cửa sổ này


1.4. Cửa sổ Data View,
Variable View


Cửa sổ Data View:
 Sử dụng cửa sổ Data View: Chọn Data View tab
 Biểu diễn dữ liệu
 Dùng để nhập, chỉnh sửa dữ liệu
 Các dòng là các trường hợp. Mỗi dòng thể hiện số liệu
của một quan sát hay một bảng hỏi
 Các cột là các biến số. Mỗi dòng thể hiện một biến số
hay một đặc điểm được đo lường
 Các ô là các giá trị. Mỗi ô chứa một giá trị của một biến
số của một quan sát
 Có thể chỉnh sửa trực tiếp vào cửa sổ này


1.5. Thanh Menu, Bar









File: thực hiện các chức năng với file như mở, đọc, lưu file,…
Edit: thực hiện các chức năng chỉnh sửa file: copy, paste, tìm
kiếm và thay thế
View: có thể thay đổi hình thức hiển thị của dữ liệu. Chức
năng phố biến nhất là Value Labels
Data: các chức năng định dạng, nhập dữ liệu: sắp xếp, trộn,
đặt điều kiện
Transform: thay đổi dạng dữ liệu có sẵn bằng lệnh mã hóa lại
biến, tính toán,…
Analyze: thực hiện tất cả các phép phân tích đối với các biến
số
Graphs: vẽ biểu đồ
Help: Trợ giúp


II. CÁCH MÃ HÓA, NHẬP
VÀ CHỈNH SỬA DỮ LIỆU


2.1. Các loại câu hỏi
Có nhiều tiêu chí phân chia các loại câu hỏi
 Một số dạng câu hỏi cần chú ý khi sử dụng SPSS:
 Câu hỏi đóng: câu hỏi đã được cho sẵn phương án
trả lời


Câu hỏi lựa chọn: chỉ được chọn 1 phương án
trả lời duy nhất
Câu hỏi tùy chọn: được chọn nhiều phương án
trả lời
 Câu hỏi mở: cho phép người trả lời tự do cung
cấp thông tin


Cách mã hóa một số loại câu hỏi
 Đối

với câu hỏi lựa chọn: mã hóa thành một
biến với nhiều phương án trả lời (giá trị)
 Đối với câu hỏi tùy chọn: mã hóa mỗi lựa chọn
thành từng biến (từng câu hỏi nhỏ) với các giá
trị cho sẵn
 Đối với câu hỏi mở: mã hóa thành biến trong đó
phương án trả lời do người nhập ghi theo bảng
hỏi


2.2. Mã hóa bảng hỏi
Bảng hỏi được mã hóa vào cửa sổ Variable View
 Khi mã hóa bảng hỏi cần chú ý các yếu tố sau:
 Đặt tên biến (Name)
 Kiểu dữ liệu (Type)
 Độ dài (Width)
 Phần thập phân (Decimals)
 Nhãn biến (Label)
 Giá trị (Values)
 Giá trị khuyết thiếu (Missing)
 Thang đo (Measure)



Đặt tên biến
Tên biến được nhập trực tiếp vào ô “Name” ở cửa sổ
Variable View
 Các yêu cầu của tên biến:







Không quá 64 ký tự
Tên biến phải bắt đầu bằng một chữ cái, các ký tự sau đó
có thể là bất kỳ chữ số tự nhiên, số La Mã, dấu chấm, hoặc
các ký tự đặc biệt như @, $, _ , #
Không được để dấu cách hoặc các ký tự đặc biệt (? ! ‘ và
*) trong tên biến


Các yêu cầu của tên biến


Tên biến không được phép trùng lặp



Tên biến không được kết thúc bằng dấu chấm câu



Tên biến không nên kết thúc bằng dấu gạch dưới



Tên biến có thể dùng chữ hoa hoặc chữ thường hoặc cả
hai tùy theo mục đích của người sử dụng



Tên biến thường được đặt theo số câu trong bảng hỏi


Các kiểu dữ liệu


Các kiểu dữ liệu cơ bản:
 Dữ liệu kiểu số (numeric):
 Sử

dụng các số đếm
 Xuất hiện trong các câu hỏi đóng và các câu hỏi mở
dùng biến liên tục
 Dữ liệu kiểu chữ (string):
 Sử dụng các chữ cái
 Thường xuất hiện trong câu hỏi mở về ý kiến của
người trả lời
 Các kiểu dữ liệu khác: số thập phân, ngày tháng,…


Tất cả các biến đều được giả định là dữ liệu kiểu số.
Người sử dụng có thể vào Type để thay đổi kiểu dữ liệu


Độ dài của biến và phần
thập phân
Độ dài của biến (Width):
 Quy định độ dài của các biến số được phép nhập
vào file SPSS.
 Tùy thuộc vào độ dài của biến số mà đặt width cho
phù hợp
 Phần thập phân (Decimals):
 Quy định phần thập phân được nhập vào file SPSS
 Phần thập phân được mặc định là 2 (0,00)
 Đối với các biến dạng chữ, phần thập phân được
mặc định là 0



Nhãn biến
Cụ thể hóa thông tin về biến số
 Được nhập trực tiếp vào cửa sổ Variable View
 Có thể gõ không dấu hoặc gõ tiếng Việt
 Độ dài: tối đa là 256 ký tự
 Nhãn biến có thể sử dụng dấu cách và một số ký tự
đặc biệt không được sử dụng ở tên biến
 Các quy tắc đặt nhãn biến:
 Tóm tắt ngắn gọn, đầy đủ nội dung câu hỏi
 Lựa chọn những từ khóa quan trọng



Giá trị


Dùng để mô tả các giá trị của biến số (các phương
án trả lời của câu hỏi)



Độ dài tên giá trị không quá 60 ký tự



Không thể đặt giá trị cho những biến kiểu chữ dài
hơn 8 ký tự


Giá trị khuyết thiếu



Missing là các giá trị khuyết thiếu trong bảng hỏi
Các loại missing: 2 loại


Missing system:
Là missing do các bước nhảy trong bảng hỏi hoặc do người
được hỏi không trả lời
 Khi nhập số liệu, missing hệ thống thường được bỏ trống




Missing user – define:
 Là missing người điều tra tự đặt do phương án trả
lời của người trả lời không phù hợp với thông tin
mà người điều tra mong muốn
 Được gán cho một giá trị nào đó.




Missing có thể là bất kỳ giá trị nào do người sử dụng tự
đặt



Đối với các biến liên tục, missing thường được gán giá
trị âm hoặc bỏ trống. Ví dụ: tuổi, thu nhập,…



Không thể gán giá trị missing cho dữ liệu kiểu chữ dài
hơn 8 ký tự



Có thể quy định tối đa 3 giá trị missing độc lập cho một
biến số


Giá trị khuyết thiếu


Đối với các dữ liệu kiểu số: có thể quy định giá trị
missing trong một khoảng giá trị nào đó



Đối với dữ liệu kiểu chữ không quá 8 ký tự, tất cả các
chữ hoặc các ô trống đều được coi là có giá trị nếu
không định nghĩa đó là giá trị missing. Để định
nghĩa đó là giá trị missing, gõ một dấu cách (a single
pace) trong bất kỳ ô nào ở Discrete missing values


Thang đo trong SPSS


Có 4 loại thang đo cơ bản: thang định danh, thang
khoảng, thang thứ bậc, thang tỷ lệ



Trong SPSS: có 3 loại thang đo: thang định danh,
thang thứ bậc, thang tỷ lệ (thang khoảng + thang tỷ lệ)


Các loại thang đo trong SPSS
Thang tỷ lệ:
 Các giá trị được sắp xếp theo một trật tự thứ bậc
 Các giá trị phải là các chữ số theo dạng khoảng hoặc dạng tỷ lệ
 Ví dụ: tuổi, thu nhập,…
 Thang thứ bậc:
 Các giá trị được sắp xếp theo một trật tự thứ bậc
Ví dụ: Cao –Trung bình - Thấp
 Có thể sử dụng các biến dạng chữ hoặc dạng số cho thang thứ
bậc nhưng dữ liệu dạng số được dùng phổ biến hơn.
 Đối với các thang thứ bậc dạng chữ, trật tự các chữ cái được giả
định là phản ánh một trật tự giữa các hạng



Các loại thang đo trong SPSS


Thang định danh:
 Các giá trị của thang không thể hiện trật tự thứ bậc
 Ví dụ: 1 = nam; 2 = nữ
 Có thể sử dụng dữ liệu dạng số hoặc dạng chữ


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay

×