Tải bản đầy đủ

Nghiên cứu một số kỹ thuật ngoại suy và ứng dụng

I

ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

---------------------------------------

NGUYỄN THỊ NGỌC TÚ

NGHIÊN CỨU MỘT SỐ KỸ THUẬT NGOẠI SUY VÀ
ỨNG DỤNG

Chuyên ngành: Khoa học máy tính

Thái Nguyên - 2015


II

LỜI CAM ĐOAN
Tôi xin cam đoan Luận văn " Nghiên cứu một số kỹ thuật ngoại suy và

ứng dụng " đã được thực hiện theo đúng mục tiêu đề ra dưới sự hướng dẫn
của TS. Nguyễn Văn Huân. Kết quả đạt được trong luận văn là sản phẩm của
cá nhân tôi. Trong toàn bộ luận văn, những điều được trình bày là của cá nhân
và được tổng hợp từ nhiều nguồn tài liệu. Tất cả các tài liệu tham khảo đều có
xuất xứ rõ ràng và được trích dẫn hợp pháp.
Tôi xin chịu hoàn toàn trách nhiệm và chịu mọi hình thức kỷ luật theo
quy định cho lời cam đoan của mình.
Thái Nguyên, ngày tháng năm 2015
Người cam đoan

Nguyễn Thị Ngọc Tú


3

LỜI CẢM ƠN
Tôi xin bày tỏ lời cảm ơn chân thành tới tập thể các thầy cô giáo Viện
Công nghệ thông tin - Viện Hàn lâm Khoa học và Công nghệ Việt Nam, các
thầy cô giáo trường Đại học Công nghệ thông tin và Truyền thông - Đại học
Thái Nguyên đã tận tình giảng dạy cũng như tạo mọi điều kiện để tôi học tập
và nghiên cứu trong 2 năm học cao học.
Tôi xin chân thành cảm ơn sâu sắc tới thầy giáo TS. Nguyễn Văn Huân
đã cho tôi nhiều sự chỉ bảo quý báu, đã tận tình hướng dẫn và tạo điều kiện
cho tôi hoàn thành tốt luận văn tốt nghiệp này.
Quá trình thực hiện đề tài không tránh khỏi các thiếu sót, tôi rất mong
tiếp tục nhận được sự đóng góp ý kiến của các thầy giáo, cô giáo, các bạn
đồng nghiệp đối với đề tài nghiên cứu của tôi để đề tài được hoàn thiện hơn.
Tôi xin chân thành cảm ơn!
Thái Nguyên, ngày tháng năm 201
Người cam đoan

Nguyễn Thị Ngọc Tú


4

MỤC LỤC

LỜI CAM ĐOAN..........................................................................................................I
LỜI CẢM ƠN .............................................................................................................III


DANH MỤC HÌNH VẼ ............................................................................................IV
DANH

MỤC

BẢNG

...................................................................................VIII

BIỂU
MỤC

...................................................................................................................IV

LỤC
MỞ

ĐẦU........................................................................................................................1
Chương 1 GIỚI THIỆU CHUNG VỀ DỮ LIỆU CHUỖI THỜI GIAN............5
1.1. Khái niệm Dữ liệu ............................................................................................
5
1.1.1. Dữ liệu định tính và dữ liệu định lượng.............................................. 5
1.1.2. Dữ liệu sơ cấp và dữ liệu thứ cấp........................................................ 5
1.2. Chuỗi thời gian và Dữ liệu chuỗi thời gian ...................................................
7
1.2.1. Chuỗi thời gian .................................................................................... 7
1.2.2. Dữ liệu chuỗi thời gian...................................................................... 12
1.3. Tổng quan về dự báo......................................................................................
16
1.3.1. Đặc điểm của dự báo ......................................................................... 16
1.3.2. Các loại dự báo.................................................................................. 17
1.3.3. Các phương pháp dự báo .................................................................. 21
Chương 2 MỘT SỐ KỸ THUẬT NGOẠI SUY ..................................................22
2.1. Khái niệm ngoại suy ......................................................................................
22
2.1.1. Khái niệm ngoại suy.......................................................................... 22
2.1.2. Khi nào nên sử dụng phương pháp ngoại suy để dự báo. ................. 22
2.1.3. Ưu nhược điểm của phương pháp ngoại suy .................................... 23
2.1.4. Tính chính xác của dự báo ................................................................ 23
2.1.5. Ứng dụng của kỹ thuật ngoại suy vào bài toán dự báo ..................... 25


5

2.2. Ngoại suy dựa dựa vào mô hình hồi quy tuyến tính ..................................
26
2.2.1. Bài toán hồi quy ................................................................................ 26
2.2.2. Các phương pháp đưa về dạng tuyến tính......................................... 29


6

2.2.3. Hồi quy nhiều chiều (Hồi quy bội) ................................................... 30
2.3. Ngoại suy bằng phương pháp trung bình động giản đơn (moving average
forecast)................................................................................................................... 31
2.4. Ngoại suy bằng phương pháp san bằng mũ (Exponential Smoothing
Methods).................................................................................................................. 33
2.5. Ngoại suy dựa vào mô hình san mũ Holt- Winters. ................................... 36
2.5.1. San mũ Holt....................................................................................... 36
2.5.2. San mũ Holt- Winters ....................................................................... 37
2.6. Ngoại suy dựa vào mô hình ARIMA (AutoRegressive Integrated Moving
Average) .................................................................................................................. 39
2.6.1. Các công cụ áp dụng trong mô hình ................................................. 40
2.6.2. Mô hình AR(p) (Auto Regression) ................................................... 44
2.6.3. Mô hình MA(q) (Moving Average) .................................................. 45
2.6.4. Sai phân I(d) ...................................................................................... 46
2.6.5. Mô hình ARIMA ............................................................................... 47
2.6.6. Các bước phát triển mô hình ARIMA. ............................................. 48
2.7. Các bước tiến hành ngoại suy ....................................................................... 49
Chương 3 ÁP DỤNG KỸ THUẬT NGOẠI SUY VÀO BÀI TOÁN DỰ
BÁO.52
3.1. Mô hình ARIMA cho dự báo tài chính, chứng khoán ............................... 52
3.1.1. Dữ liệu tài chính ................................................................................ 52
3.1.2. Mô hình ARIMA cho bài toán dự báo tài chính ............................... 52
3.1.3. Thiết kế mô hình ARIMA cho dữ liệu .............................................. 53
3.2. Áp dụng ........................................................................................................... 55
3.2.1. Môi trường thực nghiệm ................................................................... 55
3.2.2. Dữ liệu ............................................................................................... 55
3.2.3. Kiểm tra tính dừng của chuỗi chứng khoán VNM ........................... 57
3.2.4. Nhận dạng mô hình ........................................................................... 57
3.2.5. Ước lượng và kiểm định với mô hình ARIMA ................................ 60


7

3.2.6 Thực hiện dự báo................................................................................ 62
KẾT LUẬN .................................................................................................................64
TÀI LIỆU THAM KHẢO ........................................................................................65


VII

DANH MỤC HÌNH VẼ
Hình 1.1. Xu hướng giảm theo thời gian ........................................................ 13
Hình 1.2. Thành phần mùa .............................................................................. 14
Hình 1.3. Thành phần chu kỳ .......................................................................... 15
Hình 3.1: chọn giadongcua làm mục tiêu dự báo ........................................... 56
Hình 3.2: Xác định d = 0,1,2 ? ........................................................................ 57
Hình 3.3: Biểu đồ của SAC và SPAC của chuỗi giadongcua ........................ 58
Hình 3.4: Biểu đồ của SPAC và SAC ứng với d=1 ........................................ 59
Hình 3.5: Ước lượng mô hình ARIMA(2,1,1) ................................................ 60
Hình 3.6: Kết quả mô hình ARIMA(2,1,1)..................................................... 60
Hình 3.7: Kiểm tra phần dư có nhiễu trắng..................................................... 61
Hình 3.8: Dự báo ............................................................................................. 62


VIII

DANH MỤC BẢNG BIỂU
Bảng 3.1: Dữ liệu đầu vào............................................................................... 56
Bảng 3.2: Tiêu chuẩn đánh giá các mô hình ARIMA..................................... 62
Bảng 3.3: Đánh giá dự báo.............................................................................. 63


1

MỞ ĐẦU
Sự phát triển mạnh mẽ của Công nghệ thông tin và Truyền thông đã
kéo theo nhiều lĩnh vực khác phát triển như khoa học máy tính, đồ họa máy
tính, khí tượng thủy văn, tự động hóa, thiết kế - xây dựng, kinh tế, tài chính,
giáo dục và đào tạo, y tế,… Điều này đã góp phần vào sự nghiệp công nghiệp
hóa – hiện đại hóa đất nước. Trong thực tế, đối với mỗi quốc gia, trong đó có
Việt Nam muốn phát triển và trở thành các nước công nghiệp thì một trong
những vấn đề không thể thiếu là phải nghiên cứu, khảo sát, phân tích tình hình
phát triển của đất nước trong lịch sử và hiện tại để làm cơ sở cho việc ngoại
suy hay suy luận, xây dựng các kế hoạch phát triển trong tương lai với tất cả
các lĩnh vực, ngành nghề,…
Vì ngoại suy hay suy luận là một khoa học và nghệ thuật tiên đoán
những sự việc sẽ xảy ra trong tương lai, trên cơ sở phân tích khoa học về các
dữ liệu đã thu thập được. Khi tiến hành ngoại suy cần căn cứ vào việc thu thập,
xử lý số liệu trong quá khứ và hiện tại để xác định xu hướng vận động của các
hiện tượng trong tương lai nhờ vào một số mô hình toán học (Định lượng). Tuy
nhiên, ngoại suy cũng có thể là một ngoại suy chủ quan hoặc trực giác về
tương lai (Định tính) và để ngoại suy định tính được chính xác hơn, người ta cố
loại trừ những tính chủ quan của đối tượng ngoại suy.
Ngoại suy trước hết là một thuộc tính không thể thiếu của tư duy của con
người, con người luôn luôn nghĩ đến ngày mai, hướng về tương lai. Trong thời
đại công nghệ thông tin và toàn cầu hóa, ngoại suy lại đóng vai trò quan trọng
hơn khi nhu cầu về thông tin thị trường, tình hình phát triển tại thời điểm nào
đó trong tương lai càng cao. Ngoại suy được sử dụng trong nhiều lĩnh vực khác
nhau, mỗi lĩnh vực có một yêu cầu về ngoại suy riêng nên phương pháp ngoại
suy được sử dụng cũng khác nhau.
Trong ngoại suy, các đại lượng khảo sát thường không được cho dưới
dạng hàm liên tục. Trong khi đó, các phương pháp giải tích toán học thường


2

tính toán với các hàm cho bởi các công thức, do đó chúng ta không thể áp dụng
trực tiếp các hàm cho dưới dạng rời rạc như thế này. Cũng có khi ta biết rằng
đại lượng y là một hàm của đại lượng x , tức là y = f (x ), nhưng ta không biết
biểu thức hàm f (x )mà chỉ biết một số giá trị y ứng với các giá trị của x tại
i
các
điểm x i .
Thông thường x 0 < x 1 < x 2 < ... < x n và các điểm này có thể phân bố
cách đều hoặc không cách đều nhau. Mặc dù ta chỉ biết giá trị của y tại các
điểm mốc x i nhưng trong nhiều trường hợp ta cần tính toán với các giá trị y
tại các vị trí khác của x . Một vấn đề được đặt ra là cho một điểm x không
thuộc các điểm x i thì làm thế nào ta có thể tính được giá trị y tương ứng với
nó, sao cho chúng ta tận dụng tối đa các thông tin đã có. Nếu giả định giá trị
cần tìm gần đúng của y tại các điểm x nằm trong khoảng é0, xn úù thì chúng
ê
û
ta
áp dụng các bài toán nội suy.
ë
x
Nhưng trong thực tế, các bài toán không phải lúc nào các điểm x cũng
nằm trong khoảng êé0, xn úùû, chẳng hạn như một số các bài toán về ngoại
suy:
ë
x
(1). Trong tương lai các tình huống sẽ tiếp tục diễn ra như đã xảy ra trong quá
khứ; (2). Đối tượng ngoại suy quá bi quan hoặc ngược lại quá lạc quan về tình
huống cần ngoại suy khi đó kết quả ngoại suy có thể bị ảnh hưởng sai lệch;
(3). Đối tượng ngoại suy không biết nhiều lắm về tình huống ngoại suy. Khi
đó chúng ta cần giả định rằng diễn biến trong tương lai cũng sẽ tương tự như
trong quá khứ. Với các bài toán trên thì x chắc chắn sẽ nằm ngoài khoảng
é
ê ëx
0


3

, xn ùú, và như vậy thì để tìm giá trị gần đúng của y , chúng ta không thể
û
áp
dụng được phương pháp nội suy [1].
Nhằm tìm ra giá trị gần đúng của y , một trong những phương pháp
được sử dụng phổ biến hiện này là áp dụng phương pháp ngoại suy.


Ngoại suy (Extrapolation) là dựa trên những số liệu đã có về một đối
tượng được quan tâm để đưa ra suy đoán về hành vi của đối tượng đó trong
tương lai. Ngoại suy có 2 dạng chính là ngoại suy theo số liệu lát cắt và ngoại
suy theo chuỗi số liệu lịch sử. [12]
Ngoại suy theo số liệu lát cắt (Extrapolation for cross-sectional data) là
dựa trên hành vi của một số thành phần tại một thời điểm nào đó để ngoại suy
về hành vi của các thành phần khác cũng tại thời điểm đó.
Ngoại suy theo chuỗi số liệu (Time-series extrapolation) là dựa trên
chuỗi số liệu lịch sử và sử dụng mô hình toán học để đưa ra kết quả ngoại suy
đối với biến quan tâm. Giả thiết cơ bản là hành vi của biến được ngoại suy sẽ
tiếp tục trong tương lai như đã diễn ra trong quá khứ.
Xuất phát từ vai trò của bài toán ngoại suy trong thực tế, đề tài luận văn
được lựa chọn “Nghiên cứu một số kỹ thuật ngoại suy và ứng dụng”. Trên cơ
sở nghiên cứu một số kỹ thuật ngoại suy, ý nghĩa và tính chất ứng dụng của
chúng và đề xuất việc áp dụng kỹ thuật ngoại suy vào bài toán trong tương lai
cho một số bài toán cụ thể.
Nội dung chính của luận văn được trình bày trong 3 chương:
Chương 1: Giới thiệu chung về dữ liệu chuỗi thời gian.
Chương 2: Một số kỹ thuật ngoại suy.
Chương 3: Áp dụng kỹ thuật ngoại suy vào bài toán dự báo.
Luận văn này được hoàn thành dưới sự hướng dẫn tận tình của TS
Nguyễn Văn Huân, tác giả xin bày tỏ lòng biết ơn chân thành của mình đối
với thầy. Tuy nhiên vì điều kiện thời gian và khả năng có hạn nên luận văn
không thể tránh khỏi những thiếu sót. Tác giả rất mong các thầy giáo và bạn
đóng góp ý kiến để đề tài được hoàn thiện hơn.


5

Chương 1
GIỚI THIỆU CHUNG VỀ DỮ LIỆU CHUỖI THỜI GIAN
1.1. Khái niệm Dữ liệu
1.1.1. Dữ liệu định tính và dữ liệu định lượng
a) Dữ liệu định tính:
Nghiên cứu định tính điển hình là liên quan đến phỏng vấn mặt đối mặt
với người trả lời để hiểu rõ hơn những suy nghĩ và cảm giác của họ.
Có 2 loại nghiên cứu định tính phổ biến là thảo luận bàn tròn và phỏng
vấn cá nhân.
b) Dữ liệu định lượng
Nghiên cứu định lượng liên quan đến các qui trình có tính hệ thống cao
hơn nhằm có được và phân tích các dữ liệu dưới dạng các con số.
1.1.2. Dữ liệu sơ cấp và dữ liệu thứ cấp
a) Dữ liệu sơ cấp
Là những dữ liệu mà nhà nghiên cứu thu thập trực tiếp tại nguồn dữ
liệu và xử lý nó để phục vụ cho việc nghiên cứu đặt ra. Hay nói cách khác, dữ
liệu sơ cấp là dữ liệu do chính người nghiên cứu thu thập.
b) Dữ liệu thứ cấp
Dữ liệu thứ cấp là dữ liệu do người khác thu thập, sử dụng cho các mục
đích có thể là khác với mục đích nghiên cứu của chúng ta. Dữ liệu thứ cấp có
thể là dữ liệu chưa xử lý (còn gọi là dữ liệu thô) hoặc dữ liệu đã xử lý. Như
vậy, dữ liệu thứ cấp không phải do người nghiên cứu trực tiếp thu thập.
Có nhiều nhà nghiên cứu, sinh viên đánh giá thấp nguồn dữ liệu thứ cấp có
sẵn. Vì vậy chúng ta bắt đầu xem xét sự hợp lý của nguồn dữ liệu thứ cấp đối
với vấn đề nghiên cứu của chúng ta trước khi tiến hành thu thập dữ liệu của
chính mình. Các cuộc điều tra về dân số, nhà ở, điều tra doanh nghiệp, điều
tra mức sống dân cư, điều tra kinh tế xã hội gia đình (đa mục tiêu)... do chính
phủ yêu cầu là những nguồn dữ liệu rất quan trọng cho các nghiên cứu kinh tế
xã hội.


6

Ngoài ra một số nguồn dữ liệu dưới đây có thể là quan trọng cho các
nghiên cứu của chúng ta bao gồm:
Các báo cáo của chính phủ, bộ ngành, số liệu của các cơ quan
thống kê về tình hình kinh tế xã hội, ngân sách quốc gia, xuất nhập khẩu,
đầu tư


nước ngoài, dữ liệu của các công ty về báo cáo kết quả tình hình hoạt động
kinh doanh, nghiên cứu thị trường...
Các báo cáo nghiên cứu của cơ quan, viện, trường đại học.
 Các bài viết đăng trên báo hoặc các tạp chí khoa học chuyên
ngành và tạp chí mang tính hàn lâm có liên quan.


Tài liệu giáo trình hoặc các xuất bản khoa học liên quan đến vấn đề
nghiên cứu.




Cuối cùng nhưng không kém phần quan trọng là các bài báo cáo

hay
luận văn của các sinh viên khác (khóa trước) trong trường hoặc ở các trường
khác.
Dữ liệu thứ cấp có ưu điểm là giúp tiết kiệm tiền bạc, thời gian.
Nhưng cần chú ý đến nhược điểm trong sử dụng là:
Số liệu thứ cấp này đã được thu thập cho các nghiên cứu với các
mục đích khác và có thể hoàn toàn không hợp với vấn đề của chúng ta; khó
phân


loại dữ liệu; các biến số, đơn vị đo lường có thể khác nhau...
Dữ liệu thứ cấp thường đã qua xử lý nên khó đánh giá được mức độ
chính xác, mức độ tin cậy của nguồn dữ liệu.


Vì vậy trách nhiệm của người nghiên cứu là phải đảm bảo tính chính
xác của dữ liệu, phải kiểm tra xem các kết quả nghiên cứu của người khác là
dựa vào dữ liệu thứ cấp hay sơ cấp. Vì vậy điều quan trọng là phải kiểm tra
dữ liệu gốc.


7

1.2. Chuỗi thời gian và Dữ liệu chuỗi thời gian
1.2.1. Chuỗi thời gian
1.2.1.1. Khái niệm chuỗi thời gian.
Khái niệm chuỗi thời gian: Chuỗi các quan sát được thu thập trên
cùng một đối tượng tại các mốc thời gian cách đều nhau được gọi là chuỗi
thời gian. Các quan sát này có thể đo được một cách liên tục theo thời gian
hoặc là có thể được lấy theo một tập rời rạc các thời điểm khác nhau.

X :=

Một

chuỗi

{x , x

2

1

thời

gian



một

dãy

các

giá

trị

quan

sát

, ..., x n }được xếp thứ tự diễn biến thời gian vớix là các giá trị

1

n

quan sát tại thời điểm đầu tiên, x 2 là quan sát tại thời điểm thứ hai và x là
quan sát tại thời điểm thứ n .
Ví dụ: Các báo cáo tài chính mà ta thấy hằng ngày trên báo chí, tivi hay
Internet về các chỉ số chứng khoán, tỷ giá tiền tệ, chỉ số tăng cường hay chỉ số
tiêu dùng đều là những thể hiện rất thực tế của chuỗi thời gian.
Bước đầu tiên của việc phân tích chuỗi thời gian là chọn một mô hình
toán học phù hợp với tập dữ liệu cho trước X :=

{x , x
1

2

, ..., x n } nào đó. Để


thể nói về bản chất của những quan sát chưa diễn ra, ta giả thiết mỗi quan sát
x n là một giá trị thể hiện của biến ngẫu nhiên X t với t Î T . Ở đây T được
gọi là tập chỉ số. Khi đó ta có thể coi tập dữ liệu X :=

{x , x
1

2

, ..., x n }là

thể
hiện của quá trình ngẫu nhiên
Î

{X

t

, t T }. Và vì vậy, ta có thể định nghĩa

một quá trình ngẫu nhiên như sau:
Định nghĩa 1.1 (Quá trình ngẫu nhiên)


8

Một quá trình ngẫu nhiên là một họ các biến ngẫu nhiên

}
được định nghĩa trên một không gian xác suất (W, A, P ).

{X

t

,t Î T


Chú ý:
Trong việc phân tích chuỗi thời gian, tập chỉ số T là một tập các thời
điểm, ví dụ như là tập

{1, 2, ...}hay tập (-

, + ¥ ). Tất nhiên cũng có những

¥
quá trình ngẫu nhiên có T không phải là một tập con của R nhưng trong giới
hạn của luận văn này ta chỉ xét cho trường hợp T Î R . Và thường thì ta xem
T là các tập các số nguyên, khi đó ta sẽ sử dụng ký hiệu tập chỉ số là Z thay
vì T ở trên. Một điểm chú ý nữa là trong luận văn này chúng ta sẽ dùng thuật
ngữ chuỗi thời gian để đồng thời chỉ dữ liệu cũng như quá trình có dữ liệu đó
là một thể hiện.
Trong các dạng dữ liệu được phân tích thì dữ liệu chuỗi thời gian luôn
thuộc tốp đầu về tính phổ biến
1.2.1.2. Quá trình ngẫu nhiên dừng
Định nghĩa 1.2 (Hàm tự hiệp phương sai)

{X

Giả sử
Î

t

, t Z }là một quá trình ngẫu nhiên có V ar (X t ) < ¥
với
t

mỗi t Î Z . Khi đó hàm tự hiệp phương sai của X được định nghĩa theo
công thức sau:
gx (r, s)
:=

cov(X r , X s ) E [(X r
=
-

EX r )(X s - EX s )], với r, s Î Z .

Định nghĩa 1.3 (Quá trình dừng)
Chuỗi thời gian {X t , t Z } được gọi là dừng nếu nó thoả mãn 3 điều
Î
kiện sau:
2

- E Xt < ¥ , " t Î Z
- EX t = m , " t Î Z
- g x (r, s) = g x (r + t, s + t ), " t, r, s Î Z


9

Định lý 1.1

{X

Nếu

t

Î

, t Z }là một quá trình dừng, và nếu như at Î R , i Î
Z
¥

å

mãn điều kiện

ai < ¥ thì hệ thức Y t :=

i=- ¥

¥

å

thoả

ai X t -i, t Î Z sẽ định nghĩa

i=- ¥

một quá dừng.
Chú ý: Cũng có tài liệu gọi “dừng” theo nghĩa trên là dừng yếu,
dừng theo nghĩa rộng hay dừng bậc hai. Tuy nhiên trong giới hạn luận văn
chỉ xem
xét tính dừng theo định nghĩa ở trên.
Khi chuỗi thời gian {X t , t Z }là dừng thì
Î
yx = (r, s) º g (r - s, 0), " r, s Î Z ,
x

Và vì vậy, với một quá trình dừng thì có thể định nghĩa lại hàm tự hiệp
phương sai bằng cách chỉ thông qua hàm một biến. Khi đó, với quá trình dừng

{X
Î

t

, t Z ta có:
}

yx (h) º gx (h, 0) = Cov(X
, X t ), " t, h Î Z
t+h

Hàm số y x (.) = được gọi là hàm tự hiệp phương sai của X , còn
t

g x (h )là giá trị của nó tại “trễ” h . Đối với một quá trình dừng thì ta thường ký
hiệu hàm tự hiệp phương sai bởi g (.) thay


g x (.).

Với một quá trình dừng thì hàm hiệp phương sai có các tính chất
g (0) 0 , g (h ) g (0), " h Î Z
³

£

Và nó còn là một hàm chẵn nghĩa là:
g (h ) =


10

g (- h ), " h Î Z
1.2.1.3. Hàm tự tương quan
Định nghĩa 1.4
Hàm tự tương quan của quá trình ngẫu nhiên
Î
nghĩa tại trễ h như sau:

{X

t

, t Z } được định


10

r (h) := g(h) / g(0) = Corr (X

t+h

, X ), " t, h Î Z
t

Chú ý:
Trong thực tế, ta chỉ quan sát được một thể hiện hữu hạn
X :=

{x , t
t

=

1, 2, ..., n } của một chuỗi thời gian dừng nên về nguyên tắc
ta

không thể biết chính xác được các hàm tự hiệp phương sai của chuỗi thời gian
đó, muốn ước lượng nó ta đưa vào khái niệm hàm tự hiệp phương sai mẫu của
thể hiện X .
Hàm tự hiệp phương sai mẫu của một thể hiện X được định nghĩa bởi
công thức:
c(h) := -n

- 1

n

1n - h
- x)
- x ), 0 £ h < n
(x
(x å
j+h
j=1 j
n

Và c(h) := c(- h), n < h £ 0, trong đó x = - 1å x j là trung bình mẫu.
n j=1
Khi đó thì hàm tương tự tương quan mẫu cũng định nghĩa thông qua
hàm tự hiệp phương sai mẫu như sau:
r (h) := c(h) / c(0), h < n .

1.2.1.4. Tính chất của chuỗi thời gian
Các tính chất đặc trưng của chuỗi thời gian là: Tính dừng và tính
mùa vụ.
Dù một chuỗi thời gian có thể biểu hiện một hoặc nhiều tính chất
nhưng khi trình bày, phân tích và dự báo giá trị của chuỗi thời gian thì mỗi
tính chất được xử lý tách rời.
a) Tính dừng
Một dãy số liệu theo thời gian có giá trị trung bình và phương sai không
đổi theo thời gian thì dãy số được xem như có tính dừng hay còn gọi là ổn định.
Trong trường hợp ngược lại, ta nói dãy số liệu đó không có tính dừng.


Xét dãy số Y t , về mặt toán học, một dãy số liệu có tính dừng phải thỏa
mãn các điều kiện sau:
E (Y t ) = V ar (Y t ) = Covar (Y t ,Y t - k )
Trung bình: E (Y t ) Const
=
Phương sai: V ar (Y t ) Const
=
Đồng phương sai: Covar (Y t ,Y t - k ) =g

k

Chuỗi Y t được gọi là không dừng nếu vi phạm điều kiện trên.
Nếu chuỗi Y t không dừng, ta có thể lấy sai phân bậc 1. Khi đó chuỗi sai
phân bậc 1 ( Wt ) sẽ có thể dừng. Sai phân bậc 1: Wt = Yt - Yt - 1
Nếu chuỗi sai phân bậc 1 ( Wt ) không dừng, ta có thể lấy sai phân bậc
2. Khi đó chuỗi sai phân bậc 2 có thể dừng. Sai phân bậc 2:
V

= W - W .
t

t

t- 1

Chuỗi dừng có xu hướng trở về giá trị trung bình và những dao động
quanh giá trị trung bình sẽ là như nhau. Nói cách khác, một chuỗi thời gian
không dừng sẽ có giá trị trung bình thay đổi theo thời gian, hoặc giá trị
phương sai thay đổi theo thời gian hoặc cả hai.
b) Tính mùa vụ
Nếu sai phân bậc 2 mà chưa dừng, có thể chuỗi Y t có yếu tố mùa vụ.
(Nếu có yếu tố mùa vụ, tức là chuỗi vẫn chưa dừng).
Nếu cứ sau m thời đoạn, SAC lại có giá trị cao. Khi đó Y t có tính mùa
vụ với chu kỳ m thời đoạn. Phương pháp đơn giản nhất để khử tính mùa vụ là
lấy sai phân thứ m
Zt = Y t - Y t - m


1.2.2. Dữ liệu chuỗi thời gian.
1.2.2.1. Khái niệm Dữ liệu chuỗi thời gian.
Mặt lượng của hiện tượng thường xuyên biến động qua thời gian.
Trong thống kê để nghiên cứu sự biến động này ta thường dựa vào dữ liệu
chuỗi thời gian.
Dữ liệu chuỗi thời gian là dãy số các trị số của chỉ tiêu thống kê được
sắp xếp theo thứ tự thời gian.
Dữ liệu chuỗi thời gian còn được phân biệt theo tần suất xuất hiện: số
liệu theo năm, số liệu theo quý, số liệu theo tháng…
Ví dụ:
- Số lượng hàng bán được trong 12 tháng của một công ty.
- Các gía trị của chuỗi thời gian của đại lượng X được ký hiệu
X , , ... , ...X , với X là gía trị quan sát của X ở thời điểm t .
X 1 2X t
n
t
Dữ liệu chuỗi thời gian có hai thành phần:
- Thời gian: có thể là ngày, tuần, tháng, quí, năm,.... Độ dài giữa hai
thời gian liền nhau được gọi là khoảng cách thời gian.
- Chỉ tiêu về hiện tượng nghiên cứu: chỉ tiêu này có thể là số tuyệt đối,
số tương đối, số bình quân. Trị số của chỉ tiêu còn gọi là mức độ của dãy số.
* Phân loại dãy số thời gian:
Căn cứ vào tính chất thời gian của dữ liệu, có thể phân biệt thành 2 loại:
1. Dữ liệu thời kỳ: là dãy số biểu hiện mặt lượng của hiện tượng qua
từng thời kỳ nhất định.
2. Dữ liệu thời điểm: là loại dãy số biểu hiện mặt lượng của hiện tượng
qua các thời điểm nhất định. Dãy số này còn được phân biệt thành 2 loại:
- Dữ liệu thời điểm có khoảng cách thời gian đều nhau.
1.2.2.2. Các thành phần của dữ liệu chuỗi thời gian
Các nhà thống kê thường chia chuỗi theo thời gian thành 4 thành phần:
- Thành phần xu hướng dài hạn (long –term trend component)


- Thành phần mùa (seasional component)
- Thành phần chu kỳ (cyclical component)
- Thành phần bất thường (irregular component)
a) Thành phần xu hướng dài hạn
Xu hướng dài hạn thể hiện sự tăng trưởng hoặc giảm sút của một biến
số theo thời gian với khoảng thời gian đủ dài. Một số biến số kinh tế có xu
hướng tăng giảm dài hạn như
- Tốc độ tăng dân số của Việt Nam có xu hướng giảm.
- Tỷ trọng nông nghiệp trong GDP của Việt Nam có xu hướng giảm.
- Mức giá có xu hướng tăng.
Thành phần xu hướng dài hạn dùng để chỉ xu hướng tăng hay giảm của
đại lượng X trong thời gian dài. Về mặt đồ thị thành phần này có thể biểu diễn
bởi một đường thẳng hay một đường cong trơn.

Hình 1.1. Xu hướng giảm theo thời gian
 Được sử dụng khi:
- Tăng năng suất hay công nghệ mới làm thay đổi lối sống
- Dân số tăng làm tăng nhu cầu hàng hóa/dịch vụ
- Các biến bị ảnh hưởng bởi lạm phát như lương, chi phí sản xuất, sinh
hoạt
- Mức độ chấp nhận của thị trường gia tăng
 Phương pháp áp dụng: Phương pháp trung bình trượt, san mũ
(Holt), hồi quy đơn, đường tăng trưởng, mô hình mũ.


14

b) Thành phần mùa
Biến động thời vụ của biến số kinh tế là sự thay đổi lặp đi lặp lại từ
năm này sang năm khác theo mùa vụ. Biến động thời vụ xảy ra do khí hậu,
ngày lễ, phong tục tập quán…Biến động thời vụ có tính ngắn hạn với chu kỳ
lặp lại thường là 1 năm.
Thành phần mùa dùng để chỉ xu hướng tăng hay giảm của đại lượng X
tính theo mùa trong năm (có thể tính theo tháng trong năm)
Ví dụ:
- Lượng tiêu thụ chất đốt sẽ tăng vào mùa đông và giảm vào mùa hè,
ngược lại, lượng tiêu thụ xăng sẽ tăng vào mùa hè và giảm vào mùa đông.
- Lượng tiêu thụ đồ dùng học tập sẽ tăng vào mùa khai trường

Hình 1.2. Thành phần mùa
 Được sử dụng khi:
- Thời tiết ảnh hưởng đến biến đang xem xét
- Niên lịch ảnh hưởng đến biến đang xem xét
 Gồm có phương pháp phân tích, san mũ Winter, hồi quy bội…
c) Thành phần chu kỳ (cyclical component)
Các số liệu kinh tế thường có sự tăng giảm có quy luật theo chu kỳ kinh
tế. Sau một thời kỳ suy thoái kinh tế sẽ là thời kỳ phục hồi và bùng nổ kinh tế,


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay

×