Tải bản đầy đủ

Tài liệu đồ án tốt nghiệp Đề Tài: tìm hiểu ngôn ngữ vc++ 6.0 Và ứng dụng trong việc nén và giải nén tập tin văn bản doc


Đồ áN TốT NGHIệP
Đề Tài:
TìM HIểU NGÔN NGữ VC++ 6.0 Và ứng dụng
trong việc nén và giải nén tập tin văn bản
GVHD: Th.s Huỳnh Thanh Bình
SVTH:Nguyễn Đức Nghĩa
MSSV:98S1049
Lớp 40TH
Nha Trang 10/2003

Lời Cảm Ơn
Em xin đợc nói lên lời cảm ơn đấng
sinh thành và Thầy, Cô đã nuôi, dạy
em lớn khôn.

Yêu cầu của đề tài
Yêu cầu của đề tài

Tìm hiểu ngôn ngữ VC ++ 6.0


Nghiên cứu và cài đặt một số thuật
toán nén và giải nén tập tin văn bản

Nhng khỏi nim c bn v mc
Nhng khỏi nim c bn v mc
ớch ca vic nộn d liu.
ớch ca vic nộn d liu.

Mt s phng phỏp nộn
Mt s phng phỏp nộn

Thc hin chng trỡnh
Thc hin chng trỡnh

Kt lun.
Kt lun.

Những khái niệm cơ bản và mục
Những khái niệm cơ bản và mục
đích của việc nén dữ liệu
đích của việc nén dữ liệu
*Khỏi nim d liu
L bao gm cỏc phn t c s m ta gi l d liu
nguyờn t.
*Mc ớch ca vic nộn d liu

Lu tr d liu c nhiu hn.

Tit kim c vựng nh.

Gim chi phớ lu tr.

Mang li hiu qu cho vic truyn d liu trờn mng.
*Dng nộn
Cú hai dng nộn bo ton v nộn khụng bo ton.

*Quá trình nén và giải nén
*Quá trình nén và giải nén

Công đoạn nén:


Dữ liệu Mã hoá Đóng gói Dữ liệu nén

Công đoạn giải nén:
Giải mã
Mã hoá
Dữ liệu nén
Dữ liệu gốc

MỘT SỐ PHƯƠNG PHÁP NÉN
MỘT SỐ PHƯƠNG PHÁP NÉN
*Định nghĩa nén dữ liệu
Là để ghi lại dòng dữ liệu sao cho tốn ít bộ nhớ hơn mà có thể
cho phép chúng ta khôi phục lại dữ liệu ban đầu.
*Một số loại mã

Mã ký hiệu:Quy ước các mã được sử dụng để nhận ra một
chuỗi các sự kiện khác nhau.

Mã đóng gói:Trong phương pháp mã bao giờ cũng có một
khâu đóng gói.

Mã theo độ dài:Là phát hiện một ký tự có số lần xuất hiện liên
tiếp vượt qua một ngưỡng cố định nào đó.

*
*
Mô hình nén
Mô hình nén

Nén dữ liệu có mô hình nguồn
Những thuật toán nén dữ liệu đặt trưng cho mô hình
nguồn điển hình là:

Thuật toán Huffman.

Thuật toán Fano-Shannon

Nén dữ liệu chưa có mô hình nguồn
Một trong những đặt điểm nén dữ liệu chưa có mô hình
nguồn là ngôn ngữ tự nhiên.

*Kỹ thuật từ điển
*Kỹ thuật từ điển

Sử dụng phương pháp phân đoạn văn bản thành các đoạn
Sử dụng phương pháp phân đoạn văn bản thành các đoạn
nhỏ hơn sao cho nó đạt được độ dài nhất có thể được mà nó
nhỏ hơn sao cho nó đạt được độ dài nhất có thể được mà nó
đã xuất hiện trong quá khứ.
đã xuất hiện trong quá khứ.

Định nghĩa về phân đoạn văn bản:
Định nghĩa về phân đoạn văn bản:


Phân đoạn văn bản A là chia nó ra thành các đoạn nhỏ
Phân đoạn văn bản A là chia nó ra thành các đoạn nhỏ
hơn, mỗi đoạn được gọi là một phân đoạn.
hơn, mỗi đoạn được gọi là một phân đoạn.

Có hai loại từ điển:
Có hai loại từ điển:



Tù điển tĩnh:
Tù điển tĩnh:


Mã có từ điển cố định được gọi là mã tĩnh hay nói cách
Mã có từ điển cố định được gọi là mã tĩnh hay nói cách
khác là từ điển tĩnh.
khác là từ điển tĩnh.

Từ điển động:
Từ điển động:


Được xây dựng trong quá trình chạy chương trình.
Được xây dựng trong quá trình chạy chương trình.

THỰC HIỆN CHƯƠNG TRÌNH
THỰC HIỆN CHƯƠNG TRÌNH
*Chương trình đã cài đặt được các thuật toán
*Chương trình đã cài đặt được các thuật toán
nén theo kỹ thuật từ điển sau:
nén theo kỹ thuật từ điển sau:




Thuật toán LZSS
Thuật toán LZSS






Thuật toán LZARI
Thuật toán LZARI




Thuật toán LZW
Thuật toán LZW

*
*
Thuật toán LZSS
Thuật toán LZSS
Thuật toán nén:
1. Đặt vị trí mã hoá nơi bắt đầu của dòng đầu vào
2. Tìm sự phù hợp tối đa trong cửa sổ cho vùng đệm
P :=con trỏ tới sự phù hợp
L:= chiều dài của sự phù hợp
3. If L>=MIN_LENGTH then
-Đầu ra P và di chuyển vị trí mã hoá một ký tự ở trước.
else
Đầu ra là ký tự đầu tiên của vùng đệm và chuyển vị trí
mã hoá một ký tự ở trước.
4.Nếu có nhiều ký tự trong luồng đầu vào thì trở về bước 2.
Thuật toán giải nén:
Ngược lại quá trình nén.

Ví dụ thuật toán nén lzss
Ví dụ thuật toán nén lzss

*Thuật toán LZW
*Thuật toán LZW
Thuật toán nén lzw:
String=lấy ký tự vào
While vẫn còn ký tự vào Do
begin
ch:=lấy ký tự vào
if String +ch là trong bảng chuỗi then
String = String+ch
else
begin
Đầu ra Code của String
Thêm String + ch tới bảng chuỗi String
String=ch
end;
End;


Thuật toán giải nén LZW
Thuật toán giải nén LZW
Read Old_code
While Vẫn còn ký tự đầu vào Do
begin
read New_code
String=sự chuyển đổi của New_code
Output String
ch= ch đầu tiên trong String
Thêm Old_code + ch để chuyển đổi bảng
old_code=New_code
end

*
*
Thuật toán LZW
Thuật toán LZW
Ví dụ thực hiện nén:
Ví dụ thực hiện giải nén:
Ví dụ thực hiện giải nén:

*
*
So sánh giữa các thuật toán
So sánh giữa các thuật toán

KẾT LUẬN
KẾT LUẬN
*Đánh giá chương trình

Đã cài đặt được một số thuật toán nén theo kỹ thuật từ điển
như: LZSS, LZARI,LZW.

Do hạn chế về tài liệu tham khảo nên một số thuật toán nén
khác chưa cài đặt được.
*Hướng phát triễn

Có thể mở rộng chương trình để thực hiện trong việc nén tập
tin hình ảnh.

Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay

×