Tải bản đầy đủ

Xây dựng các lược đồ thủy vân bền vững bằng cách kểt hợp phép biến đổi DWT và SVD

i

LỜI CAM ĐOAN
Tôi xin cam đoan toàn bộ nội dung luận văn này là do tôi tự sưu tầm,
biên soạn và nghiên cứu.
Nội dung của luận văn này chưa từng được ai khác công bố hay xuất bản
dưới bất kỳ hình thức nào và cũng không được sao chép từ bất kỳ một công
trình nghiên cứu nào.
Toàn bộ mã nguồn chương trình hoàn toàn do tôi tự tay viết và chỉnh sửa
dưới sự hướng dẫn của thầy giáo hướng dẫn, kết quả thử nghiệm hoàn toàn do
tôi tìm hiểu và thực hiện.
Nếu sai tôi xin hoàn toàn chịu trách nhiệm.
Thái Nguyên, ngày 10 tháng 4 năm 2016
Học viên

Nguyễn Nam Phương


ii

LỜI CẢM ƠN


Tôi xin bày tỏ lòng biết ơn sâu sắc đến thầy giáo PGS.TS.Nguyễn Bá
Tường- Trường Học viện Kĩ thuật Quân sự là người đã trực tiếp hướng dẫn,
chỉ bảo tận tình và hết lòng giúp đỡ tôi trong suốt thời gian làm luận văn này.
Xin được cảm ơn các anh, chị và các bạn đồng nghiệp trong nhóm
nghiên cứu an toàn bảo mật thông tin do thầy Nguyễn Bá Tườnghướng dẫn đã
có những góp ý quý báu trong quá trình nghiên cứu và trình bày luận văn.
Tôi cũng chân thành cảm ơn những người thân trong gia đình, bạn bè đã
động viên và tạo mọi điều kiện giúp tôi trong quá trình học tập, công tác cũng
như trong cuộc sống.
Cuối cùng tôi xin gửi lời chúc sức khỏe và thành công tới tất cả quý thầy
cô và gia đình cùng toàn thể các bạn.
Thái Nguyên, ngày 10 tháng 4 năm 2016
Học viên

Nguyễn Nam Phương


iii

MỤC LỤC
LỜI CAM ĐOAN ........................................................................................... i
LỜI CẢM ƠN ................................................................................................ ii
MỤC LỤC .................................................................................................... iii
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT ...................................... v
DANH MỤC BẢNG ..................................................................................... vi
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ ....................................................... vii
LỜI MỞ ĐẦU ................................................................................................ 1
Chương 1. CÁC KHÁI NIỆM CƠ SỞ............................................................ 3
1.1. Ảnh số ................................................................................................. 3
1.1.1.Khái niệm và phân loại ảnh số ....................................................... 3
1.1.2.Điểm ảnh ....................................................................................... 4
1.1.3.Màu và mô hình màu ..................................................................... 5
1.1.4.Histogram ...................................................................................... 9
1.1.5.Định dạng ảnh ............................................................................. 10
1.2. Các phép biến đổi ma trận ................................................................. 12
1.2.1.Biến đổi Cosine rời rạc DCT ....................................................... 12
1.2.2.Biến đổi Wavelet rời rạc DWT..................................................... 15
1.2.3.Biến đổi SVD .............................................................................. 16
1.3. Giấu tin.............................................................................................. 18

1.3.1.Khái niệm giấu tin ....................................................................... 18
1.3.2.Giấu tin trên miền không gian...................................................... 20
1.3.3.Giấu tin trên miền biến đổi .......................................................... 21
1.4. Thủy vân số ....................................................................................... 22
1.4.1.Khái niệm .................................................................................... 22
1.4.2.Phân loại ...................................................................................... 22
1.4.3.Các yêu cầu đối với hệ thống thủy vân ........................................ 25
1.4.4.Mô hình thủy vân cơ bản ............................................................. 25
1.4.5.Tấn công thủy vân ....................................................................... 27


iv

1.4.6.Đánh giá chất lượng thủy vân ...................................................... 27
1.4.7.Ứng dụng của thủy vân ................................................................ 29
Chương 2. THỦY VÂN BỀN VỮNG DỰA TRÊN CÁC PHÉPBIẾN ĐỔI
DWT VÀ SVD ............................................................................................. 31
2.1. Giới thiệu chung ................................................................................ 31
2.2. Khai triển SVD .................................................................................. 31
2.2.1. Khái niệm về khai triển SVD ...................................................... 31
2.2.2. Một số tính chất của khai triển SVD ........................................... 32
2.3. Thủy vân trên miền SVD .................................................................. 34
2.4. Phương pháp DMA [5]: Thủy vân kết hợp SVD và DWT ba mức ..... 37
2.4.1. Thuật toán chuyểnđổi sang dãy nhị phân .................................... 37
2.4.2. Thuật toán nhúng thủy vân.......................................................... 37
2.4.3. Thuật toán trích thủy vân ............................................................ 39
2.4.4. Nhận xét và đánh giá .................................................................. 40
2.5. Phương pháp TDD [6]: Thủy vân sử dụng SVD và DWT hai mức. ... 41
2.5.1. Giới thiệu.................................................................................... 41
2.5.2. Thuật toánnhúng thủy vân .......................................................... 41
2.5.3. Thuật toán trích........................................................................... 42
2.5.4. Nhận xét và đánh giá .................................................................. 43
Chương 3. THỰC NGHIỆM, PHÂN TÍCH VÀ SO SÁNHCÁC LƯỢC ĐỒ
THỦY VÂN ................................................................................................. 44
3.1. Các Độ đo xác định chất lượng và tính bền vững............................... 44
3.2 Giới thiệu chương trình ...................................................................... 44
3.3. Kết quả thử nghiệm ........................................................................... 49
3.3.1. Kết quả lược đồ DMA ................................................................ 49
3.3.2. Kết quả lược đồ TDD so sánh lược đồ với DMA ........................ 51
KẾT LUẬN.................................................................................................. 53
TÀI LIỆU THAM KHẢO ............................................................................ 54


v

DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT

Chữ viết tắt
SVD
QR
NMF

Diễn giải

Ý nghĩa

Singular Value Decomposition

Biến đổi SVD

QR Decomposition

Biến đổi QR

Non-negative Matrix Factorization Thừa số hóa ma trận không
âm

DCT

Discrete Cosine Transform

Biến đổi Cosine rời rạc

IDCT

Invert Discrete Cosine Transform

Biến đổi ngược DCT

DFT

Discrete Fourier Transform

Biến đổi Forier rời rạc

IDFT

Invert Discrete Fourier Transform

Biến đổi ngược DFT

DWT

Discrete Wavelet Transform

Biến đổi Wavelet rời rạc

IDWT

Invert Discrete Wavelet Transform Biến đổi ngược DWT

FT

Fourier Transfer

Biến đổi Fourier


vi

DANH MỤC BẢNG

Bảng 3.1: Kết quả thử nghiệm về chất lượng ảnh sau khi ............................. 49
nhúng thủy vân: ............................................................................................ 49
Bảng 3.2: Kết quả thử nghiệm tính bền vững của lược đồ thủy vân:............. 49
Bảng 3.3: Kết quả thử nghiệm tính bền vững của lược đồ thủy vân .............. 50
sau khi ảnh thủy vân bị tấn công: ................................................................. 50
Bảng 3.4: So sánh chất lượng ảnh của lược đồ DMA và TDD. ..................... 51
Bảng 3.5: Bảng So sánh tính bền vững của lược đồ DMA và TDD .............. 52
dựa trên độ đo hệ số tương quan r. ............................................................... 52


vii

DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Hình 1.1: Biểu diễn các điểm ảnh trong ảnh số............................................... 4
Hình 1.2: Tổ hợp màu Red-Green-Blue trong hệ màu RGB ........................... 6
Hình 1.3: Tổ hợp các màu trong mô hình màu CMYK ................................... 7
Hình 1.4: Mặt phẳng màu U-V tại giá trị Y = 0.5 ........................................... 8
Hình 1.5: Biểu đồ histogram của ảnh đa cấp xám Lena .................................. 9
Hình 1.6: Cấu trúc tệp ảnh bitmap ................................................................ 10
Hình 1.7: Sơ đồ quá trình giấu tin................................................................. 19
Hình 1.8: Sơ đồ quá trình giải mã tin giấu .................................................... 20
Hình 1.9: Phân loại các kỹ thuật thủy vân..................................................... 23
Hình 1.10: Mô hình hệ thống thủy vân cơ bản .............................................. 26
Hình 2.1: Một khối ảnh 8 8 của ảnh Baboon ............................................... 32
Hình 2.2: Kết quả phân tích SVD đối với ma trận A của .............................. 33
Hình 2.3: Sơ đồ nhúng thủy vân DMA ......................................................... 39
Hình 2.4: Sơ đồ nhúng thủy vân TDD .......................................................... 42
Hình 2.5: Sơ đồ Trích thủy vân .................................................................... 43


1

LỜI MỞ ĐẦU
Ngày nay, cùng với sự phát triển mạnh mẽ của công nghệ thông tin và
truyền thông, mạng Internet đã trở thành một trong các phương tiện truyền tải,
chia sẻ thông tin, tài liệu một cách thuận tiện, hiệu quả. Thông tin luôn sẵn
sàng trực tuyến, mọi người đều có thể kết nối vào Internet để tìm kiếm một
cách dễ dàng các thông tin cần thiết. Bên cạnh đó, các công ty, các nhà cung
cấp sản phẩm có thể bán sản phẩm của mình thông qua mạng Internet cũng
như sẵn sàng cung cấp dữ liệu, thông tin về các sản phẩm, dịch vụ của mình
cho người dùng thông qua hệ thống mạng Internet một cách hiệu quả.
Với lượng thông tin được truyền qua mạng ngày càng nhiều thì vấn nạn
sao chép và sử dụng không hợp pháp dữ liệu số ngày một tăng.Tuy nhiên việc
quản lý và khai thác các thông tin này lại đôi khi nằm ngoài tầm kiểm soát
của các cá nhân, tổ chức do vấn nạn sao chép bất hợp pháp, vi phạm bản
quyền ngày một gia tăng. Từ đó cần thiết phải có các giải pháp chống sao
chép để hạn chế việc vi phạm bản quyền các sản phẩm dữ liệu số.
Một trong những giải pháp hữu hiệu để bảo vệ bản quyền là kỹ thuật
thủy vân số.Thủy vân số dựa trên kết quả nghiên cứu của nhiều lĩnh vực khác
nhau như: Mật mã học, kỹ thuật giấu tin, lý thuyết thống kê và xử lý tín hiệu
số. Mục đích của phương pháp này là nhúng một lượng thông tin có ích vào
các sản phẩm số (lượng thông tin này được gọi là thủy vân). Dựa trên mục đích
sử dụng các lược đồ thủy vân được chia thành hai nhóm chính gồm thủy vân
bền vững và thủy vân dễ vỡ. Thủy vân dễ vỡ là kỹ thuật nhúng thủy vân vào
trong ảnh, khi có bất kì sự can thiệp hay thay đổi nào tới ảnh gốc thì dấu thủy
vân sẽ không còn nguyên vẹn; kỹ thuật thủy vân này được ứng dụng trong bài
toán xác thực tính toàn vẹn dữ liệu số. Trong khi đó thủy vân bền vững được
ứng dụng trong bài toán bảo vệ bản quyền đối với các sản phẩm số.


2

Luận văn trình bày một số lược đồ thủy vân bền vững dựa trêncác phép
biến đổi SVD,DWTứng dụng trong việc bảo vệbản quyền trên dữ liệu ảnh số.
Đây là hướng nghiên cứu mới trên thế giới, có ý nghĩa khoa học và ứng dụng
thực tiễn. Nội dung luận văn được tổ chức thành ba chương như sau:
Chương 1:Trìnhbàytổngquanvềcác kiến thức cơ bản về ảnh số, một số
phép biến đổi ma trận, khái niệm về giấu tin và thủy vân số.
Chương 2: Trình bày các kết quả nghiên cứu về thủy vân số dựa trên sự
kết phép biến đổi SVD và DWT đã được công bố và đề xuất hai lược đồ thủy
vân mới sử dụng kết hợp phếp biến đổi SVD và DWT.
Chương 3: Trình bày các phântích,đánhgiá và so sánh giữa các lược đồ
thủy vân đã trình bày trong chương 2.Đồng thời tác giả cũng đưa ra kết quả
chương trình thử nghiệm cho các lược đồ trên.


3

Chương 1. CÁC KHÁI NIỆM CƠ SỞ

Chương này trình bày các khái niệm cơbản về ảnh số, ảnh nhị phân,
ảnh đa mức xám, ảnh mầu, điểm ảnh, mầu và mô hình mầu, các định dạng
ảnh, các phép biến đổi ma trận thường dùng trong xử lý ảnh, các khái niệm về
giấu tin, thủy vân số.
1.1. Ảnh số
1.1.1. Khái niệm và phân loại ảnh số
Ảnh số là tập hợp bao gồm hữu hạn các phần tử được gọi là điểm ảnh
(pixel), mỗi điểm ảnh được biểu diễn bởi một số hữu hạn các bit.
Trên phương diện toán học, ảnh số được xem như là một ma trận
nguyên dương gồm m hàng và n cột, mỗi phần tử của ma trận đại diện cho
một điểm ảnh. Dựa theo màu sắc ta có thể chia ảnh số thành 3 loại cơ bản:
Ảnh nhị phân, ảnh đa cấp xám và ảnh màu (true color).
Ảnh nhị phân
Ảnh nhị phân là ảnh chỉ có hai màu, một màu đại diện cho màu nền và
màu còn lại cho đối tượng của ảnh.Nếu hai màu là đen và trắng thì gọi là ảnh
đen trắng.Như vậy, ảnh nhị phân được xem như một ma trận nhị phân.
Ảnh đa mức xám
Ảnh đa cấp xám là ảnh có thể nhận tối đa 256 mức sáng khác nhau
trong khoảng màu đen - màu trắng. Như vậy, ảnh đa mức xám xem như là ma
trận không âm có giá trị tối đa là 255. Mỗi điểm ảnh trong ảnh đa cấp xám
biểu diễn cường độ sáng của ảnh tại điểm đó.
Ảnh màu
Ảnh màu hay còn gọi là ảnh true color, mỗi điểm ảnh được biểu diễn
bởi một số byte (thường là 3 byte)đại diện cho 3 thành phần màu và như vậy,
ảnh màu có thể xem như 3 ma trận nguyên ứng với 3 thành phần màu của các


4

điểm ảnh.Hệ màu RGB sẽ bao gồm 3 ma trận màu tương ứng với các giá trị
Red, Green và Blue.Đây là hệ màu được sử dụng phổ biến nhất.
Ngoài ra, ảnh cũng cũng có thể được phân thành hai loại: Ảnh có tần số
cao và ảnh có tần số thấp.
1.1.2. Điểm ảnh
Điểm ảnh (pixel, picture element) là một phần tử ảnh, đơn vị thông tin
nhỏ nhất trong một ảnh dạng raster.Ảnh số (digital image) là tập hợp hữu hạn
các điểm ảnh.Ảnh số có thể được biểu diễn dưới dạng một ma trận 2 chiều,
mỗi phần tử của ma trận tương ứng với một điểm ảnh.

Hình 1.1: Biểu diễn các điểm ảnh trong ảnh số
Hàng xóm của một điểm ảnh (Neighbors of a Pixel)
Một điểm ảnh p trong hệ tọa độ (x,y) có 4 hàng xóm bên cạnh theo
chiều dọc và chiều ngang với tọa độ như sau:
(x + 1, y) ; (x - 1, y) ; (x, y + 1) ; (x, y - 1).
Tập hợp bốn pixel có tọa độ như trên được gọi là 4-hàng xóm của p, ký
hiệu N4(p). Khoảng các từ bốn điểm này đến p có giá trị đúng bằng một đơn
vị khoảng cách. Trong trường hợp p nằm ở biên của ảnh, một số hàng xóm
của p sẽ nằm ở bên ngoài ảnh.Bốn điểm có tọa độ sau được gọi là “Hàng xóm
chéo – Diagonal Neighbors” của p, ký hiệu ND(p):
(x + 1, y + 1) ; (x + 1, y - 1) ; (x - 1, y + 1) ; (x - 1, y - 1)


5

ND(p) cùng với N4(p) được gọi là N8(p), tức là 8 hàng xóm của p.
Tương tự như trên thì N8(p) cũng sẽ có các điểm ở bên ngoài ảnh nếu p là một
điểm trên biên của ảnh.
Điểm ảnh liền kề (Adjacency)
Định nghĩaV là tập các giá trị cường độ sáng của ảnh. Tập V được dùng
để xác định các điểm ảnh liền kề. Ví dụ với ảnh nhị phân V = {0, 1}; ảnh đa
cấp xám thì V = {0, 1, 2 , …, 255}. Có ba kiểu liền kề:
a) 4-adjacency: Hai điểm ảnh p và q trong tập V được gọi là 4adjacency nếu q thuộc tập N4(p).
b) 8-adjacency: Hai điểm ảnh p và q trong tập V được gọi là 8adjacency nếu q thuộc tập N8(p).
c) m-adjacency: Hai điểm ảnh p và q trong tập V được gọi là 8adjacency nếu thỏa mãn một trong hai điều kiện sau:
- q thuộc tập N4(p).
- q thuộc tập ND(p) và tập N4(p) ∩ N4(q) = Ø.
1.1.3. Màu và mô hình màu
Một mô hình màu là một mô hình toán học trừu tượng mô tả cách các
màu sắc có thể được biểu diễn như là bộ dữ liệu số, thường là ba hoặc bốn giá
trị hoặc các thành phần màu sắc.Người ta chia ra thành nhiều mô hình màu
khác nhau tùy thuộc vào ứng dụng của từng lĩnh vực.Dưới đây là các mô hình
màu được dùng phổ biến nhất.
Mô hình RGB
Mô hình màu RGB sử dụng mô hình bổ sung trong đó ánh sáng đỏ,
xanh lá cây và xanh lam được tổ hợp với nhau theo nhiều phương thức khác
nhau để tạo thành các màu khác. Từ viết tắt RGB trong tiếng Anh có nghĩa là
đỏ (red), xanh lá cây (green) và xanh lam (blue), là ba màu gốc trong các mô
hình ánh sáng bổ sung.


6

Hình 1.2: Tổ hợp màu Red-Green-Blue trong hệ màu RGB
Cũng lưu ý rằng mô hình màu RGB tự bản thân nó không định nghĩa
thế nào là "đỏ", "xanh lá cây" và "xanh lam" một cách chính xác, vì thế với
cùng các giá trị như nhau của RGB có thể mô tả các màu tương đối khác nhau
trên các thiết bị khác nhau có cùng một mô hình màu.
Mô hình RGB sẽ làm việc tốt với các thiết bị phát quang sử dụng ánh
sáng trắng làm cơ sở. Vì vậymô hìnhRGB được sử dụng cho các màu thể hiện
trên màn hình máy tính cũng như các màu trong thiết kế Web được chiếu qua
các màn hình hay máy chiếu dùng ánh sáng.
Trong biểu diễn số trên máy tính, ảnh màu RGB có thể sử dụng số bit
màu là 16, 24, 32 hoặc 48. Ảnh có số bitcàng cao thì càng biểu diễn chính xác
màu sắc của điểm ảnh.
Mô hình CMYK
Từ CMYK (hay YMCK) là một mô hình màu được sử dụng nhiều trong
in ấn. Mô hình màu này dựa trên cơ sở trộn các chất màu của các màu sau:
C=Cyan - màu xanh lơ
M=Magenta - màu cánh sen hay hồng sẫm
Y=Yellow - màu vàng
K=Key - màu đen (Ký hiệu là K vì màu Black đã dùng ký hiệu B trong
mô hình RGB).


7

Hình 1.3: T
Tổ hợpp các màu trong mô hình màu CMYK
Nguyên lý làm việc
vi của CMYK là trên cơ sở hấp thụ ánh sáng. Màu mà
chúng ta nhìn thấy là từ
ừ phần của ánh sáng không bị hấp thụ.. Trong CMYK
CMYK,
hồng sẫm cộng vớii vàng ssẽ cho màu đỏ, cánh sen cộng vớii xanh lơ cho màu
xanh lam, xanh lơ cộng
ng với
v i vàng sinh ra màu xanh lá cây và tổ
t hợp của các
màu xanh lơ, cánh sen và vàng tạo
t ra màu đen.
Vì màu “đen” sinh ra bởi
b việc trộn các màu gốc loại trừ là không thực
sự giống như mựcc đen th
thật sự hay màu đen của vật đen tuyệtt đđối (là vật hấp
thụ toàn bộ ánh sáng), việc
vi in ấn trên cơ sở bốn màu (đôi khi gọii là in các màu
mặc dù điều
u này không chính xác) phải sử dụng mực đen để bổ sung thêm
vào với các màu gốcc loại
lo trừ là các màu vàng, cánh sen và xanh lơ.
Việc sử dụng
ng công ngh
nghệ in ấn bốn màu sinh ra kết quả in ấn cuối cùng
rất cao cấp với độ tương phản
ph cao hơn. Tuy nhiên màu của vậtt th
thể mà người
ta nhìn thấy
y trên màn hình máy tính thông th
thường có sự sai khác chút ít với
v
màu củaa nó khi in ra vì các mô hình màu CMYK và RGB (s
(sử dụụng trong màn
hình máy tính) có các gam màu khác nhau. Mô hình màu RGB là mô hình
dựa trên cơ sở phát xạ ánh sáng trong khi mô hình CMYK làm việc
vi theo cơ
chế hấp thụ ánh sáng.
Mô hình HSB
Mô hình màu HSB,
HSB còn gọi là mô hình màu HSV,, là một
m mô hình
màudựa trên ba giá trị:


8

H: (Hue) Vùng màu
S: (Saturation) Độ bão hòa màu
B (hay V): (Bright hay Value) Độ sáng
Mô hình YUV
Mô hình YUVquy định một không gian màu được tạo bởi một độ sáng
và hai thành phần màu (chrominance). YUV được sử dụng trong hệ thống
phát sóng truyền hình theo chuẩn PAL, đây là chuẩn ở phần lớn các nước trên
thế giới.
Mô hình YUV giúp tạo ra màu đúng với nhận thức của con người hơn
chuẩn RGB(được dùng trong các thiết bị đồ hoạ máy tính) nhưng không
chuẩn bằng không gian màu HSV.

Hình 1.4: Mặt phẳng màu U-V tại giá trị Y = 0.5
Trong mô hình YUV, Y đại diện cho thành phần độ sáng, U và V là đại
diện cho các thành phần màu. Không gian màu YCbCr hay YPbPr, được sử
dụng trong các thiết bị phát hình, đều xuất phát từ mô hình màu YUV(Cb/Pb
và Cr/Pr là những phiên bản biến thể của U và V), và đôi khi bị gọi một cách
không chính xác là “YUV”. Không gian màu YIQ được dùng trong các hệ
thống truyền hình NTSC cũng liên quan đến YUV, tuy nhiên lại đơn giản hơn
YUV nhiều.


9

Các tín hiệu
u YUV đ
đều xuất phát từ các nguồn
n RGB. Các giá tr
trị trọng số
R, G và B được cộng lạại với nhau để tạo ra một tín hiệu Y đơn đđể biểu diễn độ
sáng chung tại một điểm
m. Tín hiệu U sau đó được tạo ra bằng
ng cách
các trừ Y khỏi
tín hiệu
u xanh lam (B ccủa RGB) và được nhân với một tỉ lệ nhấất định, còn V
được tính bằng cách trừ
ừ Y khỏi màu đỏ (R của RGB) và nhân tỉỉ lệ với một hệ
số khác.
Các công thứcc sau có th
thể dùng để tính toán Y, U và V từ R
R, G và B:

1.1.4. Histogram
Histogram là khái niệm
ni
cơ bản trong xử lý ảnh.
nh. Histogram là bbảng
thống kê tần suấtt giá tr
trị cường độ sáng của các điểm ảnh. Đốii vvới ảnh màu,
cường độ sáng của mộtt đi
điểm ảnh được xác định theo công thức:
c:
= 0.299 + 0.587 + 0.114
trong đó

, , àgiá trị các thành phần màu và là
là cư
cường độ sáng

của ảnh.

Hình 1.5: Biểu
Bi đồ histogram của ảnh đa cấpp xám Lena


10

1.1.5. Định dạng ảnh
Ảnh bitmap
Trong đồ họa máy vi tính, BMP, còn được biết đến với tên tiếng Anh
khác là Windows bitmap, là một định dạng tập tin hình ảnh dạng raster khá
phổ biến. Các tập tin đồ họa lưu dưới dạng BMP thường có đuôi là .BMP
hoặc .DIB (Device Independent Bitmap).

Hình 1.6: Cấu trúc tệp ảnh bitmap
Các thuộc tính tiêu biểu của một tập tin ảnh BMPlà:
-

Số bit trên mỗi điểm ảnh (bit per pixel), thường được ký hiệu bởi n.

Một ảnh BMP n-bit có 2nmàu. Giá trị n càng lớn thì ảnh càng có nhiều màu,
và càng rõ nét hơn. Giá trị tiêu biểu của n là 1 (ảnh đen trắng), 4 (ảnh 16
màu), 8 (ảnh 256 màu), 16 (ảnh 65536 màu) và 24 (ảnh 16 triệu màu). Ảnh
BMP 24-bit có chất lượng hình ảnh trung thực nhất.
-

Chiều cao của ảnh (height), cho bởi điểm ảnh (pixel).

-

Chiều rộng của ảnh (width), cho bởi điểm ảnh.

Cấu trúc tập tin ảnh BMP bao gồm 4 phần:
Bitmap Header (14 bytes): giúp nhận dạng tập tin bitmap.


11

Bitmap Information (40 bytes): lưu một số thông tin chi tiết giúp hiển
thị ảnh.
Color Palette (4*x bytes), x là số màu của ảnh: định nghĩa các màu sẽ
được sử dụng trong ảnh.
Bitmap Data: lưu dữ liệu ảnh.
Đặc điểm nổi bật nhất của định dạng BMP là tập tin hình ảnh thường
không được nén bằng bất kỳ thuật toán nào.Khi lưu ảnh, các điểm ảnh được
ghi trực tiếp vào tập tin một điểm ảnh sẽ được mô tả bởi một hay nhiều byte
tùy thuộc vào giá trị n của ảnh. Do đó, một hình ảnh lưu dưới dạng BMP
thường có kích cỡ rất lớn, gấp nhiều lần so với các ảnh được nén (chẳng hạn
GIF, JPEG hay PNG).
Ảnh JPEG
Ảnh JPEG là một định dạng ảnh đã qua xử lý nén ảnh, thuật toán nén là
thuật toán JPEG(Joint Photographic Experts Group) - một trong những
phương pháp nénảnh hiệu quả, có tỷ lệ nén ảnh tới vài chục lần. Tuy nhiên
ảnh sau khi giải nén sẽ khác với ảnh ban đầu. Chất lượng ảnh sẽ bị suy giảm
sau khi giải nén. Sự suy giảm này tăng dần theo hệ số nén. Tuy nhiên sự mất
mát thông tin này là có thể chấp nhận được và việc loại bỏ những thông tin
không cần thiết được dựa trên những nghiên cứu về hệ nhãn thị của mắt
người.
Một số đặc điểm của ảnh JPEG là:
- Ảnh có dung lượng nhỏ, dùng phổ biến trên các thiết bị di động, các

trang web.
- Ảnh JPEG có thể hiển thị các hình ảnh với các màu chính xác (true-

colour), có thể lên đến 16 triệu màu.


12

- Ảnh sử dụng thuật toán nén JPEG sẽ bị mất thông tin so với ảnh gốc.

Do đó một số đường bao giữa các khối màu sẽ xuất hiện điểm mờ, và các
vùng sẽ mất đi sự rõ nét.
Các định dạng khác
Ngoài hai định dạng ảnh kể trên còn có rất nhiều định dạng ảnh
khácphổ biến được kể đến như:
- Ảnh raster: PNG, ICO, GIFF, TIFF,…
- Ảnh vector: AI, CorelDRAW, CGM, DXF, EVA, EMF, Gerber,

HVIF, IGES, PGML,…
- Ảnh RAW: CIFF, DNG, ORF.

1.2. Các phép biến đổi ma trận
Như chúng ta đã biết, ảnh số được lưu dưới dạng các ma trận điểm ảnh.
Do đó, các phép biến đổi ảnh số thực chất là các phép biến đổi trên các ma
trận. Trong mục này, ta xét các phép biến đổi ma trận được sử dụng nhiều
trong xử lý ảnh.Các phép biến đổi này thường trả về những nét đặc trưng nhất
của ảnh, qua đó có thể sử dụng các đặc trưng này để tiến hành xử lý ảnh.
1.2.1. Biến đổi Cosine rời rạc DCT
Biến đổi cosine rời rạc là một công cụ toán học xử lý các tín hiệu như
ảnh hay video. Nó sẽ chuyển đổi các tín hiệu từ miền không gian sang miền tần
số và biến đổi ngược lại từ miền tần số quay trở lại miền không gian mà không
gây tổn hao đến chất lượng. Lý do chọn biến đổi cosine cho xử lý ảnh số là
biến đổi cosine rời rạc yêu cầu ít sự phức tạp tính toán và tài nguyên hơn.
Phép biến đổi DCT 1-D
Với dữ liệu đầu vào là tậpngiá trị pt (giá trị điểm ảnh, mẫu âm
thanh). Phép biến đổi thuận DCT một chiều được xác định:
=

2

cos

(2 + 1)
2


13

trong đó:
1
= √2
1

ế =0
ớ = 0,1, … ,

1

ế >0

và Gflà tập n hệ số DCT tương ứng của đầu vào. Hệ số đầu tiên
được gọi là phần tử DC (Direct Current) và các hệ số còn lại được gọi là
phần tử AC (Alternating current). Các hệ số này có thể bao gồm cả số âm và
số dương.
Phép biến đổi IDCT biến đổi các hệ số DCT (DC và AC) từ miền tần
số về miền thời gian được xác định theo công thức:
=

2

.

cos

(2 + 1)
2

= 0,1, … ,



1

Một tính chất quan trọng của DCT là rất hữu ích trong bài toán nén dữ
liệu, với dữ liệu đầu vào có sự tương quan cao thì năng lượng của dữ liệu đầu
vào sẽ tập trung vào một số phần tử đầu tiên, đặc biệt là hệ số DC. Các phần
tử còn lại có giá trị nhỏ, thường xấp xỉ bằng 0.
Phép biến đổi DCT 2-D
Phép biến đổi DCT 1-D phù hợp với các mẫu dữ liệu âm thanh.Nhưng
không phù hợp ảnh, do dữ liệu ảnh có quan hệ trên không gian hai chiều
(hàng, cột). Tuy nhiên, đối với ảnh ta có thể áp dụng DCT 1-D hai lần: trên
các hàng và trên các cột. Do vậy ta gọi phép biến đổi này là DCT 2-D.
Phép biến đổi thuận DCT 2-D đối với m × n giá trị của p trên
không gian 2 chiều được xác định theo công thức:
,

=

2


×

với 0 ≤ ≤

,

1; 0 ≤ ≤

×

(2 + 1)
2
1 và ,

×

(2 + 1)
2

được xác định:


14

1
= √2
1

ế

=0


ế

= 0,1, … ,

1

>0

Khi đó, hệ số đầu tiên G0,0 gọi là phần tử DC và các hệ số còn lại là AC.
Phép biến đổi IDCT 2-D tương ứng đối với m x n hệ số G về miền
không gian được tính theo công thức:
,

=

2

.

,

với 0 ≤ ≤

1; 0 ≤ ≤



×

1
= √2
1

ế

(2 + 1)
2

×

1 và

được xác định:

=0


ế

,

(2 + 1)
2

×

= 0,1, … ,

1

>0

Trong ứng dụng, dữ liệu ảnh được chia thành các khối 8 × 8, áp dụng
phép biến đổi DCT 2-D để nhận được khối hệ số DCT gồm 64 phần tử. Để
tăng tốc độ thực hiện, phép biến đổi DCT thường được tiếp cận theo phương
pháp ma trận.Ma trận Cosine rời rạc T cấp 8x8 được tính theo công thức:
1
,

ế =0

√8
=
( + 0.5)
1
cos
8
√8

ế >0

Khi đó, phép biến đổi Cosine rời rạc hai chiều đối với khối điểm ảnhP
để nhận được khối hệ số DCT (G) theo công thức:
=

×

×

×

×

và phép biến đổi ngược tương ứng:
=






15

Kỹ thuật thuỷ vân sửdụng phép biến đổi DCT thường chia ảnh gốc
thành các khối,thực hiện phép biến đổi DCTvới từng khối ảnh gốc để được
miền tần số thấp, miền tần số giữa và miền tần số cao. Đa số kỹ thuật thuỷ vân
ẩn bền vững sẽ chọn miền tần số giữa của mỗi khối để nhúng bit thuỷ vân
theo một hệ số k nào đó gọi là hệ số tương quan giữa chất lượng ảnh sau khi
nhúng thuỷvân (tính ẩn của thuỷ vân) và độ bền vững của thuỷ vân.
Trong một vài năm gần đây, một số lược đồ thủy vân dựa trên phép
biến đổi DCT kết hợp với các giải thuật trí tuệ nhân tạo như: giải thuật di
truyền, giải thuật tối ưu bầy đàn, mạng neural,… đã được nhiều nhà khoa học
quan tâm nghiên cứu.
1.2.2. Biến đổi Wavelet rời rạc DWT
Việc tính toán các hệ số Wavelet tại tất cả các tỉ lệ là một công việchết
sức phức tạp.Nếu tính toán như vậy sẽ tạo ra một lượng dữ liệukhổng lồ.Để
giảm thiểu công việc tính toán người ta chỉ chọn ra một tậpnhỏ các giá trị tỉ lệ
và các vị trí để tiến hành tính toán. Hơn nữa nếu việctính toán được tiến hành
tại các tỷ lệ và các vị trí trên cơ sở luỹ thừa cơ số2 thì kết quả thu được sẽ hiệu
quả và chính xác hơn rất nhiều. Quá trìnhchọn các tỷ lệ và các vị trí để tính
toán như trên tạo thành lưới nhị tố(dyadic).Một phân tích như trên hoàn toàn có
thể thực hiện được nhờbiến đổi Wavelet rời rạc (DWT). Do đó, việc tính toán
biến đổi DWT thựcchất là sự rời rạc hoá biến đổi Wavelet liên tục (CWT); việc
rời rạc hoáđược thực hiện với sự lựa chọn các hệ số a và b như sau:
=2 ,

=2

, ớ ,



Biến đổi Wavelet được sử dụng rộng rãi trong các lĩnh vực xử lý tín
hiệu số, xử lý ảnh, nén ảnh, mã hóa tín hiệu,….


16

1.2.3. Biến đổi SVD
Định nghĩa
Mọi ma trận thực Y cấp m×n cho trước luôn luôn có thể phân tích thành
tích của 3 ma trận thực như sau:
=

×

là ma trận trực chuẩn cấp

×

là ma trận trực chuẩn cấp

× .

×

Trong đó:

.

là ma trận đường chéo cấp m×n có tính chất:
(1,1) ≥ (2,2) ≥. . . ≥ ( , ) ≥ 0, với =

( , ).

Tính chất
Phép biến đổi SVD (Singular Value Decomposition) cũng giống như
DCT, DWT đều là các phép biến đổi ma trận trực giao và có cùng một tính
chất quan trọng là tập trung năng lượng ảnh vào một số phần tử cố định của
miền biến đổi. Năng lượng ảnh tập trung vào phần tử

(1,1) trong phép biến

đổi SVD, phần tử này có tính ổn định cao, vì vậy có thể sử dụng chúng để xây
dựng các lược đồ thủy vân bền vững trước các phép tấn công.
Các ứng dụng
Một số ứng dụng sử dụng biến đổi SVD có thể chỉ ra như:
-

Nén ảnh (Image Compression)

-

Lập chỉ mục ngữ nghĩa tiềm ẩn (Latent semantic indexing - LSI)

Lập chỉ mục ngữ nghĩa tiềm ẩn (LSI) là một phương pháp lập chỉ mục
và tìm kiếm sử dụng một kỹ thuật phân tích ma trận SVD để xác định các
mẫu trong các mối quan hệ giữa các điều kiện và khái niệm có trong một bộ
sưu tập không có cấu trúc văn bản. LSI là dựa trên nguyên tắc rằng các từ
được sử dụng trong các bối cảnh tương tự có xu hướng có ý nghĩa tương tự.
Một tính năng quan trọng của LSI là khả năng trích xuất nội dung khái niệm


17

của một nội dung văn bản bằng cách thiết lập mối liên hệ giữa những điều
kiện xảy ra trong những hoàn cảnh tương tự. LSI cũng là một ứng dụng thống
kê đa biến được phát triển bởi Jean-Paul Benzécri trong đầu những năm 1970,
vào một bảng dự phòng được xây dựng từ tính từ trong các tài liệu.
Ưu điểm của phương pháp LSI sử dụng biến đổi SVD là có thể đối phó
với vấn đề đồng nghĩa, điều mà các phương pháp truyền thống không thực
hiện được.
- Kỹ thuật (Engineering)

Trong kỹ thuật nói chung, biến đổi SVD có khả năng áp dụng cho các
lĩnh vực sau:
 Hệ thống động lực tuyến tính (Linear Dynamical System)
 Phân tích EOF analysis(of ocean topography and climate system)
 Xử lý tín hiệu và nhận dạng mẫu (Signal processing and pattern
recognition)
 Dự báo thời tiết số (Numerical weather prediction, Lanczos
methods)
- Truyền thông (Comunications)

Ứng dụng phương pháp SVD trong truyền thông như:
 Mạng không dây (Wireless communications)
 Nén ảnh và video (Compression of videos and images)
- Toán học và thống kê (Mathematics and Staticstics)

 Đại số tuyến tính (Numerical linear algebra)
 Xấp xỉ hạng ma trận (Low-rank matrix approximation)
 Giải phương trình tuyến tính thuần nhất (Solving Homogeneous
linear equations)
 Principal Component Analysis


18

1.3. Giấu tin
1.3.1. Khái niệm giấu tin
Giấu tin là kỹ thuật nhúng thông tin vào dữ liệu môi trường, dữ liệu
môi trường thường là: văn bản, ảnh, âm thanh, video. Thông tin được nhúng
có thể là những thông điệp bí mật cần trao đổi, thông tin về tác giả, hoặc
thông tin về sản phẩm đa phương tiện.
Nếu là bảo vệ cho chính đối tượng được giấu tin bên trong. Đây chính
là thủy vân số, là lĩnh vực rất đa dạng, có nhiều mục đích và đang được quan
tâm, nghiên cứu rất nhiều; tính ứng dụng của nó trong hiện tại rất lớn và đã có
nhiều kỹ thuật được đề xuất.
Trong trường hợp là bảo mật cho dữ liệu được đem giấu. Chính là giấu
tin mật, tập trung vào các kỹ thuật giấu tin sao cho người khác rất vất vả, khó
khăn mới phát hiện được đối tượng có chứa thông tin mật bên trong.
Các lược đồ giấu tin trong ảnh có thể được chia thành 2 chủ đề chính.
Thứ nhất, gồm những lược đồ giấu tin trên miền không gian ảnh, những lược
đồ này thường biến đổi các bit thấp trong giá trị màu của các điểm ảnh. Thứ
hai, gồm những lược đồ giấu tin trên miền biến đổi của ảnh, hai phép biến đổi
hay được sử dụng là: Phép biến đổi cosine rời rạc (DCT), phép biến đổi sóng
con (DWT).
Số lượng lược đồ giấu tin trên ảnh màu, ảnh đa cấp xám nhiều hơn so
với ảnh nhị phân. Lý do chủ yếu là việc thay đổi trên ảnh nhị phân dễ bị phát
hiện hơn so với ảnh màu và ảnh đa cấp xám. Tuy nhiên, giấu tin trên ảnh nhị
phân luôn nhận được sự quan tâm của các nhà nghiên cứu. Bởi ngoài việc ứng
dụng trực tiếp trên ảnh nhị phân, những lược đồ này còn là cơ sở để phát triển
cho những loại dữ liệu đa phương tiện khác.


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay

×