Tải bản đầy đủ

Phát hiện ảnh giả mạo dạng lồng ghép trên miền tần số và sai phân cấp hai

i

LỜI CAM ĐOAN
Tôi xin cam đoan luận văn thạc sĩ khoa học máy tính: “Phát hiện ảnh
giả mạo dạng lồng ghép trên miền tần số và sai phân cấp hai” là kết quả của
quá trình học tập, nghiên cứu khoa học độc lập, nghiêm túc.
Các số liệu trong luận văn là trung thực, có nguồn gốc rõ ràng,
được trích dẫn và có tính kế thừa, phát triển từ các tài liệu, tạp chí, các
công trình nghiên cứu đã được công bố trên các website, …
Các phương pháp nêu trong luận văn được rút ra từ những cơ sở lý
luận và quá trình nghiên cứu tìm hiểu của tác giả.
Học viên

Nguyễn Hoàng Long


ii

LỜI CẢM ƠN
Luận văn này được thực hiện tại Trường Đại học Công nghệ
Thông tin và Truyền thông Thái Nguyên dưới sự hướng dẫn, chỉ bảo tận

tình của PGS.TS. Phạm Văn Ất và các cộng sự, những người mà từ đó
học viên đã học được rất nhiều điều quý báu, các thầy là tấm gương sáng
cho em trong nghiên cứu chuyên môn cũng như trong cuộc sống. Em xin
gửi gửi lời cảm ơn thầy PGS. TS. Phạm Văn Ất và các cộng sự đã tận
tình giúp đỡ em trong suốt thời gian học tập vừa qua, đặc biệt là định
hướng nghiên cứu và tận tình hướng dẫn cho em trong suốt quá trình làm
luận văn.
Nếu không có sự giúp đỡ tận tình của thầy, em khó có thể hoàn
thành luận văn này.
Bên cạnh đó em cũng xin chân thành cảm ơn các thầy cô T rư ờng
Đ ạ i h ọc Công nghệ Thông tin & T ru yề n t hô n g đã tận tình giảng dạy,
chỉ bảo và cung cấp cho e7m những kiến thức cần thiết trong suốt thời
gian học và cũng xin gửi lời cám ơn chân thành đến những người thân,
bạn bè và đồng nghiệp đã giúp đỡ và động viên tôi trong suốt thời gian
học tập cũng như trong thời gian thực hiện luận văn.
Chân thành cảm ơn !
Thái Nguyên, ngày 10 tháng 6 năm 2016
Học viên

Nguyễn Hoàng Long


iii

MỤC LỤC
LỜI CAM ĐOAN .....................................................................................................................i
LỜI CẢM ƠN ....................................................................................................................... ii
DANH MỤC CÁC HÌNH VẼ ............................................................................................. vi
DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT ................................................................. vii
MỞ ĐẦU................................................................................................................................1
1. Đặt vấn đề .......................................................................................................................... 1
2. Đối tượng, phạm vi nghiên cứu ..................................................................................... 2
3. Hướng nghiên cứu của đề tài ......................................................................................... 2
4. Những nội dung nghiên cứu chính: ............................................................................... 2
CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN PHÁT HIỆN ẢNH GIẢ
MẠO.......................................................................................................................................4
1.1. TỔNG QUAN VỀ XỬ LÝ ẢNH ...................................................................................4
1.1.1. Xử lý ảnh là gì? ............................................................................................................ 4
1.1.1.1. Thu nhận ảnh....................................................................................... 5
1.1.1.2. Tiền xử lý ........................................................................................... 6

1.1.1.3. Phân đoạn ảnh .................................................................................... 6
1.1.1.4. Hệ quyết định ..................................................................................... 7
1.1.1.5. Trích chọn đặc điểm ............................................................................ 7
1.1.1.6. Nhận dạng ........................................................................................... 8
1.1.2. Các khái niệm cơ bản trong xử lý ảnh ...................................................................... 10
1.1.3. Các vấn đề cơ bản trong xử lý ảnh............................................................................ 10
1.1.3.1. Biểu diễn ảnh.................................................................................... 10
1.1.3.2. Nắn chỉnh biến dạng ......................................................................... 12
1.1.3.3. Khử nhiễu ......................................................................................... 12
1.1.3.4. Nhận dạng ảnh .................................................................................. 13
1.2. BÀI TOÁN PHÁT HIỆN ẢNH GIẢ MẠO.................................................................13
1.2.1. Khái niệm về ảnh giả mạo...................................................................................... 13
1.2.2. Phân loại ảnh giả mạo............................................................................................. 14


iv

1.3. KỸ THUẬT PHÒNG CHỐNG VÀ PHÁT HIỆN ẢNH GIẢ MẠO .........................17
1.3.1. Kỹ thuật phòng chống ảnh giả mạo. ........................................................................ 17
1.3.1.1.Giới thiệu và phân loại thủy vân ........................................................ 18
1.3.1.2. Tính chất của lược đồ thủy vân ......................................................... 20
1.3.1.3.Ứng dụng của thủy vân ...................................................................... 21
1.3.2. Một số kỹ thuật phát hiện ảnh giả mạo ................................................................ 21
1.3.2.1. Dựa vào sự không tương thích hướng nguồn sáng................................ 21
1.3.2.2. Dựa vào sự không tương thích về nhiễu............................................... 22
1.3.2.3. Dựa vào sự không tương thích về các pixel ......................................... 22
1.3.2.4. Dựa vào sự không tương thích về màu sắc........................................... 23
1.3.2.5. Dựa vào sự xuất hiện nhiều lần của một vùng trên ảnh ......................... 23
1.3.2.6. Dựa vào dấu vết của việc lấy mẫu lại ................................................ 23
1.4. MỘT SỐ PHƯƠNG PHÁP PHÁT HIỆN VÙNG ẢNH ĐƯỢC LẤY MẪU LẠI ....24
1.4.1. Khái niệm lấy mẫu lại (Resample)............................................................................ 24
1.4.1.1. Lấy mẫu lại tín hiệu .......................................................................... 24
1.4.1.2. Lấy mẫu lại trên ảnh ......................................................................... 25
1.4.1.3 Tính chất của phép lấy mẫu tăng trên ảnh .......................................... 25
1.4.2. Giới thiệu về phương pháp phát hiện vùng ảnh được lấy mẫu lại ........................... 27
1.4.2.1. Phương pháp của Popescu và Kichner .............................................. 27
1.4.2.2. Phương pháp dựa trên mật độ năng lượng ......................................... 28
1.4.2.3. Phương pháp dựa trên phép phân tích SVD ...................................... 28
1.4.2.4. Phương pháp dựa trên sai phân cấp hai ............................................. 28
1.4.2.5. Phương pháp sử dụng phép biến đổi DCT, DWT. ............................. 29
CHƯƠNG II: PHÁT HIỆN ẢNH GIẢ MẠO ĐƯỢC LẤY MẪU TĂNG BẰNG CÁC
PHÉP BIẾN ĐỔI TRÊN MIỀN TẦN SỐ VÀ SAI PHÂN CẤP HAI ...............................30
2.1. PHƯƠNG PHÁP DỰA TRÊN PHÉP BIẾN ĐỔI COSIN RỜI RẠC (DCT) ...........30
2.1.1. Phép biến đổi Cosin rời rạc (DCT) của ma trận ảnh .......................................... 30
2.1.2. Phương pháp phát hiện dựa trên phép biến đổi DCT ......................................... 33
2.2. PHƯƠNG PHÁP DỰA TRÊN PHÉP BIẾN ĐỔI DWT ............................................34
2.2.1. Một số ký hiệu và khái niệm ................................................................ 34


v

2.2.2. Ý tưởng chung của phép biến đổi DWT trực chuẩn ............................. 34
2.2.3. Phép biến đổi DWT dạng Haar (DWT Haar) ....................................... 35
2.2.4. Phép biến đổi DWT dạng Daubechies D4 (DWT D4) .......................... 36
2.3. PHÁT HIỆN ẢNH GIẢ MẠO BẰNG PHÉP BIẾN ĐỔI SONG TRỰC GIAO
BIOR3.5 VÀ LỌC THÔNG CAO CỦA PHÉP BIẾN ĐỔI DWT. ...................................37
2.3.1. Phát hiện vùng giả mạo bằng phép biến đổi song trưc giao Bior 3.5 ............... 37
2.3.2. Phương pháp dựa trên lọc thông cao của phép biến đổi DWT ................................ 39
2.3.2.1. Phép biến đổi DWT theo bộ lọc ........................................................ 39
2.3.2.2. Phương pháp giảm độ phức tạp tính toán (ký hiệu LTC) ................... 41
2.4. PHƯƠNG PHÁP PHÁT HIỆN BẰNG PHÉP BIẾN ĐỔI HIỆU:..............................43
2.4.1. Xây dựng phép biến đổi hiệu trên ma trận điểm ảnh ............................................... 43
2.4.2. Phương pháp phát hiện ảnh giả mạo dựa trên phép biến đổi hiệu (ký hiệu BĐH) 44
2.5. PHƯƠNG PHÁP SAI PHÂN CẤP HAI (Ký hiệu là SPB2): ....................................44
2.6. Đánh giá độ phức tạp tính toán và tính bền vững của các phương pháp........... 45
CHƯƠNG III: THỬ NGHIỆM VÀ ỨNG DỤNG .............................................................49
3.1. LỰA CHỌN BỘ ẢNH THỬ NGHIỆM ................................................................. 49
3.2. TẠO ẢNH GIẢ MẠO DẠNG LỒNG GHÉP ....................................................... 49
3.3. XÂY DỰNG CHƯƠNG TRÌNH THỬ NGHIỆM TRÊN MATLAB ............... 50
3.4. MỘT SỐ ỨNG DỤNG PHÁT HIỆN ẢNH GIẢ MẠO DẠNG LỒNG GHÉP..... 53
KẾT LUẬN ..........................................................................................................................55
Hướng phát triển của luận văn..............................................................................................56
TÀI LIỆU THAM KHẢO ...................................................................................................57


vi

DANH MỤC CÁC HÌNH VẼ
Hình 1.1. Các giai đoạn trong xử lý ảnh................................................................... 5
Hình 1.2. Các thành phần chính trong hệ thống xử lý ảnh ........................................ 9
Hình 1.3. Minh họa về việc giả mạo ảnh .............................................................. 14
Hình 1.4. Minh họa cho loại ảnh giả mạo tăng cường ảnh: .................................... 15
Hình 1.5. Ảnh che phủ và bỏ đi đối tượng ............................................................. 16
Hình 1.6. Hai hướng trong phòng chống và phát hiện ảnh số giả mạo .................... 17
Hình 1.7. Quá trình nhúng thủy vân ....................................................................... 18
Hình 1.8. Quá trình trích thủy vân ......................................................................... 18
Hình 1.9. Kết quả mô tả do độ đồng đều của các khối ảnh sau khi lấy mẫu tăng. ... 26
Hình 2.1 : Sơ đồ phương pháp phát hiện dựa theo phép biến đổi DCT ................... 33
Hình 2.2: Áp dụng phép biến đổi DWT theo hàng và cột ....................................... 36
Hinh 2.3: Áp dụng phép biến đổi DWT theo hai mức ............................................ 36
Hình 2.4. Sơ đồ các bước trong phương pháp dựa trên phép biến đổi DWT song
trực giao 3.5. ......................................................................................................... 38
Hình 2.5. Sơ đồ thực hiện phép biến đổi DWT thuận. ............................................ 39
Hình 2.6. Sơ đồ phép biến đổi DWT ngược. .......................................................... 40
Hình 2.7. Sơ đồ các bước trong phương pháp LTC. ............................................... 42
Bảng 3.1. Một số hình ảnh giả mạo được dùng để thực nghiệm. ............................ 50
Bảng 3.2. Một số hình ảnh giả mạo và kết quả phát hiện. ...................................... 51
Bảng 3.3. Minh họa tính bền vững của các phương pháp. ...................................... 52
Bảng 3.4. Thời gian thực hiện của 3 phương pháp (đơn vị là giây). ....................... 52


vii

DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT

Ký hiệu/
chữ viết
tắt

Ý nghĩa

BMP

Bitmap (định dạng ảnh)

DCT

Discrete Cosine Transform (biến đổi cosine rời rạc)

DFT

Discrete Fourier Transform (Phép biến đổi Fourier rời rạc)

DWT

Discrete Wavelet Transform (biến đổi wavelet rời rạc)

IDCT

Inverse Discrete Cosine Transform (phép biến đổi DCT
ngược)

IDWT

Inverse Discrete Wavelet Transform (biến đổi DWT ngược)

JPEG

Joint Photographic Experts Group (một định dạng ảnh nén)

NMF

Non-negative Matrix Factorization (khai triển ma trận không
âm)

SVD

Singular Value Decomposition (phân tích giá trị đặc trưng)

TIFF

Tagged Image File Format (định dạng ảnh)


1

MỞ ĐẦU
1. Đặt vấn đề
Ngày nay, ảnh số là phương tiện truyền thông được sử dụng rộng rãi,
đóng vai trò quan trọng trong đời sống con người, có tác động đến xã hội,
tham gia vào các quá trình pháp lý và kinh tế như: làm bằng chứng trong điều
tra, xử án, bảo hiểm, gian lận khoa học,… Hơn nữa, với sự phổ biến của máy
ảnh kĩ thuật số và các phần mềm chỉnh sửa (Photoshop, GIMP,…) dẫn đến
ảnh số có thể dễ dàng được chỉnh sửa mà không cần đến các kiến thức chuyên
gia và việc chỉnh sửa hầu như không để lại dấu vết mà mắt thường có thể
nhận biết được. Kết quả là khi những hình ảnh được chỉnh sửa sử dụng cho
mục đích xấu nó có thể dẫn đến những hậu quả nghiêm trọng. Do vậy, việc
phát hiện ảnh giả mạo là vấn đề đặt ra ngày càng cấp bách và càng trở nên
khó khăn.
Có nhiều cách để tạo ra hình ảnh giả mạo, trong đó lồng ghép các vùng
ảnh từ các ảnh khác nhau là một cách rất phổ biến. Trong khi làm như vậy, để
tạo ra hình ảnh thuyết phục, người ta thường phải sửa kích thước, quay, hay
co giãn các phần của ảnh, quá trình này đòi hỏi lấy mẫu lại (resampling). Mặc
dù việc lấy mẫu lại thường không thể nhìn thấy bằng mắt thường nhưng nó
vẫn để lại các dấu vết về mặt tương quan giữa các điểm ảnh. Vì vậy, dựa vào
dấu vết của việc lấy mẫu lại để phát hiện ảnh giả mạo có các vùng được lồng
chép từ các nguồn khác nhau là một hướng quan trọng, thu hút nhiều sự quan
tâm nghiên cứu.
Đã có nhiều nghiên cứu để phát hiện ra dạng giả mạo này, tuy nhiên hiệu
quả chưa cao và đòi hỏi thời gian tính toán lớn. Gần đây có một số phương pháp
dựa trên miền tần số và sai phân cấp hai để phát hiện ảnh giả mạo dạng lồng
ghép và khoanh được vùng giả mạo. So với các phương pháp khác thì các
phương pháp này có đặc điểm là đơn giản và khoanh được vùng giả mạo khá rõ


2

ràng. Chính vì những ưu điểm trên và đây là một hướng nghiên cứu mới có
nhiều ứng dụng nên em đã chọn đề tài “Phát hiện ảnh giả mạo dạng lồng
ghép trên miền tần số và sai phân cấp hai” cho luận văn của mình.
2. Đối tượng, phạm vi nghiên cứu
- Đối tượng : Ảnh giả dạng lồng ghép : là ảnh nhận được bằng cách ghép
các phần của ảnh khác vào một ảnh đa mức xám gốc (phần được chèn vào gọi là
vùng giả mạo).
- Phạm vi nghiên cứu : Ảnh có các vùng giả mạo được lấy mẫy tăng
(phóng to) cho phù hợp với kích thước và độ phân giải của ảnh gốc.
3. Hướng nghiên cứu của đề tài
- Nghiên cứu việc phát hiện và khoanh vùng giả mạo được lấy mẫu tăng
bằng phương pháp DCT, DWT và sai phân cấp 2.
- Xây dựng chương trình thử nghiệm để so sánh tính hiệu quả của các
phương pháp trên.
4. Những nội dung nghiên cứu chính:
Dựa trên mục tiêu đã xác định, nội dung nghiên cứu chính sẽ được trình
bày qua 3 chương với cấu trúc sau:
Chương 1 : Tổng quan về xử lý ảnh và Bài toán phát ảnh giả mạo
Trình bày những kiến thức cơ bản về xử lý ảnh, khái niệm về ảnh giả mạo
giúp chúng ta có cái nhìn trực quan về ảnh giả mạo và phân loại ảnh giả mạo,
bên cạnh đó đưa ra một số phương pháp phòng chống, phát hiện ảnh giả mạo.
Chương 2: Phát hiện ảnh giả mạo được lấy mẫu tăng bằng các phép
biến đổi trên miền tần số và sai phân cấp hai
Nội dung Chương này sẽ trình bày cụ thể các phương pháp phát hiện ảnh
giả mạo bằng các phép biến đổi trên miền tần số như: DCT, DWT ( DWT
song trực giao Bior 3.5, Lọc thông cao DWT) và phương pháp Sai phân cấp hai.


3

Chương 3: Thử nghiệm và Ứng dụng
Tiến hành xây dựng c á c chương trình thực nghiệm để phát hiện
ảnh kỹ thuật số giả mạo dạng lồng ghép; Phân tích và so sánh các phương
pháp qua kết quả thử nghiệm.


4

CHƯƠNG 1
TỔNG QUAN VỀ XỬ LÝ ẢNH
VÀ BÀI TOÁN PHÁT HIỆN ẢNH GIẢ MẠO

1.1. TỔNG QUAN VỀ XỬ LÝ ẢNH
1.1.1. Xử lý ảnh là gì?
Xử lý ảnh là một khoa học tương đối mới mẻ so với nhiều ngành khoa
học khác, nhất là trong quy mô công nghiệp, song trong xử lý ảnh đã bắt đầu
xuất hiện những máy tính chuyên dụng. Để có thể hình dung cấu hình một hệ
thống xử lý ảnh chuyên dụng hay một hệ thống xử lý ảnh dùng trong nghiên
cứu, đào tạo, trước hết chúng ta sẽ xem xét các bước cần thiết trong xử lý ảnh.
Trước hết là quá trình thu nhận ảnh. Ảnh có thể thu nhận qua camera.
Thường ảnh thu nhận qua camera là tín hiệu tương tự (loại camera ống kiểu
CCIR), nhưng cũng có thể là tín hiệu số hóa (loại-Change Coupled Device).
Ảnh cũng có thể thu nhận từ vệ tinh qua các bộ cảm ứng (sensor), hay
ảnh, tranh được quét trên scanner. Tiếp theo là quá trình số hóa để biến đổi tín
hiệu liên tục sang tín hiệu rời rạc (lấy mẫu) và số hóa bằng lượng hóa, trước
khi chuyển sang giai đoạn xử lý, phân tích hay lưu trữ lại.
Quá trình phân tích ảnh bao gồm nhiều công đoạn nhỏ. Trước hết là
công việc tăng cường ảnh để nâng cao chất lượng ảnh. Do những nguyên
nhân khác nhau: Có thể do chất lượng thiết bị thu nhận ảnh, do nguồn sáng
hay do nhiễu ảnh có thể bị suy biến. Do vậy cần phải tăng cường và khôi phục
lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay làm cho ảnh gần
giống nhất với trạng thái gốc - trạng thái trước khi ảnh bị biến dạng. Giai
đoạn tiếp theo là phát hiện các đặc tính như biên, phân vùng ảnh, trích chọn
các đặc tính,v.v…


5

Cuối cùng, tùy theo mục đích của người xử dụng, sẽ là giai đoạn nhận
dạng, phân lớp hay các quyết định khác. Các giai đoạn chính trong quá trình
xử lý ảnh được mô tả qua hình 1.1.
Thu nhận
(Camera, Scanner,
Sensor…)

Tiền xử lý
(Nắn chỉnh, xóa,
nhiễu…)

Trích chọn đặc
trưng

Lưu trữ
Hậu xử lý
(Chính xác hóa, rút
gọn,…)

Kết Luận
Hệ quyết định

Hình 1.1. Các giai đoạn trong xử lý ảnh
1.1.1.1. Thu nhận ảnh
Đây là bước đầu tiên trong quá trình xử lý ảnh. Để thực hiện điều
này, ta cần có bộ thu ảnh và khả năng số hoá những tín hiệu liên tục được
sinh ra bởi bộ thu ảnh đó. Bộ thu ảnh ở đây có thể là máy chụp ảnh đơn sắc
hay màu, máy quét ảnh, ... Trong trường hợp bộ thu ảnh cung cấp chưa
phải là dạng số hoá ta còn phải chuyển đổi hay số hoá ảnh.
Quá trình chuyển đổi ADC (Analog to Digital Converter) để thu
nhận dạng số hoá của ảnh. Các thông số quan trọng ở bước này là độ
phân giải, chất lượng màu, dung lượng bộ nhớ và tốc độ thu nhận ảnh của
các thiết bị.
Mặc dù đây chỉ là công đoạn đầu tiên song kết quả của nó có ảnh
hưởng rất nhiều đến công đoạn kế tiếp.


6

1.1.1.2. Tiền xử lý
Ở bước này, ảnh sẽ được cải thiện về độ tương phản, khử nhiễu,
khử bóng, khử độ lệch, v.v với mục đích làm cho chất lượng ảnh trở nên
tốt hơn nữa, chuẩn bị cho các bước xử lý phức tạp hơn về sau trong quá
trình xử lý ảnh. Quá trình này thường được thực hiện bởi các bộ lọc.
+ Khử nhiễu: Nhiễu được chia thành hai loại: nhiễu hệ thống và
nhiễu ngẫu nhiên. Đặc trưng của nhiễu hệ thống là tính tuần hoàn. Do
vậy, có thể khử nhiễu này bằng việc sử dụng phép biến đổi Fourier và
loại bỏ các đỉnh điểm. Đối với nhiễu ngẫu nhiên, trường hợp đơn giản là
các vết bẩn tương ứng với các điểm sáng hay tối, có thể khử bằng
phương pháp nội suy, lọc trung vị và trung bình.
+ Chỉnh mức xám: Đây là kỹ thuật nhằm chỉnh sửa tính không
đồng đều của thiết bị thu nhận hoặc độ tương phản giữa các vùng ảnh.
+ Chỉnh tán xạ: Ảnh thu nhận được từ các thiết bị quang học hay
điện tử có thể bị mờ, nhoè. Phương pháp biến đổi Fourier dựa trên tích
chập của ảnh với hàm tán xạ cho phép giải quyết việc hiệu chỉnh này.
1.1.1.3. Phân đoạn ảnh
Phân đoạn ảnh có nghĩa là chia một ảnh đầu vào thành nhiều phần
khác nhau hay còn gọi là các đối tượng để biểu diễn phân tích, nhận dạng
ảnh. Ví dụ: để nhận dạng chữ (hoặc mã vạch) trên phong bì thư cho mục
đích phân loại bưu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên người
thành các từ, các chữ, các số (hoặc các vạch) riêng biệt để nhận dạng.
Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây
lỗi, làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất
nhiều vào công đoạn này.
Mục đích của phân đoạn ảnh là để có một miêu tả tổng hợp về


7

nhiều phần tử khác nhau cấu tạo lên ảnh thô. Vì lượng thông tin chứa
trong ảnh rất lớn, trong khi đa số các ứng dụng chúng ta chỉ cần trích một
vài đặc trưng nào đó, do vậy cần có một quá trình để giảm lượng thông
tin khổng lồ đó. Quá trình này bao gồm phân vùng ảnh và trích chọn đặc
tính chủ yếu.
1.1.1.4. Hệ quyết định
Ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối,
dung lượng điểm ảnh, môi trường để thu ảnh phong phú kéo theo nhiễu.
Trong nhiều khâu xử lý và phân tích ảnh ngoài việc đơn giản hóa
các phương pháp toán học đảm bảo tiện lợi cho xử lý, người ta mong
muốn bắt chước quy trình tiếp nhận và xử lý ảnh theo cách của con
người. Trong các bước xử lý đó, nhiều khâu hiện nay đã xử lý theo các
phương pháp trí tuệ con người. Vì vậy, ở đây các cơ sở tri thức được phát
huy.
1.1.1.5. Trích chọn đặc điểm
Việc giải quyết bài toán nhận dạng trong những ứng dụng mới nảy
sinh trong cuộc sống không chỉ tạo ra những thách thức về giải thuật, mà
còn đặt ra những yêu cầu về tốc độ tính toán.
Đặc điểm chung của tất cả ứng dụng đó là những đặc điểm đặc
trưng cần thiết thường là nhiều, không thể do chuyên gia đề xuất, mà
phải được trích chọn dựa trên các thủ tục phân tích dữ liệu.
Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các
đối tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ
lưu trữ giảm xuống.
Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích
nhận dạng trong quá trình xử lý ảnh. Có thể nêu ra một số đặc điểm
của ảnh sau đây:


8

- Đặc điểm không gian: phân bố mức xám, phân bố xác suất, biên
độ, điểm uốn v.v
- Đặc điểm biến đổi: các đặc điểm loại này được trích chọn bằng
việc thực hiện lọc vùng (zonal filtering). Các bộ vùng được gọi là “mặt
nạ đặc điểm” (feature mask) thường là các khe hẹp với hình dạng khác
nhau (chữ nhật, tam giác, cung tròn v.v..).
- Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối
tượng và do vậy rất hữu ích trong việc trích chọn các thuộc tính bất biến
được dùng khi nhận dạng đối tượng. Các đặc điểm này có thể được trích
chọn nhờ toán tử Gradient, toán tử la bàn, toán tử Laplace, toán tử
“chéo không” (zero crossing) ...
1.1.1.6. Nhận dạng
Đây là bước cuối cùng trong quá trình xử lý ảnh.
Nhận dạng ảnh là quá trình xác định nội dung ảnh. Quá trình này
thường thu được bằng cách so sánh với mẫu chuẩn đã được lọc (hoặc
lưu) từ trước.
Nhận dạng ảnh có thể được nhìn nhận một cách đơn giản là việc
gán nhãn cho các đối tượng trong ảnh. Ví dụ như khi nhận dạng chữ viết,
các đối tượng trong ảnh cần nhận dạng là các mẫu chữ, ta cần tách riêng
các mẫu chữ đó ra và tìm cách gán đúng các ký tự của bảng chữ cái tương
ứng cho các mẫu chữ thu được trong ảnh. Giải thích là công đoạn gán
nghĩa cho một tập các đối tượng đã được nhận biết.
Chúng ta cũng có thể thấy rằng, không phải bất kỳ một ứng dụng xử
lý ảnh nào cũng bắt buộc phải tuân theo tất cả các bước xử lý đã nêu ở
trên, ví dụ như các ứng dụng chỉnh sửa ảnh nghệ thuật chỉ dừng lại ở bước
tiền xử lý.


9

Một cách tổng quát thì những chức năng xử lý bao gồm cả nhận
dạng và giải thích thường chỉ có mặt trong hệ thống phân tích ảnh tự động
hoặc bán tự động, được dùng để rút trích ra những thông tin quan trọng
từ ảnh, ví dụ như các ứng dụng nhận dạng ký tự quang học, nhận dạng chữ
viết tay v.v…
Với các giai đoạn trên, một hệ thống xử lý ảnh gồm các thành phần tối
thiểu như hình sau:
Màn hình
Đồ họa

Camera

Bộ nhớ
ngoài

Màn hình

Bộ xử lý tương tự

Bộ nhớ ảnh

Màn hình đồ họa

Bộ xử lý
ảnh số

Bàn phím

Máy in

Hình 1.2. Các thành phần chính trong hệ thống xử lý ảnh
 Đối với một hệ thống xử lý ảnh thu nhận qua camera-camera như là
con mắt của hệ thống: có hai loại camera ống loại CCIR và camera CCD.
Loại camera ứng với chuẩn CCIR quét ảnh với tần số 1/25 và mỗi ảnh gồm
625 dòng. Loại CCD gồm các photo điốt và làm tương ứng một cường độ
sáng tại một điểm ảnh với một phần tử ảnh (pixel). Như vậy, ảnh là tập hợp
các điểm ảnh. Số pixel tạo nên một ảnh gọi là độ phân giải
 Bộ xử lý tương tự thực hiện các chức năng sau:
- Chọn camera thích hợp nếu hệ thống có nhiều camera.
- Chọn màn hình hiển thị tín hiệu.


10

- Thu nhận tín hiệu video bởi bộ số hóa. Thực hiện lấy mẫu và mã hóa.
- Tiền xử lý ảnh khi thu nhận: dùng kỹ thuật bảng tra (Look Up Table).
 Bộ xử lý ảnh số gồm nhiều bộ xử lý chuyên dụng: xử lý lọc, trích
chọn đường bao, nhị phân hóa ảnh.
 Máy chủ đóng vai trò điều khiển các thành phần ở trên.
 Bộ nhớ ngoài: Dữ liệu ảnh cũng như các dữ liệu khác, để có thể
chuyển giao cho các quá trình khác, nó cần được lưu trữ.
1.1.2. Các khái niệm cơ bản trong xử lý ảnh
Điểm ảnh (pixel): Biểu diễn cường độ sáng hay một dấu hiệu nào đó
tại một tọa độ nào đó của đối tượng trong không gian. Điểm ảnh là một hàm
nhiều biến P(x1, x2,..., xn) trong đó n là số chiều của ảnh.
Ảnh: là một tập hợp các điểm ảnh, thông thường được biểu diễn dưới
dạng ma trận các điểm ảnh.
Mức xám: là kết quả sự mã hóa tương ứng của mỗi cường độ sáng của
một điểm ảnh với một giá trị số - kết quả của quá trình lượng hóa. Cách mã
hóa kinh điển thường dùng 16, 32 hay 64 mức.
Biểu đồ tần suất: biểu đồ tần xuất của một mức xám g của ảnh I là số
điểm ảnh của I có mức xám g.
1.1.3. Các vấn đề cơ bản trong xử lý ảnh
1.1.3.1. Biểu diễn ảnh
Ảnh được thu nhận từ các thiết bị thu nhận ảnh. Sau khi thu nhận, ảnh
được lưu trữ trên máy tính. Quá trình lưu trữ gồm 2 mục đích: tiết kiệm bộ
nhớ và giảm thời gian xử lý.


11

Ảnh được lưu trữ trong bộ nhớ có ảnh hưởng rất lớn đến việc hiển thị,
in ấn và xử lý. Ảnh là tập hợp các điểm ảnh có cùng kích thước do đó nếu sử
dụng càng nhiều điểm ảnh thì càng mịn càng đẹp và càng thể hiện rõ hơn chi
tiết của ảnh, người ta gọi đặc điểm này là độ phân giải. Việc lựa chọn độ phân
giải phụ thuộc vào nhu cầu sử dụng và đặc trưng của từng loại ảnh cụ thể.
Chẳng hạn, ảnh dùng trong văn bản thường thể hiện dưới dạng đen trắng có
độ phân giải 300 DPI, ảnh bản vẽ, bản đồ có độ phân giải 200DPI.
Trên cơ sở đó, các ảnh được biểu diễn theo 2 mô hình cơ bản là
RASTER và VECTOR.
Mô hình RASTER:
Theo mô hình này, ảnh được biểu diễn dưới dạng ma trận các điểm ảnh.
Tùy theo yêu cầu thực tế mà mỗi điểm ảnh được biểu diễn bằng một hoặc
nhiều bit.
Ngày nay thiết bị phần cứng phát triển nhưng chủ yếu là theo định
hướng Raster cho cả thiết bị đầu vào cũng như đầu ra. Ví dụ: máy in, máy
quét, v.v…
Một trong những nghiên cứu chủ yếu trong mô hình raster là kỹ thuật
nén ảnh, chia ra hai khuynh hướng đó là nén bảo toàn và nén không bảo toàn
thông tin.
Nén bảo toàn thông tin là có khả năng phục hồi hoàn toàn dữ liệu ban
đầu. Nén không bảo toàn thông tin là có khả năng phục hồi dữ liệu ban đầu
nhưng với sai số chấp nhận được. Trên cơ sở đó người ta xây dựng được
nhiều khuôn dạng ảnh khác nhau: *.pcx, *.tif, *.gif, *.jpg, *.jpeg, v.v…


12

Mô hình VECTOR:
Ảnh lưu trữ trên máy tính ngoài yêu cầu về giảm không gian lưu trữ,
thời gian xử lý, dễ dàng cho hiển thị và in ấn còn phải đảm bảo dễ dàng trong
sự lựa chọn, sao chép, di chuyển và tìm kiếm. Theo những yêu cầu này, kỹ
thuật biểu diễn Vector tỏ ra ưu việt hơn.
Trong mô hình Vector, ảnh được biểu diễn bởi các điểm ảnh và các
đường thể hiện hướng của một điểm. Ảnh dạng vector được thu nhận từ các
thiết bị như sensor, digitalier, v.v….
Ngày nay, các thiết bị phần cứng phát triển mạnh theo hướng Raster
cho cả đầu vào và đầu ra nên một trong những nghiên cứu chủ yếu của mô
hình Vector là tập trung cho chuyển đổi từ ảnh Raster sang ảnh Vector.
1.1.3.2. Nắn chỉnh biến dạng
Ảnh thu được sau quá trình thu nhận thường bị biến dạng do những
thiết bị quang học và điện tử. Do đó cần phải có khâu nắn chỉnh biến dạng.
Để nắn chỉnh biến dạng ta dựa vào tập các điểm điều khiển (pi, p’i), ( i=
1, …, n).
n

Cần tìm hàm: : Pi  (Pi) sao cho:



2

f ( pi )  pi  min

i 1

1.1.3.3. Khử nhiễu
Trong quá trình thu nhận ảnh không thể tránh khỏi bị nhiễu. Có 2 loại
nhiễu cơ bản:
- Nhiễu hệ thống: là loại nhiễu gây ra bởi hệ thống, như vết xước
hoặc nguồn sáng ngoại lai. Loại nhiễu này có tính chất chu kỳ và có thể dễ
khắc phục bằng các phép biến đổi.


13

- Nhiễu ngẫu nhiên: là các vết bẩn không rõ nguyên nhân. Loại nhiễu
này thường khó khử, tùy vào từng ảnh cụ thể mà có cách khắc phục. Thông
thường sử dụng các phép lọc.
1.1.3.4. Nhận dạng ảnh
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người
ta muốn đặc tả nó. Quá trình nhận dạng thường đi sau quá trình trích chọn các
đặc tính chủ yêu của đối tượng. Có 2 kiểu đối tượng:
- Mô tả tham số (nhận dạng theo tham số)
- Mô tả theo cấu trúc (nhận dạng theo cấu trúc)
Trên thực tế, người ta đã áp dụng kỹ thuật nhận dạng khá thành công
với nhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ
(chữ cái, chữ số, chữ có dấu).
Nhận dạng chữ in hoặc đánh máy phục vụ cho việc tự động hóa quá
trình đọc tài liệu, tăng nhanh tốc độ và chất lượng thu nhận thông tin từ máy
tính.
Nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về cách viết,
kiểu chữ, v.v...) phục vụ cho nhiều lĩnh vực.
Ngoài hai kỹ thuật nhận dạng trên, hiện nay một kỹ thuật nhận dạng
mới dựa vào kỹ thuật mạng nơron đang được áp dụng và cho kết quả khả
quan.
1.2. BÀI TOÁN PHÁT HIỆN ẢNH GIẢ MẠO
1.2.1. Khái niệm về ảnh giả mạo
Ảnh giả mạo được xem là ảnh không có thật, việc có được ảnh là do sự
ngụy tạo bởi các chương trình xử lý ảnh hoặc quá trình thu nhận ảnh.
Sức mạnh của các chương trình xử lý ảnh số như PhotoShop, Corel Draw,
v.v...giúp việc tạo ra các ảnh giả mạo từ một hay nhiều ảnh khác nhau trở nên
dễ dàng. Một trong những ví dụ cho việc giả mạo này là hình 1.3. Hình này
được tạo lập từ 3 bức ảnh: Nhà trắng, Bill Clinton và Saddam Hussein. Bill


14

Clinton và Saddam Hussein được cắt và dán vào bức ảnh Nhà trắng. Các hiệu
ứng về bóng và ánh sáng cũng được tạo ra làm cho bức ảnh nhìn có vẻ hoàn
toàn như thật.

Hình 1.3. Minh họa về việc giả mạo ảnh
1.2.2. Phân loại ảnh giả mạo.
Ảnh giả mạo thường chia làm hai loại chính. Ảnh giả nhưng thật, tức là
hiện trường được dựng thật, và việc thu nhận ảnh là thật. Loại thứ hai là ảnh
giả được tạo lập trên cơ sở các phần của ảnh gốc thật hoặc được cắt dán để
thêm vào hay che đi các chi tiết trên ảnh.
Trong luận văn này tôi quan tâm đến một số dạng giả mạo thuộc loại
thứ hai. Trong dạng ảnh giả mạo thứ hai có thể chia làm 3 loại chính: Ghép
ảnh, tăng cường ảnh và copy - di chuyển vùng trên ảnh.
+ Ghép ảnh
Ghép ảnh là dạng giả mạo ảnh số phổ biến nhất, trong đó hai hay nhiều
ảnh số được ghép lại với nhau để tạo ra một ảnh số hoàn chỉnh.
Độ tin cậy của sự giả mạo loại này phụ thuộc vào mức độ phù hợp giữa
các thành phần trong ảnh về kích thước, tư thế, màu sắc, chất lượng và ánh


15

sáng. Nếu có một cặp ảnh tương thích tốt, được thực hiện bởi một chuyên gia
giàu kinh nghiệm thì việc gải mạo hoàn toàn như thật.
+ Tăng cường ảnh

(a)

(b)

(c)

(d)

Hình 1.4. Minh họa cho loại ảnh giả mạo tăng cường ảnh:
(a) ảnh gốc, (b) ảnh được thay đổi màu sắc,
(c) ảnh tăng độ tương phản, (d) ảnh được làm mờ nền.


16

Hình 1.4 gồm một ảnh gốc (hình 1.4(a)), và 3 ví dụ cho loại giả mạo
tăng cường ảnh. (1) Xe mô tô màu xanh được chuyển thành màu lục lam và
xe tải màu đỏ trong nền được chuyển thành màu vàng (hình 1.4(b)), (2) Tăng
độ tương phản của toàn cảnh làm cho ảnh này giống như được chụp vào một
ngày trời nắng (hình 1.4(c)); (3) Các xe ô tô đỗ trong ảnh này bị làm mờ khiến
cho chiều sâu của khung cảnh trở nên hẹp hơn (hình 1.4(d)) v.v...Không giống
như ghép ảnh, hay ảnh chỉnh sửa PhotoShop loại thao tác này thường sử dụng
ít click chuột hơn.
Mặc dù loại giả mạo này không thể thay đổi cơ bản hình dạng hay ý
nghĩa của ảnh gốc như loại ghép ảnh, nhưng nó vẫn có tác động khéo léo lên
cách hiểu ảnh. Ví dụ, có thể sửa đổi thời tiết và thời gian trong ngày hay có
thể làm mờ đi vài chi tiết để thổi phồng các chi tiết khác trong ảnh, v.v...
+ Coppy và dịch chuyển vùng trên ảnh

(a) Ảnh gốc

(b) Ảnh đã che phủ đối tượng

Hình 1.5. Ảnh che phủ và bỏ đi đối tượng
Một dạng khác thường thấy nữa của ảnh giả mạo loại hai là việc sao
chép/dịch chuyển các phần của ảnh gốc. Đối với ảnh giả mạo được tạo lập
trên cơ sở cắt dán trên cùng một ảnh gốc, các vùng trên ảnh được thu nhận bởi
cùng một camera, cùng một góc độ nên tương đồng về ánh sáng và bóng là


17

như nhau. Do đó, mắt thường hầu như không thể phân biệt được. Các dạng
thường thấy của ảnh giả mạo loại này là việc bớt đi hoặc thêm vào các đối
tượng trong ảnh, việc bớt đi các đối tượng trong ảnh có thể xem như là che
phủ đối tượng hoặc xóa đi đối tượng. Hình 1.5(a) là ảnh gốc với 2 chiếc ô tô,
một xe con và 1 xe tải. Hình 1.5(b) là hình 1.5(a) giả tạo với việc che phủ
chiếc xe tải bằng một cành cây cũng lấy từ trong chính ảnh đó..
1.3. KỸ THUẬT PHÒNG CHỐNG VÀ PHÁT HIỆN ẢNH GIẢ MẠO
Các kỹ thuật được chia làm hai hướng là kỹ thuật chủ động (Active
Forensic) được dùng để xác thực/phòng chống giả mạo ảnh và kỹ thuật thụ
động (Passive Forensic) được dùng để phát hiện ảnh giả mạo. Hai hướng này
được mô tả qua sơ đồ sau:

Hình 1.6. Hai hướng trong phòng chống và phát hiện ảnh số giả mạo
1.3.1 Kỹ thuật phòng chống ảnh giả mạo.
Các kỹ thuật này sử dụng thủy vân số và chữ ký số để phòng chống giả
mạo ảnh. Các nội dung sau đây sẽ trình bày về kỹ thuật thủy vấn số.


18

1.3.1.1.Giới thiệu và phân loại thủy vân
Thủy vân số (Watermarking) là một phương pháp ẩn một số thông tin
vào dữ liệu đa phương tiện. Thủy vân số có hai quá trình là quá trình nhúng
thủy vân (Hình 1.7) và quá trình trích thủy vân (Hình 1.8). Trong các quá
trình này sử dụng khóa bí mật hoặc khóa công khai để tăng cường tính an
ninh của các lược đồ.

Hình 1.7. Quá trình nhúng thủy vân

Hình 1.8. Quá trình trích thủy vân
Thủy vân số có nhiều ứng dụng, nên các phương pháp thủy vân được
quan tâm và đã có nhiều lược đồ thủy vân được đề xuất. Các phương pháp
thủy vân được chia làm ba loại chính: thủy vân bền vững (robust
watermarking), thủy vân dễ vỡ (fragile watermarking), và thủy vân bán dễ vỡ
(semi-fragile watermarking).
Thủy vân bền vững: Loại thủy vân này yêu cầu dấu thủy vân phải ít bị
biến đổi (bền vững) trước sự tấn công trên sản phẩm chứa dấu thủy vân, hoặc
trong trường hợp loại bỏ được dấu thủy vân thì sản phẩm sau khi bị tấn công


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay

×