Tải bản đầy đủ

Phát hiện độ dịch chuyển của phiếu điểm

i

ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG

ĐÀO SƠN

PHÁT HIỆN ĐỘ DỊCH CHUYỂN CỦA
PHIẾU ĐIỂM

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Thái Nguyên - 2015
ĐẠI HỌC THÁI NGUYÊN


ii

ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG


ĐÀO SƠN

PHÁT HIỆN ĐỘ DỊCH CHUYỂN CỦA
PHIẾU ĐIỂM
Chuyên ngành: Khoa học máy tính
Mã số: 60 48 01 01

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Người hướng dẫn khoa học: PGS.TS ĐỖ NĂNG TOÀN

Thái Nguyên - 2015


i

LỜI CAM ĐOAN
Tôi xin cam đoan kết quả trong luận văn là sản phẩm của riêng cá nhân
tôi. Trong toàn bộ nội dung của luận văn, những điều được trình bày hoặc là
của cá nhân hoặc là được tổng hợp từ nhiều nguồn tài liệu. Tất cả các tài liệu
tham khảo đều có xuất xứ rõ ràng và được trích dẫn hợp pháp.
Tôi xin hoàn toàn chịu trách nhiệm theo quy định cho lời cam đoan của
mình.
Người cam đoan
Đào Sơn


ii

LỜI CẢM ƠN
Trước hết em xin gửi lời cảm ơn sâu sắc đến thầy hướng dẫn khoa học
PGS.TS Đỗ Năng Toàn về những chỉ dẫn khoa học, định hướng nghiên cứu
và tận tình hướng dẫn tôi trong suốt quá trình làm luận văn.
Em cũng xin cảm ơn các Thầy trong viện Công Nghệ Thông Tin, các
Thầy Cô trong trường Đại học Công Nghệ Thông Tin và Truyền Thông - Đại
học Thái Nguyên đã quan tâm chỉ bảo và trực tiếp giảng dạy, giúp đỡ trong
suốt quá trình học tập và nghiên cứu.
Tôi xin chân cảm ơn lãnh đạo các phòng, ban trong trường Cao đẳng Cơ
khí – Luyện kim đã tạo điều kiện cho tôi học tập và nghiên cứu đề tài này.
Cuối cùng, tôi xin cảm ơn gia đình và bạn bè, những người đã luôn ủng
hộ và động viên tôi để tôi yên tâm nghiên cứu luận văn này.

Đào Sơn


iii

MỤC LỤC

LỜI CAM ĐOAN................................................................................................................. i
LỜI CẢM ƠN ...................................................................................................................... ii
MỤC LỤC...........................................................................................................................iii
DANH MỤC HÌNH ẢNH ................................................................................................ .v
MỞ ĐẦU.............................................................................................................................. 1
Chương 1 : KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ NHẬN DẠNG BIỂU MẪU ........... 3
1.1. KHÁI QUÁT VỀ XỬ LÝ ẢNH................................................................................. 3
1.1.1. Xử lý ảnh là gì ..................................................................................... 3
1.1.2. Mô tả ảnh ............................................................................................. 6
1.1.2.1. Picture Element: phần tử ảnh ............................................................ 6
1.1.2.2. Grey level: mức xám ........................................................................ 7
1.1.2.3. Quan hệ giữa các điểm ảnh ............................................................... 9
1.1.3. Các vấn đề trong xử lý ảnh ................................................................ 11
1.1.3.1. Kỹ thuật tăng, giảm độ sáng ............................................................ 11
1.1.3.2. Kỹ thuật tăng, giảm độ tương phản .................................................. 13
1.1.3.3. Tách ngưỡng.................................................................................... 14
1.1.3.4. Chuyển đổi sang ảnh nhị phân ......................................................... 14
1.1.3.5. Loại bỏ nhiễu ................................................................................... 17
1.2. NHẬN DẠNG PHIẾU ĐIỂM ..................................................................................20
1.2.1. Biểu diễn phiếu điểm ......................................................................... 20
1.2.1.1. Cấu trúc vật lý ................................................................................. 21
1.2.1.2. Cấu trúc logic .................................................................................. 22
1.2.2. Phân tách vùng chứa dữ liệu. .............................................................. 23
1.2.3. Tách dòng và tách kí tự. ..................................................................... 26
1.2.3.1. Giải thuật Horizontal Projection ...................................................... 26


iv

1.2.3.2.Giải thuật Vertical Projection ........................................................... 26
1.2.4. Trích rút đặc trưng. ............................................................................. 27
Chương 2 : KỸ THUẬT PHÁT HIỆN ĐỘ DỊCH CHUYỂN CỦA PHIẾU ĐIỂM .28
2.1. KHỬ NHIỄU ........................................................................................ 28
2.1.1. Nhiễu ảnh .......................................................................................... 28
2.1.2. Khử nhiễu .......................................................................................... 29
2.1.2.1. Lọc tuyến tính (Linear Filter)........................................................... 29
2.1.2.2. Lọc phi tuyến (NonLinear Filter) ..................................................... 35
2.1.2.3. Mặt nạ gờ sai phân và làm nhăn (Unharp Masking and Crispering) . 38
2.1.2.4. Lọc thông thấp, thông cao và lọc dải thông ...................................... 39
2.2. PHÁT HIỆN ĐỘ DỊCH CHUYỂN CỦA PHIẾU ĐIỂM DỰA VÀO
HISTOGRAM ................................................................................................................41
2.3. PHÁT HIỆN ĐỘ DỊCH CHUYỂN PHIẾU ĐIỂM THEO VĂN BẢN MẪU ...48
Chương 3 : CHƯƠNG TRÌNH THỬ NGHIỆM ...........................................................53
3.1. Bài toán .......................................................................................................................53
3.2. Phân tích bài toán ................................................................................. 53
3.3. Chương trình thử nghiệm ..........................................................................................54
PHẦN KẾT LUẬN ...........................................................................................................62
TÀI LIỆU THAM KHẢO ................................................................................................64


v

DANH MỤC HÌNH ẢNH
Hình 1.1: Quá trình xử lý ảnh
Hình 1.1: Các bước cơ bản trong xử lý ảnh
Hình 1.3: Ví dụ lược đồ xám
Hình 1.4: Lân cận các điểm ảnh của toạ độ (x,y)
Hình 1.5. Ảnh gốc
Hình 1.6. Ảnh đã giảm độ sáng
Hình 1.7. Ảnh đã được tăng cường độ sáng
Hình 1.8. Ảnh gốc
Hình 1.9. Ảnh đã giảm độ tương phản
Hình 1.10. Ảnh đã được tăng độ tương phản
Hình 1.11. Mô phỏng thuật toán lọc trung vị để loại bỏ nhiễu.
Hình 1.12. Mô tả phép quay ảnh
Hình 1.13: Tổng quan quá trình tạo ảnh tài liệu
Hình 1.14. Mẫu phiếu điểm thu nhận từ máy quét
Hình 1.15. Bức ảnh trước khi điều chỉnh kích thước
Hình 1.16. Bức ảnh sau khi điều chỉnh kích thước thành 7x5
Hình 2.1: Ảnh gốc và ảnh thu được qua lọc tuyến tính
Hình 2.2: Ví dụ bộ lọc giữ biên
Hình 2.3: Các toán tử gờ sai phân
Hình 2.4: Sơ đồ lọc thông cao
Hình 2.5: Một số nhân chập trong lọc thông cao


vi

Hình 2.6: Ảnh qua lọc thông cao (ảnh gốc 2.1)
Hình 2.7. Mô hình histogram dọc của phiếu điểm mẫu.
Hình 2.8. Mô hình histogram dọc của phiếu điểm cần nhận dạng.
Hình 2.9. Mô hình histogram của phiếu điểm mẫu và phiếu điểm cần
nhận dạng được xếp trên cùng một trục tọa độ.
Hình 2.10. (a) là ảnh mẫu (b) là ảnh cần nhận dạng
Hình 2.11. Mô hình histogram dọc của phiếu điểm mẫu.
Hình 2.12. Mô hình histogram dọc của phiếu điểm cần nhận dạng
Hình 2.13. Mô hình histogram của phiếu điểm mẫu và phiếu điểm cần
nhận dạng được xếp trên cùng một trục tọa độ.
Hình 2.14. Xây dựng lưới tựa các hình chữ nhật
Hình 3.1: Giao diện chương trình thử nghiệm
Hình 3.2: Menu File
Hình 3.3: Menu Basic
Hình 3.4: Menu Filter
Hình 3.5: Menu Skew Detection
Hình 3.6: Một mẫu phiếu điểm sau khi scan chưa được xử lý
Hình 3.7: Phiếu điểm sau khi được chỉnh độ nghiêng bị dịch chuyển
Hình 3.8: Kết quả sau khi hiệu chỉnh


1

MỞ ĐẦU
Hiện nay, trong việc quản lý, thu nhận và xử lý thông tin với khối
lượng ngày càng lớn, nhiều lúc với những phần mềm thủ công không đem lại
hiệu quả mong muốn, tốn nhiều thời gian và công sức. Nhằm đem lại sự chính
xác và nhanh chóng, đỡ tốn công sức của con người. Trong những năm gần
đây nhiều nhà nghiên cứu đã phát triển mạnh mẽ bài toán nhập liệu tự động.
Nhập liệu tự động là việc nạp thông tin vào máy thông qua những tác
động thủ công của con người.Tuy nhiên trong thực tế để cài một hệ nhập liệu
tự động cụ thể gặp khá nhiều khó khăn.
Trong hầu hết các cơ sở giáo dục đào tạo của nước ta đều được trang bị
phần mềm quản lý đào tạo nhằm nâng cao chất lượng giảng dạy và quản lý
học sinh, sinh viên, giúp giảm bớt một phần lớn công việc của đội ngũ cán bộ
quản lý giáo dục. Tuy nhiên việc lưu trữ, cập nhật vào hệ thống phần mềm
quản lý giáo dục vẫn còn thủ công, không những làm tốn nhiều công sức của
đội ngũ giáo vụ mà còn có nhiều sai sót đặc biệt với những trường có số
lượng môn học và số sinh viên lớn.
Từ những lý do trên, để khắc phục phần nào các nhược điểm em đã chọn
đề tài “PHÁT HIỆN ĐỘ DỊCH CHUYỂN CỦA PHIẾU ĐIỂM” với mong
muốn phần nào giải quyết được phần nào những khó khăn đó. Thay vì phải
nhập thủ công, giờ đây việc nhập trở nên dễ dàng, thuận tiện hơn. Các công
đoạn chính bao gồm:
- Phiếu điểm viết tay của giảng viên qua máy quét thu được hình ảnh
và đưa vào máy tính.
- Áp dụng các kỹ thuật tiền xử lý ảnh (nâng cao chất lượng ảnh,
chuyển sang ảnh nhị phân, loại bỏ nhiễu,...).


2

- Nhận dạng với các mẫu thu thập được.
- Cập nhật vào Cơ sở dữ liệu.
Việc cập nhật tự động rõ ràng đã giải quyết được những khó khăn và
bất tiện của quản lý điểm thông thường để lại.
Nội dung của luận văn tốt nghiệp gồm có 3 chương:
Chương 1. Khái quát về xử lý ảnh và nhận dạng biểu mẫu.
Chương 2. Kỹ thuật phát hiện độ dịch chuyển của phiếu điểm .
Chương 3. Chương trình thử nghiệm.


3

Chương 1
KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ NHẬN DẠNG BIỂU MẪU
1.1. KHÁI QUÁT VỀ XỬ LÝ ẢNH
1.1.1. Xử lý ảnh là gì
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một
ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát
triển của nó rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc
biệt là máy tính chuyên dụng riêng cho nó.
Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào
nhằm cho ra kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh
có thể là một ảnh “tốt hơn” hoặc một kết luận.

Hình 1.1: Quá trình xử lý ảnh
Để dễ tưởng tượng, xét các bước cần thiết trong xử lý ảnh. Đầu tiên,
ảnh tự nhiên từ thế giới ngoài được thu nhận qua các thiết bị thu (như
Camera, máy chụp ảnh, máy scanner). Trước đây, ảnh thu qua Camera là các
ảnh tương tự (loại Camera ống kiểu CCIR). Gần đây, với sự phát triển của
công nghệ, ảnh màu hoặc đen trắng được lấy ra từ Camera, sau đó nó được
chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo. (Máy ảnh số
hiện nay là một thí dụ gần gũi). Mặt khác, ảnh cũng có thể tiếp nhận từ vệ
tinh; có thể quét từ ảnh chụp bằng máy quét ảnh. Hình 1.2 dưới đây mô tả các
bước cơ bản trong xử lý ảnh.


4

Hình 1.1: Các bước cơ bản trong xử lý ảnh
Sơ đồ này bao gồm các thành phần sau:
a) Phần thu nhận ảnh (Image Acquisition)
Ảnh có thể nhận qua camera màu hoặc đen trắng. Thường ảnh nhận qua
camera là ảnh tương tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh
25 dòng), cũng có loại camera đã số hoá (như loại CCD – Change Coupled
Device) là loại photodiot tạo cường độ sáng tại mỗi điểm ảnh.
Camera thường dùng là loại quét dòng, ảnh tạo ra có dạng hai chiều.
Chất lượng một ảnh thu nhận được phụ thuộc vào thiết bị thu, vào môi trường
(ánh sáng, phong cảnh)
b) Tiền xử lý (Image Processing)
Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào
bộ tiền xử lý để nâng cao chất lượng. Chức năng chính của bộ tiền xử lý là lọc
nhiễu, nâng độ tương phản, nổi biên, làm trơn biên ảnh, khuyếch đại ảnh… để
làm ảnh rõ hơn, nét hơn.
c) Phân đoạn (Segmentation) hay phân vùng ảnh
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để
biểu diễn phân tích, nhận dạng ảnh. Ví dụ: để nhận dạng chữ (hoặc mã vạch)


5

trên phong bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về
địa chỉ hoặc tên người thành các từ, các chữ, các số (hoặc các vạch) riêng biệt
để nhận dạng. Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ
gây lỗi, làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất
nhiều vào công đoạn này.
d) Biểu diễn ảnh (Image Representation)
Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã
phân đoạn) cộng với mã liên kết với các vùng lận cận. Việc biến đổi các số
liệu này thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính.
Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng (Feature
Selection) gắn với việc tách các đặc tính của ảnh dưới dạng các thông tin định
lượng hoặc làm cơ sở để phân biệt lớp đối tượng này với đối tượng khác trong
phạm vi ảnh nhận được. Ví dụ: trong nhận dạng ký tự trên phong bì thư,
chúng ta miêu tả các đặc trưng của từng ký tự giúp phân biệt ký tự này với ký
tự khác.
e) Nhận dạng và nội suy ảnh (Image Recognition and Interpretation)
Nhận dạng ảnh là quá trình xác định ảnh. Quá trình này thường thu
được bằng cách so sánh với mẫu chuẩn đã được học (hoặc lưu) từ trước. Nội
suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng. Ví dụ: một loạt chữ số và
nét gạch ngang trên phong bì thư có thể được nội suy thành mã điện thoại. Có
nhiều cách phân loai ảnh khác nhau về ảnh. Theo lý thuyết về nhận dạng, các
mô hình toán học về ảnh được phân theo hai loại nhận dạng ảnh cơ bản:
- Nhận dạng theo tham số.
- Nhận dạng theo cấu trúc.


6

Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng
trong khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký
điện tử), nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch,
nhận dạng mặt người…
f) Cơ sở tri thức (Knowledge Base)
Như đã nói ở trên, ảnh là một đối tượng khá phức tạp về đường nét, độ
sáng tối, dung lượng điểm ảnh, môi trường để thu ảnh phong phú kéo theo
nhiễu. Trong nhiều khâu xử lý và phân tích ảnh ngoài việc đơn giản hóa các
phương pháp toán học đảm bảo tiện lợi cho xử lý, người ta mong muốn bắt
chước quy trình tiếp nhận và xử lý ảnh theo cách của con người. Trong các
bước xử lý đó, nhiều khâu hiện nay đã xử lý theo các phương pháp trí tuệ con
người. Vì vậy, ở đây các cơ sở tri thức được phát huy.
1.1.2. Mô tả ảnh
Để hiểu chi tiết hơn, trước tiên ta xem xét hai khái niệm (thuật ngữ)
thường dùng trong xử lý ảnh đó là Picture Element (phần tử ảnh) và grey
level (mức xám).
1.1.2.1. Picture Element: phần tử ảnh
Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ
sáng. Để có thể xử lý ảnh bằng máy tính cần thiết phải tiến hành số hoá ảnh.
Số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù
hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám). Khoảng cách
giữa các điểm ảnh đó được thiết lập sao cho mắt người không phân biệt được
ranh giới giữa chúng. Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture
Element) hay gọi tắt là Pixel (điểm ảnh). Trong khuôn khổ ảnh hai chiều, mỗi
pixel ứng với cặp tọa độ (x, y).


7

Theo định nghĩa Pixel, khoảng cách giữa các điểm ảnh phải được chọn
sao cho mắt người vẫn thấy được sự liên tục của ảnh. Việc lựa chọn khoảng
cách thích hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và được
phân bố theo trục x và y trong không gian hai chiều. Ví dụ: Độ phân giải của
ảnh trên màn hình CGA (Color Graphic Adaptor) là một lưới điểm theo chiều
ngang màn hình: 320 điểm chiều dọc * 200 điểm ảnh (320*200). Rõ ràng,
cùng màn hình CGA 12" ta nhận thấy mịn hơn màn hình CGA 17" độ phân
giải 320*200. Lý do: cùng một mật độ (độ phân giải) nhưng diện tích màn
hình rộng hơn thì độ mịn (liên tục của các điểm) kém hơn.
Như vậy, một ảnh là một tập hợp các điểm ảnh. Khi được số hoá, nó
thường được biểu diễn bởi bảng hai chiều I(n,p): n dòng và p cột. Ta nói ảnh
gồm n x p pixels. Người ta thường kí hiệu I(x,y) để chỉ một pixel. Thường giá
trị của n chọn bằng p và bằng 256.
1.1.2.2. Grey level: mức xám
Mức xám là kết quả sự mã hoá tương ứng một cường độ sáng của mỗi
điểm ảnh với một giá trị số - kết quả của quá trình lượng hoá. Các thang giá
trị mức xám thường dùng là 16, 32 hay 64 mức. Mã hoá 256 mức là phổ dụng
nhất do lý do kỹ thuật máy tính dùng 1 byte (8 bít) để biểu diễn mức xám.
Mức xám dùng 1 byte biểu diễn: 28=256 mức, tức là từ 0 đến 255)
Lược đồ xám: là một hàm rời rạc cung cấp tần suất xuất hiện của mỗi
mức xám:
h(sk) = nk
trong đó:

sk là mức xám thứ k
nk là số các điểm ảnh có cùng mức xám thứ k
n là tổng số các điểm ảnh


8

Biểu diễn lược đồ xám:
 Trục tung biểu diễn số điểm ảnh cho một mức xám (hoặc tỷ lệ số
điểm ảnh có cùng mức xám trên tổng số điểm ảnh)
 Trục hoàng biểu diễn các mức xám
Ví dụ:

Hình 1.3: Ví dụ lược đồ xám
Ảnh đen trắng: là ảnh có hai màu đen, trắng (không chứa màu khác)
với mức xám ở các điểm ảnh có thể khác nhau.
Ảnh nhị phân: ảnh chỉ có 2 mức đen trắng phân biệt tức dùng 1 bit mô
tả 21 mức khác nhau, hay nói cách khác: mỗi điểm ảnh của ảnh nhị phân chỉ
có thể là 0 hoặc 1.
Ảnh màu: trong khuôn khổ lý thuyết ba màu (Red, Blue, Green) để tạo
nên thế giới màu, người ta thường dùng 3 byte để mô tả mức màu, khi đó các
giá trị màu: 28*3=224≈ 16,7 triệu màu.
Như vậy từ những lý thuyết trên có thể nói ảnh số là tập hợp các điểm
ảnh với mức xám phù hợp dùng để mô tả ảnh gần với ảnh thật


9

1.1.2.3. Quan hệ giữa các điểm ảnh
Một ảnh số giả sử được biểu diễn bằng hàm f(x, y). Tập con các điểm
ảnh là S; cặp điểm ảnh có quan hệ với nhau ký hiệu là p, q. Chúng ta nêu một
số các khái niệm sau:
a) Các lân cận của điểm ảnh (Image Neighbors)
Giả sử có điểm ảnh p tại toạ độ (x, y). p có 4 điểm lân cận gần nhất
theo chiều đứng và ngang (có thể coi như lân cận 4 hướng chính: Đông, Tây,
Nam, Bắc).
{(x-1, y); (x, y-1); (x, y+1); (x+1, y)} = N4(p)
trong đó: số 1 là giá trị logic; N4(p) tập 4 điểm lân cận của p

Hình 1.4: Lân cận các điểm ảnh của toạ độ (x,y)
Các lân cận chéo: Các điểm lân cận chéo NP(p) (Có thể coi lân cận
chéo la 4 hướng: Đông-Nam, Đông-Bắc, Tây-Nam, Tây-Bắc)
Np(p) = { (x+1, y+1); (x+1, y-1); (x-1, y+1); (x-1, y-1)}
Tập kết hợp: N8(p) = N4(p) + NP(p) là tập hợp 8 lân cận của điểm ảnh
p.
Chú ý: Nếu (x, y) nằm ở biên (mép) ảnh; một số điểm sẽ nằm ngoài
ảnh.


10

b) Các mối liên kết điểm ảnh
Các mối liên kết được sử dụng để xác định giới hạn (Boundaries) của
đối tượng vật thể hoặc xác định vùng trong một ảnh. Một liên kết được đặc
trưng bởi tính liền kề giữa các điểm và mức xám của chúng.
Giả sử V là tập các giá trị mức xám. Một ảnh có các giá trị cường độ
sáng từ thang mức xám từ 32 đến 64 được mô tả như sau :
V={32, 33, … , 63, 64}.
Có 3 loại liên kết.
* Liên kết 4: Hai điểm ảnh p và q được nói là liên kết 4 với các giá trị
cường độ sáng V nếu q nằm trong một các lân cận của p, tức q thuộc N4(p)
* Liên kết 8: Hai điểm ảnh p và q nằm trong một các lân cận 8 của p,
tức q thuộc N8(p)
* Liên kết m (liên kết hỗn hợp): Hai điểm ảnh p và q với các giá trị
cường độ sáng V được nói là liên kết m nếu.
- q thuộc N4(p) hoặc
- q thuộc NP(p)
c) Đo khoảng cách giữa các điểm ảnh.
Định nghĩa: Khoảng cách D(p, q) giữa hai điểm ảnh p toạ độ (x, y), q
toạ độ (s, t) là hàm khoảng cách (Distance) hoặc Metric nếu:
- D(p,q) ≥ 0 (Với D(p,q)=0 nếu và chỉ nếu p=q)
- D(p,q) = D(q,p)
- D(p,z) ≤ D(p,q) + D(q,z); z là một điểm ảnh khác.


11

Khoảng cách Euclide: Khoảng cách Euclide giữa hai điểm ảnh p(x, y)
và q(s, t) được định nghĩa như sau:
De(p, q) = [(x - s)2 + (y - t)2]1/2
Khoảng cách khối: Khoảng cách D4(p, q) được gọi là khoảng cách khối
đồ thị (City-Block Distance) và được xác định như sau:
D4(p,q) = | x - s | + | y - t |
Giá trị khoảng cách giữa các điểm ảnh r: giá trị bán kính r giữa điểm
ảnh từ tâm điểm ảnh đến tâm điểm ảnh q khác. Ví dụ: Màn hình CGA 12”
(12”*2,54cm = 30,48cm=304,8mm) độ phân giải 320*200; tỷ lệ 4/3 (Chiều
dài/Chiều rộng). Theo định lý Pitago về tam giác vuông, đường chéo sẽ lấy tỷ
lệ 5 phần (5/4/3: đường chéo/chiều dài/chiều rộng màn hình); khi đó độ dài
thật là (305/244/183) chiều rộng màn hình 183mm ứng với màn hình CGA
200 điểm ảnh theo chiều dọc. Như vậy, khoảng cách điểm ảnh lân cận của
CGA 12” là ≈ 1mm.
Khoảng cách D8(p, q) còn gọi là khoảng cách bàn cờ (Chess-Board
Distance) giữa điểm ảnh p, q được xác định như sau:
D8(p,q) = max (| x-s | , | y-t |)
1.1.3. Các vấn đề trong xử lý ảnh
Ta nhận thấy một ảnh màu RGB bao gồm 3 ảnh xám: R, G và B. Như
vậy để xử lý ảnh mầu ta phải xử lý trên 3 ảnh xám R, G, B của nó và kết hợp
lại sẽ có kết quả như mong muốn.
1.1.3.1. Kỹ thuật tăng, giảm độ sáng
Tăng cường độ sáng của một ảnh có thể được hiểu như sự phát sáng
toàn bộ ảnh. Hay nói một cách cụ thể đó là sự phát sáng toàn bộ của mọi Pixel
trong ảnh đó.


12

Đây là một kỹ thuật khá đơn giản: để tăng thêm độ sáng, tất cả các
Pixel của ảnh cần được cộng thêm giá trị điều chỉnh vào mọi kênh màu RGB.
Tuy kỹ thuật này đơn giản nhưng nó đem lại hiệu quả khá cao và rất hay được
sử dụng trong lĩnh vực xử lý ảnh. Nó giúp ích rất nhiều trong các ngành như y
học, địa lý, quân sự,... trong việc phân tích và nhận dạng.
Điều chỉnh độ sáng không chỉ được sử dụng để làm sáng lên những ảnh
tối mà còn được sử dụng để làm tối đi các ảnh sáng. Một ảnh sáng hoàn toàn
đơn giản là tất cả các Pixel đều màu trắng trong khi một ảnh tối hoàn toàn là
tất cả các Pixel đều màu tối. Sự khác nhau duy nhất trong làm tối một ảnh là
trừ đi giá trị điều chỉnh vào mỗi kênh màu RGB của ảnh.
Đối với mỗi kênh màu, chúng chỉ nhận các giá trị [0..255]. Chính vì thế
khi tăng cường hay giảm độ sáng của một ảnh ta phải chú ý đến ngưỡng của
các kênh. Điều đó có nghĩa là với mỗi kênh màu của một Pixel nếu nhỏ hơn 0
thì ta phải gán bằng 0 và nếu lớn hơn 255 thì ta phải gán bằng 255. Biểu thức
cho kỹ thuật Brightness có dạng:
g(x,y) = f(x,y) + b
Trong đó b là hằng số cộng thêm vào giá trị màu f(x,y). Độ sáng của
ảnh tăng nếu b > 0, và giảm bớt nếu b < 0.

Hình 1.5. Ảnh gốc

Hình 1.6. Ảnh đã giảm

Hình 1.7. Ảnh đã được

độ sáng

tăng cường độ sáng


13

1.1.3.2. Kỹ thuật tăng, giảm độ tương phản
Độ tương phản (Contrast) thể hiện sự thay đổi cường độ sáng của đối
tượng so với nền, hay nói cách khác, độ tương phản là độ nổi của điểm ảnh
hay vùng ảnh so với nền.
Ảnh số là tập hợp các điểm, mà mỗi điểm có giá trị độ sáng khác nhau. Ở
đây, độ sáng để mắt người dễ cảm nhận ảnh song không phải là quyết định.
Thực tế chỉ ra rằng hai đối tượng có cùng độ sáng nhưng đặt trên hai nền khác
nhau nhau sẽ cho cảm nhận khác nhau. Vì vậy ta có thể thay đổi độ tương
phản của ảnh sao cho phù hợp.
Việc làm tăng độ tương phản rất hữu ích khi tiến hành xử lý trước theo
phương pháp phân ngưỡng. Bằng việc làm tăng độ tương phản, sự khác nhau
của giá trị nền và đối tượng, độ dốc của cạnh đối tượng được tăng lên. Do đó
sau khi làm tăng độ tương phản ta có thể tìm các giá trị màu thích hợp với
một vùng sáng hơn.
Trong một ảnh có độ tương phản cao, có thể xác định được các viền rõ
ràng và chi tiết khác nhau của ảnh đó được nổi bật. Còn trong một ảnh có độ
tương phản thấp, tất cả các màu đều gần như nhau gây khó khăn cho việc xác
định các chi tiết của ảnh.

Hình 1.8. Ảnh gốc

Hình 1.9. Ảnh đã giảm

Hình 1.10. Ảnh đã

độ tương phản

được tăng độ tương
phản


14

Biểu thức cho kỹ thuật Contrast có dạng:
g(x,y) = af(x,y)
Trong đó a là hằng số nhân vào giá trị màu tại f(x,y). Độ sáng của ảnh
tăng nếu a > 1, và giảm bớt nếu a < 1.
1.1.3.3. Tách ngưỡng
Ta chọn hai mức Thấp- Min, Cao-Max và giá trị ngưỡng λ, khi đó giá
trị các pixel được định nghĩa lại như sau:
+ Inew(x, y) = Max nếu I(x, y) >= λ
+ Inew(x, y) = Min nếu I(x, y) < λ
1.1.3.4. Chuyển đổi sang ảnh nhị phân
Nhiệm vụ của việc chuyển đổi sang ảnh nhị phân là tách màu của “đối
tượng” ra khỏi nền. Biểu đồ hình cột của giá trị mức xám của tài liệu ảnh
thông thường chứa 2 giá trị: giá trị mức cao tương ứng với màu nền trắng và
giá trị nhỏ hơn tương tứng với màu chữ. Vì thế, nhiệm vụ của việc xác định
ngưỡng giá trị mức xám (giá trị mức xám lớn hơn giá trị ngưỡng sẽ là màu
trắng, giá trị mức xám nhỏ hơn giá trị ngưỡng sẽ là màu đen) là xác định một
giá trị thích hợp để việc chuyển đổi từ ảnh xám sang ảnh nhị phân sao cho
lượng thông tin mất mát là ít nhất.
Trong đề tài này tôi tính ngưỡng để chuyển đổi từ ảnh xám sang ảnh
nhị phân theo phương pháp của Otsu. Và việc chuyển đổi từ ảnh xám sang
ảnh nhị phân được thực hiện theo phương pháp ngưỡng tổng thể.
 Phương pháp ngưỡng toàn cục
Trong phương pháp sử dụng ngưỡng toàn cục, giá trị ngưỡng được tính
toán từ toàn bộ ảnh. Các điểm ảnh có giá trị mức xám dưới ngưỡng sẽ được


15

coi như là “nét bút”; các điểm ảnh có mức xám lớn hơn ngưỡng được coi là
“nền”. Quá trình này có thể được mô tả như sau:
1
b ( x, y )  
0

if

f ( x, y )  T
otherwise

Trong phương pháp ngưỡng toàn cục, tôi sử dụng phương pháp Otsu để
tính ngưỡng của mỗi bức ảnh. Phương pháp của Otsu dựa trên việc phân tích
biểu đồ hình cột mức xám của toàn bộ ảnh và sau đó chọn một giá trị làm giá
trị ngưỡng phù hợp với việc chuyển đổi ảnh sang ảnh nhị phân.
 Phương pháp Otsu
Trong lĩnh vực xử lý ảnh, phương pháp Otsu được dùng để tự động
thực hiện việc tính ngưỡng của một ảnh, và sau đó dùng giá trị ngưỡng vừa
tính được để chuyển đổi ảnh xám sang ảnh nhị phân.
Thuật toán tính ngưỡng có thể mô tả như sau: Các giá trị mức xám của
ảnh được chia ra làm 2 lớp sau đó tính giá trị ngưỡng. Chúng ta sẽ tìm giá trị
ngưỡng nhỏ nhất trong các lớp khác nhau, được định nghĩa như là một tổng
các giá trị khác nhau của các lớp;
 w2 (t )  1 (t ) 12 (t )  2 (t ) 22 (t )

Trọng số wi là xác suất của 2 lớp được tác riêng biệt bởi ngương t và
các  i2 khác nhau của các lớp đó.
Phương pháp Otsu chỉ ra rằng giá trị nhỏ nhất trong một lớp đồng thời
cũng được coi như là giá trị lớp nhất giữa 2 lớp.

 b2 (t )   2   w2 (t )  1 (t )2 (t )1 (t )   2 (t )2


16

Phương pháp tính ngưỡng theo Otsu dựa trên một ý tưởng khá là đơn
giản: Tìm giá trị ngưỡng mà có giá trị trọng số nhỏ nhất trong các lớp khác nhau.
Điều này cũng tương đương với việc tìm giá trị lớn nhất giữa 2 lớp khác nhau.
Trọng số trong một lớp được tính như sau:
 w2 ( t )   1 ( t ) 12 ( t )   1 ( t ) 22 ( t )

Trong đó các xác suất của lớp được tính như sau:
t

L

 1 (t )   P (i )

 2 (t ) 

i 1

 P (i )
i  t 1

Và các giá trị trung bình được cho bởi công thức:
t

 1 (t )  
i 1

iP (i )
 1 (t )

L

 2 (t ) 

iP ( i )
i  t 1  2 ( t )



Cuối cùng, các lớp khác nhau được tính theo công thức sau:
t



2
1

(t ) 

 i

2

  1 (t )

i 1

L

 22 ( t ) 

 i 

i  t 1

2

 2 (t )

P (i)
 1 (t )

P (i )
 2 (t )

* Thuật toán:
- Tính biểu đồ hình cột và xác suất của mỗi cường độ xám.
- Khởi tạo i (0) và i (0)
- Tính toán tất cả các trường hợp có thể có giá trị ngưỡng từ t=1 tới
cường độ mức xám lớn nhất.
- Cập nhật i và i
- Tính  b2 (t )


17

- Giá trị ngưỡng mong muốn tương đương với giá trị  b2 (t ) lớn nhất.
1.1.3.5. Loại bỏ nhiễu
Đối với một tệp tin ảnh thì nhiểu được định nghĩa là nhưng thông tin
không có trong ảnh gốc, nhưng trong quá trình sử dụng các thiết bị để đọc ảnh
vào trong máy tính xuất hiện thêm những thông tin không mong muốn. Việc
xử lý nhiễu tức là loại bỏ các thông tin này ra khỏi ảnh để thuận tiện cho việc
trích rút thông tin phục vụ cho việc xử lý ảnh dễ dàng hơn và chính xác hơn.
 Một số kiểu nhiễu:
Có một số kiểu nhiễu mà chúng ta hay gặp:
Loại nhiễu “salt” và “peper”, các điểm ảnh trong ảnh là những màu hay
cường độ sáng khác nhau so với các điểm xung quanh nó. Đối với những
điểm ảnh là loại nhiễu này thì thông thường giá trị mức xám của chúng không
liên quan tới các điểm ảnh xung quanh nó.
Trong đề tài này, dữ liệu ảnh chủ yếu được lấy bằng cách scan ảnh, do
đó loại nhiễu phổ biến và thường gặp đó là ‘salt’ và ‘peper’.
 Các phương pháp lọc nhiễu.
- Sử dụng bộ lọc tuyến tính: Một trong những phương pháp để loại bỏ
nhiễu là kết hợp ảnh gốc (ảnh cần lọc nhiễu) với một mặt nạ lọc thông thấp
hoặc là làm mượt ảnh. Ví dụ, mặt nạ Gaussian bao gồm các phần tử được xác
định bởi hàm Gaussion. Sự kết hợp này mang đến giá trị của mỗi điểm ảnh
cân đối với các điểm lân cận nó. Một cách tổng quát, một bộ lọc làm mượt
ảnh thiết lập giá trị của mỗi điểm ảnh là giá trị trung bình của chính nó và các
điểm ảnh lân cận. Các bộ lọc làm mượt ảnh được sử dụng để loại bỏ vết nhơ
trong ảnh.


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay

×