Tải bản đầy đủ

Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

Xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

MỤC LỤC
MỤC LỤC.......................................................................................................................... 1
Danh mỤc các hình vẼ......................................................................................................3
Danh mỤc các bẢng biỂu.................................................................................................3
LỜi cẢm ơn........................................................................................................................ 4
MỞ đẦu.............................................................................................................................. 5
CHƯƠNG 1. BÀI TOÁN XÁC ĐỊNH MẶT NGƯỜI TRONG ẢNH SỐ......................7
1.1 Giới thiệu về bài toán xác định mặt người trong ảnh số...........................................7
1.2 Những khó khăn và thách thức đối với bài toán xác định mặt người......................7
1.3 Các ứng dụng của xác định mặt người.......................................................................8
1.4 Xác định phạm vi đề tài...............................................................................................9
CHƯƠNG 2. CÁC KỸ THUẬT XÁC ĐỊNH MẶT NGƯỜI TRONG ẢNH SỐ.........10
2.1 Hướng tiếp cận dựa trên tri thức..............................................................................10
2.1.1 Tư tưởng của tiếp cận dựa trên tri thức.............................................................10
2.1.2 Các nghiên cứu liên quan...................................................................................11
2.2 Hướng tiếp cận dựa trên đặc trưng không thay đổi................................................13
2.2.1 Các đặc trưng của khuôn mặt.............................................................................13
2.2.3 Kết cấu của khuôn mặt.......................................................................................15
2.2.4 Mầu sắc da..........................................................................................................15

2.2.5 Đa đặc trưng.......................................................................................................15
2.3 Hướng tiếp cận dựa trên so sánh khớp mẫu............................................................15
2.3.1 Tư tưởng của so sánh khớp mẫu........................................................................15
2.3.2 Xác định các mẫu...............................................................................................15
2.3.3 Các mẫu biến dạng.............................................................................................17
CHƯƠNG 3: THUẬT TOÁN XÁC ĐỊNH MẶT NGƯỜI TRONG ẢNH SỐ DỰA
TRÊN KỸ THUẬT NHẬN BIẾT MÀU DA..................................................................19
3.1 Các kỹ thuật nhận biết màu da dựa trên tính chất điểm ảnh.................................19
3.1.1 Không gian màu sử dụng cho mô hình hóa màu da..........................................20
3.1.1.1 Không gian màu RGB...........................................................................20
3.1.1.2 Không gian RGB chuẩn hóa..................................................................20
3.1.1.3 HIS, HSV, HSL - Độ bão hòa của màu.................................................21
3.1.1.4 TSL – Tint, Saturation, Lightness (sắc thái, độ bão hòa, độ dịu )........21
3.1.1.5 YcrCb.....................................................................................................22
3.1.1.6 Các hệ tọa độ không gian màu khác......................................................22
Học viên: Lê Thị Phương Anh
1


Xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

3.1.2 Mô hình hóa màu da...........................................................................................22
3.1.2.1 Xác định ngưỡng cụ thể một điểm ảnh là màu da.................................23
3.1.2.2 Phương pháp mô hình hóa màu da sử dụng phân phối không tham số 23
3.1.2.3 Mô hình hóa phân phố màu da có tham số............................................25
3.1.3 So sánh và đánh giá các mô hình.......................................................................27
3.2. Đề xuất thuật toán xác định ảnh màu dựa trên màu da.........................................29
3.2.1. Định vị vùng khuôn mặt người trong ảnh màu................................................29
3.2.2 Giai đoạn tiền xử lý hình ảnh ban đầu...............................................................32
3.2.2.1 Định nghĩa của một khuôn mặt người...................................................34
3.2.2.2 Thuật toán để xác định khuôn mặt dựa trên kỹ thuật mặt nạ................34
3.2.2.3 Xác định tọa độ của trung tâm của khuôn mặt......................................35
3.3 Kết quả thực nghiệm và đánh giá.............................................................................42
KẾT LUẬN....................................................................................................................... 45
TÀI LIỆU THAM KHẢO...............................................................................................49

Học viên: Lê Thị Phương Anh
2



Xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

DANH MỤC CÁC HÌNH VẼ
Hình 2.1: Một phương pháp xác định khuôn mặt điển theo hướng tiếp cận Top-down. ...............11
Hình 2.2: Phương pháp chiếu:........................................................................................................12
Hình 2.3: Một mẫu khuôn mặt có kích thước 14 x 16 pixel được sử dụng trong phương pháp định
vị khuôn mặt của Sinha. Mẫu gồm 16 vùng trên khuôn mặt và 23 quan hệ ( các mũi tên)............17
Hình 3.1. Màu sắc hình ảnh và các thành phần R, G và B.............................................................29
Hình 3.2. Các thành phần của ảnh gốc trong không gian màu HSV, YCbCr và I1I2I3.................30
Hình 3.3. Tiền xử lý hình ảnh ban đầu tại đầu vào hệ thống..........................................................33
Hình 3.4. Bản gốc hình ảnh tại đầu vào phát hiện và mặt nạ thích hợp xác định các khu vực của
mặt người........................................................................................................................................35
Hình 3.5. Định nghĩa trung tâm của khuôn mặt.............................................................................36
Hình 3.6. Ví dụ 1 về phân lớp của khuôn mặt.................................................................................37
Hình 3.7. Ví dụ 2 về phân lập của khuôn mặt.................................................................................37
Hình 3.8. Các phân tích của khuôn mặt và tiền xử lý mới..............................................................38
Hình 3.9a. Các bước để xác định tọa độ của mắt trung tâm..........................................................38
Hình 3.9b. Căn chỉnh của khuôn mặt theo yêu cầu........................................................................39
Hình 3.10. Cấu trúc hệ thống xác định và chuẩn hóa mặt người...................................................40
Hình 3.11. Khuôn mặt trong cơ sở dữ liệu FERET.........................................................................42
Hình 3.12. Kết quả phát hiện mặt người trong cơ sở dữ liệu FERET COLOR..............................43
Hình 3.13. Kết quả phát hiện mặt người trong cơ sở dữ liệu CAMERA........................................44

DANH MỤC CÁC BẢNG BIỂU
Bảng 3.1 Kết quả nhận biết đúng và sai của các phương pháp......................................................28

Học viên: Lê Thị Phương Anh
3


Xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

LỜI CẢM ƠN

Đầu tiên, em xin gửi lời cảm ơn sâu sắc nhất đến cán bộ hướng dẫn khoa học, thầy
giáo, TS Vũ Duy Linh, người đã truyền cho em nguồn cảm hứng nghiên cứu khoa học,
người đã định hướng cho em đến với lĩnh vực nghiên cứu này.
Em xin bày tỏ lời cảm ơn tới các thầy giáo, cô giáo đã giảng dạy em trong suốt hai
năm học qua. Em cũng muốn gửi lời cảm ơn tới những thành viên lớp đã có những góp ý
chuyên môn cũng như sự động viên về tinh thần rất đáng trân trọng.
Em xin ghi nhận những tình cảm, sự giúp đỡ về chuyên môn của các thầy giáo trong
Bộ môn Khoa học máy tính, Khoa Công nghệ thông tin, Trường Đại học Thái Nguyên. Sự
quan tâm của các thầy cô đã động viên và khích lệ em rất nhiều trong thời gian qua.
Cuối cùng, em xin gửi lời cảm ơn sâu sắc tới tất cả người thân trong gia đình và
những bạn bè em với những động viên dành cho em trong công việc và trong cuộc sống.

Học viên thực hiện luận văn

Lê Thị Phương Anh

Học viên: Lê Thị Phương Anh
4


Xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

MỞ ĐẦU
Công nghệ thông tin đã và đang được ứng dụng rộng rãi trong mọi lĩnh vực của cuộc
sống. Với một hệ thống máy tính, chúng ta có thể làm được rất nhiều việc từ đơn giản đến
phức tạp. Máy tính giúp con người tiết kiện thời gian và công sức khi xử lý các công việc
trong thực tế. Điển hình như công việc nhận dạng mặt người. Trước đây, khi muốn tìm
kiếm một kẻ tình nghi trong siêu thị hay sân bay, các nhân viên an ninh phải tìm kiếm trên
từng màn hình của các camera theo dõi. Ngày nay, công việc đấy đã được làm tự động nhờ
các hệ thống nhận dạng mặt người. Phát hiện mặt người trong ảnh là một phần quan trọng
của hệ thống nhận dạng đó. Nếu giải quyết tốt việc phát hiện mặt người sẽ giúp chúng ta
tiết kiệm thời gian và nâng cao độ chính xác của việc nhận dạng khuôn mặt.
Phát hiện mặt người cũng là một bài toán nhận dạng đơn giản, hệ thống chỉ cần phân
loại đối tượng đưa vào có phải mặt người hay không phải mặt người. Ở mức độ cao hơn,
sau khi đã phát hiện được khuôn mặt, các khuôn mặt đó sẽ được so sánh với các khuôn
mặt có trong dữ liệu để nhận dạng xem khuôn mặt đấy là của ai (thường áp dụng trong
nhận dạng khuôn mặt của người nổi tiếng hoặc của tội phạm đang bị truy nã).
Bài toán phá hiện mặt người được bắt đầu nghiên cứu từ những năm 1990, và đã có
rất nhiều công trình nghiên cứu về phát hiện khuôn mặt trong ảnh, tuy nhiên cho đến nay,
các nhà khoa học vẫn không ngừng tìm các hướng tiếp cận mới, các thuật toán mới nhằm
nâng cao hiệu suất của việc phát hiện khuôn mặt cũng như việc nhận dạng mặt người.
Với mục tiêu chính là tìm hiểu, phân tích các thuật toán phát hiện mặt người hiện nay
và đưa ra cách tiếp cận mới để áp dụng vào bài toán phát hiện mặt người trong ảnh, luận
văn được trình bày trong 3 chương với bố cục như sau:
Chương 1: Bài toán xác định mặt người trong ảnh số. Giới thiệu tổng quan về bài
toán xác định mặt người trong ảnh, các ứng dụng và những khó khăn của bài toán.
Chương 2: Các kỹ thuật xác định mặt người trong ảnh số. Phân tích các kỹ thuật
xác định mặt người trong ảnh số.

Học viên: Lê Thị Phương Anh
5


Xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

Chương 3: Thuật toán xác định mặt người trong ảnh số dựa trên kỹ thuật nhận
biết màu da. Tập chung phân tích kỹ thuật phát hiện mặt người dựa trên đặc trưng màu
da. Từ đó đề xuất thuật toán xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết
màu da và thực nghiệm.
Cuối cùng là kết luận và hướng phát triển: Tóm tắt những kết quả đạt được, những
hạn chế và nêu lên các hướng phát triển trong tương lai.

Học viên: Lê Thị Phương Anh
6


Xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

CHƯƠNG 1. BÀI TOÁN XÁC ĐỊNH MẶT NGƯỜI TRONG ẢNH SỐ
1.1 Giới thiệu về bài toán xác định mặt người trong ảnh số

Trong những năm qua, có rất nhiều công trình nghiên cứu về bài toán nhận dạng mặt
người. Các nghiên cứu đi từ bài toán đơn giản, từ việc nhận dạng một mặt người trong ảnh
đen trắng cho đến mở rộng cho ảnh mầu và có nhiều mặt người trong ảnh. Đến nay các bài
toán xác định mặt người đã mở rộng với nhiều miền nghiên cứu như nhận dạng khuôn
mặt, định vị khuôn mặt, xác định trạng thái mắt người, theo dõi mặt người hay nhận dạng
cảm xúc mặt người…
Phát hiện mặt người trong ảnh là phần đầu tiên của một hệ thống nhận dạng mặt
người. Các hệ thống nhận dạng khuôn mặt được bắt đầu xây dựng từ những năm 1970, tuy
nhiên do còn hạn chế về các luật xác định mặt người nên chỉ được áp dụng trong một số
ứng dụng như nhận dạng thẻ căn cước. Nó chỉ được phát triển mạnh mẽ từ những năm
1990 khi có những tiến bộ trong công nghệ video và ngày nay thì các ứng dụng của xác
định mặt người đã trở nên phổ biến trong cuộc sống [1].
Định nghĩa bài toán xác định mặt người: Xác định khuôn mặt người là một kỹ thuật
máy tính để xác định các vị trí và kích thước của các khuôn mặt người trong các ảnh số bất
kì. Kỹ thuật này nhận biết các đặc trưng của khuôn mặt và bỏ qua những thứ khác xung
quanh đối tượng như: tòa nhà, cây cối, cơ thể…
1.2 Những khó khăn và thách thức đối với bài toán xác định mặt người.

Việc xác định khuôn mặt người có những khó khăn nhất định như:
-

Hướng (pose) của khuôn mặt đối với máy ảnh, như: nhìn thẳng, nhìn
nghiêng hay nhìn từ trên xuống. Cùng trong một ảnh có thể có nhiều khuôn
mặt ở những tư thế khác nhau.

-

Sự có mặt của các chi tiết không phải là đặc trưng riêng của khuôn mặt
người, như: râu quai nón, mắt kính, ….

-

Các nét mặt (facial expression) khác nhau trên khuôn mặt, như: vui, buồn,
ngạc nhiên, ….

Học viên: Lê Thị Phương Anh
7


Xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

-

Mặt người bị che khuất bởi các đối tượng khác có trong ảnh.

-

Sự biểu cảm của khuôn mặt: sự biểu cảm có thể làm thay đổi đáng kể các
đặc trưng và thông số của khuôn mặt, ví dụ như khuôn mặt của cùng một
người sẽ rất khác khi người đấy cười, tức giận hay sợ hãi …

1.3 Các ứng dụng của xác định mặt người

Xác định mặt người thường là một phần của một hệ thống (facial recognition system)
[2]. Nó thường được dùng trong giám sát video, giao tiếp người máy và quản lý cơ sở dữ
liệu ảnh…
Các ứng cơ bản của xác định mặt người có thể kể đến là:
-

Xác minh tội phạm: Dựa vào ảnh của một người, nhận dạng xem người đấy có
phải là tội phạm hay không bằng cách so sách với các ảnh tội phạm đang được
lưu trữ. Hoặc có thể sử dụng camera để phát hiện tội phạm trong đám đông.
Ứng dụng này giúp cơ quan an ninh quản lý con người tốt hơn.

-

Camera chống trộm: Các hệ thống camera sẽ xác định đâu là con người và theo
dõi xem con người đó có làm gì phạm pháp không, ví dụ như lấy trộm đồ, xâm
nhập bất hợp pháp vào một khu vực nào đó.

-

Bảo mật: Các ứng dụng về bảo mật rất đa dạng, một trong số đó là công nghệ
nhận dạng mặt người của laptop, công nghệ này cho phép chủ nhân của máy
tính chỉ cần ngồi trước máy là có thể đăng nhập được. Để sử dụng công nghệ
này, người dùng phải sử dụng một webcam để chụp ảnh khuôn mặt của mình và
cho máy “học” thuộc các đặc điểm của khuôn mặt giúp cho quá trình đăng nhập
sau này.

-

Lưu trữ khuôn mặt: Xác định mặt người có thể được ứng dụng trong các trạm
rút tiền tự động (ATM) để lưu trữ khuôn mặt của người rút tiền. Hiện nay có
những người bị người khác lấy trộm thẻ ATM và mã PIN, và bị rút tiền trộm,
hoặc có những chủ tài khoản đi rút tiền nhưng lại báo với ngân hàng là bị mất
thẻ và bị rút tiền trộm. Nếu lưu trữ được khuôn mặt của người rút tiền, ngân
hàng có thể đối chứng và xử lý dễ dàng hơn.

Các ứng dụng khác:
Học viên: Lê Thị Phương Anh
8


Xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

-

Điều khiển vào ra: văn phòng, công ty, trụ sở, máy tính, Palm,…Kết hợp thêm
vân tay và mống mắt. Cho phép nhân viên được ra vào nơi cần thiết.

-

An ninh sân bay, xuất nhập cảnh (hiện nay cơ quan xuất nhập cảnh Mỹ đã áp
dụng ). Dùng camera quan sát để xác thực người nhập cảnh và kiểm tra xem
người đấy có phải là tội phạm hay phần tử khủng bố không.

-

Tìm kiếm và tổ chức dữ liệu liên quan đến con người thông qua khuôn mặt
người trên nhiều hệ cơ sở dữ liệu lưu trữ thật lớn, như internet, các hãng truyền
hình,…Ví dụ: tìm các đoạn video có tổng thống Obama phát biểu, tìm các phim
có diễn viên Thành Long đóng…

-

Kiểm tra trạng thái người lái xe có ngủ gật, mất tập trung hay không, và hỗ trợ
thông báo khi cần thiết.

-

Tương lai sẽ phát triển các loại thẻ thông minh có tích hợp sẵn đặc trưng của
người dùng trên đó, khi bất cứ người dùng khác dùng để truy cập hay xử lý tại
các hệ thống sẽ được yêu cầu kiểm tra các đặc trưng khuôn mặt so với thẻ để
biết nay có phải là chủ thẻ hay không.

-

Hãng máy chụp hình Canon đã ứng dụng bài toán xác định khuôn mặt người
vào máy chụp hình thế hệ mới để cho kết quả hình ảnh đẹp hơn, nhất là khuôn
mặt người.

1.4 Xác định phạm vi đề tài

Trong đề tài này, tôi tập trung vào việc xác định khuôn mặt trong ảnh dựa trên nhận
biết màu da. Từ đấy lưu khuôn mặt tìm được vào cơ sử dữ liệu để phục vụ cho các mục
đích khác (chẳng hạn như nhận dạng mặt người hoặc ghép khuôn mặt vào bức ảnh
khác…). Do các điều kiện khó khăn đã nêu ở trên tôi xin đưa ra những giả định và ràng
buộc sau để giảm độ phức tạp của bài toán:
-

Các khuôn mặt được chụp thẳng hoặc góc nghiêng không đáng kể (nhỏ hơn
hoặc bằng 10o)

-

Phông nền của ảnh không quá phức tạp.

-

Ảnh được chụp trong điều kiện ánh sáng bình thường.

Học viên: Lê Thị Phương Anh
9


Xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

CHƯƠNG 2. CÁC KỸ THUẬT XÁC ĐỊNH MẶT NGƯỜI TRONG ẢNH SỐ
Dựa vào tính chất của các phương pháp xác định mặt người trên ảnh, các phương
pháp này được chia thành bốn loại chính, tương ứng với bốn hướng tiếp cận khác nhau.
Ngoài ra cũng có rất nhiều nghiên cứu mà phương pháp xác định mặt người không chỉ dựa
vào một hướng mà có liên quan đến nhiều hướng.
-

Hướng tiếp cận dựa trên tri thức: Dựa vào các thuật toán, mã hóa các đặc trưng
và quan hệ giữa các đặc trưng của khuôn mặt thành các luật. Đây là hướng tiếp
cận theo kiểu top-down.

-

Hướng tiếp cận dựa trên đặc trưng không thay đổi: Xây dựng các thuật toán để
tìm các đặc trưng của khuôn mặt mà các đặc trưng này không thay đổi khi tư thế
khuôn mặt hay vị trí đặt camera thay đổi.

-

Hướng tiếp cận dựa trên so sánh khớp mẫu: Dùng các mẫu chuẩn của khuôn
mặt (các mẫu này đã được chọn và lưu trữ) để mô tả các khuôn mặt hay các đặc
trưng của khuôn mặt (các mẫu này được chọn tách biệt theo tiêu chuẩn đã được
các tác giả đề ra để so sánh). Phương pháp này có thể dùng để xác định vị trí
hay dò tìm khuôn mặt trên ảnh.

-

Hướng tiếp cận dựa trên diện mạo: Trái ngược với hướng tiếp cận dựa trên
khuôn mẫu, các mô hình (hay các mẫu) sẽ được học từ một tập ảnh huấn luyện
mà thể hiện tính chất tiêu biểu của sự xuất hiện của mặt người trong ảnh. Sau đó
hệ thống (mô hình) sẽ xác định mặt người. Phương pháp này còn được biết đến
với tên gọi tiếp cận theo các phương pháp học máy.

2.1 Hướng tiếp cận dựa trên tri thức
2.1.1 Tư tưởng của tiếp cận dựa trên tri thức

Trong hướng tiếp cận này, các phương pháp xác định mặt người được xây dựng dựa
vào các luật, các luật này phụ thuộc vào tri thức của các tác giả nghiên cứu về bài toán xác
định khuôn mặt. Dễ dàng xây dựng các luật cơ bản để mô tả các đặc trưng của khuôn mặt
và các quan hệ tương ứng. Ví dụ, một khuôn mặt thường có hai mắt đối xứng qua trục
Học viên: Lê Thị Phương Anh
10


Xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

thẳng đứng giữa khuôn mặt và có một mũi một miệng. Các quan hệ đặc trưng có thể là
quan hệ về vị trí và khoảng cách tương đối. Khó khăn của hướng tiếp cận này đó là làm
thế nào để chuyển các tri thức của con người về khuôn mặt sang các luật cho máy tính một
cách hiệu quả. Nếu các luật này quá chi tiết, chặt chẽ thì sẽ có thể xác định thiếu các
khuôn mặt có trong ảnh, nhưng nếu các luật quá tổng quát thì sẽ dẫn đến xác định sai khu
vực không phải là khuôn mặt thành khuôn mặt. Ngoài ra cũng khó để mở rộng phạm vi
của bải toán để xác định các khuôn mặt có nhiều tư thế khác nhau.
2.1.2 Các nghiên cứu liên quan

Có nhiều cách để xây dựng chương trình xác định mặt người theo hướng tiếp cận dựa
trên tri thức. Thông thường chương trình sẽ được xây dựng theo hướng dựa vào một
phương pháp nào đấy chọn ra các ứng viên trong bức ảnh trước, sau đó sẽ áp dụng các luật
để xác định ứng viên nào là khuôn mặt, ứng viên nào không phải là khuôn mặt. Quá trình
này có thể được áp dụng nhiều lần để giảm sai sót. Các luật được xây dựng dựa vào tri
thức của người nghiên cứu về các đặc trưng của khuôn mặt (ví dụ như cường độ phân
phôi và sự khác nhau ) của các vùng trên khuôn mặt.

Hình 2.1: Một phương pháp xác định khuôn mặt điển theo hướng tiếp cận Top-down.

Yang và Huang đã sử dụng hướng tiếp cận dựa trên tri thức để xác định khuôn mặt
[3-4]. Hệ thống của hai tác giả bao gồm ba mức luật. Đầu tiên các ông sử dụng một khung
cửa sổ để quét trên bức ảnh và thông qua một số tập luật để xác định các ứng viên có thể là
mặt người, ví dụ như tìm phần trung tâm của khuôn mặt (phần tối hơn trong hình 2.1).
Tiếp theo, dùng một tập luật để mô tả tổng quát hình dáng khuôn mặt, lọc các ứng viên ở
mức một thành một tập các ứng viên mới có xác xuất là khuôn mặt cao hơn. Cuối cùng,
các ông lại dùng một tập luật khác để xem xét ở mức chi tiết các đặc trưng khuôn mặt (có
thể là đặc trưng về mắt, mũi, miệng…), từ đó lọc ra các ứng viên chính xác nhất. Có thể

Học viên: Lê Thị Phương Anh
11


Xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

nói cách làm của hai ông là một cách làm mịn dần để đạt được kết quả tốt nhất, mặc dù tỷ
lệ chính xác chưa cao, nhưng đây là tiền đề cho nhiều nghiên cứu sau này.
Có rất nhiều công trình nghiên cứu sử dụng phương pháp chiếu để xác định khuôn
mặt. Kotropoulos và Pitas [5] đưa ra một phương pháp gần tương tự với Yang và Huang.
Đầu tiên, các vùng của khuôn mặt được định vị bởi phương pháp chiếu (đã được Kanade
sử dụng thành công) để xác định biên của khuôn mặt. Với I(x,y) là giá trị xám của một
điểm trong ảnh có kích thước m x n ở tại vị trí (x,y), các hàm để chiếu ảnh theo phương
ngang và thẳng đứng được định nghĩa như sau:

HI(x) =


VI(y) =

.

Dựa trên biểu đồ hình chiếu ngang, khi xét biểu đồ biến thiên của HI hai ông tìm
được hai cực tiểu địa phương tương ứng với hai đỉnh đầu bên trái và bên phải của khuôn
mặt. Còn theo hình chiếu dọc, xét biến thiên và tìm cực tiểu địa phương của VI cũng cho
ta các vị trí của miệng, đỉnh mũi và hai mắt. Các đặc trưng này đủ để xác định khuôn mặt.
Hình 2.2.a cho một ví dụ về cách xác định như trên. Cách xác định này có tỷ lệ xác định
chính xác là 86.5% cho trường hợp chỉ có một khuôn mặt thẳng trong ảnh và hình nền
không phức tạp. Nếu hình nền phức tạp như hình 2.2.b thì rất khó tìm. Còn nếu ảnh có
nhiều khuôn mặt (hình 2.2.c) thì sẽ không xác định được.

Hình 2.2: Phương pháp chiếu: (a) Ảnh chỉ có một khuôn mặt và hình nền đơn giản;
(b) Ảnh chỉ có một khuôn mặt và hình nền phức tạp;
(c) Ảnh có nhiều khuôn mặt
Học viên: Lê Thị Phương Anh
12


Xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

2.2 Hướng tiếp cận dựa trên đặc trưng không thay đổi

Tiếp cận dựa trên các đặc trưng không thay đổi là tiếp cận theo kiểu Bottom-Up. Dựa
trên thực tế, chúng ta cố gắng tìm ra những đặc điểm không thay đổi khi của khuôn mặt
khi ở các tư thế khác nhau và các điều kiện môi trường như ánh sáng khác nhau. Đã có rất
nhiều nghiên cứu về hướng tiếp cận này, các đặc điểm không thay đổi được tìm thấy như
lông mày, mắt, mũi, miệng hay các đường viền trên tóc… Trên cơ sở các đặc trưng này,
các nhà nghiên cứu xây dựng lên một mô hình thống kê mô tả quan hệ của các đặc trưng
và từ đó xác định sự xuất hiện của khuôn mặt trong bức ảnh. Khó khăn của hướng tiếp cận
này đó là phải mô tả các đặc trưng không thay đổi và quan hệ giữa chúng phù hợp với điều
kiện ánh sáng, độ nhiễu hay bị che khuất.
2.2.1 Các đặc trưng của khuôn mặt

Có rất nhiều nghiên cứu về các đặc trưng của khuôn mặt. Có thể dựa vào các đặc
trưng như hai mắt, hai lỗ mũi, miệng, phần nối giữa mũi và miệng…hoặc dựa vào đường
viền của khuôn mặt.
Leung trong [6] đã đề xuất mô hình xác xuất để xác định khuôn mặt trong ảnh có
hình nền phức tạp dựa trên việc tìm kiếm các đặc trưng không thay đổi của khuôn mặt
trong ảnh, sau đó dùng đồ thị ngẫu nhiên để xác định khuôn mặt. Tư tưởng của phương
pháp này đó là xem bài toán xác định khuôn mặt như là bài toán tìm kiếm với mục tiêu là
tìm thứ tự các đặc trưng không thay đổi của khuôn mặt. Dùng năm đặc trưng (hai mắt, hai
lỗ mũi, phần nối giữa mũi và miệng) để mô tả một khuôn mặt. Đồng thời tính quan hệ
khoảng cách cho tất cả các cặp đặc trưng (như mắt trái, mắt phải), sau đấy dùng phân bố
Gauss để mô hình hóa. Một mẫu khuôn mặt được đưa ra thông qua trung bình tương ứng
cho một tập đa hướng, đa tỷ lệ của bộ lọc đạo hàm Gauss. Từ một ảnh, các đặc trưng của
ứng viên được xác định bằng cách so khớp từng điểm ảnh khi lọc tương ứng với vector
mẫu. Hai ứng viên có đặc trưng đứng đầu sẽ được chọn để tìm kiếm cho các đặc trưng
khác của khuôn mặt. Từ các đặc trưng không thay đổi, các đặc trưng khác sẽ được xác
định thông qua sự đánh giá xác xuất khoảng cách giữa các đặc trưng, hơn nữa phương sai
của phép thống kê này có thể được tính toán trước để xác định các đặc trưng với xác xuất
lớn. Tỷ lệ chính xác của phương pháp này là 86%.
Bên cạnh tính khoảng cách liên quan để mô tả quan hệ giữa các đặc trưng như Leung
Kendall [6], Mardia và Dryden [7] dùng lý thuyết xác suất thống kê về hình dáng. Dùng
Học viên: Lê Thị Phương Anh
13


Xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

hàm mật độ xác suất (Probility Density Function - PDF) qua N điểm đặc trưng, tương ứng
(xi, yi) là đặc trưng thứ i với giả sử là phân bố Gauss có 2N-chiều. Các tác giả áp dụng
phương thức cực đại khả năng (Maximum-Likelihood - ML) để xác định vị trí khuôn mặt.
Một thuận lợi của phương pháp này là các khuôn mặt bị che khuất vẫn có thể xác định
được. Hạn chế phương pháp này đó là không xác định được nhiều khuôn mặt trong cùng
một ảnh.
Không dùng phương pháp xác suất, Sirohey đưa một phương pháp khác xác định
khuôn mặt từ một ảnh có hình nền phức tạp dựa trên cạnh [8]. Dùng phương pháp Candy
[9] và heuristics loại bỏ các cạnh để còn lại duy nhất một đường bao xung quanh khuôn
mặt. Một hình ellipse dùng để bao khuôn mặt, tách biệt vùng đầu và hình nền. Tỷ lệ chính
xác của thuật toán là 80%.
Graf đưa ra một phương pháp xác định đặc trưng rồi xác định khuôn mặt trong ảnh
xám [10]. Dùng bộ lọc để làm nổi các biên, các phép toán hình thái học (morphology)
được dùng để làm nổi bật các vùng có cường độ cao và hình dáng chắc chắn (như mắt).
Thông qua histogram để tìm các đỉnh nổi bật để xác định các ngưỡng chuyển ảnh xám
thành hai ảnh nhị phân. Các thành phần dính nhau đều xuất hiện trong hai ảnh nhị phân
thì được xem là vùng của ứng viên khuôn mặt rồi phân loại xem có phải là khuôn mặt
không. Phương pháp được kiểm tra trên các ảnh chỉ có đầu và vai của người. Tuy nhiên
phương pháp này còn một vấn đề đấy là sử dụng các phép toán morphology như thế nào
và làm sao xác định khuôn mặt trên các vùng ứng viên.
Trong [11], Girosi dùng Gaze để tìm ứng viên góc mắt, miệng và tâm mắt. Ông xây
dựng SVM (Support Vector Machine) đã được học trước đó để xác định các vị trí ứng viên
có phải là góc mắt, miệng, và tâm mắt hay không để theo vết con mắt người. Juan và
Narciso xây dựng một không gian màu mới YCg’Cr’ để lọc các vùng là ứng viên khuôn
mặt dựa trên sắc thái của màu da người. Sau khi có ứng viên, hai ông dùng các quan hệ về
hình dáng khuôn mặt, mức độ cân đối của các thành phần khuôn mặt để xác định khuôn
mặt người.
Tương tự, Chang và Hwang cũng dùng không gian màu Ycg’Cr’ với tỷ lệ chính xác
hơn 80% trong ảnh xám. Jin xây dựng một bộ lọc để xác định ứng viên khuôn mặt người
theo màu da người. Từ ứng viên này tác giả xác định khuôn mặt người theo hình dáng

Học viên: Lê Thị Phương Anh
14


Xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

khuôn mặt và các quan hệ đặc trưng về thành phần khuôn mặt, với mắt phải được chọn
làm gốc tọa độ để xét quan hệ. Tỷ lệ chính xác cho khuôn mặt chụp thẳng trên 80%.
2.2.3 Kết cấu của khuôn mặt.

Khuôn mặt con người có những kết cấu riêng biệt mà có thể dùng để phân loại so với
các đối tượng khác. Từ kết cấu của khuôn mặt xây dựng lên một bộ phân loại, gọi là kết
cấu giống khuôn mặt (face-like texture).
2.2.4 Mầu sắc da

Thông thường các ảnh màu không xác định trực tiếp trên toàn bộ dữ liệu ảnh mà các
tác giả dùng tính chất sắc màu của da người (khuôn mặt người) để chọn ra được các ứng
viên có thể là khuôn mặt người (lúc này dữ liệu đã thu hẹp đáng kể) để xác định khuôn
mặt người.
2.2.5 Đa đặc trưng

Gần đây có nhiều nghiên cứu sử dụng các đặc trưng toàn cục như: màu da người,
kích thước, và hình dáng để tìm các ứng viên khuôn mặt, rồi sau đó sẽ xác định ứng viên
nào là khuôn mặt thông qua dùng các đặc trưng cục bộ (chi tiết) như: mắt, lông mày, mũi,
miệng, và tóc. Tùy mỗi tác giả sẽ sử dụng tập đặc trưng khác nhau.
2.3 Hướng tiếp cận dựa trên so sánh khớp mẫu.
2.3.1 Tư tưởng của so sánh khớp mẫu

Trong hướng tiếp cận dựa trên so sánh khớp mẫu, các mẫu chuẩn của khuôn mặt
(thường là khuôn mặt được chụp thẳng) sẽ được xác định trước hoặc được biểu diễn thành
một hàm với các tham số cụ thể. Từ một ảnh đưa vào, tính các giá trị tương quan so với
các mẫu chuẩn về đường viền khuôn mặt, mắt, mũi và miệng. Thông qua các giá trị tương
quan này mà hệ thống sẽ quyết định có hay không có tồn tại khuôn mặt trong ảnh. Hướng
tiếp cận này có lợi thế là rất dễ cài đặt, nhưng không hiệu quả khi tỷ lệ, tư thế, và hình
dáng thay đổi.
2.3.2 Xác định các mẫu

Sakai đã cố gắng thử xác định khuôn mặt người chụp thẳng trong ảnh [12]. Tác giả
dùng vài mẫu con (sub template) về mắt, mũi, miệng, và đường viền khuôn mặt để mô
hình hóa một khuôn mặt. Mỗi mẫu con được định nghĩa trong giới hạn của các đoạn thẳng.
Các đường thẳng trong ảnh được trích bằng cách xem xét thay đổi của hệ số góc và so
Học viên: Lê Thị Phương Anh
15


Xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

khớp các mẫu con. Đầu tiên tìm các ứng viên thông qua mối tương quan giữa các ảnh con
và các mẫu về đường viền. Sau đó, so khớp với các mẫu con khác. Hay nói một cách khác,
giai đoạn đầu xem như là giai đoạn sơ chế để tìm ứng viên, giai đọan thứ hai là giai đoạn
tinh chế để xác định ứng viên có phải là khuôn mặt hay không. Ý tưởng này được duy trì
cho đến các nghiên cứu sau này.
Craw đưa ra một phương pháp xác định khuôn mặt người dựa vào các mẫu về hình
dáng của các ảnh được chụp thẳng (dùng vẻ bề ngoài của hình dáng khuôn mặt). Đầu tiên
dùng phép lọc Sobel (Phép lọc Sobel dựa vào tích vô hướng của hai vector gradient) để
tìm các cạnh. Các cạnh này sẽ được nhóm lại theo một số ràng buộc. Sau đó, tìm đường
viền của đầu, quá trình tương tự được lặp đi lặp lại với mỗi tỷ lệ khác nhau để xác định
các đặc trưng khác như: mắt, lông mày, và môi. Sau đó Craw mô tả một phương thức xác
định dùng một tập có 40 mẫu để tìm các đặc trưng khuôn mặt và điều khiển chiến lược
dò tìm [13].
Một số nhà nghiên cứu sử dụng hình chiếu như các mẫu để xác định khuôn mặt
người. Silhouettes dùng PCA (Phân tích thành phần chính-Principal Component Analysis)
để có một tập hình chiếu cơ bản từ các mẫu khuôn mặt, hình chiếu được mô tả như một
mảng các bit. Dùng đặc trưng hình chiếu riêng kết hợp biến đổi Hough để xác định khuôn
mặt người. Sau đó một phương pháp xác định dựa trên đa loại mẫu để xác định các thành
phần của khuôn mặt được trình bày. Phương pháp này định nghĩa một số giả thuyết để mô
tả các khả năng của các đặc trưng khuôn mặt. Với một khuôn mặt sẽ có một tập giả thuyết,
lý thuyết DepsterShafer. Dùng một nhân tố tin cậy để kiểm tra sự tồn tại hay không của
các đặc trưng của khuôn mặt, và kết hợp nhân tố tin cậy này với một độ đo để xem xét có
hay không có khuôn mặt trong ảnh.
Sinha dùng một tập nhỏ các ảnh bất biến trong không gian ảnh để mô tả không gian
các mẫu ảnh [15-16]. Tư tưởng chính của ông dựa vào sự thay đổi mức độ sáng của các
vùng khác nhau của khuôn mặt (như hai mắt, hai má, và trán), (quan hệ về mức độ sáng
của các vùng còn lại thay đổi không đáng kể). Sau đấy xác định các cặp tỷ số của mức độ
sáng của một số vùng (một vùng tối hơn hay sáng hơn) cho ta một lượng bất biến khá hiệu
quả. Ông lưu sự thay đổi độ sáng của các vùng trên khuôn mặt trong một tập thích hợp với
các cặp quan hệ sáng hơn – tối hơn giữa các vùng nhỏ. Một khuôn mặt được xác định nếu
nó thỏa mãn tất cả các cặp sáng hơn – tối hơn. Ý tưởng này xuất phát từ sự khác biệt của
Học viên: Lê Thị Phương Anh
16


Xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

cường độ giữa các vùng kề cục bộ trên ảnh, sau này nó được mở rộng trên cơ sở biến đổi
wavelet để xác định người đi bộ, xác định xe hơi, xác định khuôn mặt. Ý tưởng của Sinha
còn được áp dụng trong các nghiên cứu về thị giác của robot.

Hình 2.3: Một mẫu khuôn mặt có kích thước 14 x 16 pixel được sử dụng trong phương pháp định
vị khuôn mặt của Sinha. Mẫu gồm 16 vùng trên khuôn mặt và 23 quan hệ ( các mũi tên).

Hình 2.3 cho thấy mẫu khuôn mặt với 16 cùng và 23 quan hệ. Các quan hệ này được
dùng để phân loại, có 11 quan hệ thiết yếu (các mũi tên màu đen) và 12 quan hệ xác thực
(các mũi tên mầu xám). Mỗi mũi tên là một quan hệ. Một quan hệ của hai vùng thỏa mãn
mẫu khuôn mặt khi tỷ lệ giữa hai vùng vượt qua một ngưỡng và một khuôn mặt được xác
đinh khi có 23 quan hệ thỏa mãn điều kiện trên. Một số phương pháp khác như của Froba
và Zink lọc cạnh ở độ phân giải thấp rồi dùng biến đổi Hough để so khớp mẫu theo hướng
cạnh để xác định hình dáng khuôn mặt ở dạng chụp hình thẳng ở dạng xám. Tỷ lệ chính
xác trên 91%. Ngàoi ra Shu và Jain còn xây dựng ngữ nghĩa khuôn mặt. Ngữ nghĩa xây
dựng theo hình dáng và vị trí các thành phần khuôn mặt. Hai ông từ bộ ngữ nghĩa này tạo
một đồ thị quan hệ để dễ dàng so khớp khi xác định khuôn mặt người …
2.3.3 Các mẫu biến dạng

Yuille dùng các mẫu biến dạng để mô hình hóa các đặc trưng của khuôn mặt [17].
Trong hướng tiếp cận này, các đặc trưng khuôn mặt được mô tả bằng các mẫu được tham
số hóa và có một hàm năng lượng (giá trị) được để liên kết các cạnh, đỉnh, và thung lũng
trong ảnh để tương ứng với các tham số trong mẫu. Mô hình này tốt nhất khi tối thiểu hàm
năng lượng qua các tham số, Mặc dù có kết quả tốt nhưng phương pháp này có một số hạn
chế đó là các mẫu biến dạng phải được khởi tạo trong phạm vi gần với các đối tượng mà
nó xác định.

Học viên: Lê Thị Phương Anh
17


Xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

Rất nhiều hướng tiếp cận dựa trên dường gấp khúc (snake) và các mẫu để xác định
khuôn mặt. Đầu tiên ảnh sẽ được làm xoắn lại bởi một lọc làm mờ rồi dùng phép toán
morphology để làm nổi bật cạnh lên. Tiếp theo dùng một đường gấp khúc có n điểm ảnh
(giá trị n nhỏ) để tìm và ước lượng các đọan cong nhỏ. Mỗi khuôn mặt được xấp xỉ bằng
một ellipse và biến đổi Hough, rồi tìm một ellipse nổi trội nhất. Các ứng viên sẽ có bốn
tham số mô tả nột ellipse (để xác định khuôn mặt). Với mỗi ứng viên, một phương thức
tương tự như phương thức mẫu biến dạng được dùng để xác định các đặc trưng ở mức chi
tiết. Nếu tìm thấy số lượng đáng kể các đặc trưng khuôn mặt và thỏa mãn tỷ lệ cân đối thì
xem như đã xác định được một khuôn mặt. Lam và Yan cũng dùng đường gấp khúc để xác
định vị trí đầu với thuất toán greedy để cực tiểu hóa hàm năng lượng [18].
Thay vì dùng đường gấp khúc thì Huang và Su [19] dùng lý thuyết dòng chảy để
xác định đường viền khuôn mặt dựa trên đặc tính hình học. Hai ông dùng lý thuyết tập hợp
đồng mức (Level Set) để loang từ các khởi động ban đầu để có được các khuôn mặt người.

Học viên: Lê Thị Phương Anh
18


Xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

CHƯƠNG 3: THUẬT TOÁN XÁC ĐỊNH MẶT NGƯỜI TRONG ẢNH SỐ
DỰA TRÊN KỸ THUẬT NHẬN BIẾT MÀU DA
Phát hiện mặt người trong ảnh có nhiều ứng dụng trong cuộc sống, tuy nhiên, trong
luận văn này, tôi chỉ xây dựng một chương trình nhỏ để minh họa cho các lý thuyết trình
bày ở trên.
3.1 Các kỹ thuật nhận biết màu da dựa trên tính chất điểm ảnh

Phát hiện dựa vào màu sắc của da người cũng là một trong những phương pháp được
dùng để phát hiện mặt người. Tuy nhiên nếu chỉ đơn thuần sử dùng màu sắc không thôi thì
rất khó có thể đạt được hiệu quả cao trong phát hiện mặt người. Vì trong các khung cảnh
thì có rất nhiều vật có màu sắc tương tự như màu của khuôn mặt. Tuy nhiên nếu kết hợp
phương pháp này với các phương pháp khác lại có thể mang lại hiệu quả cao. Vì kinh
nghiệm cho thấy màu da người có đặc tính màu riêng biệt, và đặc tính này cho phép dễ
dàng nhận ra đâu là da người [27]. Và thông thường trong hướng tiếp cận phát hiện mặt
người dựa trên thông tin xuất hiện trong ảnh, thì màu da được sử dụng như một bước phân
vùng các vùng ảnh có màu sắc giống màu da, điều đó cho phép giảm không gian tìm kiếm
khuôn mặt, cải thiện hiệu năng của hệ thống tìm kiếm. Do đó nhiều mô hình đã được xây
dựng để có thể phát hiện được da người.
Khi xây dựng hay mô hình hóa một hệ thống phát hiện hay phân tách vùng màu da
với mục đích sử dụng cho việc phát hiện mặt người, người ta thường đặt ra ba vấn đề
chính [28] sau: thứ nhất là mô hình đó được xây dựng trong không gian màu nào? thứ hai
là hàm phân phối của màu da được mô hình hóa chính xác đến mức độ nào và cuối cùng là
sẽ xử lý vùng màu da được phân vùng cho nhận biết mặt người như thế nào?
Phương pháp được được đề cập trong phần này là phương pháp phát hiện da người
dựa trên đặc tính điểm ảnh, nghĩa là sẽ phân lớp điểm ảnh thành hai lớp, lớp là lớp điểm
anh có thuộc màu da và lớp kia không phải là màu da. Các điểm ảnh là hoàn toàn độc lập
với nhau. Ngược lại với phương pháp này là phương pháp dựa trên đặc tính vùng ảnh.
Phát hiện màu da dựa trên đặc tính điểm ảnh có một lịch sử phát triển khá dài, tuy nhiên
trong khuôn khổ phần tổng quan này, chỉ đề cập và so sánh những kỹ thuật đã được công
bố và được đánh giá hiệu quả.
Học viên: Lê Thị Phương Anh
19


Xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

Mục đích cuối cùng của phần tổng quan này là thu tập các kỹ thuật đã được công bố,
mô tả những ý tưởng chính của kỹ thuật đó, tổng hợp và đưa ra những ưu điểm, nhược
điểm và những đặc trưng của từng kỹ thuật. Từ đó sẽ đưa ra quyết định lựa chọn kỹ thuật
phù hợp dùng để phân vùng màu da áp dụng trong luận văn.
3.1.1 Không gian màu sử dụng cho mô hình hóa màu da

Trong lĩnh vực đo màu, cũng như các lĩnh vực trong truyền tín hiệu hình ảnh và
video sử dụng rất nhiều không gian màu với các tính chất khác nhau. Và trong số đó nhiều
không gian màu được áp dụng cho vấn đề mô hình hóa màu da. Sau đây là tóm lược nhóm
các không gian màu được sử dụng rộng rãi nhất cũng như các tính chất của chúng.
3.1.1.1 Không gian màu RGB

RGB là không gian màu cơ bản được áp dụng từ lâu cho màn hình CRT. Trong
không gian màu này, mỗi điểm màu là sự kết hợp của ba thành phần đơn màu (Đỏ - Red,
Xanh lá cây- Green và xanh da trời: Blue). Đây là một trong những không gian màu được
sử dụng phổ biến nhất cho việc xử lý và lưu trữ dữ liệu ảnh số. Tuy nhiên do tính tương
quan cao giữa các kênh, giá trị cảm nhận không đồng nhất, sự pha trỗn giữa dữ liệu thành
phần màu và dữ liệu về độ sáng mà không gian RGB không được ưa thích sử dụng cho
việc phân tích màu cũng như trong các thuật toán nhận dạng dựa trên màu sắc.
3.1.1.2 Không gian RGB chuẩn hóa

Không gian RGB chuẩn hóa là không gian màu nhận được từ không gian RGB cơ
bản theo công thức chuẩn hóa đơn giản sau đây:
r=

R
G
B
g=
b=
R +G + B
R+G + B
R+G + B

(3.1)

Có thể dễ dàng thấy rằng, trong không gian này, r+g +b = 1. Do đó chỉ cần hai trong
ba thành phần trên là đủ để biểu diễn không gian màu này, thành phần thứ ba sẽ không còn
giá trị và có thể được bỏ qua, để rút ngắn được số chiều của không gian này. Hai thành
phần còn lại thường được gọi là các thành phần “màu tinh khiết” (“pure colors”). Thông
thường, hai thành phần r và b thường được giữ lại, còn b bị rút bỏ đi. Tính chất cần chú ý
của không gian màu này đó là tính bất biến đối với của bề mặt. Nghĩa là, nếu như không
quan tâm đến ánh sáng xung quanh, thì không gian chuẩn hóa RGB là bất biến đối với sự
thay đổi về hướng bề mặt liên quan đến nguồn chiếu (tất nhiên là duới một vài giả thiết

Học viên: Lê Thị Phương Anh
20


Xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

nhất định). Kết hợp với phép chuyển đổi đơn giản từ không gian màu RGB cơ bản mà
không gian RGB chuẩn hóa này ngày càng được sử dụng rộng rãi trong nhiều lĩnh vực,
trong đó có linh vực nhận dạng.
3.1.1.3 HIS, HSV, HSL - Độ bão hòa của màu

Không gian màu dựa trên tính bão hòa màu được giới thiệu khi có những nhu cầu
trong việc xác định số lượng tính chất màu. Chúng miêu tả màu sắc với những giá trị
thuộc về trực giác, dựa trên ý kiến của các họa sỹ về những trạng thái khác nhau của màu
sắc, trạng thái bão hòa cũng như từng tông màu khác nhau. Hue biểu thị cho màu trỗi (như
màu đỏ, màu xanh lá cây, màu đỏ tía và màu vàng) của một vùng ảnh, saturation (độ bão
hòa) là thước đo cho giới mức ngưỡng màu của một vùng ảnh.
Các khái niệm như “intensity” (cường độ), “lightness” (tính dịu) hay “value”(giá trị)
liên quan đến độ sáng của màu. Giá trị trực giác của các thành phần trong không gian màu
này và sự phân biệt rõ ràng giữa độ sáng với cá thành phần màu của không gian màu là ưu
điểm mà giúp cho không gian này được sử dụng phổ biến trong vấn đề phần vùng màu da.
Công thức chuyển từ không gian RGB sang không gian này như sau:

H = arccos

S = 1− 3
V=

1
( ( R − G) + ( R − B) )
2

( ( R −G)

2

+ ( R − B) ( G − B)

min ( R, G, B )
R+G + B

)

(3.2)

1
( R + G + B)
3

Ngoài ra còn có thể tính Hue à Saturation bằng cách sử dụng hàm log cho các thành
phần màu của không gian màu RGB. Phương pháp này có thể làm giảm sự độc lập của các
thành phần màu theo mức sáng.
Hệ tọa độ cực giữa Hue và Saturation có thể gây ra nhiều khó khăn trong mô hình
màu da, chính vì vậy người ta còn chuyển nó sang hệ tọa độ Đềcác theo công thức sau:
X = S cos H , Y = S sin H

(3.3)

3.1.1.4 TSL – Tint, Saturation, Lightness (sắc thái, độ bão hòa, độ dịu )

Học viên: Lê Thị Phương Anh
21


Xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

Không gian chuẩn hóa thành phần màu và độ sáng TSL được chuyển từ không gian
chuẩn hóa RGB theo công thức sau đây:
S = 9 / 5 ( r ′2 + g ′2 ) 
 arctan ( r ′ / g ′ ) / 2π + 1/ 4 g ′ > 0

T = arctan ( r ′ / g ′ ) / 2π + 3 / 4 g ′ < 0
 0, g ′ = 0

1/2

(3.4)

L = 0.299 R + 0.587G + 0.114 B

Trong đó, r’ = r – 1/3, g’ = g – 1. Theo kết quả nghiên cứu, so sánh chín không gian
màu sử dụng cho mô hình màu da thi không gian chuẩn hóa TSL thực hiện mô hình hóa
màu da nhanh hơn các không gian khác.
3.1.1.5 YcrCb

YCrCblà không gian màu được sử dụng nhiều trong vấn đề nén ảnh. Màu sắc dược
biểu diễn bởi luma(đó là giá trị độ sáng được tính toán từ không gian RGB), gồm ba thành
phần, một thành phần là tổng các trọng số từ RGB, hai thành phần màu khác nhau Cr và
Cb được tạo ra bằng cách từ từ hai thành phần Red và Blue trong không gian màu RGB.
Công thức để chuyển đổi như sau:
Y = 0.299 R + 0.587G + 0.114G
Cr = R − Y

(3.5)

Cb = B − Y

Việc chuyển đổi đơn giản, tính phân chia rõ ràng của độ sáng và các thành phần màu
là những đặc tính giúp cho không gian này lôi cuốn các nhà nghiên cứu sử dụng cho việc
mô hình hóa màu da.
3.1.1.6 Các hệ tọa độ không gian màu khác

Bên cạnh YcrCb, một vài không gian màu khác đựoc tạo ra từ chuyển đổi tuyến tính
không gian RGB được sử dụng trong vấn đề phát hiện màu da. Như là YES, YUV hay
YIQ. Tuy nhiên chúng ít được sử dụng hơn.
3.1.2 Mô hình hóa màu da

Mục đích cuối cùng của phát hiện màu da là xây dựng một quy tắc có tính quyết
định. Đây là quy tắc sẽ giúp phân biệt một điểm ảnh là da hay không phải là da người.
Thông thường, quy tắc này sẽ thiết lập một giá trị đo cho phép tính toán mức độ tương
Học viên: Lê Thị Phương Anh
22


Xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

đồng giữa một điểm ảnh màu với đặc trưng màu da. Giá trị đo này được thiết lập như thế
nào, công thức ra sao tùy thuộc vào từng phương pháp mô hình hóa màu da.
3.1.2.1 Xác định ngưỡng cụ thể một điểm ảnh là màu da

Trong một số không gian màu, phương pháp xây dựng và xếp lớp màu da bằng cách
xác định rõ ràng (thông qua một số quy tắc) biên giới các giá trị của điểm ảnh là màu da
hay không.
Ví dụ như: trong không gian RGB, (R,G,B) được xếp thuộc lớp màu da nếu như:
R>95 và G>40 và B>20 và
Max(R,G,B) – Min(R,G,B) >15 và
|R-B| > 15 và R>g và R>B
Tính đơn giản của phương pháp này cũng thu hút nhiều sự tập trung nghiên cứu. Ưu
điểm dễ thấy của phưuơng pháp này đó là tính đơn giản của quy tắc nhận biết màu da.
Điều này cho phép phân lớp một cách nhanh chóng và dễ dàng.
Tuy nhiên kết quả đạt được khi phân lớp là không cao trong trường hợp tổng quát. Vì
vậy khó khăn chính của phương pháp này nếu muốn có được hệ số nhận dạng cao đó là
phải tìm ra được một không gian màu thích hợp cũng như các quy tắc tốt để nhận biết màu
da trong không gian màu này.
Hiện nay người ta đang đề xuất sử dụng thuật toán máy học để tìm ra một không gian
màu thích hợp cũng như các quy tắc phân lớp màu da với mong muốn có được hệ số nhận
dạng cao. Tuy nhiên đó cũng chỉ mới là đề xuất và chưa có một kết quả cụ thể của một
nghiên cứu nào đựoc công bố.
Tuy nhiên, giữa và kết quả đạt được, chúng ta vẫn có thể tìm ra được những quy tắc
cho phép nhận biết chắc chắn một điểm ảnh không phải là màu da. Những quy tắc này có
thể được sử dụng làm bước lọc khởi tạo cho các phương phân lớp pháp phức tạp hơn giữa
vùng màu da và vùng không phải màu da. Nó giúp cho quá trình phân lớp được thực hiện
nhanh chóng hơn và đỡ tốn công hơn.
3.1.2.2 Phương pháp mô hình hóa màu da sử dụng phân phối không tham số

Ý tưởng chính của phương pháp mô hình hóa màu da không tham số đó là ước lượng
phân phối màu da từ dữ liệu huấn luyện mà không xuất phát từ một mô hình rõ ràng nào
Học viên: Lê Thị Phương Anh
23


Xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

của màu da. Kết quả của phương pháp này thường được biểu diễn dưới dạng một bản đồ
phân bố màu da (SPM – Skin Probability Map).
Mỗi một giá trị phân bố được gán cho mỗi điểm trong không gian màu.
3.1.2.2.1 Bảng tra cứu chuẩn hóa (LUT – Lookup Table)
Một số thuật toán phát hiện mặt người và bám sát mặt người sử dụng một lược đồ
mức xám dựa trên hướng tiếp cận phân vùng các điểm ảnh là màu da.
Không gian màu được lượng tự hóa thành từng nhóm, mỗi một nhóm đáp ứng cho
một khoảng các thành phần màu. Các nhóm lược đồ này được tham chiếu tới một bảng gọi
là bảng tra cứu. Mỗi một nhóm lưu trữ một số lượng lần xuất hiện của một màu khi tiến
hành huấn luỵện ảnh da người. Sau quá trình huấn luyện, biểu đồ sẽ tính toán và chuẩn
hóa, chuyển sang giá trị biểu đô trong phân phối xác suất miền rời rạc:
Pskin(c) = skin[c]/Norm

(3.6)

Trong đó, skin[c] nhận giá trị của nhóm lược đồ, đáp ứng cho véc tơ màu c, Norm là
một hệ số chuẩn hóa (tổng tất cả các giá trị của các nhóm biểu đồ) hay là giá trị lớn nhất
của một nhóm biểu đồ. Giá trị chuẩn hóa của của bảng tra cứu các nhóm biểu đồ là căn cứ
để cho phép quyết định một màu có là màu da hay không?
3.1.2.2.2 Phân lớp Bayes (Bayes Classifier)
Giá trị của Pskin(c) trong công thức trên là một điều kiện xác suất – P(c|skin) – xác
suất một màu quan sát c là một pixel màu da. Và xác suất thích hợp được dùng để phát
hiện màu da đó là P(skin|c) – xác suất quan sát màu được màu da khi xuất hiện một giá trị
màu c rời rac. Để tính giá trị này, ta sử dụng công thức Bayes quen thuộc :
P ( skin | c ) =

P ( skin | c ) P ( skin )
P ( skin | c ) P ( skin ) + P ( c | ¬skin ) P ( ¬skin )

(3.7)

Trong đó P(c|skin) và P(c|-skin) được tính trực tiếp từ biểu đồ màu da và không màu
da. Xác suất toàn phần P(skin) và P(-skin) thì được ước lượng từ một số lượng các mẫu là
màu da và không màu da trong tập mẫu huấn luyện.
Bất đẳng thức P(skin|c) > Θ, trong đó Θ là một giá trị ngưỡng, có thẻ được sử dụng
để trở thành quy tắc trong phát hiện màu da. Công thức trên đôi khi hơi phức tạp, và để có
thể tránh điều này, nếu như thực sự không cần phải biết một cách chính xác suất P(skin|c)
Học viên: Lê Thị Phương Anh
24


Xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

và P(-skin|c) mà chỉ cần biết tỉ số giữa chúng thì người ta thường đưa vê công thức như
sau:
P ( skin | c )
P ( skin | c ) P ( skin )
=
P ( ¬skin | c ) P ( c | ¬skin ) P ( ¬skin )

(3.8)

So sánh công thức này với một ngưỡng có thể tạo ra một quy tắc cho phép phát hiện
tỉ số màu da/không phải màu da. Sau một vài phép biến đổi, chúng ta nhận được công thức
P ( c | skin )

P ( c | ¬skin )

1 − P ( skin )
Θ=K×
P ( skin )

(3.9)

Công thức trên có thể thấy rằng, việc chọn lựa giá trị của xác suất toàn phần không
ảnh hưởng đến chất lượng của bộ phát hiện, vì với bất kì một xác suất toàn phần P(skin)
đều có thể chọn được một giá trị K phù hợp sao cho giá trị của ngưỡng là Θ.
3.1.2.2.3 Tổng kết phương pháp không tham số
Hai ưu điểm dễ thấy của phương pháp mô hình hóa phân phối không tham số đó là:
thứ nhất, chúng có thể huấn luyện và sử dụng được một cách nhanh chóng. Thứ hai, chúng
độc lập với lý thuyết vè hình dạng của phân phối màu da (điều này không đúng trong mô
hình hóa màu da có tham số). Tuy nhiên nhược điểm của phương pháp này đó là chúng
yêu cầu nhiều bộ nhớ để lưu trữ và không có khả năng nội suy hay tạo ra dữ liệu huấn
luyện. Lấy ví dụ như, chúng ta lượng tử hóa điểm ảnh trong không gian RGB về 8bit cho
mỗi màu, khi đó chúng ta phải cần một mảng có tới 2 24 phần tử để lưư trữ tập tất cả các
xác suất của mô hình.
Để có thể giảm bớt kích thước này bằng cách loại bỏ những dữ liệu huấn luyện nhỏ
lẻ, không gian màu thường sử dụng kích thước 128*128*128, 64*64*64, 32*32*32. Theo
như nghiên cứu thì kích thước 32*32*32 là kích thước không gian mang lại hiệu quả cao
nhất.
3.1.2.3 Mô hình hóa phân phố màu da có tham số

Hầu hết các mô hình màu da không tham số dựa trên biểu đồ xám đều yêu cầu rất
nhiều bộ nhớ và hiệu năng của chúng phụ thuộc hoàn toàn của tập ảnh huấn luyện cố định.

Học viên: Lê Thị Phương Anh
25


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay

×