Tải bản đầy đủ

Luận văn tốt nghiệp Khoa học máy tính: Tìm hiểu mạng Neural Hamming và ứng dụng trong bài toán nhận dạng các chữ cái Tiếng Việt








LU N VĂN T T NGHI P CHUYÊN NGÀNH Ậ Ố Ệ
KHOA H C MÁY TÍNH Ọ
Đ tài: “Tìm hi u ề ể m ng Neural Hamming và ng d ng trong bài toánạ ứ ụ
nh n d ng các ch cái Ti ng Vi t”ậ ạ ữ ế ệ
Sinh viên: Phùng Văn Ki mệ
L p ớ : Cao h c k10bọ
Giáo viên h ng d nướ ẫ : TS. Lê Quang Minh








PH N M Đ UẦ Ở Ầ
T lâu các nhà khoa h c đã nh n th y nh ng u đi m c a b ócừ ọ ậ ấ ữ ư ể ủ ộ
con ng i và tìm cách b t ch c đ th c hi n trên nh ng máy tính, t oườ ắ ướ ể ự ệ ữ ạ
cho nó có kh năng h c t p, nh n d ng và phân lo i. Vì v y các nhà khoaả ọ ậ ậ ạ ạ ậ
h c đã nghiên c u và sáng t o ra m ng Neural nhân t o. Nó th c s đ cọ ứ ạ ạ ạ ự ự ượ
chú ý và nhanh chóng tr thành m t h ng nghiên c u đ y tri n v ng đ cở ộ ướ ứ ầ ể ọ ặ
bi t là lĩnh v c nh n d ng. Và bài toán nh n d ng ký t là m t bài toánệ ự ậ ạ ậ ạ ự ộ
con trong l p các bài toán nh n d ng, x lý nh.ớ ậ ạ ử ả
Hi n nay trên th gi i, các s n ph m nh n d ng ký t đã đ cệ ế ớ ả ẩ ậ ạ ự ượ
tri n khai t ng đ i r ng rãi. Tuy nhiên đây là các s n ph m nh n d ngể ươ ố ộ ả ẩ ậ ạ
ký t ti ng Anh, do đó đ i v i nh n d ng ký t ti ng Vi t thì ch cóự ế ố ớ ậ ạ ự ế ệ ỉ
ng i Vi t Nam m i có th phát tri n đ c. n c ta trong m t vài nămườ ệ ớ ể ể ượ Ở ướ ộ
g n đây cũng đã có m t s s n ph m nh n d ng ti ng vi t đ c tri nầ ộ ố ả ẩ ậ ạ ế ệ ượ ể
khai trên th tr ng. Nh ng các s n ph m này đ c bán trên th tr ngị ườ ư ả ẩ ượ ị ườ
d i d ng đóng kín nên vi c đ phát tri n thành ph n m m t đ ng c pướ ạ ệ ể ể ầ ề ự ộ ậ
nh t nh là đi u không th . Vì v y nên tôi đã ch n đ tài ậ ả ề ể ậ ọ ề “Tìm hi uể
m ng Neural Hamming và ng d ng trong bài toán nh n d ng các chạ ứ ụ ậ ạ ữ
cái Ti ng Vi t”ế ệ .
H th ng ch cái Ti ng Vi t là đ c xây d ng d a trên ch cáiệ ố ữ ế ệ ượ ự ự ữ
Latinh có thêm ch ghép và d u ph . Do đó vi c nh n d ng s g p khóữ ấ ụ ệ ậ ạ ẽ ặ
khăn h n so v i ch cái Latinh thông th ng và c n ph i có thu t toán xơ ớ ữ ườ ầ ả ậ ử
lý đem l i đ chính xác cao. ạ ộ
Trong khuôn kh , th i l ng c a lu n văn, tôi đ a ra m t ch ngổ ờ ượ ủ ậ ư ộ ươ
trình mô ph ng m ng Neural nh n d ng 29 ch cái Ti ng Vi t t A đ nỏ ạ ậ ạ ữ ế ệ ừ ế
Y và 10 ch s t 0 đ n 9.ữ ố ừ ế
Lu n văn đ c s p x p và chia thành 3 ch ng chính:ậ ượ ắ ế ươ .







- Ch ng 1: T ng quan v hi n tr ng các bài toán nh n d ng và thi tươ ổ ề ệ ạ ậ ạ ế
l p bài toán nghiên c u;ậ ứ
- Ch ng 2: Tìm hi u v m ng Neural và kho ng cách Hamming;ươ ể ề ạ ả
- Ch ng 3: ng d ng m ng neural Hamming trong bài toán nh n d ngươ Ứ ụ ạ ậ ạ
các ch cái Ti ng Vi t.ữ ế ệ
Nhân đây, tôi xin chân thành c m n TS. Lê Quang Minh ng i tr c ti pả ơ ườ ự ế
h ng d n, ch b o nhi t tình cho tôi hoàn thành lu n văn này. Tôi xinướ ẫ ỉ ả ệ ậ
chân thành cám n các th y cô trong Tr ng Đ i h c CNTT & TT Đ iơ ầ ườ ạ ọ ạ
h c Thái Nguyên và toàn th các b n đã giúp đ tôi hoàn thành cu n lu nọ ể ạ ỡ ố ậ
văn này.







CH NG I: T NG QUAN V HI N TR NG CÁC BÀI TOÁNƯƠ Ổ Ề Ệ Ạ
NH N D NG VÀ THI T L P BÀI TOÁN NGHIÊN C UẬ Ạ Ế Ậ Ứ
1.1 T ng quan v bài toán nh n d ng.ổ ề ậ ạ
Nh n d ng ch là m t lĩnh v c đã đ c quan tâm nghiên c u vàậ ạ ữ ộ ự ượ ứ
ng d ng t nhi u năm nay theo hai h ng chính:ứ ụ ừ ề ướ
• Nh n d ng ch in: ph c v cho công vi c t đ ng hóa đ c tài li u,ậ ạ ữ ụ ụ ệ ự ộ ọ ệ
tăng t c đ và hi u qu nh p thông tin vào máy tính tr c ti p t cácố ộ ệ ả ậ ự ế ừ
ngu n tài li u.ồ ệ
• Nh n d ng ch vi t tay: v i nh ng m c đ ràng bu c khác nhau vậ ạ ữ ế ớ ữ ứ ộ ộ ề
cách vi t ,ki u ch ph c v cho các ng d ng đ c và x lý ch ng t ,ế ể ữ ụ ụ ứ ụ ọ ử ứ ừ
hóa đ n, phi u ghi, b n th o vi t tay Nh n d ng ch vi t tay đ c táchơ ế ả ả ế ậ ạ ữ ế ượ
thành hai h ng phát tri n: nh n d ng ch vi t tay tr c tuy n (on-line)ướ ể ậ ạ ữ ế ự ế
và nh n d ng ch vi t tay ngo i tuy n (off-line).ậ ạ ữ ế ạ ế
Đ n th i đi m này, bài toán nh n d ng ch in đã đ c gi i quy tế ờ ể ậ ạ ữ ượ ả ế
g n nh tr n v n (s n ph m FineReader 11 c a hãng ABBYY có thầ ư ọ ẹ ả ẩ ủ ể
nh n d ng ch in theo 20 ngôn ng khác nhau trong đó có c Vi t Nam,ậ ạ ữ ữ ả ệ
ph n m m nh n d ng ch Vi t in VnDOCR 4.0 c a Vi n Công nghầ ề ậ ạ ữ ệ ủ ệ ệ
Thông tin Hà N i có th nh n d ng đ c các tài li u ch a hình nh, b ngộ ể ậ ạ ượ ệ ứ ả ả
và văn b n ti ng Vi t v i đ chính xác trên 99%, ). Tuy nhiên trên thả ế ệ ớ ộ ế
gi i cũng ớ như Vi t Nam, bài toán nh n d ng ch vi t tay v n còn làở ệ ậ ạ ữ ế ẫ
v n đ thách th c l n đ i v i các nhà nghiên c u. Bài toàn này ch a thấ ề ứ ớ ố ớ ứ ư ể
gi i quy t tr n v n vì nó ph thu c quá nhi u vào ng i vi t và s bi nả ế ọ ẹ ụ ộ ề ườ ế ự ế
đ i quá đa d ng trong cách vi t và tr ng thái tinh th n c a t ng ng iổ ạ ế ạ ầ ủ ừ ườ
vi t. Đ c bi t đ i v i vi c nghiên c u nh n d ng ch vi t tay ti ng Vi tế ặ ệ ố ớ ệ ứ ậ ạ ữ ế ế ệ







l i càng g p nhi u ạ ặ ề khó khăn h n do b ký t ti ng Vi t có thêm ph nơ ộ ự ế ệ ầ
d u, r t d nh m l n v i các nhi u.ấ ấ ễ ầ ẫ ớ ễ
1.2. C th v bài toán nh n d ng ch cái Ti ng Vi t.ụ ể ề ậ ạ ữ ế ệ
Hi n nay cũng có r t nhi u bài báo đ c p đ n bài toán nh n d ngệ ấ ề ề ậ ế ậ ạ
kí t quang h c, nh m c i ti n các ph ng pháp phân đo n nh, nh nự ọ ằ ả ế ươ ạ ả ậ
d ng. Song v n ch a gi i quy t m t cách tri t đ nh ng v n đ khó khănạ ẫ ư ả ế ộ ệ ể ữ ấ ề
c a bài toán th ng g p ph i. Đ c bi t là đ i v i vi c nh n d ng các kíủ ườ ặ ả ặ ệ ố ớ ệ ậ ạ
t ti ng Vi t, g p r t nhi u khó khăn, do tính riêng bi t c a ti ng Vi t:ự ế ệ ặ ấ ề ệ ủ ế ệ
S kí t nhi u, các kí t l i có d u…Nên bài toán v n còn thu hút đ cố ự ề ự ạ ấ ẫ ượ
s quan tâm, nghiên c u nh m gi i quy t nh ng v n đ khó khăn c a bàiự ứ ằ ả ế ữ ấ ề ủ
toán m t cách tri t đ . M t s h nh n nh n d ng văn b n đã và đangộ ệ ể ộ ố ệ ậ ậ ạ ả
đ c áp d ng r t nhi u vào ng d ng nh FineReader c a hãngượ ụ ấ ề ứ ụ ư ủ
AABBYY, OmmiPage c a hãng Scansoft đ c dùng đ nh n d ng cácủ ượ ể ậ ạ
văn b n ti ng Anh,… VNDOCR c a Vi n công ngh thông tin cho cácả ế ủ ệ ệ
văn b n ti ng Vi tả ế ệ
Nhìn chung, các s n ph m ph n m m nh n d ng văn b n Ti ngả ẩ ầ ề ậ ạ ả ế
Vi t ch in c a n c ta đã thu đ c k t qu kh quan, đ c bi t ph nệ ữ ủ ướ ượ ế ả ả ặ ệ ầ
m m VNDOCR đã đ c s d ng r ng rãi trong các c quan nhà n c.ề ượ ử ụ ộ ơ ướ
Riêng ph n nh n d ng kí t vi t tay v n đang đ c nghiên c u và phátầ ậ ạ ự ế ẫ ượ ứ
tri n nh m ph c v cho các yêu c u khác nhau nh đ c và x lý các bi uể ằ ụ ụ ầ ư ọ ử ể
m u: hóa đ n, phi u đi u tra ẫ ơ ế ề
Khó khăn l n nh t khi nghiên c u bài toán nh n d ng ch cáiớ ấ ứ ậ ạ ữ
ti ng Vi t là s bi n thiên quá đa d ng trong cách vi t c a t ngế ệ ự ế ạ ế ủ ừ







ng i. Cùng m t ng i vi t nh ng đôi khi cũng có nhi u s khácườ ộ ườ ế ư ề ự
bi t trong cách vi t tuỳ thu c vào t ng ng c nh, ki u vi t c a m tệ ế ộ ừ ữ ả ể ế ủ ộ
ng i cũng có th thay đ i theo th i gian ho c theo thói quen Đi uườ ể ổ ờ ặ ề
này gây ra nhi u tr ng i trong vi c nh n d ng cũng nh l a ch nề ở ạ ệ ậ ạ ư ự ọ
mô hình nh n d ng.ậ ạ
1.3. Thi t l p bài toán.ế ậ
Đ tài mà tôi th c hi n là: “ ng d ng m ng Neural Hamming trong bàiề ự ệ Ứ ụ ạ
toán nh n d ng các ch cái Ti ng Vi t”, công vi c chính là “Xây d ngậ ạ ữ ế ệ ệ ự
ch ng trình nh n d ng các ch cái Ti ng Vi t” ý t ng bài toán nhươ ậ ạ ữ ế ệ ưở ư
sau:
 Phân tích nh cho ký t : Chia nh và tách ký t theo t ng vùng gi iả ự ả ự ừ ớ
h n;ạ
 Chuy n đ i kí t sang ma tr n đi m nh;ể ổ ự ậ ể ả
 Chuy n thành ma tr n tuy n tính và đ a vào m ng neural;ể ậ ế ư ạ
 Đ a vào m ng neural tính giá tr đ u ra.ư ạ ị ầ
Các b c gi i quy t bài toán s d ng m ng neural Hamming nh nướ ả ế ử ụ ạ ậ
d ng ch cái Ti ng Vi t mô t theo ti n trình chung nh sau:ạ ữ ế ệ ả ế ư
nh đ u vàoẢ ầ Ti n x lýề ử
Quá trình
bi n đ i nhế ổ ả
Nh n d ngậ ạ K t quế ả
Hình 1. S đ h th ng nh n d ngơ ồ ệ ố ậ ạ
1.3.1. nh đ u vàoẢ ầ
V i đ u vào là các file nh *ớ ầ ả .bmp có kích c nh là 150 x 150. Sauỡ ả
khi đã n p m u c n nh n d ng ta ti n nh các thao tác x lý nh đ táchạ ẫ ầ ậ ạ ế ả ử ả ể
ra ký t . Ta có th xác đ nh đ c ký t d a vào đ ng biên c a ký t .ự ể ị ượ ự ự ườ ủ ự
Tr i qua các b c ti n x lý nh: l c m n nh, nh phân, ch nh nghiêng,ả ươ ề ử ả ọ ị ả ị ỉ







chu n kích th c, l p kho ng tr ng, l y biên, ta thu đ c nh ký t v iẩ ướ ấ ả ố ấ ượ ả ự ớ
biên c a nó.ủ
1.3.2. Ti n s lýề ử
Giai đo n này góp ph n làm tăng đ chính xác phân l p c a hạ ầ ộ ớ ủ ệ
th ng nh n d ng, tuy nhiên nó cũng làm cho t c đ nh n d ng c a hố ậ ạ ố ộ ậ ạ ủ ệ
th ng ch m l i. Vì v y, tùy thu c vào ch t l ng nh quét vào c a t ngố ậ ạ ậ ộ ấ ượ ả ủ ừ
văn b n c th đ ch n m t ho c m t vài ch c năng trong kh i này. N uả ụ ể ể ọ ộ ặ ộ ứ ố ế
c n u tiên t c đ x lý và ch t l ng c a máy quét t t thì có th b quaầ ư ố ộ ử ấ ượ ủ ố ể ỏ
giai đo n này. Kh i ti n x lý bao g m m t s ch c năng:ạ ố ề ử ồ ộ ố ứ
Nh phân hóa nh, l c nhi u, chu n hóa kích th c nh, làm tr nị ả ọ ễ ẩ ướ ả ơ
biên ch , làm đ y ch , làm m nh ch và xoay văn b n.ữ ầ ữ ả ữ ả
1.3.2.1. Nh phân hóa nhị ả
Nh phân hóa nh là m t k thu t chuy n nh đa c p xámị ả ộ ỹ ậ ể ả ấ
sang nh nh phân. Trong b t kỳ bài toán phân tích ho c nâng caoả ị ấ ặ
ch t l ng nh nào, nó cũng c n thi t đ xác đ nh các đ i t ngấ ượ ả ầ ế ể ị ố ượ
quan tr ng. Nh phân hóa nh phân chia nh thành 2 ph n: ph nọ ị ả ả ầ ầ
n n và ph n ch . H u h t các ph ng pháp nh phân hóa nhề ầ ữ ầ ế ươ ị ả
hi n nay đ u l a ch n m t ng ng thích h p theo c ng đ sángệ ề ự ọ ộ ưỡ ợ ườ ộ
c a nh và sau đó chuy n t t c các giá tr đ sáng l n h nủ ả ể ấ ả ị ộ ớ ơ
ng ng đó thành m t giá tr đ sáng (ví d “tr ng”) và t t c cácưỡ ộ ị ộ ụ ắ ấ ả
giá tr bé h n ng ng thành m t giá tr đ sáng khác (“đen”).ị ơ ưỡ ộ ị ộ







Hình 1.2. Nh phân hóa nh.ị ả
1.3.2.2. L c nhi uọ ễ
Nhi u là m t t p các đi m sáng th a trên nh. Kh nhi u là m tễ ộ ậ ể ừ ả ử ễ ộ
v n đ th ng g p trong nh n d ng, nhi u có nhi u lo i (nhi u đ m,ấ ề ườ ặ ậ ạ ễ ề ạ ễ ố
nhi u v t, nhi u đ t nét ). Đ kh các nhi u đ m (các nhi u v i kíchễ ệ ễ ứ ể ử ễ ố ễ ớ
th c nh ), có th s d ng các ph ng pháp l c (l c trung bình, l c trungướ ỏ ể ử ụ ươ ọ ọ ọ
v )- Tuy nhiên, v i các nhi u v t (ho c các nhi u có kích th c l n) thìị ớ ễ ệ ặ ễ ướ ớ
các ph ng pháp l c t ra kém hi u qu , trong tr ng h p này s d ngươ ọ ỏ ệ ả ườ ọ ử ự
ph ng pháp ươ kh các vùng liên thông nh t ra có hi u qu h n.ử ỏ ỏ ệ ả ơ
Hình 1.3. Nhi u đ m và nhi u v t.ễ ố ễ ệ
1.3.2.3. Chu n hóa kích th c nhẩ ướ ả
Hình 1.4.Chu n hóa kích th c nh các ký t “A” và “P”.ẩ ướ ả ự







Vi c chu n hóa kích th c nh d a trên vi c xác đ nh tr ng tâmệ ẩ ướ ả ự ệ ị ọ
nh, sau đó xác đ nh kho ng cách l n nh t t tâm nh đ n các c nhả ị ả ớ ấ ừ ả ế ạ
trên, d i, trái, ph i c a hình ch nh t bao quanh nh. Thông quaướ ả ủ ữ ậ ả
kho ng cách l n nh t đó, có th xác đ nh đ c m t t l co, giãn c aả ớ ấ ể ị ượ ộ ỷ ệ ủ
nh g c so v i kích th c đã xác đ nh, t đó hi u ch nh kích th c nhả ố ớ ướ ị ừ ệ ỉ ướ ả
theo t l co, giãn này. Nh v y, thu t toán chu n hóa kích th c nhỷ ệ ư ậ ậ ẩ ướ ả
luôn luôn đ m b o đ c tính cân b ng khi co giãn nh, nh s không bả ả ượ ằ ả ả ẽ ị
bi n d ng ho c b l ch.ế ạ ặ ị ệ
1.3.2.4 Làm tr n biên chơ ữ
Đôi khi do ch t l ng quét nh quá x u, các đ ng biên c a chấ ượ ả ấ ườ ủ ữ
không còn gi đ c dáng đi u tr n tru ban đ u mà hình thành cácữ ượ ệ ơ ầ
đ ng răng c a gi t o. Trong các tr ng h p này, ph i dùng các thu tườ ư ả ạ ườ ọ ả ậ
toán làm tr n biên đ kh c ph c [28].ơ ể ắ ụ
(a) (b)
Hình 1.5.(a) nh g c, (b) nh sau khi đ c làm tr n biên.Ả ố Ả ượ ơ
1.3.2.5. Làm đ y chầ ữ
Ch c năng này đ c áp d ng v i các ký t b đ t nét m t cáchứ ượ ụ ớ ự ị ứ ộ
ng u nhiên. nh đ t nét gây khó khăn cho vi c tách ch , d b nh m haiẫ Ả ứ ệ ữ ễ ị ầ
ph n liên thông c a ký t thành hai ký t riêng bi t, t o nên sai l mầ ủ ự ự ệ ạ ầ
trong quá trình nh n d ng.ậ ạ







1.3.2.6. Làm m nh chả ữ
Đây là m t b c quan tr ng nh m phát hi n khung x ng c a kýộ ướ ọ ằ ệ ươ ủ
t b ng cách lo i b d n các đi m biên ngoài c a các nét. Tuy nhiên,ự ằ ạ ỏ ầ ể ủ
quá trình làm m nh ch r t nh y c m v i vi c ả ữ ấ ạ ả ớ ệ kh nhi u. Hi n nay cóử ễ ệ
nhi u ph ng pháp làm m nh ch , các thu t toán tìm x ng có thề ươ ả ữ ậ ươ ể
tham kh o [28].ả ở

Hình 1.4 . Làm m nh chả ữ
1.3.2.7. Đi u ch nh đ nghiêng c a văn b nề ỉ ộ ủ ả
Do trang tài li u quét vào không c n th n ho c do s c in n, cácệ ẩ ậ ặ ự ố ấ
hàng ch b l ch so v i l chu n m t góc α, đi u này gây khó khăn choữ ị ệ ớ ề ẩ ộ ề
công đo n tách ch , đôi khi không th tách đ c. Trong nh ng tr ngạ ữ ể ượ ữ ườ
h p nh v y, ph i tính l i t a đ đi m nh c a các ch b sai l ch. Cóợ ư ậ ả ạ ọ ộ ể ả ủ ữ ị ệ
nhi u k thu t đ đi u ch nh đ nghiêng, k thu t ph bi n nh t d aề ỹ ậ ể ề ỉ ộ ỹ ậ ổ ế ấ ự
trên c s bi u đ chi u (projection profile) c a nh tài li u; m t s kơ ở ể ồ ế ủ ả ệ ộ ố ỹ
thu t d a trên c s các phép bi n đ i Hough và Fourier, m t s kậ ự ơ ở ế ổ ộ ố ỹ
thu t hi u ch nh đ nghiêng khác có th tìm th y trong [28].ậ ệ ỉ ộ ể ấ







Hình 1.7.Hi u ch nh đ nghiêng c a văn b n.ệ ỉ ộ ủ ả







Quá trình bi n đ i nhế ổ ả
M t s ph ng pháp bi n đ i và khai tri n chu i th ng đ c ápộ ố ươ ế ổ ể ỗ ườ ượ
d ng trong ụ lĩnh v c nh n d ng ch :ự ậ ạ ữ
1.3.3.1. Bi n đ i Fourierế ổ
M t trong nh ng tính ch t n i b t nh t c a phép bi n đ i Fourierộ ữ ấ ổ ậ ấ ủ ế ổ
là kh năng nh n d ng các ký t có s thay đ i v các t th khácả ậ ạ ự ự ổ ề ư ế
nhau, các phép bi n đ i này đã đ c áp d ng đ nh n d ng ký t theoế ổ ượ ụ ể ậ ạ ự
nhi u cách khác nhau [29,30].ề
1.3.3.2. Bi n đ i ế ổ Wavelet
Phép bi n đ i này là m t dãy các k thu t khai tri n cho phép môế ổ ộ ỹ ậ ể
t đ c tr ng c a nh các m c đ khác nhau. Các công đo n tách chả ặ ư ủ ả ở ứ ộ ạ ữ
thành các ký t ho c t đ c mô t b ng các h so wavelet theo cácự ặ ừ ượ ả ằ ệ
m c đ khác nhau đ i v i t ng gi i pháp. Sau đó các h so waveletứ ộ ố ớ ừ ả ệ
đ c chuy n qua m t máy phân l p đ ph c v cho vi c nh n d ngượ ể ộ ớ ể ụ ụ ệ ậ ạ
[31,32].
1.3.3.3. Ph ng pháp mô menươ
Theo ph ng pháp này, nh g c s đ c thay th b ng m t t pươ ả ố ẽ ượ ế ằ ộ ậ
các đ c tr ng v a đ c a đ nh n d ng các đ i t ng b t bi n đ i v iặ ư ừ ủ ủ ể ậ ạ ố ượ ấ ế ố ớ
các phép thay đ i t l , t nh ti n ho c quay [33]. Các mô men đ c xétổ ỷ ệ ị ế ặ ượ
nh các dãy khai tri n đ c tr ng vì nh g c có th xây d ng l i m tư ể ặ ư ả ố ể ự ạ ộ
cách đ y đ t các h s mô men.ầ ủ ừ ệ ố
1.3.3.4. Khai tri n Karhunent-Loeveể







Vi c khai tri n này nh m phân tích các véc t riêng đ rút g n sệ ể ằ ơ ể ọ ố
chi u c a t p đ c tr ng b ng cách t o ra các đ c tr ng m i là t h pề ủ ậ ặ ư ằ ạ ặ ư ớ ổ ợ
tuy n tính c a các đ c tr ng g c. Đây ch là m t phép bi n đ i t i uế ủ ặ ư ố ỉ ộ ế ổ ố ư
trong m t s gi i h n nào đó c a vi c nén thông tin [34], Khai tri nộ ố ớ ạ ủ ệ ể
Karhunent-Loeve đ c dùng trong m t s bài toán nh n d ng m u nhượ ộ ố ậ ạ ẫ ư
nh n d ng m t ng i, nó cũng đ c s d ng trong h th ng OCR c aậ ạ ặ ườ ượ ử ụ ệ ố ủ
Vi n Công ngh và Tiêu chu n Qu c gia Hoa Kỳ (NIST - Nationalệ ệ ẩ ố
Institute of Standards and Technology of the United States). Vì vi c khaiệ
tri n này đòi h i ph i s d ng các thu t toán có kh i l ng tính toánể ỏ ả ử ụ ậ ố ượ
r t l n nên vi c s d ng các đ c tr ng Karhunent-Loeve trong các bàiấ ớ ệ ử ự ặ ư
toán nh n d ng ch không đ c ph bi n r ng rãi. Tuy nhiên, đ tăngậ ạ ữ ượ ổ ế ộ ể
t c đ tính toán cho các máy phân l p, các đ c tr ng này tr nên thi tố ộ ớ ặ ư ở ế
th c h n cho các h nh n d ng ch trong nh ng năm g n đây.ự ơ ệ ậ ạ ữ ữ ầ
1.3.4. Nh n d ngậ ạ
Có nhi u ph ng pháp nh n d ng m u khác nhau đ c áp d ngề ươ ậ ạ ẫ ượ ụ
r ng rãi trong các h th ng nh n d ng ch vi t tay. Các ph ng phápộ ệ ố ậ ạ ữ ế ươ
này có th đ c tích h p trong các h ng ti p c n sau: Đ i sánh m u,ể ượ ợ ướ ế ậ ố ẫ
th ng kê, c u trúc, SVM và m ng n ron.ố ấ ạ ơ
1.3.4.1. Đ i sánh m uố ẫ
K thu t nh n d ng ch đ n gi n nh t d a trên c s đ i sánhỹ ậ ậ ạ ữ ơ ả ấ ự ơ ở ố
các nguyên m u (prototype) v i nhau đ nh n d ng ký t ho c t . Nóiẫ ớ ể ậ ạ ự ặ ừ
chung, toán t đ i sánh xác đ nh m c đ gi ng nhau gi a hai vé tử ố ị ứ ộ ố ữ ơ
(nhóm các đi m, hình d ng, đ cong ) trong m t không gian đ c tr ng.ể ạ ộ ộ ặ ư
Các k thu t đ i sánh có th nghiên c u theo ba h ng sau:ỹ ậ ố ể ứ ướ







Đ i sánh tr c ti p: ố ự ế M t ký t đ u vào là nh đa c p xám ho c nhộ ự ầ ả ấ ặ ả
nh phân đ c so sánh tr c ti p v i m t t p m u chu n đã đ c l uị ượ ự ế ớ ộ ậ ẫ ẩ ượ ư
tr . Vi c so sánh d a theo m t đ đo v s t ng đ ng nào đó (ch ngữ ệ ự ộ ộ ề ự ươ ồ ẳ
h n nh đ đo Euclide) đ nh n d ng. Các k thu t đ i sánh này cóạ ư ộ ể ậ ạ ỹ ậ ố
th đ n gi n nh vi c so sánh m t - m t ho c ph c t p h n nh phânể ơ ả ư ệ ộ ộ ặ ứ ạ ơ ư
tích cây quy t đ nh [50,51]. M c dù ph ng pháp đ i sánh tr c ti p đ nế ị ặ ươ ố ự ế ơ
gi n và có m t c s toán h c v ng ch c nh ng k t qu nh n d ngả ộ ơ ở ọ ữ ắ ư ế ả ậ ạ
c a nó cũng r t nh y c m v i nhi u.ủ ấ ạ ả ớ ễ
Các m u bi n d ng và Đ i sánh m m: ẫ ế ạ ổ ề M t ph ng pháp đ i sánhộ ươ ố
khác là s d ng các m u bi n d ng, trong đó m t phép bi n d ng nhử ụ ẫ ế ạ ộ ế ạ ả
đ c dùng đ đ i sánh m t nh ch a bi t v i m t c s d li u nhượ ể ố ộ ả ư ế ớ ộ ơ ở ữ ệ ả
đã bi t [52]. Ý t ng c b n c a đ i sánh m m là đ i sánh m t cáchế ưở ơ ả ủ ố ề ố ộ
t i u m u ch a bi t v i t t c các m u có th mà các m u này có thố ư ẫ ư ế ớ ấ ả ẫ ể ẫ ể
kéo giãn ra ho c co l i. Ch m t không gian đ c tr ng đ c thành l p,ặ ạ ỉ ộ ặ ư ượ ậ
các véc t ch a bi t đ c đ i sánh b ng cách s d ng quy ho ch đ ngơ ư ế ượ ố ằ ử ự ạ ộ
và m t hàm bi n d ng [53,54]. ộ ế ạ
Đ i sánh gi m nh : ố ả ẹ Đây là m t ộ kỹ thu t đ i sánh nh ậ ố ả m c đở ứ ộ
t ng tr ng, ượ ư kỹ thu t này s d ng hình dáng đ c tr ng c b n c a nhậ ử ự ặ ư ơ ả ủ ả
ký t . Th nh t, các vùng đ i sánh đã đ c nh n bi t. Sau đó, trên cự ứ ấ ố ượ ậ ế ơ
s m t s vùng đ i sánh đ c đánh giá t t, các ph n t c a nh đ cở ộ ố ố ượ ố ầ ử ủ ả ượ
so sánh v i các vùng đ i sánh này. Công vi c này đòi h i m t k thu tớ ố ệ ỏ ộ ỹ ậ
tìm ki m trong m t không gian đa chi u đ tìm c c đ i toàn c c c aế ộ ề ể ự ạ ụ ủ
m t s hàm [55]. Các k thu t đ i sánh m u ch áp d ng t t đ i v iộ ố ỹ ậ ố ẫ ỉ ự ố ố ớ
nh n d ng ch in, còn đ i v i ch vi t tay thì các k thu t này t raậ ạ ữ ố ớ ữ ế ỹ ậ ỏ
kém hi u qu .ệ ả







1.3.4.2. Ph ng pháp ti p c n c u trúcươ ế ậ ấ
Cách ti p c n c a ph ng pháp này d a vào vi c mô t đ i t ngế ậ ủ ươ ự ệ ả ố ượ
nh m t s khái ni m bi u di n đ i t ng c s trong ngôn ng tờ ộ ố ệ ể ễ ố ượ ơ ở ữ ự
nhiên. Đ mô t đ i t ng ng i ta dùng m t s d ng nguyên thuể ả ố ượ ườ ộ ố ạ ỷ
nh đo n th ng, cung, M i đ i t ng đ c mô t nh m t s k tư ạ ẳ ỗ ố ượ ượ ả ư ộ ự ế
h p c a các d ng nguyên thu .ọ ủ ạ ỷ
Các quy t c k t h p các d ng nguyên thu đ c xây d ng gi ngắ ế ọ ạ ỷ ượ ự ố
nh vi c nghiên c u văn ph m trong m t ngôn ng , do đó quá trìnhư ệ ứ ạ ộ ữ
quy t đ nh nh n d ng là quá trình phân tích cú pháp [57,58]. Ph ngế ị ậ ạ ươ
pháp này đ t v n đ đ gi i quy t bài toán nh n d ng ch t ng quát.ặ ấ ề ể ả ế ậ ạ ữ ổ
Tuy v y, cho đ n nay còn nhi u v n đ liên quan đ n h nh n d ng cúậ ế ề ấ ề ế ệ ậ ạ
pháp ch a đ c gi i quy t đ c l p và ch a xây d ng đ c các thu tư ượ ả ế ộ ậ ư ự ượ ậ
toán ph d ng. Hi n nay, nh n d ng theo c u trúc ph bi n là tríchổ ụ ệ ậ ạ ấ ổ ế
tr n các đ c tr ng c a m u h c, phân ho ch b ng ký t d a trên cácọ ặ ư ủ ẫ ọ ạ ả ự ự
đ c tr ng này, sau đó nh c n nh n d ng s đ c trích ch n đ cặ ư ả ầ ậ ạ ẽ ượ ọ ặ
tr ng, sau đó so sánh trên b ng phân ho ch đ tư ả ạ ể ìm ra ký t có các đ cự ặ
tr ng phù h p.ư ợ
Đ i v i nh n d ng ch vi t tay r i r c d a theo c u trúc x ngố ớ ậ ạ ữ ế ờ ạ ự ấ ươ
và đ ng biên, công vi c này đòi h i ph i xây d ng các đ c tr ng c aườ ệ ỏ ả ự ặ ư ủ
ch , đ c bi t là đ c tr ng v các đi m u n, đi m g p khúc và đ cữ ặ ệ ặ ư ề ể ố ể ấ ặ
tr ng c a các nét. Sau khi ti n hành công đo n ti n x lý, công vi cư ủ ế ạ ề ử ệ
tách các nét đ c ti n hành thông qua các đi m ch c. Sau đó trích ch nượ ế ể ạ ọ
đ c tr ng c u trúc x ng c a ch , m i nét đ c tr ng b i c p ch sặ ư ấ ươ ủ ữ ỗ ặ ư ở ặ ỉ ố
đ u và cu i t ng ng v i th t c a đi m ch c đ u và đi m ch cầ ố ươ ứ ớ ứ ự ủ ể ạ ầ ể ạ







cu i. Cu i cùng là xây d ng cây tìm ki m, d a vào đ c tr ng v c uố ố ự ế ự ặ ư ề ấ
trúc x ng và c u trúc biên đ phân t p m u h c thành các l p. Quáươ ấ ể ậ ẫ ọ ớ
trình tìm ki m đ phân l p đ c ti n hành qua hai b c: Xác đ nh l pế ể ớ ượ ế ướ ị ớ
t ng ng v i m u vào và tìm ki m trong l p đó m u nào g n gi ngươ ứ ớ ẫ ế ớ ẫ ầ ố
v i m u vào nh t [62,63]. Các ph ng pháp c u trúc áp d ng cho cácớ ẫ ấ ươ ấ ụ
bài toán nh n d ng ch đ c phát tri n theo hai h ng sau:ậ ạ ữ ượ ể ướ
1.3.4.2.1. Ph ng pháp ng pháp (Grammatical Methods)ươ ữ
Gi a th p niên 1960, các nhà nghiên c u b t đ u xét các lu t c aữ ậ ứ ắ ầ ậ ủ
ngôn ng h c đ phân tích ti ng nói và ch vi t. Sau đó, các lu t đaữ ọ ể ế ữ ế ậ
d ng c a chính t , t v ng và ngôn ng h c đã đ c áp d ng cho cácạ ủ ả ừ ự ữ ọ ượ ụ
chi n l c nh n d ng. Các ph ng pháp ng pháp kh i t o m t sế ượ ậ ạ ươ ữ ở ạ ộ ố
lu t sinh đ hình thành các ký t t m t t p các công th c ng phápậ ể ự ừ ộ ậ ứ ữ
nguyên th y. Các lu t sinh này có th k t n i b t kỳ ki u đ c tr ngủ ậ ể ế ố ấ ể ặ ư
th ng kê và đ c tr ng hình thái nào d i m t s cú pháp ho c các lu tố ặ ư ướ ộ ố ặ ậ
ng nghĩa [56,57,58]. Gi ng nh lý thuy t ngôn ng , các lu t sinh choữ ố ư ế ữ ậ
phép mô t các c u trúc câu có th ch p nh n đ c và trích ch n thôngả ấ ể ấ ậ ượ ọ
tin theo ng c nh v ch vi t b ng cách s d ng các ki u ng phápữ ả ề ữ ế ằ ử ụ ể ữ
khác nhau [59]. Trong các ph ng pháp này, vi c hu n luy n đ c th cươ ệ ấ ệ ượ ự
hi n b ng cách mô t m i ký t b ng m t văn ph m Gi. Còn trong phaệ ằ ả ỗ ự ằ ộ ạ
nh n d ng thì chu i, cây ho c đ th c a m t đ n v vi t b t kỳ (ký t ,ậ ạ ỗ ặ ồ ị ủ ộ ơ ị ế ấ ự
t ho c câu) đ c phân tích đ quy t đ nh văn ph m c a m u đó thu cừ ặ ượ ể ế ị ạ ủ ẫ ộ
l p nào. Các ph ng pháp ng pháp h u h t đ c s d ng trong giaiớ ươ ữ ầ ế ượ ử ụ
đo n h u x lý đ s a các l i mà kh i nh n d ng đã th c hi n saiạ ậ ử ể ử ỗ ố ậ ạ ự ệ
[60,61].
1.3.4.2. Ph ng pháp đ th (Graphical Methods)ươ ồ ị







Các đ n v ch vi t đ c mô t b i các cây ho c các đ th . Cácơ ị ữ ế ượ ả ở ặ ồ ị
d ng nguyên th y c a ký t (các nét) đ c l a ch n b i m t h ngạ ủ ủ ự ượ ự ọ ở ộ ướ
ti p c n c u trúc. Đ i v i m i l p, m t đ th ho c cây đ c thành l pế ậ ấ ố ớ ỗ ớ ộ ồ ị ặ ượ ậ
trong giai đo n hu n luy n đ mô t các nét, các ký t ho c các t .ạ ấ ệ ể ả ự ặ ừ
Giai đo n nh n d ng gán m t đ th ch a bi t vào m t trong các l pạ ậ ạ ộ ồ ị ư ế ộ ớ
b ng cách s d ng m t đ đo đ so sánh các đ c đi m gi ng nhau gi aằ ử ụ ộ ộ ể ặ ể ố ữ
các đ th .ồ ị
Có r t nhi u h ng ti p c n khác nhau s d ng ph ng pháp đấ ề ướ ế ậ ử ụ ươ ồ
th , tiêu bi u là h ng ti p c n đ th phân c p đ c dùng trong vi cị ể ướ ế ậ ồ ị ấ ượ ệ
nh n d ng ch vi t tay Trung Qu c và Hàn Qu c [62,63].ậ ạ ữ ế ố ố
1.3.4.3. Mô hình Markov n (HMM - Hidden Markov Model)ẩ
HMM là m t mô hình xác su t h u h n tr ng thái theo ki u phátộ ấ ữ ạ ạ ể
sinh ti n trình b ng cách đ nh nghĩa xác su t liên k t trên các chu iế ằ ị ấ ế ỗ
quan sát. M i chu i quan sát đ c sinh ra b i m t chu i các phépỗ ỗ ượ ở ộ ỗ
chuy n tr ng thái, b t đ u t tr ng thái kh i đ u cho đ n khi thu đ cể ạ ắ ầ ừ ạ ở ầ ế ượ
tr ng thái k t thúc. T i m i tr ng thái thì m t ph n t c a chu i quanạ ế ạ ỗ ạ ộ ầ ử ủ ỗ
sát đ c phát sinh ng u nhiên tr c khi chuy n sang tr ng thái ti pượ ẫ ướ ể ạ ế
theo. Các tr ng thái c a HMM đ c xem là n bên trong mô hình vì t iạ ủ ượ ẩ ạ
m i th i đi m ch nhìn th y các kí hi u quan sát còn các tr ng thái cũngỗ ờ ể ỉ ấ ệ ạ
nh s chuy n đ i tr ng thái đ c v n hành n bên trong mô hình [70].ư ự ể ổ ạ ượ ậ ẩ
HMM đã t ng đ c áp d ng r ng rãi đ i v i các bài toán nh nừ ượ ụ ộ ố ớ ậ
d ng ch vi t tay m c t [71,72,73,74,75].ạ ữ ế ở ứ ừ
1.3.4.4. Máy véc t t a (SVM)ơ ự







Các k t qu ch y u v ế ả ủ ế ề lĩnh v c này ch t p trung trên các t p dự ỉ ậ ậ ữ
li u ch s vi t tay chu n nh USPS và MNIST [5.3,5.1,87], bên c nhệ ữ ố ế ẩ ư ạ
đó cũng có m t s công trình nghiên c u trên các h ch cái ti ng Laộ ố ứ ệ ữ ế
tinh, Hy L p, Trung Qu c, Vi t Nam tuy nhiên các k t qu đ t đ cạ ố ệ ế ả ạ ượ
cũng còn nhi u h n ch [88,89,5.2,5.4].ề ạ ế
SVM đ c áp d ng r ng rãi trong các lĩnh khai phá d li u và thượ ụ ộ ữ ệ ị
giác máy tính SVM g c đ c thi t k đ gi i bài toán phân l p nhố ượ ế ế ể ả ớ ị
phân, ý t ng chính c a ph ng pháp này là tìm m t siêu ph ng phânưở ủ ươ ộ ẳ
cách sao cho kho ng cách l gi a hai l p đ t c c đ i. Kho ng cách nàyả ề ữ ớ ạ ự ạ ả
đ c xác đ nh b i các véc t t a (SV - Support Vector), các ượ ị ở ơ ự sv này đ cượ
l c ra t t p m u hu n luy n b ng cách gi i m t bài toán t i u l iọ ừ ậ ẫ ấ ệ ằ ả ộ ố ư ồ
[5.1].
1.3.4.5. M ng n ronạ ơ
M t m ng n ron đ c đ nh nghĩa nh m t c u trúc tính toán baoộ ạ ơ ượ ị ư ộ ấ
g m nhi u b x lý “n ron” đ c k t n i song song ch ng ch t v iồ ề ộ ử ơ ượ ế ố ằ ị ớ
nhau. Do b n ch t song song c a các n ron nên nó có th th c hi n cácả ấ ủ ơ ể ự ệ
tính toán v i t c đ cao h n so v i các k thu t phân l p khác. M tớ ố ộ ơ ớ ỹ ậ ớ ộ
m ng n ron ch a nhi u nút, đ u ra c a m t nút đ c s d ng choạ ơ ứ ề ầ ủ ộ ượ ử ụ
m t nút khác trong m ng và hàm quy t đ nh cu i cùng ph thu c vàoộ ở ạ ế ị ố ụ ộ
s t ng tác ph c t p gi a các nút. M c dù nguyên lý khác nhau, nh ngự ươ ứ ạ ữ ặ ư
h u h t các ki n trúc m ng n ron đ u t ng đ ng v i các ph ngầ ế ế ạ ơ ề ươ ươ ớ ươ
pháp nh n d ng m u th ng kê [26,27].ậ ạ ẫ ố
Các ki n trúc m ng n ron có th đ c phân thành hai nhómế ạ ơ ể ượ
chính: m ng truy n th ng và m ng lan truy n ng c. Trong các hạ ề ẳ ạ ề ượ ệ
th ng nh n d ng ch , các m ng n ron s d ng ph bi n nh t là m ngố ậ ạ ữ ạ ơ ử ụ ổ ế ấ ạ







perceptron đa l p thu c nhóm m ng truy n th ng và m ng SOM (Selfớ ộ ạ ề ẳ ạ
Origanizing Map) c a Kohonen thu c nhóm m ng lan truy n ng c.ủ ộ ạ ề ượ
M ng perceptron đa l p đ c đ xu t b i Rosenblatt [64] đ cạ ớ ượ ề ấ ở ượ
nhi u tác gi s d ng trong các h nh n d ng ch vi t tay [65,66].ề ả ử ụ ệ ậ ạ ữ ế
H u h t các nghiên c u phát tri n nh n d ng ch vi t tay hi n nay đ uầ ế ứ ể ậ ạ ữ ế ệ ề
t p trung vào m ng SOM [67]. SOM k t h p trích ch n đ c tr ng vàậ ạ ế ợ ọ ặ ư
nh n d ng trên m t t p l n các ký t hu n luy n. M ng này ch ng tậ ạ ộ ậ ớ ự ấ ệ ạ ứ ỏ
r ng nó t ng đ ng v i thu t toán phân c m k-means.ằ ươ ươ ớ ậ ụ
V i thu t toán đ n gi n nh ng r t hi u qu , cùng v i thành côngớ ậ ơ ả ư ấ ệ ả ớ
c a mô hình này trong các ng d ng th c ti n, m ng n ron hi n đangủ ứ ụ ự ễ ạ ơ ệ
là m t trong các h ng nghiên c u c a lĩnh v c h c máy. M ng n ronộ ướ ứ ủ ự ọ ạ ơ
t ra phù h p v i các bài toán đ i sánh, phân lo i m u, x p x hàm, t iỏ ợ ớ ố ạ ẫ ấ ỉ ố
u hoá, l ng t hoá véc t và phân ho ch không gian d li u, trongư ượ ử ơ ạ ữ ệ
khi các ph ng pháp truy n th ng không đ kh năng gi i quy t cácươ ề ố ủ ả ả ế
v n đ nêu trên m t cách hi u qu . Đ c bi t trong các h th ng nh nấ ề ộ ệ ả ặ ệ ệ ố ậ
d ng s d ng m ng n ron đã đ t đ c t l nh n d ng khá chính xác,ạ ử ụ ạ ơ ạ ượ ỉ ệ ậ ạ
có th so sánh v i các ph ng pháp nh n d ng c u trúc, th ng kê, ể ớ ươ ậ ạ ấ ố
1.3.5. K t quế ả
Sau khi tr i qua quá trình ti n x lý m u nh c n nh n d ngả ề ử ẫ ả ầ ậ ạ
đ c thu g n v i kích c là 60x30 và đ n quá trình ánh x giá tr pixelượ ọ ớ ỡ ế ạ ị
nh vào. B c quan tr ng cu i cùng đó là nh n d ng và cho ra k tả ướ ọ ố ậ ạ ế
qu .ả
1.4. K t lu nế ậ







N i dung c a ch ng 1 là trình bày v các bài toán nh n d ng nóiộ ủ ươ ề ậ ạ
chung và nh n d ng ch nói riêng trên th gi i cũng nh Vi t Nam:ậ ạ ữ ế ớ ư ở ệ
Nh ng ng d ng đã đ c áp d ng trong th c t ; m t s k t qu đ c coiữ ứ ụ ượ ụ ự ế ộ ố ế ả ượ
là thành công nh t. Và thi t l p đ c n i dung c a bài toán đ c xâyấ ế ậ ượ ộ ủ ượ
d ng trong lu n văn.ự ậ
T nh ng thi t l p bài toán trên đ gi i quy t bài toán nh n d ngừ ữ ế ậ ở ể ả ế ậ ạ
ch v i nh ng u đi m đ n gi n v thu t toán nh ng r t hi u q a, cùngữ ớ ữ ư ể ơ ả ề ậ ư ấ ệ ủ
v i nh ng thành công trong các ng d ng th c ti n Tôi ch n ph ngớ ữ ứ ụ ự ễ ọ ươ
pháp nh n d ng ch s d ng m ng n ron nhân t o làm đ nh h ng t pậ ạ ữ ử ụ ạ ơ ạ ị ướ ậ
trung nghiên c u c a lu n án.ứ ủ ậ
CH NG II: TÌM HI U M NG NEURAL VÀ ƯƠ Ể Ạ
M NG HAMMINGẠ
2.1. M ng neuralạ
2.1.1. Khái ni m m ng neural .ệ ạ
2.1.1.1. Tìm hi u v Neural.ể ề
2.1.1.1.1. Neural sinh h c: ọ
M t neural đ c c u g m nh ng thành ph n chính sau: Dendrite,ộ ượ ấ ồ ữ ầ
Soma, Synapse, Axon nh hình 1.1.ư

Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay

×

×