Tải bản đầy đủ

Tìm hiểu các phép biến đổi trong xử lý dữ liệu đa phương tiện và ứng dụng

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
─────── * ───────

Báo cáo xử lí dữ liệu đa
phương tiện
Đề 8: Tìm hiểu các phép biến đổi trong xử lí
dữ liệu đa phương tiện và ứng dụng
Giảng viên hướng dẫn: PGS.TS Nguyễn Thị Hoàng Lan
Sinh viên thực hiện:
Nguyễn Xuân Thạo

20122461

Lê Thị Hải Yến

20122839

Đoàn Anh Tuấn

20122668


Nguyễn Đình Phúc

20122233

Hà Nội, tháng 5 năm 2016


2

Mục lục


3

I.

Phép biến đổi đơn vị

1. Định nghĩa

Trong không gian vector dữ liệu (mảng 1 chiều gồm n giá
trị), phép biến đổi đơn vị được định nghĩa bởi:

y = TA . x

T

với điều kiện

TA .TA* = I

Trong đó:


x

: Ma trận dữ liệu đầu vào có dạng [1*n]={

x1 , x2 , x3 ,..., xn





y

: Ma trận hệ số biến đổi

TA
TA*

: Ma trận của phép biến đổi

T

: Ma trận chuyển vị của ma trận phức liên hợp của

ma trận


I

}

TA

: Ma trận đơn vị

Xét điều kiện trên ta thấy:
−1

TA .TA = I

nếu

Mặt khác: Nếu

TA

TA

−1

là trực giao thì

TA = TA ⇒ TAT .TA = I

là ma trận thực thì

TA

TA* = TA ⇒ TAT = TAT*

Do đó: nếu ma trận
vừa thực vừa trực giao thì
(điều kiện được thỏa mãn)
Tồn tại một phép biến đổi ngược:

xˆ = TS . yˆ = ∑i Tsi y i

trong đó

TA .TAT* = I


4




TS = T A

−1

= T AT* ⇒ TS .T A = TA .TS = I

Tsi = ( si ,1 , si , 2 ,..., si , n )
của ma trận

T
của ma trận


T A*

chính là hàng thứ i
và cũng là cột thứ i

T
A*

Tsi

được gọi là vector cơ sở của phép
biến đổi

Phép biến đổi đơn vị phân tích vector x thành tổ hợp tuyến
tính của các vector cơ sở với hệ số phân tích là y.
Kì vọng:

ˆ = δ [i − j]
E Φi , Φ
j

Trong không gian trực chuẩn,
ta có:
−1

TA

là ma trận trực giao do đó

T

TS = TA = TA ⇒ TA .TAT = TAT .TA = I
E Φ i , Φ j = δ [i − j]
2. Tính chất chung của các phép biến đổi đơn vị

Các phép biến đổi đơn vị có 3 tính chất chung:
-

Bảo toàn năng lượng: ||x||2=||y||2 (đẳng thức
Parseval), không gây sai số giữa 2 miền không gian

-

Năng lượng tập trung: Đối với ảnh thông thường,
năng lượng phân bố không đều; các thành phần biến
thiên nhanh chiếm năng lượng nhỏ trong tín hiệu; nhiều
phép biến đổi đơn vị tập trung năng lượng ảnh vào một
vài thành phần hệ số biến đổi.


5
-

Giải tương quan: Đầu vào là vector có thành phần
tương quan mạnh, qua phép biến đổi sẽ nhận được các
thành phần tương quan yếu.

3. Áp dụng phép biến đổi đơn vị trong nén dữ liệu

Phép biến đổi áp dụng tốt trong nén dữ liệu cần phải giải
tương quan, có tốc độ nén nhanh và chính xác.
Đánh giá: Trong các phép biến đổi đơn vị, phương pháp
biến đổi KL là tốt nhất về lí thuyết cho nén dữ liệu.
Nguyên nhân là vì: Phép biến đổi KL đạt được sự giải tương
quan tốt nhất nên về mặt lí thuyết thì đó là phương pháp
nén dữ liệu tốt nhất.
Tuy nhiên, trong các giải pháp thực tế, phép biến đổi DCT
được coi là xấp xỉ tốt cho phép KLT và được dùng theo
chuẩn JPEG.
Nguyên nhân:
- Phép biến đổi DCT chia tín hiệu và xử lý theo từng khối
để phù hợp với giả thiết ổn định tương đối trong mỗi
khối.
- Phép biến đổi DCT tính toán đối xứng, có cấu trúc để
cho phép xây dựng thuật toán tính nhanh.
- Đảm bảo độ giải tương quan tốt.
DCT là một tiêu chuẩn quốc tế cho các hệ thống mã
chuyển vị bởi nó có đặc tính gói năng lượng tốt (gói năng
lượng của ảnh con vào một phần nhỏ các hệ số hàm
truyền), cho kết quả là số thực và có thuật toán nhanh để
thực hiện chúng. DCT mang lại một tỉ lệ nén hiệu quả và
chất lượng ảnh suy giảm là có thể chấp nhận được. Chính vì
thế với JPEG là một định dạng ảnh phổ biến nhất hiện nay,
việc sử dụng DCT giúp giảm được rất nhiều chi phí và tài
nguyên lưu trữ truyền tải.

II.

Phép biến đổi KL,PCA

1. Phép biến đổi KL

1.1 Khái niệm
Phép biến đổi KL có nguồn gốc từ khai triển chuỗi của các
quá trình ngẫu nhiên liên tục. Biến đổi KL cũng còn gọi là
biến đổi Hoteling hay phương pháp thành phần chính.


6
Phép biến đổi KL là phép biến đổi tuyến tính đơn vị dựa
trên các vecto riêng và các giá trị riêng của ma trận tương
quan để cho phép giảm thứ nguyên không gian với sai số
nhỏ nhất.
1.2 Cơ sở lý thuyết của phép biến đổi KL
Đây là phép biến đổi không gian chiều thành không gian
chiều, với . Mỗi thành phần của vectơ miêu tả một đặc tính
của đối tượng. Nếu ta biến đổi được từ không gian n chiều
về không gian m chiều, như vậy ta sẽ làm giảm được thông
tin dư thừa (giảm thứ nguyên).
Mục đích của biến đổi KL là chuyển từ không gian n chiều
sang không gian trực giao m chiều sao cho sai số bình
phương là nhỏ nhất. Gọi là tập các vector cơ sở trong không
gian trực giao .
Với

với và

Mọi vector y trong không gian trực giao có thể viết:
với
Gọi là kết quả thu được trong không gian m chiều và

Sai số trong phép biến đổi
Sai số trung bình bình phương:

Mà , do đó
Theo định nghĩa của R, phương trình trở thành:
đạt min khi ( đạt min.


7
Đặt

.(5)

Như vậy đạt min khi (5) min. Để tìm min của 5 ta dùng
phương pháp đạo hàm và dẫn đến việc giải phương trình:

Phương trình 6 gọi là phương trình đặc trưng của R với
là các trị riêng và là các véctơ riêng tương ứng. Đây chính
là cơ sở lý thuyết của biến đổi KL.
1.3 Các bước thực hiện biến đổi KL
Không gian quan sát
Phép biến đổi KL:

sao cho sai số trung bình bình

phương nhỏ nhất.
là ma trận của phép biến đổi.
Các bước thực hiện:
Tính ma trận tương quan R của X:
R có giá trị riêng tương ứng với
vecto riêng (trực giao đôi một).
Có phương trình đặc trưng của R:

⇒ các giá trị riêng
⇒ các vecto riêng
Chọn M giá trị lớn nhất trong N giá trị tìm được, ta có M
vecto tương ứng.
Ma trận biến đổi với .
2. Phép biến đổi PCA

Mục tiêu của PCA là tìm một không gian mới với số
chiều nhỏ hơn không gian cũ.


8
Các trục toạ độ trong không gian mới được xây dựng
sao cho trên mỗi trục, độ biến thiên của dữ liệu trên đó là
lớn nhất có thể.
Thuật toán PCA
Cho ma trận
• Bước 1: Tiền xử lý

hoặc

Với là độ lệch chuẩn của cột j trong X.
• Bước 2: Xây dựng không gian mới.
Tìm các giá trị riêng và vecto riêng của ma trận hiệp
phương sai của .

R có N giá trị riêng �, ta sắp xếp theo thứ tự giảm dần,
tương ứng được N vecto riêng u.
• Bước 3: Chuyển dữ liệu từ không gian ban đầu
vào không gian mới.
Chọn ra k vecto riêng đầu tiên:

Toạ độ các điểm trong không gian mới là:


9

III.

Tìm hiểu thuật toán trích chọn đặc trưng ảnh
dựa trên phép biến đổi KL-PCA
Bắt đầu

Tập ảnh luyện tập

Kết thúc
Mỗi ảnh tương ứng với 1 vectơ , [

Mỗi vectơ trong không gian mới
,[

Tính vectơ trung bình
,[

Chọn K vectơ riêng lớn nhất
,[

Tính

Tính ma trận hiệp phương sai

Tính các vectơ riêng của ma trận hiệp phương sai

Bước 1: Chuẩn bị tập ảnh luyện tập

………
Tập ảnh luyện tập bao gồm M ảnh cùng kích thước
Bước 2: Mỗi ảnh tương ứng với 1 vectơ


10

……

…..

NxN

• Chuyển đổi mỗi ma trận ảnh tương đương với 1 vectơ dữ
liệu thành phần, mỗi vectơ được biểu diễn dưới dạng ma
trận cột cỡ


• Ví dụ:
-->
• Mỗi ảnh sẽ tưng ứng với 1 vectơ :
Bước 3: Tính vectơ trung bình


11

……

• Tính vectơ trung bình
,[
Bước 4: Tính
Trừ mỗi vectơ ban đầu cho vectơ trung bình
,
• Tính vectơ trung bình :
• Trừ mỗi vectơ ban đầu cho vectơ trung bình
Bước 5: Tính ma trận hiệp phương sai



,

Bước 6: Tính giá trị riêng, vectơ riêng của ma trận hiệp
phương sai



: giá trị riêng



: Vectơ riêng của C

• Do ma trận có kích thước lớn ( ) nên khối lượng tính toán
lớn.


12


• Vì ma trận có kích thước nhỏ hơn ( ) nên ta sẽ tính vectơ
riêng theo ma trận sau đó tính , .
Bước 7: Chọn K vectơ riêng lớn nhất
• Không gian đặc trưng (Eigen face space) :
,

• Mỗi vectơ trong không gian riêng tương ứng với 1 vectơ


13

Tài liệu tham khảo
1. Slide bài giảng xử lí dữ liệu đa phương tiện của cô
Nguyễn Thị Hoàng Lan
2. “Principal Component Analysis” CS498
3. Principal Component Analysis – PCA



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay

×