Tải bản đầy đủ

Phương pháp tiên tiến nén video AVC và ứng dụng

IT4621

XỬ LÝ DỮ LIỆU ĐA PHƯƠNG TIỆN
Đề tài 13

“Phương pháp tiên tiến nén Video AVC
và ứng dụng”
Giảng viên hướng dẫn: PSG. TS Nguyễn Thị Hoàng Lan
Nhóm:


NỘI DUNG
- Tìm hiểu chung phương pháp nén Video tiên tiến (AVC: Advanced
Video Coding)
- Tìm hiểu chuẩn MPEG - 4/ H264 AVC.
- So sánh phương pháp nén Video chuẩn MPEG - 4 với phương pháp
nén Video theo chuẩn MPEG - 1.
- Tìm hiểu một thuật toán trong nén theo chuẩn MPEG - 4, thử nghiệm
ứng dụng.



Tìm hiểu chung phương pháp nén Video tiên tiến
AVC và chuẩn MPEG - 4/ H264 AVC
- H.264/ MPEG - 4 Part 10 hay AVC (Advanced Video Coding),
thường được gọi tắt là H.264.
- Là một chuẩn mã hóa/ giải mã Video và định dạng video đang được
sử dụng rộng rãi hiện nay để ghi, nén và chia sẻ Video phân giải cao,
dựa trên việc bù chuyển động (Motion - Compensation) trên từng
Block (Block Oriented).


Tìm hiểu chung phương pháp nén Video tiên tiến
AVC
- Kỹ thuật SVC (Scalable Video Coding) được sử dụng trong phương
pháp này để thể hiện sự tiên tiến.


Ứng dụng
- MPEG4 Part 10 /H264 hay AVC là một trong những định dạng
đang được dùng phổ biến nhất hiện nay trong công nghệ mã hóa,
phân phối và xử lý Video.
- Ví dụ: Digital Television, DVD and Blu - Ray Disks, Mobile TV,
Video Conferencing and Internet Video Streaming, iTunes Store
Movies/ Videos…


Đặc tính nổi bật của chuẩn nén Video
MPEG - 4/ H.264/ AVC
- Dự đoán không gian định hướng trong kiểu mã hóa Intra: hỗ trợ tới
17 kiểu dự đoán, làm cho việc dự đoán mẫu được chính xác hơn, đạt
hiệu quả nén cao hơn.
- Bù chuyển động với kích thước nhỏ có thể thay đổi. Kích thước bù
chuyển động nhỏ nhất là 4x4, điều này mang lại hiệu suất 15% so
với MPEG - 2.
- Bù chuyển động với nhiều hình tham khảo.
- Tách riêng hình tham khảo và hình hiển thị


Đặc tính nổi bật của chuẩn nén Video
MPEG - 4/ H.264 AVC
- Giảm dư thừa về không gian tốt hơn.


- Lượng tử hóa thích nghi.
- Sử dụng bộ lọc tách khối.
- Kiểu dự đoán trọng số H.264/ AVC có thể hỗ trợ quá trình mờ dần
hay tối dần khung hình trong những đoạn Film có hiệu ứng mờ dần
(những frame đến sau rất giống so với những frame ngay trước nó,
chỉ có sắc độ là khác một chút).


Các Profile và các Level
H.264/AVC có 4 Profile như sau:


Các Profile và các Level

Các phần mã hóa của các Profile trong H.264


Các phần chung cho tất cả các Profile
- Slice I (Slice mã hoá trong ảnh): Slice đã mã hoá bằng việc sử dụng
dự đoán chỉ từ các mẫu đã mã hoá bên trong cùng một Slice .
- Slice P (Predictive - Coded Slice ): các Slice được mã hoá bằng việc
sử dụng dự đoán liên ảnh từ các ảnh tham chiếu đã được mã hoá
trước đó sử dụng hầu hết cho Vector chuyển động và hệ số tham
chiếu để dự đoán các giá trị mẫu cho mỗi Block.
- CAVLC (Context - Based Adaptive Variable Lengh Coding): mã hoá
độ dài biến đổi tương thích với tình huống, cho mã hoá Entropy.


Kiến trúc phân lớp của H.264/ AVC
H.264/ AVC Codec bao gồm 2 khối : Video Coding Layer ( VCL)
và Network Abstraction Layer ( NAL).


Cấu trúc dòng bit

- Bit đầu tiên là bit 0.
- 2 bits tiếp theo được sử dụng để chỉ ra rằng có hay không NALU
chứa chuỗi (tập hợp) các tham số Picture hoặc một mảnh của một
Picture tham chiếu.
- 5 bits tiếp theo được sử dụng để chỉ ra loại của NALU Units, cái
tương ứng với loại dữ liệu được mang trong NALU Unit.


Quá trình nén H264/ MPEG – 4:

Sơ đồ khối mã hóa H.264/ AVC


Bù chuyển động trong các Slice P (dự đoán liên ảnh):

Sơ đồ nguyên lý nén Slice P


- Các dạng mã hóa bù chuyển động được xác định cho các
Macroblock Slice P. Dự đoán liên ảnh làm giảm sự tương quan theo
thời gian với sự trợ giúp của việc ước tính Vector chuyển động và bù
chuyển động.
- Chia các Macroblock thành các Block.
- Các giá trị dự đoán cho thành phần chói và thành phần màu.
- Bù chuyển động MPEG – 4 Part 10/ H.264 cho phép các Vector
chuyển động không hạn chế, tức là chúng có thể hướng ra ngoài
miền ảnh.
- MPEG – 4 Part 10/ H.264 hỗ trợ dự đoán bù chuyển động đa ảnh.
- Ngoài các Mode bù chuyển động được mô tả ở trên, Macroblock
Slice P cũng có thể được mã hóa trong Mode gọi là SKIP.


- So với các tiêu chuẩn trước đó, MPEG – 4 Part 10/ H.264 đã tổng
quát khái niệm Slice B và không chỉ hỗ trợ một cặp dự đoán theo
hướng tiến/ lùi mà còn cả hai cặp theo hướng tiến/ tiến và lùi/ lùi.
- Các Mode dự đoán trong Slice B: Trong Slice B có 4 Mode dự đoán
liên ảnh khác nhau được hỗ trợ: dự đoán list 0, list 1, hai hướng và
trực tiếp.


Bộ giải mã

Sơ đồ khối giải mã H.264/ AVC


- Bù chuyển động: Bù chuyển động thực hiện việc thiết lập lại các
khung trên cơ sở các Vector đã nhận được, dữ liệu Delta (dữ liệu
khác nhau giữa hai khung liên tiếp) và hình ảnh đã được mã hóa
trước đó.
- Khôi phục lỗi: Một trong những nhiệm vụ quan trọng nhất của bộ
giải mã là làm phù hợp và khôi phục lại các lỗi chắc chắn xảy ra, đặc
biệt là khi kết nối qua các liên kết dễ xảy ra lỗi như mạng không dây.


Các kỹ thuật trong H.264/ AVC
- Instantaneous Decoding Refresh Picture.
- Switching I – Slices and Switching P – Slices.
- Transform and QuantizationIntraframe Coding with Directional
Spatial Prediction.
- Adaptive Block Size Motion Compensation


So sánh phương pháp nén Video chuẩn
MPEG – 4 với MPEG – 1
Sơ đồ nén MPEG – 1:


Nén Frame I:


Nén Frame B, P:


Sơ đồ nén MPEG – 4:


- MPEG – 1 (1992) – mã ISO/ IEC - MPEG – 4 dựa trên MPEG – 1 và
tiêu chuẩn MPEG – 2.
11172: sử dụng chủ yếu để ghi
- MPEG – 4/ H264 AVC xử lý khối
CD – ROM, VCD.
điểm ảnh kích thước 4x4.
- MPEG – 4 tập tin kích thước nhỏ
- Độ phân giải 352x240, 25-30
hơn và Streaming trực tuyến, giải
ảnh/s, tốc độ từ 1.2 - 1.5 Mbit/s,
quyết vấn đề truyền thông đa
cấu trúc lấy mẫu 4:2:0
phương tiện hay lưu trữ với không
gian ổ đĩa giới hạn.
- Không cho phép mã hóa dữ liệu
- do đó thích hợp cho MPEG – 4
có độ phân giải lớn.
cần thuật toán tốt hơn để quét và
xác định những Pixel có thể được
- MPEG – 1 xử lý khối điểm ảnh
loại bỏ, để giảm kích thước dữ liệu
kích thước 8x8.
hơn nữa.


Mã hóa frame I
Nếu một khối hoặc macroblock được mã hóa trong
chế độ intra, một khối dự đoán được tạo dựa trên
các khối được mã hóa tạo ra trước đó. Khối dự
đoán P này được trừ đi khối hiện tại trước khi mã
hóa. Đối với thành phần độ chói (luma), P có thể
được tạo cho mỗi khối phụ 4x4 hoặc cho một
macroblock 16x16. Có tổng cộng 9 chế độ dự
đoán cho mỗi khối luma 4x4; 4 chế độ cho khối
luma 16x16; và một chế độ luôn được áp dụng
cho mỗi khối chroma 4x4.


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay

×