Mã Hóa Khối ảnh Theo Chuẩn Nén Video H.264 AVC - H.265 HEVC Là Gì
Có thể bạn quan tâm
Trong cuộc sống, trong từng ứng dụng cụ thể, trong truyền thông truyền hình… Dữ liệu và băng thông luôn luôn thiếu.
Trong truyền thông, viễn thông truyền hình Những định dạng mã hóa dữ liệu Video thường là những dữ liệu có dung lượng rất lớn, truyền hình có độ phân giải cao HDTV, nếu không nén thành các định dạng có dung lượng nhỏ thì tốc độ lên tới hơn 1,5 Gbps, với tốc độ như thế để truyền tải là rất khó khăn.
Do vậy các chuẩn nén video hay video / Audio Encoder ra đời nhằm loại bỏ những dữ liệu dư thừa mà vẫn đảm bảo chất lượng tốt
Chuẩn mã hóa (nén) H.264 – Encoder H.264 là một chuẩn tiên tiến ra đời chính thức vào năm 2003. Nó tạo ra sự đột phá, cho phép nén video một cách tốt hơn đồng thời cải thiện được chất lượng so với các chuẩn trước đó.
Vậy Công ty AVA sẽ tổng hợp và chia sẻ đến các bạn về Chuẩn mã hóa video H.264/AVC, h.264/mpeg-4 avc. h.264 dvr
Ứng dụng H.264 trong mô hình truyền hình internet IPTV
CÁC BỘ MÃ HÓA TIÊN TIẾN BẠN NÊN XEM
Phương pháp nén ảnh JPEG
1. Một số đặc điểm của dữ liệu ảnh
Một tính chất chung nhất của tất cả các ảnh số đó là tương quan giữa các pixel ở cạnh nhau lớn, điều này dẫn đến dư thừa thông tin để biểu diễn ảnh.
Dư thừa thông tin sẽ làm cho việc mã hoá không tối ưu. Do đó công việc cần làm để nén ảnh là phải tìm được các biểu diễn ảnh với tương quan nhỏ nhất để giảm thiểu độ dư thừa thông tin của ảnh.
Thực tế, có hai kiểu dư thừa thông tin được phân loại như sau:
- Dư thừa trong miền không gian: tương quan giữa các giá trị pixel của ảnh, điều này có nghĩa rằng các pixel lân cận của ảnh có giá trị gần giống nhau (trừ những pixel ở giáp đường biên ảnh).
- Dư thừa trong miền tần số: Tương quan giữa các mặt phẳng màu hoặc dải phổ khác nhau.
Trọng tâm của các nghiên cứu về nén ảnh là tìm cách giảm số bit cần để biểu diễn ảnh bằng việc loại bỏ dư thừa trong miền không gian và miền tần số càng nhiều càng tốt.
CÁC BỘ MÃ HÓA VIDEO H 264 AVC
Các kỹ thuật nén ảnh được sử dụng:
- Nén ảnh không mất thông tin : với phương pháp này sau khi giải nén ta khôi phục được chính xác ảnh gốc. Các phương pháp nén này bao gồm mã hoá Huffman, mã hoá thuật toán…
- Nén ảnh có mất thông tin: ảnh giải nén có một sự sai khác nhỏ so với ảnh gốc.
Các phương pháp này bao gồm:
- Lượng tử hoá vô hướng: PCM và DPCM
- Lượng tử hoá vector
- Mã hoá biến đổi: biến đổi cosin rời rạc (DCT), biến đổi Fourier nhanh (FFT)
- Mã hoá băng con
Nguyên lý nén ảnh JPEG
Nguyên lý của phương pháp nén JPEG là: Cắt hình ảnh thành từng khối nhỏ, phân tích tất cả các dữ liệu về màu sắc, độ sáng mà các khối đó chứa bằng các phương trình ma trận.
Ảnh màu trong không gian RGB (Red, Green, Blue) được chuyển đổi qua hệ YUV. Trong khi thị giác của con người lại rất nhạy cảm với hệ Y, ít nhạy cảm hơn nhiều với hệ U, V.
Hệ thống sẽ nén thành phần Y của ảnh ở mức độ ít hơn nhiều so với U và V. Kế tiếp là dùng biến đổi Cosin rời rạc, sau đó lượng hóa và mã hóa theo phương pháp Huffman. Khi giải nén ảnh, các bước thực thi sẽ làm ngược lại quá trình nói trên.
Các bước trong nén ảnh JPEG
Mã hoá biến đổi DCT
Nguyên tắc chính của phương pháp mã hoá này là biến đổi tập các giá trị pixel của ảnh trong miền không gian sang một tập các giá trị khác trong miền tần số sao cho các hệ số trong tập giá trị mới này có tương quan giữa các điểm ảnh gần nhau nhỏ hơn.
BIẾN ĐỔI DCT THUẬN VÀ NGHỊCH
Vì ảnh gốc có kích thước rất lớn cho nên trước khi đưa vào biến đổi DCT, ảnh được phân chia thành các khối vuông, mỗi khối này thường có kích thước 8 x 8 pixel và biểu diễn các mức xám của 64 điểm ảnh, các mức xám này là các số nguyên dương có giá trị từ 0 đến 255.
Việc phân khối này sẽ làm giảm được một phần thời gian tính toán các hệ số chung, mặt khác biến đổi cosin đối với các khối nhỏ sẽ làm tăng độ chính xác khi tính toán với dấu phẩy tĩnh, giảm thiểu sai số do làm tròn sinh ra.
Biến đổi DCT là một công đoạn chính trong các phương pháp nén sử dụng biến đổi. 2 công thức ở đây minh hoạ cho 2 phép biến đổi DCT thuận nghịch đối với mỗi khối ảnh có kích thước 8 x 8. Giá trị x(n1, n2) biểu diễn các mức xám của ảnh trong miền không gian, X(k1, k2) là các hệ số sau biến đổi DCT trong miền tần số
Mỗi khối 64 điểm ảnh sau biến đổi DCT thuận sẽ nhận được 64 hệ số thực DCT (bảng 1). Mỗi hệ số này có chứa một trong 64 thành phần tần số không gian hai chiều. Hệ số với tần số bằng không theo cả hai hướng (tương ứng với k1 và k2 bằng 0) được gọi là hệ số một chiều DC, hệ số này chính là giá trị trung bình của 64 điểm ảnh trong khối. 63 hệ số còn lại gọi là các hệ số xoay chiều AC. Hệ số một chiều DC tập trung phần lớn năng lượng của ảnh.
Bảng 1. Các bước của quá trình mã hóa biến đổi DCT đối với 1 khối
Chú ý rằng bản thân biến đổi DCT không làm mất thông tin vì DCT là một biến đổi tuyến tính chuyển các giá trị của điểm ảnh từ miền không gian thành các hệ số trong miền tần số.
Nếu biến đổi DCT thuận và nghịch được tính toán với độ chính xác tuyệt đối và nếu các hệ số DCT không phải qua bước lượng tử và mã hoá thì ảnh thu được sau biến đổi DCT ngược sẽ giống hệt ảnh gốc.
Lượng tử và giải lượng tử
Sau khi thực hiện biến đối DCT, 64 hệ số sẽ được lượng tử hoá dựa trên một bảng lượng tử gồm 64 phần tử Q(u,v) với 0≤u, v≤7.
Bảng này được định nghĩa bởi từng ứng dụng cụ thể. Các phần tử trong bảng lượng tử có giá trị từ 1 đến 255 được gọi là các bước nhảy cho các hệ số DCT. Quá trình lượng tử được coi như là việc chia các hệ số DCT cho bước nhảy lượng tử tương ứng, kết quả này sau đó sẽ được làm tròn xuống số nguyên gần nhất.
Công thức (3) thể hiện việc lượng tử với F(u,v) là các hệ số DCT, FQ(u,v) là các hệ số sau lượng tử, các hệ số này sẽ được đưa vào bộ mã hoá Entropy
Mục đích của việc lượng tử hoá là giảm số lượng bit cần để lưu trữ các hệ số biến đổi bằng việc giảm độ chính xác của các hệ số này cho nên lượng tử là quá trình xử lý có mất thông tin.
Quá trình giải lượng tử ở phía bộ giải mã được thực hiên ngược lại. Các hệ số sau bộ giải mã entropy sẽ nhân với các bước nhảy trong bảng lượng tử (bảng lượng tử được đặt trong phần header của ảnh JPEG). Kết quả này sau đó sẽ được đưa vào biến đổi DCT ngược.
Chuẩn nén MPEG
Khái quát
- MPEG (Moving Picture Expert Group) là nhóm chuyên gia về hìnhảnh, được thành lập từ tháng 2 năm 1988 với nhiệm vụ xây dựng tiêu chuẩn cho tín hiệu Audio và Video số.
Ngày nay, MPEGđã trở thành một kỹ thuật nén Audio và Video phổ biến nhất vì nó không chỉ là một tiêu chuẩn riêng biệt mà tuỳ thuộc vào yêu cầu cụ thể của từng thiết bị sẽ có một tiêu chuẩn thích hợp nhưng vẫn trên cùng một nguyên lý thống nhất.
- Tiêu chuẩn đầu tiên được nhóm MPEG đưa ra là MPEG-1, mục tiêu của MPEG-1 là mã hoá tín hiệu Audio-Video với tốc độ khoảng 1.5Mb/s và lưu trữ trong đĩa CD với chất lượng tương đương VHS.
- Tiêu chuẩn thứ 2 : MPEG-2 được rađời vào năm 1990, không như MPEG-1 chỉ nhằm lưu trữ hình ảnh động vào đĩa với dung lượng bit thấp. MPEG-2 với “công cụ ” mã hoá khác nhau đã được phát triển. Các công cụ đó gọi là “Profiles” được tiêu chuẩn hoá và có thể sử dụng để phục vụ nhiều mục đích khác nhau.
- Tiêu chuẩn tiếp theo mà MPEG đưa ra là MPEG-4, được đưa ra vào tháng 10 năm 1998,đã tạo ra một phương thức thiết lập và tương tác mới với truyền thông nghe nhìn trên mạng Internet, tạo ra một phương thức sản xuất, cung cấp và tiêu thụ mới các nội dung video trên cơ sơ nội dung và hướng đối tượng (Content/object-based)
H264 là chuẩn công nghiệp trong nén video – một quá trình biến đổi dữ liệu video số về 1 định dạng chiếm ít dung lượng hơn để lưu trữ hoặc truyền đi. H264 được công bố đầu tiên năm 2003, xây dựng dựa trên các chuẩn trước đó như MPEG2, MPEG4 với mục đích tăng hiệu quả nén, tăng tính mềm dẻo trong nén video, truyền video và lưu trữ video
H264 hoạt động như thế nào?
Việc nén H264 được thực hiện qua các quá trình: Prediction, transform, Encode để có được dòng bit H264 (bit stream). Bộ giải mã H264 thực hiện quá trình ngược lại: decoding, inverse transform, reconstruction.
- Quá trình mã hóa:
Prediction
Bộ mã hóa xử lý một khung video (frame) dưới dạng các khối (macroblock) 16x16 pixel. Nó xây dựng 1 bộ dự đoán khối dựa trên các dữ liệu mã hóa trước đó, các dữ liệu này có thể ở frame hiện tại (intra prediction) hoặc ở các frame đã được mã hóa và truyền đi trước đó (inter prediction). Bộ giải mã sẽ lấy khối hiện tại trừ đi khối dự đoán của nó để thu được 1 phần dư.
Phương pháp dự đoán của H264 mềm dẻo hơn các phương pháp dự đoán của các chuẩn trước đó, cho phép các dự đoán chính xác và tăng cường hiệu quả nén video. Dự đoán trong (intra prediction) dùng khối 16x16 và 4x4 để dự đoán khối từ các khối xung quanh đã được xử lý trước đó trong cùng frame. (Như minh họa trong hình dưới đây)
Dự đoán liên khung (inter prediction) sử dụng khối có kích thước từ 4x4 đến 16x16 để dự đoán các điểm ảnh trong khung hiện tại từ các miền tương ứng trong các khung đã được xử lý trước đó. (Minh họa ở hình dưới)
Biến đổi và lượng hóa
Dùng phép biến đổi nguyên 4x4 hoặc 8x8 để biến đổi phần chênh lệch của khối (block) thực và khối dự đoán của nó. Phép biến đổi này là phép biến đổi cosin rời rạc. Sau biến đổi ta thu được 1 tập các hệ số, mỗi hệ số là trọng số ứng với 1 mẫu cơ bản ( khi ta kết hợp các mẫu cơ bản này lại – dùng các trọng số vừa tính được , thì sẽ tái tạo lại được phần dư vừa biến đổi ) Hình sau mô tả quá trình biến đổi cosin rời rạc ngược.
Mã hóa dòng bit
Quá trình nén video đưa ra một số giá trị phải đưa vào mã hóa để xây dựng dòng bit đã nén. Các giá trị đó gồm:
+ Các hệ số đã lượng hóa
+ Thông tin cho phép bộ giải mã có thể tái tạo quá trình dự đoán.
+ Thông tin về cấu trúc của dữ liệu đã nén và công cụ dùng trong quá trình mã hóa.
+ Thông tin về thứ tự đầy đủ của các frame.
Các giá trị và tham số này (gọi là các thành phần cú pháp H264) được chuyển thành dữ liệu nhị phân và dùng phương pháp nén “variable length coding” và /hoặc “arithmetic coding”. Dòng bit nén này có thể được lưu trữ lại hoặc truyền đi.
- Quá trình giải mã
Giải mã dòng bit
Giải lượng hóa và biến đổi ngược
Tái tạo các frame.
H264 trong thực tế
• Hiệu quả
So với các chuẩn nén MPEG2 , MPEG4-visual thì H264 có thể mang lại chất lượng video cao hơn với cùng 1 tỉ lệ nén. (Hoặc nén tốt hơn với cùng chất lượng video)
• Ứng dụng
Do có được ưu điểm vượt trội trong hiệu quả nén video nên H264 được ứng dụng rất rộng rãi.
- DVD độ nét cao (High definition DVD)
- High definition TV broadcasting ở Châu Âu.
- Các sản phẩm của Apple (iTune , iPod…)
- Mobile TV broadcasting
- Internet video
- Video conferencing
FFMPEG
Tuy nhiên hiện nay chuẩn Video tiên tiến hơn đã xuất hiện cùng với suwpj phá triển của công nghệ:
Chuẩn nén định dạng H.265 HEVC- H.265 HEVC Encoder
XEM THÊM BỘ MÃ HÓA H264 VÀ H265
Chuẩn High Efficiency Video Coding (HEVC) cung cấp chất lượng nén video được cải thiện đáng kể so với những người tiền nhiệm của nó (gần đây nhất là H.264/AVC). Tiêu chuẩn này đã được phê chuẩn vào năm 2013 với H.265 của ITU-T và MPEG-H Part 2 của ISO/IEC.
bang-thong-h264-h265
Vậy so sánh chuẩn nén video H 264 và H265
Bài kiểm tra cho kết quả các tính toán dựa PSNR cho thấy tổng lượng dữ liệu ghi lại trong mỗi giây (bit rate) trong HEVC (High Efficiency Video Coding: chuẩn nén video chất lượng cao) cao hơn 50% so với chuẩn H.264/AVC nhưng cho chất lượng video tương tự.
Các thử nghiệm sử dụng một tập hợp của chuỗi video được mã hóa với 4 cỡ phân giải hình ảnh khác nhau: UHD (3840x2160 pixel và 4096x2048 pixel), 1080p (1920x1080 pixel), 720p (1280x720 pixel) vàd 480p (832x480 pixel) với tần số quét là 30Hz, 50Hz, hoặc 60Hz.
Nội dung video đã được lựa chọn để đại diện cho đặc trưng không gian và thời gian khác nhau, và sau đó được mã hóa bằng cách sử dụng các tiêu chuẩn HEVC và AVC để cho ra các video và so sánh chất lượng với nhau.
>>> BẠN NÊN XEM THÊM CÁC BỘ MÃ HÓA TRUYỀN HÌNH ENCODER >>>>
Từ khóa » định Dạng Video H264 Và H265
-
Chuẩn Nén H.265 Là Gì? So Sánh Giữa H.264 Và H.265
-
So Sánh Chuẩn Nén Hình H265+ Với H265, H264 - Phố Công Nghệ
-
Sự Khác Biệt Giữa H.264 Và H.265
-
Sự Khác Biệt Giữa H.264 Và H.265 - VẬT TƯ MẠNG
-
Giới Thiệu Chuẩn Nén Video Mới H.265/HEVC
-
Chuẩn Nén H.265 Là Gì? So Sánh Giữa H.264 Và H.265 - Anh Ngọc
-
File HEVC (H.265) Là Gì? Cách Mở Và Chuyển đổi File HEVC Sang ...
-
Mã Hóa Video Hiệu Quả Cao – Wikipedia Tiếng Việt
-
Chuyển định Dạng H265 Sang H264 Với Video ProC - YouTube
-
Chuẩn Nén Hình ảnh H.265+, H.265, H.264 Trên Camera Giám Sát Là Gì
-
Các định Dạng đuôi Video Phổ Biến Hiện Nay - Điện Máy XANH
-
Chuẩn Nén Video H265 HEVC Là Gì? - Cơn Bão Số
-
Cách Chuyển đổi Video MP4 Sang H.265 / HEVC Và Vice Versa