Реклама
Алгоритмы сжатия JPEG и M-JPEG. PDF Печать E-mail
Эта статья приоткроет суть некоторых из алгоритмов сжатия используемых в видеонаблюдении. К таким алгоритмам относятся форматы JPEG и M-JPEG (Motion JPEG). Эти форматы используют дискретное косинусное преобразование. Ниже будет описан процесс компрессии который используют эти форматы.

Эта статья приоткроет суть некоторых из алгоритмов сжатия используемых в видеонаблюдении. К таким алгоритмам относятся форматы JPEG и M-JPEG (Motion JPEG). Эти форматы используют дискретное косинусное преобразование.

Начнем с алгоритма сжатия JPEG. Данный формат задумывался и использовался для сжатия изображения в статике, т.е. для рисунков, фотографий и различных изображений. Данный формат сжатия нашел обширное применение в WEB-камерах, видеосерверах и других различных сетевых устройствах. Свое название формат JPEG получил от комитета объединенных экспертов по фотографии Joint Photographic Expert Group. Этот комитет входит в состав ISO. Как уже упоминалось выше, этот формат компрессии  базируется на дискретном косинусном преобразовании (Discrete-Cosine Transform).  Форматы, основанные на таком принципе способны обеспечить достаточно высокий уровень компрессии, однако, осуществляя сжатие с  потерей данных.

Рассмотрим процедуру дискретного косинусного преобразования на примере формата JPEG.

Компрессия изображения в JPEG формат производится в несколько этапов:

- преобразование цветового пространства

- сегментация

-дискретное косинусное преобразование (Discrete-Cosine Transform)

- квантование

- кодирование

Для декодирования формата JPEG используется алгоритм обратный приведенному выше.

Итак, начнем по порядку, с преобразования цветового пространства.

Принимая во внимание то, что формат JPEG имеет возможность кодировки изображения любого типа  цветного пространства (RGB, CMYK и HSI), рекомендуется использовать цветовое пространство типа яркость/цветность для достижения наилучшей степени сжатия. При таком типа цветового пространства, где для каждого пикселя изображения используется 3 параметра Y,U и V. Для перехода в пространство яркость/цветность пользуются простыми математическими преобразовании.

Вторым пунктом стоит сегментация. Наиболее восприимчив наш глаз к такому параметру изображения как цветность(Y).Именно в этом параметре несется большая часть визуальной информации, воспринимаемой человеком. К компонентам цветности (U и V) человеческий глаз менее чувствителен. Это обусловлено строением и особенностями человеческого зрительного органа. Это означает что часть информации (цветность изображения) можно просто отбросить критической потери  НУЖНОЙ информации, тем самым значительно сократив объём информации о изображении.

Изображение  делится на части, содержащие по несколько пикселей каждая. Обычно каждая часть представляет собой квадрат 8 на 8 пикселей. Далее для каждой компоненты Y,U и V формируется собственная рабочая матрица. Для Y (яркость) матрица формируется из значений яркости каждого пикселя. А для компонентов U и V (цветность) такие матрицы формируются  из значений пикселей через строчку и через ряд. После этого этапа идет потеря  ¾  цветовой информации,  но объем изображения уменьшается вдвое.

Далее переходим к  самому принципу дискретному косинусному преобразованию. DCT является одним из преобразований Фурье, и оно также имеет обратное преобразование. В дискретном косинусном преобразовании изображение представляется как совокупность волн в пространстве, оси X и Y для которых проводятся параллельно поперечной и продольной осям изображения. Значение цвета для каждого пикселя откладывается по оси Z. Таком образом, используя дискретно косинусное преобразование , осуществляется переход от совокупности пространственных волн к спектральной интерпретации. Пространственная волна разделяется на ряд гармоник. Наиболее значимые остаются, а наименее значимые - отбрасываются. Степень сжатия изображения как раз и зависит от количества оставшихся гармоник. DCT трансформирует ранее полученные рабочие матрицы в матрицы частотных коэффициентов соответствующего размера. Высокочастотным коэффициентам отводятся места в левой верхней части матрицы, а низкочастотным - в противоположной, т.е. в правой нижней части матрицы. Стоит отметить, что основную часть графических образов изображения образуют именно низкочастотные коэффициенты. Следовательно можно сократить размер изображения при удалении высокочастотных коэффициентов. Как раз эта процедура и происходит в следующем этапе.

Квантовые матрицы частотных коэффициентов происходит путем деления поэлементного деления матрицы частотных коэффициентов на матрицу квантования. Создается отдельная матрица квантования для каждого компонента Y,U и V.Путем такого деления отбрасывается высокочастотная информация невоспринимаемая глазом. Затем элементы результирующих матриц округляются до целых чисел и получившиеся нули в правом нижнем углу матрицы  отбрасываются.

Наступает  завершающий этап - кодирование. В ходе этого процесса все элементы матрицы записываются в цепочку после зигзагообразного сканирования. Получаемый после этого вектор сворачивается  при помощи алгоритма «группового кодирования» или сокращенно RLE (Run Length Encoding). Каждый элемент (не нулевой) представляется парой чисел. Первое число показывает количество нулей расположенных перед ним. Второе число равно значению самого элемента. Далее эти пары чисел кодируются  алгоритмом  Хаффмана с фиксированнойктаблицей. Именно этот двоичный код, полученный кодированием по алгоритму Хаффмана  передается по сети и хранится в компьютере.

Стоит отметить, что из-за специфики кодирования изображения,  формат JPEG эффективен только при использовании  многоградационного изображения. В таком изображении различия у соседних пикселей незначительно. Одним из недостатков формата JPEG также является эффект «мозаики» который возникает из-за технологии компрессии видеоизображения. К недостатком относится и ограничения на полосу пропускания. Изображение с разрешением 768х576, коэффициентом сжатия 4 и скоростью передачи 25 кадров/с  передается со скоростью 8 Мбит/с.

 
Motion JPEG (M-JPEG)

Этот алгоритм является тем же самым алгоритмом  JPEG только применяемый к видеоизображению. А процесс компрессии ничем особенным не отличается, кроме того, что весь видеопоток разбивается на отдельные кадры, над которыми и происходит преобразования в формат JPEG. Стоит отметить, что при использовании этого формата средний коэффициент сжатия достигает значения 1:5. Скорость передачи видеопотока в режиме 720х576 составляет 5 Мбит/с.

 
« Пред.   След. »

Опросы

На правах рекламы

Внимание!!! Файл sape.php не обнаружен. Проверьте правильность установки кода Sape.