Кодирование звуковой и видеоинформации
В настоящее время компьютер часто используется не только для выполнения сложных расчетов, но и для развлечений, например, игр, прослушивания музыкальных произведений, просмотра видеофильмов, что подразумевает применение компьютера для работы с мультимедиа. При этом под мультимедиа понимают комплекс аппаратных и программных средств, обеспечивающих работу со звуком, графикой, анимацией, видео и другими видами информации. Далее рассмотрим основные принципы кодирования звуковой и видео информации. Звуковая информация в компьютере представляется двумя способами: как набор выборок звукового сигнала (оцифрованный звук); как набор команд для синтеза звука с помощью музыкальных инструментов. Первый способ основан на том, что любой непрерывный сигнал, в том числе и звуковой, может быть достаточно точно представлен с помощью последовательности выборок этого сигнала, взятых через определенные интервалы времени. Каждая выборка может быть преобразована в цифровую форму. Таким образом, звуковой сигнал может быть описан с помощью последовательности целых чисел. Для цифрового преобразования звукового сигнала выполняют последовательно две операции: дискретизацию и квантование (рис. 5.10). Дискретизация – это запоминание значения сигнала через определенные интервалы времени, а квантование – это выполнение аналого-цифрового преобразования с каждым полученным при дискретизации значением. Фактически при квантовании выполняется следующее действие: , где U – величина преобразуемого значения, D U – наименьшее возможное значение, отличное от нуля (величина кванта). При выполнении преобразования дробная часть значения N отбрасывается.
Значения, полученные в результате выполнения указанных операций, вместе со служебной информацией (количество разрядов одной выборки, частота дискретизации, число каналов воспроизведения и т.д.) записываются в файл для последующего использования. Пример 5.24. Выполнить квантование и дискретизацию сигнала, изображенного на рис. 5.11. Интервал дискретизации равен D t, величина кванта – 0, 1 В. Последовательность преобразованных значений записать в файл в двоичной форме. В результате квантования и дискретизации получается следующая последовательность значений: 1, 3, 4, 5, 6, 7, 5, …. Если преобразовать данные значения в 8-разрядные двоичные числа, то в файл будет записано: 00000001000000110000010000000101000001100000011100000101…. Для определения объема данных, содержащихся в звуковом файле, можно воспользоваться следующей формулой:
,
где f – частота дискретизации (Гц, 1/с); D t – интервал дискретизации (с); n – разрядность квантованных значений в двоичной форме (бит); k – режим воспроизведения (1 – стерео, 2 – моно); t – время воспроизведения (мин). Пример 5.25. Определить объем данных в звуковом файле, воспроизводимом 10 мин с частотой 22050 выборок в секунду и 8-битовыми значениями выборки по одному (моно) и двум каналам (стерео). Объем звуковых данных при монозвучании:
= 13230000 байт ≈ 12.6 Мб. Объем звуковых данных при стереозвучании:
= 26460000 байт ≈ 25.2 Мб.
Второй способ представления звуковой информации в компьютере связан с использованием синтезаторов музыкальных инструментов. Файл в этом случае содержит последовательность событий вместе с синхронизирующей информацией, которые обеспечивают требуемое звучание необходимых инструментов при воспроизведении музыкального произведения. Видеофайл представляет собой последовательность кадров изображения (видеопоток) и звуковых данных (аудиопоток), которые должны воспроизводиться через определенные промежутки времени. Для определения примерного объема данных, содержащихся в видеофайле можно воспользоваться следующей формулой:
,
где t – время воспроизведения файла (с); RV – скорость воспроизведения данных видеопотока (Гц, 1/с); SV – размер дискретизованной величины для видеопотока (байт); RA – скорость воспроизведения данных аудиопотока (Гц, 1/с); SA – размер дискретизованной величины для аудиопотока (байт). Пример 5.26. Определим объем видеофайла, содержащего информацию, воспроизводимую 10 мин при значениях RV = 30 Гц, SV = 20000 байт, RA = 22050 Гц, SA = 8 байт. Используя выражение, найдем объем видео файла равен Q ≈ = 465840000 байтов ≈ 444.3 Мб. Кадр изображения в видеофайле представляет собой некоторое графическое изображение, воспроизводимое в определенный момент времени. Такое графическое изображение является динамическим. Кроме этого, используются также статические изображения, например, фотографии, чертежи зданий, схемы электрических соединений, блок-схемы алгоритмов и т.д. Основным устройством, используемым для представления графической информации, является видеосистема компьютера, которая в простейшем случае состоит из видеоадаптера и монитора. Монитор – это устройство, предназначенное для вывода графической информации (изображений). Изображение выводится на экран монитора, который представляет собой растр – сетку из точек с определенным шагом. Светящимися элементами экрана являются точки сетки – пиксели. Каждый пиксель характеризуется атрибутом, отражающим информацию о цвете и яркости. Количество строк растра монитора A, количество точек в строке B, количество цветов C, которые могут быть воспроизведены точкой растра, характеризуют разрешающую способность монитора, которая описывается в виде A´ B´ C, например, 1280´ 1024´ 65536. Для кодирования атрибута пикселя используются три числа – величины яркостей красного R, зеленого G и синего B цветов, смешение которых дает требуемый цвет (рис. 5.11).
Все функции управления видеомонитором и взаимодействия с центральным процессором компьютера выполняет видеоадаптер. При этом выводимое на экран монитора изображение хранится в памяти видеоадаптера (видеопамяти), а его аппаратура обеспечивает регулярное чтение этой информации и передачу в монитор. Поэтому вся работа с изображением сводится к тем или иным операциям с видеопамятью. Режимы работы видеоадаптера можно разделить на палитровые и непалитровые. В палитровом режиме в видеопамяти хранятся индексы, по которым определяются атрибуты пикселей (RGB-значения) из таблицы цветов (палитры). Палитра в общем случае представляет собой набор N m -разрядных регистров, каждый из которых содержит информацию о 3 цветовых компонентах – красной (R), зеленой (G) и синей (B). Таким образом, в палитровом режиме можно задать
M = 2 m
различных цветов. Однако в каждый момент времени работы видеоадаптера можно получить доступ только к набору из N цветовых регистров палитры. Всего число палитр определяется:
Для 16-цветного режима с 6-разрядными регистрами палитры:
N = 16, M = 64, K = 488526937079580.
В непалитровом режиме в видеопамяти непосредственно хранятся атрибуты пикселей, т. е. n разрядов кода цвета содержат n R, n G и n B разрядов под каждую составляющую цвета (R, G, B). При записи в видеопамять код цвета дополняется нулями слева до числа разрядов, кратного 8. Пример 5.27. Определить объем видеопамяти и различное число цветов в 256-цветном палитровом режиме 320´ 200 с 6-разрядными регистрами палитры. 1. Требуемый объем видеопамяти равен
Q = 320·200·log2256 бит = 512000 бит = 64000 байт.
2. Различное число цветов в данном режиме равно
M = 26·3 = 218 = 262144. Вопросы и задачи для повторения 1) Какие стандарты символьной информации существуют? 2) Определите стандарт кодирования символьной информации Unicod. 3) Как кодируется звуковая информация? 4) Как кодируется видеоинформация? 5) Выполнить квантование и дискретизацию сигнала, изображенного на рис. 5.10. Интервал дискретизации равен Dt, величина кванта – 0, 2 В. Последовательность преобразованных значений записать в файл в двоичной форме. 6) Определить объем данных в звуковом файле, воспроизводимом 3 мин с частотой 32000 выборок в секунду и 16-битовыми значениями выборки.
|