Форматы представления аудиофайлов

⇐ Предыдущая 6 7 8 9 101112 13 14 15 Следующая ⇒

В этом разделе речь пойдет о цифровых форматах, хранящих звук файлов. Иначе говоря, - о хранении оцифрованного звука. Напряжение, передаваемое по телефонным каналам и несущее звук, представляет собой аналоговый сигнал достаточно сложной формы. Чтобы преобразовать такой сигнал в цифровую форму, необходимо выполнить последовательно две операции: дискретизацию и квантование. Дискретизация состоит в периодическом измерении значений напряжения (на рис. 3.4 дискретизация сигнала производится в моменты времени t₁,.., t₄,..), а квантование - в преобразовании измеренных аналоговых значений в цифровой код. Соответственно, на качество оцифрованного звукового сигнала оказывают влияние два фактора: частота дискретизации и разрядность цифрового кода, получаемого при квантовании. При увеличении частоты дискретизации и разрядности кода качество оцифрованного звука улучшается, но пропорционально возрастает объем информации, которая должна храниться в файле, т. е. необходимо найти компромиссное решение между качеством и размерами файла.

Частоту дискретизации определить достаточно просто. В соответствии стеоремой Котельникова частота дискретизации должна быть вдвое больше максимальной частоты спектра звукового сигнала. Принятая в настоящее время частота дискретизации для аудио-CD составляет 44100 Гц, т. е. максимальная воспроизводимая частота звукового спектра составляет 20050 Гц, что превышает диапазон звуков, воспринимаемых ухом человека. Это обеспечивает идеальное звучание таких устройств. Частота дискретизации в телефонных сетях составляет 8000, что более чем в два раза превышает полосу пропускания телефонного канала, равную 3000 Гц.

Количество уровней или разрядность квантования характеризует точность передачи уровня звукового сигнала. Действительно, при 256 уровнях квантования или представлении уровня звука с помощью 8 бит информации, величина погрешности квантования равна половине расстояния между соседними уровнями, так как к именно с этой точностью значение электрического напряжения может быть преобразовано в цифровой код (притом условии, что наименьшему уровню сигнала, обозначенному min на рис. 3.4 , соответствует цифровой код 00000000 или OOh, а наибольшему, обозначенному max, - 11111111 или Offh в 16-тиричной форме представления), т. е. отнесено к одному из двух соседних уровней, между которыми находится реальное значение сигнала. Сказанное иллюстрируется рис. 3.4 . Нетрудно сообразить, что при частоте дискретизации в 44100 Гц и квантовании каждого такого уровня 16-двоичными разрядами (4096 уровней квантования) хранение одной минуты цифрового аудио потребует около 5 Мб информационного пространства, а 30 минут стереозвучания - около 300 Мб.

Закодированные описанным способом цифровые аудиоданные характеризуются значительной избыточностью, т. е. они могут быть упакованы, а затем восстановлены без всякой потери качества. Однако применение для сжатия цифрового аудио архиваторов обычного типа, таких как ARJ или ZIP, позволяет сжать исходный файл приблизительно лишь на 20%, т. е. оно неэффективно.

Основная идея сжатия аудиосигнала с потерями - пренебрежение теми фрагментами звука, которые лежат вне пределов восприятия человеческого уха. Первая такая возможность определяется маскирующим эффектом, в соответствии с которым сильные звуки приводят к невосприимчивости уха к слабым в том же самом частотном диапазоне. Поэтому слабые звуки можно кодировать с малым количеством уровней, в результате чего сокращается количество информации, используемое при кодировании звука.

Далее, весь частотный диапазон делится на подполосы, каждая из которых обрабатывается отдельно, причем маскирующий эффект используется как внутри каждой подполосы, так и между ними, т. е. очень мощный звук в одной из подполос приводит к маскированию во всех остальных. Затем используются особенности психоакустической модели человеческого слуха, в соответствии с которой тщательно сохраняются звуки хорошо воспринимаемых частот и удаляются звуки тех частот, которые не воспринимаются.

Для стереозвучания используется дополнительный прием, связанный с тем, что стереоэффект воспринимается человеком только в области средних звуковых частот. Поэтому сигнал низких и высоких частот передается в монофоническом звучании.

Наконец, используются специальные алгоритмы сжатия, основанные на высокой предсказуемости звукового сигнала, т. е. большом значении его коэффициента автокорреляции. Все перечисленные выше методы и алгоритмы позволяют получить десятикратный и более высокий коэффициент сжатия практически без потери качества звучания, что реализуется в формате МРЗ, разработанном комитетом MPEG (Motion Picture Expert Group - группа экспертов в области движущихся изображений).

Для воспроизведения звуковых файлов формата МРЗ существует целая группа программ-плейеров. Список большинства из них можно найти на сайтеhttp://www.dailymp3.com. Самые популярные из них - это Winamp, включаемая в дистрибутив браузера Netscape Communicator начиная с версии 4.7, K-Jofol, которая является самым быстрым декодером звука, и NAD (или NADDY), являющаяся лидером по качеству воспроизведения звука. Другие плейеры используются гораздо реже.

Из форматов звуковых файлов следуетупомянуть AU для UNIX-подобных систем и платформ, WAV - стандарт звуковых файлов для операционной системы Windows, AIFF - стандарт звуковых файлов для платформы Apple Macintosh и MIDI (Musical Instrument Digital Interface) - формат электронных музыкальных инструментов. Кратко остановимся на каждом из них.

Формат AU - один из наиболее распространенных в сети Интернет. В заголовочной части файла определяются параметры звуковых данных:

частота дискретизации и разрядность квантования, число звуковых каналов и метод кодирования. Наиболее распространенные файлы этого формата носят подзаголовок p-Law, рассчитанные на один звуковой канал с полосой 8000 Гц. Подзаголовок p-Law означает преобразование значений линейного квантования в логарифмическую шкалу значений, которая производится в соответствии с уравнением:

где Y_μ - значение в логарифмической шкале, m - исходное квантованное значение, m_p - максимальная величина последнего значения, μ - постоянное значение, величина которого определяет область, в которой обеспечивается наиболее высокое качество звучания.

В формате AU наряду с 8-разрядным логарифмическим кодированием, предусмотрена возможность представления 16-разрядного линейного стереозвука, имеющего частоту дискретизации 22050 и 44100 Гц.

Формат WAV является основным на платформе Windows. Фактически это специальный тип файла формата RIFF (Resource Interchange File Format), который предназначен для хранения произвольных структурированных данных. Полное название такого формата - WAVE RIFF Microsoft Windows. Звуковые данные в таком файле обычно хранятся в РСМ-форме (РСМ - Pulse Code Modulation или импульсно-кодовая модуляция). Это означает запись в файле значений квантованного кода в последовательных точках дискретизации. В заголовочной части файла содержится основная информация об оцифрованном звуке, например число каналов и частота дискретизации, а также среднее число передаваемых в секунду байтов. Последняя характеристика позволяет программе воспроизведения звука выбрать требуемые размеры буфера для хранения звуковых данных. Большинство программ воспроизведения звука буфферизуют количество данных, соответствующее одной секунде непрерывного звучания.

Формат WAV поддерживает также ряд дополнительных блоков данных. К ним относят дополнительную информацию о сжатых звуковых данных. В частности, фирма IBM зарегистрировала специальные коды форматирования для сжатия в формате u-Law. Специальный блок позволяет помечать определенные позиции в потоке звуковых данных, что дает возможность синхронизировать звуковой ряд с видеорядом. Предусмотрены также блоки для размещения дополнительной текстовой информации.

Формат Audio Interchange File Format (AIFF) преимущественно предназначен для работы на платформе Macintosh. Он во многом напоминает WAV, но позволяет, в отличие от последнего, хранить еще и шаблоны, т. е. образцы оцифрованного звука, которые можно использовать как шаблоны для отдельных нот. Специальная версия формата AIFF-C поддерживает сжатие.

Musical Instrument Digital Interface (MIDI) - старейший звуковой формат, который позволил стандартизировать работу с различными электронными музыкальными инструментами. Стандарт базируется на пакетах данных, каждый из которых соответствует определенному MIDI-событию. Эти события можно разделить по каналам. Сложная среда такого файла может включать различную аппаратуру на каждом канале, причем отдельная часть будет отвечать за события на каждом канале. Такие файлы позволяют хранить не запись оцифрованного звука, а только ноты. В результате они гораздо компактнее других типов звуковых файлов. Недостатком такого формата является то, что он не определяет в явном виде всех тонкостей воспроизведения звука.

9. Мультимедиа и ее роль в современных технологиях.

Мультимедиа сейчас - это полноценное объединение компьютерных и других информационных технологий: видео, аудио, фото, кино, телекоммуникаций (телефон, телевидение, радиосвязь), не говоря уже о тексте и графике, как статической, так и динамической (анимационной). С помощью приложений мультимедиа текст, графика, аудио- и видеоинформация объединяются в единое информационное поле, подобно тому как в кинофильме объединяются звук и движущееся изображение. Однако в отличие от кинофильма мультимедиа представляет собой интерактивную среду, т. е. пользователь может управлять процессом представления мультимедиа с помощью различных средств ввода, таких как клавиатура и манипулятор мышь.

Успешное сращивание телекоммуникационных сетей с компьютерами, стремительный рост их качества и количества преобразует вещательные сети в интерактивные, создает единое мировое информационное мультимедиа-пространство. Важнейшей частью этого пространства является сеть Internet и особенно, ее гипермедиа-система World Wide Web. Распространение мультимедиа-технологий (в сочетании с развитием электронной коммерции) в дальнейшем наложит жесткие ограничения на конкурентоспособность издательско-полиграфических фирм, ориентированных на широкий спрос. Преимущества в продаже даже самой высококачественной продукции получат те, кто быстрее и эффективней освоил электронные способы коммерции и обслуживания.

Использование мультимедиа в учебных пособиях дополняет аналитические (вычислительные и логические) и навигационные возможности компьютеров способностью к образному, синтетическому описанию изучаемого предмета или объекта. Многочисленные исследования показали, что обучаемый с первого раза запоминает лишь четверть услышанного и треть увиденного, при комбинированном воздействии на слух и зрение запоминается приблизительно половина информации, а при вовлечении обучаемого еще и в активные действия (например, при использовании интерактивных мультимедиа-технологий) доля усвоенного достигает 75%. Мультимедиа, особенно интерактивное, активизирует индивидуальные, личностные мотивы усвоения материала студентом, в том числе:

целевой (для меня важно и необходимо знать этот материал и уметь выполнять такую работу);
исследовательский (работая с учебным материалом, я не только узнаю что-то новое, но и чувствую себя активным участником процесса познания, сам участвую в творческом процессе);
эмоционально-эстетический (в процессе изучения материала я испытываю удовольствие как от получаемых результатов, так и от самого процесса изучения этого материала);
игровой (эта форма обучения интересна, начав изучать материал, я не могу остановиться, мне интересно и хочется довести до конца изучение материала);
инициационный (предполагает органичное сочетание в мультимедийном учебнике информационной и эстетически-эмоциональной глубины).

По уровню творческих мотивов и степени воздействия на человека мультимедиа следует отнести к новому виду синтетического искусства, отличительной особенностью которого является высокая информативность и интерактивность. Поэтому в будущем следует ожидать создания теории педагогики мультимедиа, учитывающей психофизиологические и эстетические законы восприятия и усвоения большого объема информации. Не исключая традиционной формы обучения, предполагающей творческое и воспитательное общение с преподавателем, мультимедиа создает новые позитивные факторы, в частности, значительный рост эффективности обучения за счет повышения качества самостоятельной работы студента с электронными учебными материалами.

Специалисты считают, что самую сложную систему автоматизированного управления было бы гораздо легче освоить в том случае, если она реализована на основе стандартного мультимедиа-интерфейса. В будущем, видимо, будут созданы эвристические алгоритмы мультимедиа, которые позволят не только человеку адаптироваться в компьютерной системе, но и компьютеру адаптироваться к уровню восприятия человека, т. е. сделать процесс адаптации двусторонним.

10. Компьютерная графика. Достоинства и недостатки.

⇐ Предыдущая 6 7 8 9 101112 13 14 15 Следующая ⇒

Дата добавления: 2015-04-19; просмотров: 788. Нарушение авторских прав; Мы поможем в написании вашей работы!

Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Почему важны муниципальные выборы? Туристическая фирма оставляет за собой право, в случае причин непреодолимого характера, вносить некоторые изменения в программу тура без уменьшения общего объема и качества услуг, в том числе предоставлять замену отеля на равнозначный...

Тема 2: Анатомо-топографическое строение полостей зубов верхней и нижней челюстей. Полость зуба — это сложная система разветвлений, имеющая разнообразную конфигурацию...

Виды и жанры театрализованных представлений Проживание бронируется и оплачивается слушателями самостоятельно...

Ваготомия. Дренирующие операции Ваготомия – денервация зон желудка, секретирующих соляную кислоту, путем пересечения блуждающих нервов или их ветвей...

Билиодигестивные анастомозы Показания для наложения билиодигестивных анастомозов: 1. нарушения проходимости терминального отдела холедоха при доброкачественной патологии (стенозы и стриктуры холедоха) 2. опухоли большого дуоденального сосочка...

Сосудистый шов (ручной Карреля, механический шов). Операции при ранениях крупных сосудов 1912 г., Каррель – впервые предложил методику сосудистого шва. Сосудистый шов применяется для восстановления магистрального кровотока при лечении...

Studopedia.info - Студопедия - 2014-2025 год . (0.012 сек.) русская версия | украинская версия