Студопедия — Кодирование Хаффмена
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Кодирование Хаффмена






Кодирование Хаффмена, пожалуй, — самый известный метод сжатия данных. Оно основано на предпосылке, что некоторые символы используются в представлении данных чаще, чем другие. Действительно, наиболее общее представление — алфавит ASCII — использует 8 бит для каждого символа. При этом известно, что, например, в английском языке буква «e» явно будет чаще встречаться, чем буква «q», хотя мы используем для их представления одинаковое количество бит. Используя только 4 бита для «e» и 12 бит для «q», можно выиграть несколько бит.

Кодирование Хаффмена формализует идею связи длины символа с вероятностью появления символов. Статическое кодирование Хаффмена требует наличия таблицы вероятностей, прежде чем вы начнете сжимать данные. Эта таблица может быть взята из результатов статистических исследований (такие таблицы были опубликованы для некоторых данных, например для английского языка), или же система сжатия может просканировать входные данные для определения вероятностей символов, прежде чем начать сжимать данные.

Необходимость наличия таблицы вероятностей для каждого типа сжимаемых данных представляет собой самую большую сложность при использовании кодов Хаффмена. Это не составит проблемы, если вы знаете, что всегда будете сжимать английский текст. В общем же случае, когда вы не знаете вероятности символов для ваших входных данных, применение статических кодов Хаффмена нецелесообразно.

К счастью, динамическая версия сжатия Хаффмена может менять схему кодирования в зависимости от характера изменений входного потока.







Дата добавления: 2015-12-04; просмотров: 192. Нарушение авторских прав; Мы поможем в написании вашей работы!



Картограммы и картодиаграммы Картограммы и картодиаграммы применяются для изображения географической характеристики изучаемых явлений...

Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...

Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...

Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

РЕВМАТИЧЕСКИЕ БОЛЕЗНИ Ревматические болезни(или диффузные болезни соединительно ткани(ДБСТ))— это группа заболеваний, характеризующихся первичным системным поражением соединительной ткани в связи с нарушением иммунного гомеостаза...

Решение Постоянные издержки (FC) не зависят от изменения объёма производства, существуют постоянно...

ТРАНСПОРТНАЯ ИММОБИЛИЗАЦИЯ   Под транспортной иммобилизацией понимают мероприятия, направленные на обеспечение покоя в поврежденном участке тела и близлежащих к нему суставах на период перевозки пострадавшего в лечебное учреждение...

Меры безопасности при обращении с оружием и боеприпасами 64. Получение (сдача) оружия и боеприпасов для проведения стрельб осуществляется в установленном порядке[1]. 65. Безопасность при проведении стрельб обеспечивается...

Весы настольные циферблатные Весы настольные циферблатные РН-10Ц13 (рис.3.1) выпускаются с наибольшими пределами взвешивания 2...

Хронометражно-табличная методика определения суточного расхода энергии студента Цель: познакомиться с хронометражно-табличным методом опреде­ления суточного расхода энергии...

Studopedia.info - Студопедия - 2014-2024 год . (0.01 сек.) русская версия | украинская версия