символов
4. Создаем дерево Хаффмана, относительно этого дерева выстраиваем кодовую таблицу.
Итоговая таблица на основе моей частотной таблицы
Общий размер до сжатия (в ASCII): 2288 бит Общий размер до сжатия (в UTF - 8): 4472 + 24 (BOM) = 4496 бит
Общий размер после сжатия (в ASCII): 1293 бит Общий размер после сжатия (в UTF - 8): 1293 + 24 (BOM) = 1317 бит
5. Проделываем тоже самое, только на основе известной частотной таблицы букв русского языка http://dict.ruslang.ru/freq.php?act=show&dic=freq_letters&title=%D7%E0%F1%F2%EE%F2%ED%EE%F1%F2%FC%20%E1%F3%EA%E2%20%F0%F3%F1%F1%EA%EE%E3%EE%20%E0%EB%F4%E0%E2%E8%F2%E0)
Сортируем по рангу (см. общую таблицу ниже) и задаем условную частоту, на основе условной частоты создаем дерево Хаффмана:
таблица на основе известной частотной таблицы букв русского языка
Общий размер до сжатия (в ASCII): 2288 бит Общий размер до сжатия (в UTF - 8): 4472 + 24 (BOM) = 4496 бит Общий размер после сжатия (в ASCII): 1341 бит Общий размер после сжатия (в UTF – 8): 1341 + 24 (BOM) = 1365 бит
|