Характеристики алгоритмов сжатия данных
Коэффициент сжатия R, характеризующий отношение объема исходных данных Lисх к объему сжатых данных Lсж: . Степень сжатия r, характеризующая относительное уменьшение объема данных: . Скорость сжатия Vс определяется по формуле , где tcж – время сжатия исходных данных. Скорость распаковки Vр определяется по формуле , где tр – время распаковки исходных данных. Важной характеристикой алгоритма сжатия является симметричность во времени С – отношение времени сжатия исходных данных ко времени распаковки: . Для использования в Internet важной характеристикой алгоритмов сжатия является масштабируемость изображения. Алгоритмы сжатия, использующие исключение повторов (RLE = Run-Length Encoding) чрезвычайно просты и ориентированы на быстрое сжатие данных, содержащих много идущих подряд одинаковых символов. В основу алгоритмов RLE положен принцип выявления групп подряд идущих одинаковых символов и замены их структурой, в которой указывается код символа и число повторов, т.е. группа идущих подряд одинаковых символов заменяется на пару кодов вида <код символа; число повторов>. Максимальное число одинаковых символов, которое можно закодировать одной такой парой, определяется длиной кода числа повторов. Проблему при сжатии алгоритмами RLE представляют данные, содержащие незначительное количество повторяющихся символов. К одиночным символам также приходится добавлять счетчик повторов, что вместо сжатия дает увеличение объема данных. Поэтому в практических реализациях алгоритмы RLE несколько усложняются, чтобы уменьшить увеличение объема сжатых данных в случае не очень подходящих данных. Наилучшими объектами для данных алгоритмов являются графические файлы, в которых большие одноцветные участки изображения кодируются последовательностью одинаковых байтов. Эти алгоритмы могут давать заметное сжатие на некоторых типах файлов баз данных, имеющих таблицы с фиксированной длиной полей. RLE используется как этап сжатия в алгоритмах сжатия изображений.Следует отметить, чтоалгоритмы сжатия, использующие исключение повторов, неэффективны для сжатия текстовых данных.
|