Арифметичне кодування

12 3 4 5 Следующая ⇒

ЗАТВЕРДЖУЮ

Завідувач кафедри №4

Кандидат військових наук, доцент

І. М. Майборода

____ ________________ 20__ р.

Розрахунок параметрів сигналів що циркулюють в системі зв’язку

ПОЯСНЮВАЛЬНА ЗАПИСКА

Курсова робота з дисципліни "Теорія електричного зв’язку "

Виконав курсант 9 курсу

262 навчальної групи

Курсант Бунін Геннадій Валерійовичь

Дата видачі завдання:21.11.14р.

Дата виконання проекту: 13.12.14р.

Керівники: Бабенко В.П.

Оцінка:___

Харків 2014

Зміст

1. Вступ………………………………...……..3

2. лінії зв'язку…………………………………5

3. арифметичне кодування………………..17

4. Моделювання коду Хафмена………….31

Висновок.....................................................43

6. Література................................................44

Вступ

Лінії (канали) зв’язку забезпечують передавання і поширення сигналів від передавача до приймача.

Лінія зв’язку складається в загальному випадку з фізичного середовища, яким передаються електричні інформаційні сигнали, апаратури передавання даних і проміжної апаратури. Синонімом терміна лінія зв’язку (line) є термін канал зв’язку (channel)

Лінії зв’язку за характером з’єднання можна класифікувати на

- магістральні, що з’єднують міста країн, країни та континенти;

- зональні (місцеві), які з’єднують локальні мережі певної території (області, міста);

- абонентські лінії доступу, що забезпечують під’єднання окремих користувачів та локальних мереж до магістральних або зональних ліній.

За типом підключення лінії зв’язку поділяють на

- комутовані телефонні лінії, в яких для організації каналу передавання даних використовуються звичайні телефонні канали та модеми. Найчастіше такі лінії використовуються як абонентські лінії доступу для забезпечення віддаленого зв’язку користувачів з офісом або з глобальною мережею, а також для зв’язку офісу з філіями для періодичного передавання невеликих файлів;

- виділені лінії, що використовуються для міжмережевого зв’язку;

- оптоволоконні лінії. Використовуються як на магістральних, так і на невеликих, місцевих мережах, а також для зв’язку віддалених офісів;

- радіорелейні лінії. Радіорелейна цифрова апаратура може використовуватися як у магістральних, так і невеликих, місцевих мережах;

- супутникові канали зв’язку та ін.

Вибір лінії залежить від декількох факторів, а саме тривалості використання лінії; вартості послуг; можливості одержати вищу чи стійкішу швидкість на лінії з усуненням перешкод; необхідності цілодобового безперервного з’єднання

1 ЛІНІЇ ЗВ'ЯЗКУ

В якості ліній зв'язку застосовують провідні (кабельні), радіо та оптичні

засоби.

Кабельні лінії зв'язку це сукупність оконечних і проміжних підсилювальних

пунктів, з'єднаних кабелями. У цифрових системах зв'язку на підсилюючих

пунктах, окрім посилення здійснюється регенерація сигналів, тобто

відновлення форми, тривалості і амплітуди імпульсів. В результаті цього

відношення сигнал / перешкода визначається тільки ділянкою між двома

сусідніми підсилювальними пунктами. В аналогових же системах

відбувається накопичення перешкод у міру проходження підсилюючих

пунктів. Підсилювальні пункти поділяються на обслуговувані (ОУП) і

обслуговуються (НПП). Необслуговувані підсилювальні пункти працюють

автоматично і управляються дистанційно за обслуговуваних підсилюючих

пунктів по каналах телеуправління і телесигналізації. Електроживлення для

пристроїв необслуговуваних пунктів надходить з найближчого

обслуговується по жилах магістрального кабелю.

По конструкції кабельні лінії поділяються на повітряні, симетричні і

коаксіальні.

Повітряна лінія являє собою пару мідних проводів, підвішених на опорах.

Смуга пропускання такої пари складає близько 105 Гц.

Таблиця 1.1. Основні характеристики провідних ліній зв'язку

Конструкція	Назва	Полоса частот (Гц)	Довжина хвилі	Область застосування
	Повітряна лінія		> 3 км	Лінії сільського звязку
	Симетрична пара		300 м	Місська телефонна мережа
	Коаксиальна пара		> 3 м	Магістральні лінії

Види ліній зв’язку
Вигляд кабеля	Короткий опис кабеля
	Кабель кручена пара, 100 пар, неекранований (UTP – Unshielded Twisted Pair).
	Кабель кручена пара, 32 пари, неекранований (UTP).
	Кабель кручена пара, 10 пар, неекранований (UTP).
	Кабель кручена пара, 4 пари, неекранований (UTP).
	Кабель кручена пара, 2 пари, неекранований (UTP).
	Кабель кручена пара, 1 пара, неекранований (UTP).
	Кабель кручена пара, 25 пар, фольгований (FTP – Folded Twisted Pair).
	Кабель кручена пара, 4 пари, фольгований (FTP).
	Кабель кручена пара, 2 пари, фольгований (FTP).
	Кабель кручена пара, 4 пари, екранований (STP – Shielded Twisted Pair).
	Кабель оптоволоконний, багатомодовий, 4 жили.
	Кабель оптоволоконний, одномодовий, 2 жили.
	Кабель оптоволоконний, одномодовий, 4 жили.
	Товстий коаксіальний кабель.
	Коаксіальний кабель для мереж кабельного телебачення.
	Плаский кабель.
	Тонкий коаксіальний кабель для комп’ютерних мереж телебачення.
	Кабель для монітора.
	Кабель USB.

По конструкції розрізняють симетричні і коаксіальні кабелі, а в залежності

від умов прокладки підземні, підводні та повітряні.

Для передачі сигналів на відстані десятків і сотень метрів широке

застосування знаходить кабель, заснований на використанні скрученої або

кручений пари. Симетричний кабель містить кілька четвірок проводів,

укладених в свинцеву (алюмінієву або сталеву) оболонку. Діаметр проводу

дорівнює 0,7-1,6 мм. Коаксіальний кабель містить від 2 до 8 пар, також

укладених в оболонку. Діаметр внутрішнього проводу коаксіальної пари

становить 1-3 мм. Діаметр зовнішнього проводу порядку в три рази більше.

Для оберігання кабелю від проникнення вологи при пошкодженні оболонки

під нею з використанням спеціальних балонів на підсилюючих пунктах

підтримується надлишковий тиск (0,5 - 0,7 атмосфери). Кабель укладається

під землею на глибині від 0,8 до 1,2 м. Одна пара симетричного кабелю має

смугу пропускання до 1 МГц, що дозволяє організувати в ній до 120 каналів

ТЧ, а коаксіальногокабелю - до декількох десятків МГц, що дозволяє

організувати до декількох тисяч каналів ТЧ. Зі збільшенням числа каналів,

організованих в лінії зв'язку, зменшується відстань між підсилювальними

пунктами. Так, в лінії зв'язку ємністю 24 каналу протяжність ділянки між

підсилювальними пунктами становить 40 км, а в лінії ємністю 60 каналів –

близько 20 км. При використанні коаксіальногокабелю це відстань ще менше.

Основні характеристики провідних ліній зв'язку наведені в таблиці 1.1.

Кабелі на скрученої (кручений) парі містять два або чотири кручені пари з

різним кроком скрутки. Кожна пара - це два скручених ізольованих

провідника. Кабель накритий зовнішньої ізоляційної оболонкою, що захищає

дроти від вологи і механічних впливів.

Скручена пара проводів за властивостями істотно відрізняється від пари тих

же прямих проводів, що йдуть поруч паралельно один одному. При

скручуванні виявляється, що провідники йдуть завжди під деяким кутом

один до одного, що знижує емкостную і індуктивний зв'язок між ними. Крім

того, значний відрізок такого кабелю для зовнішніх полів виявляється

симетричним (круглим), що знижує його чутливість до наводкам (з

диференціальної заваді) і зовнішнім випромінюванням при проходженні

сигналу. Чим дрібніше крок скрутки, тим менше перехресні перешкоди, але й

більше погонное загасання кабелю, а також час поширення сигналу. Кабель

може мати різне виконання, окремі пари можуть мати екран з мідного дроту і

/ або фольги. До загального екран можуть бути укладені і всі пари кабелю.

Категорія (Category) кручений пари визначає частотний діапазон, в якому її

застосування ефективно.

Крім загальноприйнятих позначень кабелів за категоріями, існує і

класифікація кабелів за типами (Туре), введена фірмою ІВМ. У цю

класифікацію крім мідних кабелів потрапили і оптоволоконні. Поняття

«Турі» і «Category» іноді плутають, але в назвах кабелів за класифікацією

ІВМ присутній ім'я цієї фірми і слово «Турі».

діапазон частот і області застосування радіолінії наведено в табл.

Таблиця 1.2 Діапазон частот і області застосування радіолінії

Діапазон	Діапазон частот	Область приймання
Кілометровий (10-1) км	Длінноволновий (30-300)кГц	Радіовещаніе
Гектометровій (1000-100) м	Средневолновий (300-3000)кГц	Радіовіщення
Декаметровий (100-10) м	КВ (3-30)МГц	Радіовещання, радіозвязок
Метровий (10-1) м	УКВ (30-300)МГц	ТВ, радіовещання, радиосвязь
Дециметровий (10-1) дм	Високочастотний (300-3000)МГц	ТВ, радіозвязок
Сантиметровий (10-1) см	Сверхвисокочастотний (3-30)ГГц	РРЛ, ИСЗ
Мілліметровий (10-1) мм	Мікрохвильовий (30-300)ГГц	РРЛ, ИСЗ

Короткохвильовий (КВ) діапазон займає область частот від 3 до 30 МГц.

Електромагнітна енергія в KB діапазоні поширюється просторовими і

наземними (поверхневими) променями. При цьому мають місце явища

поглинання, заломлення, відбиття, діфракціі і інтерференції хвиль. Явище

дифракції (огинання) в цьому діапазоні частот виражено слабо, тому

поверхнева хвиля розповсюджується на невеликі відстані - близько декількох

десятків кілометрів.

Заломлення і багатократне віддзеркалення радіохвиль від Землі і іонізованих

шарів атмосфери дозволяє забезпечити зв'язок на великі відстані. Однак

ступінь іонізації і висота іонізованих шарів змінюється залежно від пори року

і доби, що змінює умови поширення радіохвиль KB діапазону. В результаті

дальність радіозв'язку залежить не тільки від потужності передавача і

чутливості приймача, але і від вибору рабочей частоти, стану іоносфери і

рівня перешкод. Для засобів радіозв'язку короткохвильового діапазону

характерним є заміраніе сигналів. Причиною цих завмирань є інтерференція

променів, отриманих за рахунок відображення сигналів від різних верств

іоносфери. В результаті замираний істотно підвищується ймовірність

помилки при передачі цифрової інформації і складає близько. Іншим

недоліком короткохвильового діапазону є низька надійність зв'язку при

північних сяйвах.

Достоїнствами KB радіозв'язку є велика дальність действія при порівняня

малих середніх потужностях передавачів, можливість одночасного обміну

інформацією з багатьма абонентами; швидке розгортання ліній зв'язку:

забезпечення зв'язку з важкодоступними районами і з абонентами, місце

розташування яких невідоме.

Ультракороткохвильової діапазон займає область частот від 30 до 300 МГц.

Радіохвилі цього діапазону не відображаються іонізованими шарами

атмосфери, а поширюються над земною поверхнею на дальність прямої

видимості, проходять іонізовані шари атмосфери і розсіюються у світовому

просторі. Однак вельми мала частина електромагнітної енергії розсіюється за

рахунок неоднорідностей тропосфери та іоносфери, що створює можливості

для організації тропосферного та іоносферній радіозв'язку.

Особливості поширення УКХ дозволили створити радіолініі прямої

видимості, радіорелейні, тропосферні, іоносферние, космічні лінії зв'язку.

У діапазоні УКВ можлива одночасна робота великого числа радіостанцій з

шириною спектра випромінюваних сигналів до декількох десятків мегагерц.

Це дає можливість передавати в діапазоні УКХ широкосмугові сигнали і

використовувати різні види модуляціі, що вимагають великої смуги частот і

володіють високою завадостійкістю.

Схема побудови радіорелейної лінії зв'язку

Радіорелейні лінії зв'язку (мал.1.9) представляють собою ланцюжок

приймально-передавальних станцій сантиметрового, дециметрового або

метрового діапазону, розташованих один від одного на відстані прямой

видимості. Дальність прямої видимості визначається за формулою

, де и - Відповідно висота передавальної і

приймальні антен в метрах. У реальних умовах складають 40-60 км. У

гористій місцевості в ряді випадків вдається забезпечити пряму видимість на

відстань 110-150 м. Антенні системи узконаправлен, що дозволяє

використовувати передавачі невеликої мощності (до 20 Вт) і різко

послабити вплив зовнішніх перешкод (і зокрема навмисних), знизити взаємні

перешкоди між радіостанціями. Рівень сигналу на вході приймача не

залежить від часу та інших зовнішніх факторів, що підвищує стійкість

зв'язку. Використання радіорелейних ліній забезпечує устойчівую передачу

інформації. Однак необхідність наявності ретрансляторів, високих опор для

антен ускладнює і здорожує організації зв'язку.

Тропосферні лінії зв'язку засновані на явищі розсіювання

ультракоротких хвиль в тропосфері. Загальний принцип тропосферного

зв'язку пояснюється на ріс.1.10. Антени станцій з великими коефіцієнтами

похилення орієнтуються так, щоб їх діаграми спрямованості перетиналися в

тропосфері на висоті. Обсяг тропосфери , утворений перетином діаграм

направленності антен, розсіює опромінюють його радіохвилі. Деяка частина

розсіяною електромагнітної енергії вловлюється антеною станції 2 і

надходить на вхід приймача. Діяльність тропосферного зв'язку між двома

станціями визначається співвідношенням ,

Де - висота розташування рассеивающего обсягу; - Радіус Землі, рівний

6370 км. Висота рассеівающіх шарів тропосфери обмежена 10-15 км. Тому

дальність тропосферной зв'язку рідко перевищує 600 км, а частіше має

значеніе 100-250 км. Для її збільшення використовують тропосферні

радіорелейние лінії (ТРРЛ), що відрізняються від РРЛ прямої видимості

значно більшими інтервалами ретрансляції. Тропосферні лінії

характеризуються великими втратами при розсіюванні (до 230-240 дБ) і

завмираннями сигналів: тривалими - годинник; короткочасними - секунди,

хвилини. Для підвищення стійкості зв'язку доводиться використовувати

потужні передавачі (до 10 кВт і більше), високонаправленние антени і

рознесений по простору і частоті прийом.

Незважаючи на те, що обладнання станцій тропосферного зв'язку більш

складне і дороге, ніж радіорелейних, збільшення інтервалов ретрансляції

робить тропосферні радіолінії незаменімимі для організації зв'язку в

важкодоступних або малонаселених районах, а також для зв'язку через

морські простори.

Космічні лінії зв'язку містять космічні ретранслятори, розташовані на

орбітах заввишки в декілька десятків тисяч кілометров, які видно на

величезній території. Це дозволяє організовать радиолинию довжиною в

кілька тисяч кілометіров. Максимальний розмір зони видимості

визначається за формулою

Де - радіус Землі.

Через внесених тропосферой шумів мінімальний кут піднесення може бути,

що зменшує розмір зони радіовідімості. Особливості поширення

електромагнітних колебаній через атмосферу, а також радіовипромінювання

різних планет, обмежують діапазон частот для космічних систем зв'язку

ділянкою 2... 8 ГГц.

Супутники-ретранслятори можуть розташовуватися на круговій або

еліптичної орбітах.

Залежно від висоти орбіти поділяються на геостанционарной (GEO),

середньовисотні (MEO) і низькоорбітальні (LEO)

Геостаціонарні супутники, розташовуючись на висоті приблизно 36000 км,

знаходяться над заданою точкою земної поверхні. Цей ефект досягається за

рахунок того, що КА, рухаючись зі швидкістю обертання Землі, як би зависає

над певною точкою поверхні, розташованої на екваторі. Зв'язок через

геостаціонарний КА не має перерв в обслуговуванні, зумовлених взаємним

переміщенням супутника і терміналу користувача. Система з трьох

супутників забезпечує охоплення практично всієї території земної поверхні.

До переваг систем на геостаціонарній орбіті слід віднести можливість

забезпечення частоти за рахунок доплерівського ефекту.

Ресурс геостаціонарних КА досить високий: термін експлуатації сучасних

КА становить близько 15 років. Але це не межа, теоретично він може бути

збільшений до 25.

Однак ці системи мають ряд недоліків. Супутники на геостаціонарних

орбітах можна з успіхом використовувати для систем радіо- і телевізійного

мовлення, де затримки в 250 мс в кожному напрямку не позначаються на

якісних характеристиках сигналів. У той же час в системах персональної

радіотелефонного зв'язку тривала затримка погіршує якість телефонного

зв'язку. Сумарна величина затримки в цих системах становить 600 мс (з

урахуванням часу обробки і комутації в наземних мережах), що ускладнює

спілкування абонентів.

Системи зі середньовисотними КА забезпечують більш високі

характеристики обслуговування абонентів, ніж геостаціонарні, за рахунок

збільшення робочих кутів місця і числа КА, що знаходяться одночасно в полі

зору спостерігача. Радіо видимість двох супутників забезпечується 95%

добового часу. При цьому, хоча б один із супутників видно під кутом більше

30о. Завдяки цьому не потрібен додатковий енергетичний запас радіолінії на

втрати поширення в ближній зоні (дерева, будівлі та інші перешкоди).

Траса середньовисотних супутників проходить в діапазоні висот від 5000 до

15000 км. Вони можуть створити меншу зону обслуговування, ніж

геостаціонарні, тому для глобального охоплення найбільш населених районів

Земної кулі і судноплавних акваторій необхідно 7-12 супутників.

Особливістю низькоорбітальних КА є використовуваний діапазон частот - від

1 ГГц і легкі космічні апарати масою від 50 до 250 кг. У системі

використовується від 6 до 48 КА.

При організації зв'язку розрізняють два методи використання ШСЗ: метод

парних станцій, при якому будь-які дві наземні станції можуть

використовувати супутник для двостороннього зв'язку тільки між собою і

метод багатьох станцій (Багатостанційний доступ), при якому більше двох

наземних станцій можуть використовувати один ШСЗ для одночасної зв'язку

кожній станції з будь-якої іншої або з усіма іншими станціями.

У разі многостанционного доступу (МД) супутник функціонує в мережі, що

охоплює багато пунктів, кожен з яких в будь-який час може встановити

зв'язок з іншим пунктом. Він грає роль центральної станції, через яку

проходять всі абонентські лінії даної мережі. Найбільш простим і поширеним

методом МД є частотне розділення каналів.

При тимчасовому поділі каналів необхідна ортогональность сигналів різних

абонентів досягається тим, що кожній станції, що входить в мережу для

випромінювання сигналів виділяється певний часовий інтервал. Інтервали

випромінювання всіх станцій взаємно синхронізовані.

В останні роки широке поширення знаходять оптичні лінії зв'язку. Оптичний

діапазон включає ділянку від до. Для цілей зв'язку перспективними є хвилі

довжиною 0,3... 30 мкм.

Перевагою оптичних ліній зв'язку є несхильність зовнішніх електромагнітних

полів, більша пропускна здатність, малий об'єм і вагу.

Так, на хвилі довжиною 1 мкм смуга частот, складова всього один відсоток

від несучої частоти, дорівнює, що відповідає практично всьому

радіодіапазоні. В даний час по волоконним световодам вже можна здійснити

передачу сигналів з шириною спектра до декількох гігагерц на відстань до

декількох кілометрів без проміжних підсилювальних пунктів. Оптичні

волокна виготовляються з кварцового скла з додаванням оксиду германію.

Діаметр поперечного перерізу має величину порядку 0,1... 0,2 мм. Волокно

являє собою, фактично, діелектричний оптичний хвилевід. У таких

хвилеводах (як і в металевих) можливе поширення хвиль з певним

розподілом по поперечному перерізі електричного і магнітного полів. Ці

хвилі називають модами. Волокна, в яких може поширюватися тільки одна

мода, називають одномодовими. Волоконно-оптичний кабель складається з

декількох волокон (може бути кілька десятків). Джерелами світла у

волоконно-оптичних лініях є напівпровідникові лазери або світлодіоди. При

передачі сигналів між космічними апаратами джерелами світла є газові або

твердотільні лазери.

Швидкість передачі в волоконних лініях досягає кілька сот мегабіт в секунду.

При такій великій швидкості передачі висуваються жорсткі вимоги до

точності синхронізації. Тому в волоконно-оптичних лініях зазвичай

використовуються так звані самосінхронізірующіхся коди.

Оптичні лінії з поширенням хвиль в необмеженому просторі використовують

спрямоване лазерне випромінювання. Через поглинання хвиль в атмосфері

забезпечують зв'язок на малих дальностях. Можливе використання оптичних

хвиль для ретрансляції через ШСЗ.

арифметичне кодування

Пpи аpіфметіческом кодиpования, на відміну від розглянутих нами методів,

коли кодується символ (або група символів) замінюється відповідним їм

кодом, результат кодування всього повідомлення пpедставляется одним або

парою дійсних чисел в інтеpвале від 0 до 1. За меpе кодиpования вихідного

тексту отобpажающій його интеpвал зменшується, а кількість десяткових

(або довічних) розрядів, службовців для його пpедставления, возpастает.

Очеpедной символи вхідного тексту сокpащают величину інтервалу

виходячи з значень їх веpоятно, що визначаються моделлю. Більш веpоятно

символи роблять це в меншій мірі, ніж менш веpоятно, і, отже, додають

менше розрядів до pезультатах.

Пояснимо ідею арифметичного кодування на простому прикладі. Нехай нам

потрібно закодувати наступну текстову рядок: РАДІОВІЗІР.

Перед початком роботи кодера відповідний кодованого тексту вихідний

інтеpвал становить [ 0; 1).

Алфавіт кодованого повідомлення містить наступні символи (букви): {Р, А,

Д, І, О, В, З}.

Визначимо кількість (зустрічальність, ймовірність) кожного з символів

алфавіту в повідомленні і призначимо кожному з них інтервал, пропорційний

його ймовірності. З урахуванням того, що в кодируемом слові всього 10 букв,

отримаємо табл. 1

Таблиця 1

Символ	Ймовірність	Інтеpвал
А	0.1	0 – 0.1
Д	0.1	0.1 – 0.2
В	0.1	0.2 – 0.3
И	0.3	0.3 – 0.6
З	0.1	0.6 – 0.7
О	0.1	0.7 – 0.8
Р	0.2	0.8 – 1

Розташовувати символи в таблиці можна в будь-якому порядку: у міру їх

появи в тексті, в алфавітному чи по зростанню ймовірностей - це абсолютно

не принципово. Результат кодування при цьому буде різним, але ефект –

однаковим. Кодуванням

Отже, перед початком кодування вихідний інтервал становить [0 - 1).Після

пpосмотpа пеpвого символу повідомлення Р кодер звужує вихідний интеpвал

до нового - [ 0.8; 1), якому модель виділяє цьому символу. Таким чином,

після кодування першої літери результат кодування буде перебувати в

інтервалі чисел [ 0.8 - 1).

Наступним символом повідомлення, що надходять в кодер, буде буква А.

Якщо б ця буква була першою в кодируемом повідомленні, їй був би

відведений інтервал [ 0 - 0.1), але вона слід за Р і тому кодується новим

подинтервалом всередині вже виділеного для першої літери, звужуючи його

до величини [ 0.80 - 0.82). Іншими словами, інтервал [ 0 - 0.1), виділений

для літери А, розташовується тепер усередині інтервалу, займаного

попереднім символом (початок і кінець нового інтервалу визначаються

шляхом додавання до початку попереднього інтервалу твори ширини

попереднього інтервалу на значення інтервалу, відведені поточним символу

У результату отримаємо новий pабочий інтервал (0.80 - 0.82), тому

пpедидущій интеpвал мав ширину в 0.2 одиниці і одна десята від нього є 0.02.

Наступному символу Д відповідає виділений інтервал [ 0.1 - 0.2), що

пpіменітельно до вже наявного робочого інтервалу [ 0.80 - 0.82) звужує його

до величини [ 0.802 - 0.804).

Наступним символом, що надходять на вхід кодера, буде буква І з

виділеним для неї фіксованим інтервалом [ 0,3 - 0,6). Стосовно до вже

наявного робочого інтервалу отримаємо [ 0,8026 - 0,8032).

Пpодолжая в тому ж дусі, маємо:

На початку [0.0 - 1.0)

Після перегляду Р [0.8 - 1.0)

А [0.80 - 0.82)

Д [0.802 - 0.804)

І [0.8026 - 0.8032)

О [0.80302 - 0.80308)

В [0.803032 - 0.803038)

І [0.8030338 - 0.8030356)

З [0.80303488 - 0.80303506)

І [0.803034934 - 0.803034988)

Р [0.8030349772 - 0.8030349880)

Результат кодування: інтервал [ +0,8030349772 - +0,8030349880 ]. Насправді

, для однозначного декодування тепер достатньо знати тільки одну межу

інтервалу - нижню або верхню, тобто результатом кодування може служити

початок кінцевого інтервалу - +0,8030349772. Якщо бути ще точнішим, то

будь-яке число, укладену всередині цього інтервалу, однозначно

декодується у вихідне повідомлення. Наприклад, це можна перевірити за

числом 0,80303498, що задовольняє цим умовам. При цьому останнє число

має менше число десяткових розрядів, ніж числа, відповідні нижньої і

верхньої кордонів інтервалу, і, отже може бути представлено меншим

числом двійкових розрядів.

Неважко переконатися в тому, що, чим ширше кінцевий інтервал, тим

меншим числом десяткових (і, отже, довічних) розрядів він може бути

представлений. Ширина ж інтервалу залежить від розподілу ймовірностей

кодованих символів - більш ймовірні символи звужують інтервал у меншій

мірі і, отже, додають до результату кодування менше біт. Покажемо це на

простому прикладі.

Припустимо, нам потрібно закодувати наступний рядок символів:

AAAAAAAAA #, де ймовірність літери А становить 0,9. Процедура

кодування цього рядка і одержуваний результат будуть виглядати в цьому

випадку наступним чином:

Вхідний символ Нижня границя Верхня границя

0.0 1.0

A 0.0 0.9

A 0.0 0.81

A 0.0 0.729

A 0.0 0.6561

A 0.0 0.59049

A 0.0 0.531441

A 0.0 0.4782969

А 0.0 0.43046721

А 0.0 0.387420489

# 0.3486784401 0.387420489

Результатом кодування тепер може бути, наприклад, число 0.35, цілком

потрапляє всередину кінцевого інтервалу 0.3486784401 - 0.387420489. Для

двійкового представлення цього числа нам знадобиться 7 біт (два десяткових

розряду відповідають приблизно семи двійковим), тоді як для двійкового

представлення результатів кодування з попереднього прикладу - 0,80303498

потрібно 27 біт!

Алгоритм кодування для послідовності довільної довжини виглядає

наступним чином:

1. Визначити ймовірність кожного з символів алфавіту в повідомленні і

призначити кожному з них інтервал, пропорційний його ймовірності.

2. Скласти таблицю відповідності між символом і інтервалом.

3. Встановити початок інтервалу .

4. Встановити кінець інтервалу .

5. Виконувати до тих пір поки є ще вхідні символи

6. Отримати вхідний символ.

7. Вибрати з таблиці відповідності початок і кінець інтервалу для

символу.

8. Звузити вихідний интеpвал до нового

кінець циклу

9. Прийняти кінцеве значення для передачі

декодування

Поклав, що все що декодер знає про текст, - це кінцевий інтервал

[+0,8030349772 - +0,8030349880]. Декодеру, як і кодеру, відома також

таблиця розподілу виділених алфавітом інтервалів. Він сpазу ж розуміє, що

Пеpвое закодіpованний символ є Р, так як результат кодування цілком

лежить в інтеpвале [0.8 - 1), виділеному моделлю символу Р згідно з

таблицею.

Тепеpь повтоpов дії кодера:

Спочатку [0.0 - 1.0);

після пpосмотpа [0.8 - 1.0).

Виключимо з результату кодування вплив тепер уже відомого першого

символу Р, для цього віднімемо з результату кодування нижню межу

діапазону, відведеного для Р, - +0,8030349772 - 0.8 == +0,0030349772 - і

розділимо отриманий результат на ширину інтервалу, відведеного для Р, -

0.2. В результаті отримаємо +0,0030349772 / 0,2 == 0,015174886. Це число

цілком вміщається в інтервал, відведений для літери А, - [ 0 - 0,1), отже,

другий символом декодувати послідовності буде А.

Оскільки тепер ми знаємо вже дві декодовані букви - РА, виключимо з

підсумкового інтервалу вплив букви А. Для цього віднімемо з залишку

0,015174886 нижню межу для літери А 0,015174886 - 0.0 == 0,015174886 і

розділимо результат на ширину інтервалу, відведеного для літери А, тобто

на 0,1. В результаті отримаємо 0,015174886 / 0,1 = 0,15174886. Результат

лежить в діапазоні, відведеному для літери Д, отже, чергова буква буде Д.

Виключимо з результату кодування вплив букви Д. Отримаємо (0,15174886

0,1) / 0,1 = 0,5174886. Результат потрапляє в інтервал, відведений для літери

І, отже, черговий декодований символ - І, і так далі, поки не декодуємо всі

символи:

Декодуєме Символ Границі Ширина число на виході нижня верхня інтервала0,8030349772 Р 0.8 1.0 0.20,015174886 А 0.0 0.1 0.10,15174886 Д 0.1 0.2 0.10,5174886 И 0.3 0.6 0.30,724962 О 0,7 0,8 0,10,24962 В 0,2 0,2 0,10,4962 И 0,3 0,6 0,30,654 З 0,6 0,7 0,10,54 И 0,3 0,6 0,30,8 Р 0,6 0,8 0,20.0 Кінець декодування Описаний алгоритм декодування виглядає наступним чином:1. Отримати декодіруемий число

2. Виконувати до тих пір поки декодіруемий число

не дорівнює «0».3. Знайти символ, для якого початок інтервалу

, а кінець інтервалу

.4. Видати символ.5. Визначити наступне число

.6. кінець циклуЦе основна ідея арифметичного кодування, його практична реалізація дещо складніше. Деякі проблеми можна помітити безпосередньо з наведеного прикладу.Перша полягає в тому, що декодеру потрібно обов'язково якимось чином дати знати про закінчення процедури декодування, оскільки залишок 0,0 може означати букву а або послідовність аа, ааа, аааа і т.д. Вирішити цю проблему можна двома способами.По-перше, крім коду даних можна зберігати число, що є розміром кодованого масиву. Процес декодування в цьому випадку буде припинений, як тільки масив на виході декодера стане такого розміру.Інший спосіб - включити в модель джерела спеціальний символ кінця блоку, наприклад #, і припиняти декодування, коли цей символ з'явиться на виході декодера.Друга проблема випливає з самої ідеї арифметичного кодування і полягає в тому, що остаточний результат кодування - кінцевий інтервал - стане відомий тільки після закінчення процесу кодування. Отже, не можна почати передачу закодованого повідомлення, поки не отримана остання буква вихідного повідомлення і не визначений остаточний інтервал? Насправді в цій затримці немає необхідності. У міру того, як інтервал, що представляє результат кодування, звужується, старші десяткові знаки його (або старші біти, якщо число записується в двійковій формі) перестають змінюватися (подивіться на наведений приклад кодування). Отже, ці розряди (або біти) вже можуть передаватися. Таким чином, передача закодованої послідовності здійснюється, хоча і з деякою затримкою, але остання незначна і не залежить від розміру кодованого повідомлення.І третя проблема - це питання точності представлення. З наведеного прикладу видно, що точність представлення інтервалу (число десяткових розрядів, необхідну для його подання) необмежено зростає при збільшенні довжини кодованого повідомлення. Ця проблема зазвичай вирішується використанням арифметики з кінцевою розрядністю і відстеженням переповнення розрядності регістрів. Словникові методи стисненняПрактично всі словникові методи кодування пpінадлежат родині алгоритмів з роботи двох ізраїльських вчених - Зива і Лемпела, опублікованій в 1977 році. Сутність їх полягає в тому, що фрази в стисливому тексті замінюються покажчиком на те місце, де вони в цьому тексті вже pанее з'являлися.Це сімейство алгоритмів називається методом Зеева - Лемпела і позначається як LZ -стиснення. Цей метод Швидка пpіспосаблівается до стpуктуpе тексту і може кодувати короткі функціональні слова, так як вони дуже часто в ньому з'являються. Нові слова і фрази можуть також формуватися з частин раніше зустрінутих слів.Алгоритм LZ лежить в основі таких відомих програм - архіваторів, як PKZIP, LHA, ARJ, Stacker, Dblspace та багатьох інших. Практично всі сучасні комп'ют

12 3 4 5 Следующая ⇒

Дата добавления: 2015-09-04; просмотров: 1422. Нарушение авторских прав; Мы поможем в написании вашей работы!

Картограммы и картодиаграммы Картограммы и картодиаграммы применяются для изображения географической характеристики изучаемых явлений...

Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...

Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...

Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Машины и механизмы для нарезки овощей В зависимости от назначения овощерезательные машины подразделяются на две группы: машины для нарезки сырых и вареных овощей...

Классификация и основные элементы конструкций теплового оборудования Многообразие способов тепловой обработки продуктов предопределяет широкую номенклатуру тепловых аппаратов...

Именные части речи, их общие и отличительные признаки Именные части речи в русском языке — это имя существительное, имя прилагательное, имя числительное, местоимение...

Шов первичный, первично отсроченный, вторичный (показания) В зависимости от времени и условий наложения выделяют швы: 1) первичные...

Предпосылки, условия и движущие силы психического развития Предпосылки –это факторы. Факторы психического развития –это ведущие детерминанты развития чел. К ним относят: среду...

Анализ микросреды предприятия Анализ микросреды направлен на анализ состояния тех составляющих внешней среды, с которыми предприятие находится в непосредственном взаимодействии...

Studopedia.info - Студопедия - 2014-2025 год . (0.013 сек.) русская версия | украинская версия