Элементы теории решений
Пусть при передаче дискретных сообщений, закодированных кодом с основанием m используются реализации сигнала , 0< t< T, соответствующие кодовым символам . В течение тактового интервала 0< t< T на вход приёмного устройства поступает колебание Z(t), которое вследствие искажений и помех в канале, не совпадает в точности не с одним из сигналов . В этом случае приёмное устройство должно выбрать одну из m возможных взаимоисключающих (альтернативных) гипотез; передавался кодовый символ , то есть сигнал . …………………………. передавался кодовый символ , то есть сигнал . Для двоичной системы (m=2) приёмное устройство выбирает одну из двух альтернативных гипотез о передаче символа 1 или 0. Совокупность всех возможных реализаций Z(t) можно интерпретировать точками в пространстве Z принимаемых сигналов. Будем графически изображать реализации принимаемых сигналов и помехи n(t) длительностью Т точками на плоскости или соответствующими векторами, откладываемыми от начала координат 0. Если правило решения выбрано, то это означает, что каждой точке пространства принимаемых колебаний (концу вектора) Z=S+n приписывается одна из m гипотез, то есть определённый передаваемый кодовый символ . Пространство принимаемых сигналов окажется при этом разбитым на m непересекающихся областей , каждая из которых соответствует принятию определённой гипотезы. В такой трактовке различные приёмные устройства отличаются друг от друга способом разбииения пространства сигналов на области , то есть правилом принятия решения. В математической теории связи это разбиение называют решающей схемой. В некоторых случаях пользуются решающей схемой со стиранием, или отказом от решения. Это значит, что m областей не охватывают всего пространства сигналов Z, и если приходящий сигнал не попадает ни в одну из этих областей, то принимается решение о стирании либо о невозможности определить передаваемый символ. В двоичной системе пространство Z разбивают на две непересекающиеся области и . Пусть на интервале 0-Т принимается колебание (3.2) где – полезный сигнал в месте приёма, прошедший канал связи, а n(t) – реализация аддитивной помехи. Если помехи отсутствуют, возможные значения изображаются точками . При наличии помехи и передаче сигнала с номером i точка принимаемого колебания Z отклоняется от точки . На рис. это показано для сигналов , . Обычно область содержит точку . В тех случаях, когда помеха не выводит точку Z за пределы области , решение оказывается верным. В противном случае возникает ошибка. Изменяя границы между областями, можно влиять на вероятность ошибочного приёма отдельных передаваемых символов. Например, если в разбиении, показанном на рисунке расширить область за счёт области , то уменьшится вероятность, ошибочного приёма символа , вместо предаваемого символа . Однако в этом случае возрастает вероятность ошибочного приёма передаваемого . Очевидно, всегда существует такое расположение областей, которое в определённом смысле лучше всякого другого. Осуществить наилучшее разбиение пространства принимаемых сигналов методами теории статистических решений (оптимизацию решающей схемы приёмного устройства) можно, если задан критерий качества. 3.3. Критерии качества оптимального приёмника
I.Критерий идеального наблюдателя, или критерий Котельникова Это критерий, по которому качество приёмника оценивают безусловной вероятностью правильного приёма сигнала. Пусть на вход приёмника в течение тактового интервала 0-Т приходит некоторый элемент сигнала Z(t). Предположим, что приёмник принимает при этом решение, что передан символ . Вероятность того, это решение правильно, очевидно, равна условной вероятности того, что действительно передавался символ при условии прихода реализации элемента сигнала Z(t), . Её называют обычно апостериорной вероятностью символа (то есть вероятностью, определённой после опыта, заключающегося в наблюдении и анализе сигнала Z(t).) Очевидно, что вероятность правильного приёма будет максимальной в такой решающей схеме, для которой апостериорная вероятность максимальна. Другими словами, критерий идеального наблюдателя обеспечивается решающей схемой, построенной по правилу максимума апостериорной вероятности – решение о принимается в том случае, если выполняется система из m-1 неравенств: (3.3) Согласно известной формуле Бейеса для : (3.4) где – n-мерная плотность вероятности вектора Z, – априорная вероятность передачи символа (то есть та вероятность, которая имеет место до наблюдения и анализа, определяемая статистикой источника сообщения и правилом кодирования). Подставив (3.4) в (3.3) и учитывая, что – безусловная плотность вероятности, не являющаяся функцией i, можно записать правила решения для идеального наблюдателя в следующей форме: , (3.5) где – функция правдоподобия i -той гипотезы Для построения решающей схемы по правилу (3.5) необходимо знать априорные вероятности символов , определяемые источником, а также свойства модулятора и канала, определяющие условные плотности вероятности. – функции правдоподобия. Недостатком критерия максимума апостериорной вероятности является тот факт, что он обеспечивает большую вероятность правильного приёма за счёт сокращения области маловероятных и расширения области приёма высоковероятных символов; в результате редко передаваемые символы передавались бы менее надёжно, а они несут больше информации. II. Правило (3.5) можно записать иначе- решение о том, что передавался символ , должно приниматься, если для всех выполняется m-1 неравенств: (3.6) Отношение в левой части этого неравенства называется отношением правдоподобия двух гипотез о том, что передавался символ . Его обозначают . Для двоичной системы правило сводится к проверке (3.7) Во многих случаях различные ошибки приводят к различным последствиям. III. Учёт последствий ошибок различного рода (связанных с передачей различных символов приводит к обобщению критерия идеального наблюдателя, известного под названием критерия минимального среднего риска (или байесовского критерия). Если при передаче символа принят символ , то при имеет место ошибка. Чтобы учесть неравноценность различных ошибок, будем с каждой парой символов и связывать некоторую численную величину, называемую «потерей», обозначив её Lij. Величина «потери» зависит от того какой символ принят вместо переданного . Правильному приёму при этом приписывается нулевая потеря. Так как при передаче символа символ появляется с определёнными вероятностями как реализации некоторой дискретной случайной величины, можно говорить об условном математическом ожидании величины «потери» при передаче конкретного символа . Назовём это условное математическое ожидание условным риском: (3.8) Интервал берётся по области решающей схемы и представляет вероятность того, что сигнал Z(t) попал в эту область, если передавался символ . Усреднив условный риск по всем символам , получим величину, называемую средним риском: (3.9) Критерий минимального среднего риска заключается в том, что оптимальной считается решающая схема, обеспечивающая наименьшее значение среднего риска . Приёмник, работающий по такому критерию называется байесовским. Из (3.9) видно, что при использовании этого критерия нужно помимо априорных вероятностей передачи отдельных символов знать и величины потерь Lij. Заметим, что если считать все ошибки равноценными (), то критерий минимального среднего риска совпадает с критерием идеального наблюдателя, а байесовский приёмник совпадает с идеальным приёмником Котельникова. IV Ситуация, в которой практически невозможно определить априорную вероятность передачи отдельных элементарных сообщений, а последствия ошибок разного рода неодинаковы, особенно типична для радиолокации, когда приёмник, анализируя принимаемое колебание Z(t) (отражённый сигнал плюс помеха), должен определить, имеется в данном направлении и на данном расстоянии объект наблюдения (цель) или нет. Последствия двух родов ошибок ложной тревоги и пропуска цели – неравноценны. В этой и других сходных ситуациях чаще всего пользуются критерием приёма, известным под названием критерия Неймана Пирсона. Суть его заключается в том, что решающая схема считается оптимальной, если при заданной вероятности ложной тревоги обеспечивается минимальная вероятность пропуска цели . Введём в рассмотрение функции правдоподобия гипотезы об отсутствии цели w(Z/0) и о наличии цели w(Z/1). Минимизация при заданной величине достигается, если решение о наличии цели принимается при выполнении неравенства. (3.10) Где – пороговый уровень, определяемый заданной вероятностью ложной тревоги
В технике связи преимущественно применяют правило максимального правдоподобия. В том случае, когда все символы передаются равновероятно, правило максимального правдоподобия переходит в критерий идеального наблюдателя. Часто это правило решения применяют и при неизвестных или известных но не одинаковых априорных вероятностях символов. Правило максимального правдоподобия переходит в критерий минимума среднего риска, если положить . Существуют так же и другие критерии, например, критерий взвешенной вероятности ошибки, минимаксный критерий, при котором коэффициент потерь считается заданным и другие. Выбор того или иного варианта критерия оптимальности называют стратегией. Стратегия определяется исходными данными при проектировании. Наиболее простая стратегия соответствует критерию максимального правдоподобия. Рассматриваемые задачи в статистической теории связи классифицируются как задачи распознавания и задачи обнаружения сигнала. Например, при амплитудной телеграфии (АТ) – передача с «пассивной паузой» - приёмное устройство выполняет функции обнаружителя. (Термин «обнаружение» первоначально возник в радиолокации). В случае частотной или фазовой телеграфии (ЧТ или ФТ) приёмное устройство работает по принципу распознавания.
3.4 Алгоритм оптимального приёма при полностью известных сигналах. Когерентный приём
Полностью известными называются сигналы, у которых известны информационные параметры (то есть параметры, которые модулируются). Когерентный приём – это приём полностью известных сигналов. Предположим, что в канале действует наиболее типичная помеха – гауссовский аддитивный шум N(t), который в начале будем считать белым (широкополосным) со спектральной плотностью . Это значит, что при передаче сигнала (символа , i=0, 1, …, m-1) приходящий сигнал можно описать моделью: (3.11) где все известны. Неизвестны лишь реализация помехи и индекс i действительно переданного сигнала, который и должна определить решающая схема. Будем так же считать, что все сигналы являются финитными. Определим в этих условиях алгоритм работы оптимального приёмника, анализирующего сигнал на тактовом интервале 0-Т по критерию максимального правдоподобия. Алгоритм предусматривает ряд отдельных последовательных действий – «шагов» 1) Примем так называемую нулевую (или шумовую) гипотезу: S(t)=0; Z(t)=N(t) То есть предположим, что на вход приёмника поступает только шум. 2) Задача затрудняется тем, что ширина спектра сигнала бесконечна (поскольку он финитный), а поэтому пространство сигналов бесконечное. Для таких сигналов не существует плотности вероятностей. Однако существуют n-мерные плотности вероятностей для любых n сечений сигнала. Поэтому заменим белый шум квазибелым, имеющим ту же одностороннюю спектральную плотность мощности , но только в некоторой полосе частот F. 3) Возьмём на тактовом интервале (Т) n равноотстоящих сечений через . Отсчёты в этих сечениях квазибелого гауссовского шума независимы. 4) Поэтому n-мерная плотность вероятностей для взятых отсчётов: (3.12) где – дисперсия (мощность) квазибелого шума. 5) При гипотезе, что передавался символ , согласно (3.11) . Следовательно, условная n-мерная плотность вероятности сечений Z(t) определяется такой же формулой, как и (3.12), если заменить разностью , представляющей при этой гипотезе шум: (3.13) 6) Отношение правдоподобия для сигнала (относительно дополнительной гипотезы), вычисленное для n сечений: (3.14) 7) Заменим дисперсию её выражением Тогда (3.15) 8) По правилу максимума правдоподобия в случае квазибелого шума решающая схема должна выбирать значение i, обеспечивающее максимум . Вместо максимума можно отыскивать максимум его логарифма: (3.16) 9) Второй член в (3.16) можно при сравнении гипотез не учитывать, он сокращается. Тогда правило решения о том, что передавался символ , согласно (3.7) можно выразить системой неравенств: (3.17) 10) Вернёмся теперь к исходной задаче для белого шума. Для этого будем расширять полосу F, тогда число сечений n стремится к бесконечности, – к нулю. Суммы в (3.17) обратятся в интегралы, и правило решения определяется так: (3.18) Выражение (3.18) определяет те операции (алгоритм работы), которые должен совершать оптимальный приёмник над входным колебанием Z(t).
3.5 Структурное построение оптимального приёмника
Структурная схема приёмного устройства, работающего в соответствии с алгоритмом (3.18) для m=2 Здесь «–» - вычитающие устройства; – генераторы опорных сигналов ; «Кв» - квадраторы; – интегралы; РУ – решающее устройство, определяющее в момент времени, кратные Т (при замыкании ключей), номер ветви с минимальным сигналом. При m> 2 в схеме растёт соответственно число ветвей обработки сигнала, попадающих на РУ. Наличие в схеме квадраторов, призванных обеспечить квадратичное преобразование мгновенных значений входных сигналов во всём их динамическом диапазоне, часто затрудняет её реализацию. Поэтому на основе (3.18) получим эквивалентный алгоритм приёма, не требующий устройств возведения в квадрат. Раскрыв скобки под знаком интеграла и сократив в обеих частях неравенств (3.18) слагаемое , приходим к алгоритму приёма: (3.19) где – энергии ожидаемого сигнала (3.20) Для двоичной системы алгоритм (13.20) сводится к проверке одного неравенства: (3.22) Устройство, непосредственно вычисляющее скалярное произведение (3.23) называют активным фильтром или коррелятором; поэтому приёмник, реализующий алгоритм (3.22), называют корреляционным. На рисунке показана структурная схема приёмного устройства, работающего в соответствии с (3.22). Здесь блоки x – перемножители; – генераторы опорных сигналов – интеграторы; «–» - вычитающие устройства; РУ – решающее устройство, определяющее в моменты времени, кратные Т (при замыкании ключа), i=0, 1 – номер ветви с максимальным сигналом. Если сигналы выбраны таким образом, что все их реализации (а следовательно, и все реализации ) имеют одинаковые энергии (), алгоритм приёма (3.22) (и соответственно его реализация) упрощается (отпадает необходимость в вычитающих устройствах) и принимает вид: (3.24) Из (3.24) видно, что правило решения не изменится, если сигнал z(t), поступающий на вход демодулятора, умножить на любое число. Поэтому система, в которой все реализации сигнала имеют равную энергию, отличается тем, что оптимальный алгоритм приёма в ней не требует знания «масштаба» приходящего сигнала или, другими словами, знания коэффициента передачи k канала. Эта важная особенность обусловила широкое распространение систем сигналов с равной энергией, которые обычно называют системами с активной паузой. Это особенно важно для каналов с замираниями, в которых коэффициент передачи флуктуирует. Для двоичной системы неравенство (3.22) можно представить в более простом виде: , (3.25) где – разностный сигнал; – пороговый уровень. Для системы с активной паузой , что значительно облегчает реализацию оптимальной схемы. Существуют также системы с пассивной паузой. Реализуем алгоритм (3.25) для двоичной системы передачи однополярными импульсами (с пассивной паузой): . При этих сигналах и (3.25) примет следующий вид: (3.26) Рассмотренную систему двоичных сигналов используют в простейших устройствах проводной связи. В радиоустройствах, а также в современных кабельных каналах связи применяют высокочастотные сигналы. Наиболее простыми двоичными системами с гармоническими сигналами являются системы с амплитудой (АМ), фазовой (ФМ) и частотной (ЧМ) манипуляцией. В двоичной АМ . Все входящие сюда постоянные () полагаем известными. Поскольку здесь , правило (3.26) запишется так: Оно реализуется схемой с блоком перемножения приходящего сигнала с опорным сигналом . При двоичной ФМ системе Это – система с активной паузой, и поэтому в (3.25) . Легко убедиться, что правило решения сводится при этом к следующему: – и реализуется той же схемой что двоичная АМ при . В этом случае решающее устройство играет роль дискриминатора полярностей.
3.6 Реализация алгоритма оптимального приёма на основе согласованных фильтров. Свойства согласованного фильтра
Скалярное произведение (3.23) можно вычислить не только с помощью активного фильтра (коррелятора), но и с помощью пассивного линейного фильтра с постоянными параметрами. Если на вход фильтра подать принимаемый сигнал z(t), то напряжение на выходе фильтра можно выразить: , где – импульсная реакция фильтра. Выберем её такой, чтобы в момент t=Т получить y(T), совпадающее со скалярным произведением (3.23). Легко видеть, что это будет выполнено, если (3.27) Такой фильтр называется согласованным с сигналом . То есть фильтром, согласованным с сигналом , называется линейный фильтр с постоянными параметрами и импульсной реакцией: (3.28) Свойства согласованного фильтра: 1. Функция h(t) является зеркальным отображением s(t) относительно оси, проведённой через точку 2. Если финитный сигнал S(t) поступает на вход согласованного фильтра в момент t=0 и заканчивается в момент Т, условие физической реализуемости согласованного фильтра заведомо выполняется, если момент отсчёта – постоянная удовлетворяет условию: (3.29) 3. Передаточная функция согласованного фильтра с импульсной реакцией (3.28) , (3.30) где – функция комплексно-сопряжённая со спектральной плотностью сигнала s(t). Следовательно, АЧХ согласованного фильтра определяется амплитудным спектром сигнала s(t), а его ФЧХ (без учёта слагаемого – , определяемого задержкой ) обратна по знаку фазовой характеристике сигнала s(t). 4.Если на вход фильтра подан сигнал, с которым он согласован, то сигнальная составляющая на выходе согласованного фильтра (3.31) где – временная функция корреляции сигнала. Согласно (3.27) в момент времени Т напряжение на выходе согласованного фильтра пропорционально сигналу на выходе интегратора активного фильтра. Поэтому оптимальный приёмник, реализующий алгоритм (3.22), может быть выполнен и на базе согласованных фильтров. Структурная схема такого приёмника для двоичной системы показана на рисунке Рассмотрим ещё одно важное свойство согласованного фильтра. Будем подавать сумму детерминированного сигнала и белого шума z(t)=s(t)+N(t) на вход различных линейных цепей с постоянными параметрами и измерять в момент отношение мгновенной мощности сигнальной составляющей к средней мощности шума на выходе цепи. Докажем, что это отношение максимально, если цепь является согласованным фильтром. Пусть – спектр входного сигнала, а – передаточная функция некоторой линейной цепи. Тогда спектр сигнальной составляющей на выходе цепи равен . С помощью обратного преобразования Фурье найдём значение в момент (3.32) Мощность шума (дисперсия) на выходе цепи . Искомое отношение (3.33) Согласно неравенству Коши Буняковского-Шварца для любых комплексных функций A(x) и B(x) при , (3.34) причём равенство имеет место только при B(x)=aA(x) (3.33), где a – произвольная постоянная. Применим неравенство Бунявского-Шварца к числителю (3.33). Если положить: , то получим, , (3.35) где – отношение энергии элемента сигнала Е на входе фильтра к спектральной плотности белого шума. Знак равенства согласно (3.34) и (3.35) имеет место тогда, когда передаточная функция удовлетворяет (3.30), то есть для согласованного фильтра, что и требовалось доказать. (.) Рассмотрим возможности реализации согласованных фильтров. Согласованный фильтр для финитного сигнала произвольного вида s(t) можно, в принципе, построить на основе неискажающей длинной линии, обеспечивающей задержку сигнала на время Т, с бесконечной плотностью отводов, расположенных в дискретных точках с разносом , где F – эффективная ширина спектра сигнала. Если на вход А линии в начальный момент подаётся один короткий единичный импульс, аппроксимирующий – функцию, то с отводов снимаются такие же импульсы, разнесённые на интервале , которые пройдя через взвешивающие блоки , поступают поочерёдно на вход ФНЧ. Взвешивающие блоки содержат усилители с коэффициентом усиления , а также при отрицательных -инверторы. Таким образом, приведённая схема представляет собой линейный фильтр, называемый трансверсальным с импульсной реакцией s(t). Если входной импульс подать не в точку А, а в точку B, то будет синтезирован сигнал, представляющий зеркальное отображение s(t). Поэтому та же схема со входом в точке B оказывается фильтром, согласованным с s(t). Существуют различные другие способы реализации фильтра, точно или приближённо согласованного с сигналом заданной формы. Так, например, фильтр, согласованный с прямоугольным импульсом длительностью Т, который по определению должен иметь импульсную реакцию также в форме прямоугольного импульса, можно построить по схеме, содержащей конденсатор, линию задержки на время Т, инвертор и сумматор. Если на вход этого фильтра подать единичный импульс (дельта - функцию), то он зарядит конденсатор до некоторого напряжения. Затем спустя время Т через линию задержки и инвертор такой же входной импульс противоположной полярности поступит на конденсатор и разрядит его. Как следствие, на выходе фильтра образуется в качестве импульсной реакции прямоугольный импульс. Вариант фильтра, согласованного с прямоугольным радиоимпульсом , заданном на интервале (0, T), показан ниже. Он состоит из идеального колебательного контура без потерь, настроенного на частоту и фазовращателя, сдвигающего фазу колебаний контура на – . Линия задержки на Т в схеме и инвертор обеспечивают гашение колебаний фильтра вне интервала (0, T), импульсная же реакция фильтра на этом интервале с учётом фазовращателя , что и обеспечивает согласование. Сравним реализации на активных фильтрах и СФ. 1. Схема с согласованными фильтрами на первый взгляд кажется проще схемы с активными фильтрами, поскольку в ней нет опорных генераторов и не возникает проблемы обеспечения их когерентности (согласование по фазе с приходящим сигналом). Однако и в схеме с согласованными фильтрами имеются свои практические трудности. В этом можно убедится, сравнив эпюры напряжений (без учёта помех в канале) на выходе фильтра (рис. Б), согласованного с прямоугольным радиоимпульсом (рис.А) и на выходе интегратора активного фильтра (рис.В). Отметим, что всюду, за исключением точки t=T, напряжения на выходах обоих фильтров отличаются друг от друга. Из рисунков видно, что допустимая неточность во времени снятия отсчёта максимума сигнала на выходе активного фильтра значительно больше, чем при снятии отсчёта максимума сигнала на выходе согласованного фильтра. При активном фильтре достаточно потребовать, чтобы неточность взятия отсчёта была мала по сравнению с тактовым интервалом Т, а при согласованном фильтре - по сравнению с периодом высокочастотного заполнения радиоимпульса. Трудность обеспечения когерентного отсчёта в согласованном фильтре вполне соизмерима с трудностью реализации когерентных опорных генераторов в активном фильтре. 2. В приёмниках на корреляторах легче осуществить переход на другую частоту. (В случае с СФ – нужно строить новый СФ). Иногда в технике связи используют фильтры, характеристики которых только частично согласованы с характеристиками сигнала. Такие фильтры называются квазиоптимальными.
|