Данная мера неопределенности получила название энтропии
Заметим, что под опытом X мы можем принимать информативный параметр сигнала. Поэтому, говоря об энтропии опыта со случайными исходами, мы с полным правом можем говорить и об энтропии сигнала как о мере его неопределенности до получения конкретной реализации сигнала. Следовательно, мера К. Шеннона является обобщением меры Хартли на случай ансамбля с неравновероятными состояниями. Она, энтропия, позволяет учесть статистические свойства источника информации. Понятие энтропии тесно связано с понятием количества информации. Под количеством информации обычно понимается мера снятой неопределенности в процессе получения сигнала адресатом. Предположим, что априорно ситуация характеризовалась энтропией H1. После получения сигнала энтропия уменьшилась до H2. Тогда количество информации, полученное адресатом, (3.6) Пример 3.1. Сравнить неопределенность, приходящуюся на букву источника информации, Х (алфавита русского языка), характеризуемого ансамблем, представленным в табл. 3.1, с неопределенностью, которая была бы у того же источника при равновероятным использовании букв. При одинаковых вероятностях появления всех 32 букв алфавита неопределенность, приходящаяся на одну букву, составляет
таблица 3.1 Энтропию источника H1(X) для независимых букв (табл. 3.1), находим, используя формулу (3.5):
Пример 3.2. Приводятся значения энтропий Hi, приходится на одну букву русского и английского алфавитов с учетом различных корреляционных (статистических) связей в буквенных сочетаниях (H0, H1, H2, …, HN). Вероятность появления букв в английском алфавите приведены в таблице 3.2. таблица 3.2
Значения энтропии Hi, приходящихся на одну букву с учетом различных многобуквенных сочетаний (H2, H3, …, HN – энтропия на букву текста при учете вероятности появления двухбуквенных H2, трехбуквенных H3, …, HN сочетаний) приведены в таблице 3.3 таблица 3.3
Таким образом, энтропия приходящаяся на одну букву смыслового текста при учете многобуквенных сочетаний уменьшается. Это характеризует избыточность наиболее распространенных языков. Во многих случаях выгодно первоначальный алфавит источника представить при помощи другого алфавита путем кодирования.
3.2 Свойства энтропии [1, 3 и др.]. Рассмотрим основные свойства энтропии, обратив внимание на то, что сформулированные условия для меры неопределенности выполняются. 1. Энтропия является вещественной и неотрицательной величиной, так как для любого i(1≤ i≤ N) pi изменяется в интервале от 0 до 1, log(pi) отрицателен и, следовательно, -pilog(pi) положительна. 2. Энтропия – величина ограниченная. Для слагаемых –pilog(pi) в диапазоне 0< pi≤ 1 ограниченность очевидна. Остается определить предел, к которому стремится слагаемое –pilog(pi) при pi→ 0, поскольку -log(pi) при этом неограниченно возрастает:
Обозначив и воспользовавшись правилом Лопиталя, получим 3. Энтропия обращается в нуль лишь в том случае, если вероятность одного из состояний равна единице; тогда вероятности всех остальных состояний, естественно, равны нулю. Это положение соответствует случаю, когда состояние источника полностью определено. 4. Энтропия максимальна, когда все состояния источника равновероятны, что легко доказывается методом неопределенных множителей Лагранжа: (3.7) 5. Энтропия источника x с двумя состояниями x1 и x2 изменяется от нуля до единицы, достигая максимума при равенстве их вероятностей: График зависимости H(X) в функции p (3.8) приведены на рис. 3.1
Рис. 3.1. Зависимость энтропии H(X) от вероятности p. При p< < (1-p) частная неопределенность, приходящаяся на состояние x1 велика, однако такие состояния источника весьма редки. Состояния x2 реализуются часто, но неопределенность, приходящаяся на такое состояние, очень мала. Поэтому энтропия, характеризующая среднюю неопределенность на одно состояние ансамбля, так же мала. Аналогичная ситуация наблюдается при p> > (1-p). Отметим, что энтропия непрерывно зависит от вероятностей отдельных состояний, что непосредственно вытекает из непрерывности функции –plogp. 6. Энтропия объединения нескольких статистически независимых источников информации равна сумме энтропий исходных источников. Не теряя общности, ограничимся рассмотрением объединения, включающего два источника информации x и y понимают обобщенный источник информации (x, y), характеризующийся вероятностями p(xi, yj) всех возможных комбинаций состояний xi источника X и yj источника Y. Аналогично трактуется и объединение ансамблей. В соответствии с определением энтропия объединения (3.9) здесь p(xi, yj) – вероятности совместной реализации состояний и В случае статистической независимости источников информации x и y запишем тогда Учитывая, что и получим (3.10) Соответственно для энтропии объединения нескольких независимых источников x, y, z имеем (3.11) В дальнейшем для придания общности получаемым результатам о неопределенности выбора будем говорить в основном применительно к математическим моделям источников информации в виде ансамблей. 7. Энтропия характеризует среднюю неопределенность выбора одного состояния из ансамбля. При ее определении используют только вероятности состояний, полностью игнорируя их содержательную сторону. 8. Энтропия как мера неопределенности согласуется с экспериментальными данными, полученными при изучении психологических реакций человека, в частности реакции выбора. Установлено, что время безошибочной реакции на последовательность беспорядочно чередующихся равновероятных раздражителей (например, загорающихся лампочек) растет с увеличением их числа так же, как энтропия. Это характеризует неопределенность выбора одного раздражителя. Замена равновероятных раздражителей неравновероятными приводит к снижению среднего времени реакции ровно настолько, насколько уменьшается энтропия.
3.3 Условная энтропия и ее свойства [1, 2 и др.]. При оценке меры неопределенности выбора исхода опыта часто необходимо учитывать статистические связи, которые в большинстве случаев имеют место как между состояниями двух или нескольких источников, объединенных в рамках одной системы, так и между состояниями, последовательно выбираемыми одним источником. Определим энтропию объединения двух статистически связанных ансамблей X и Y. Объединение ансамблей характеризуется матрицей p(X, Y) вероятностей p(xi, yj) всех возможных комбинаций состояний xi(1≤ i≤ N) ансамбля X и состояний yj(1≤ j≤ k) ансамбля Y: (3.12) Суммируя столбы и строки матрицы (3.12), получим информацию об ансамблях X и Y исходных источников x и y: При известных вероятностях p(xi, yj) появления пары (xi, yj) энтропия системы сигналов X, Y в соответствии с формулой (3.9) определяется выражением (3.13) Проанализируем это выражение. Согласно теореме умножения вероятностей, (3.14) (3.15) Здесь p(yj) и p(xi) – вероятности появления элементов соответственно и ; p(yj|xi) – условная вероятность появления элемента при условии, что уже известен элемент ; p(xi|yj) – условная вероятность появления элемента при условии, что уже известен элемент . Подставив в формулу (3.13) и (3.14), получим Учитывая, что log p(yj)p(xi|yj)=log p(yj)+log p(xi|yj), последнее выражение перепишем в виде Имея в виду, что , получим Рассмотрим сумму . Согласно формуле (3.5) эта сумма представляет собой энтропию сигнала Y. Сумма представляет собой случайную величину, характеризующую неопределенность, приходящуюся на одно состояние ансамбля Y при условии, реализовалась конкретное состояние xi ансамбля X. Эта условная энтропия относительно элемента yj называется частной условной энтропией. Обозначим ее через H(X|yj). В результате получим Сумма представляет собой усредненное значение частной условной энтропии H(X|yj) по всем возможным значениям сигнала Y и называется условной энтропией сигнала X относительно сигнала Y. Обозначив условную энтропию через H(X|Y), получим (3.16) Если в равенство (3.13) подставить выражение (3.15), а не (3.14), то после аналогичных преобразований получим (3.17) Формулы (3.16) и (3.17) позволяет сделать вывод, что энтропия объединения двух сигналов X и Y равна энтропии одного из этих сигналов плюс условная энтропия второго сигнала относительно первого.
|