ИНФОРМАЦИЯ И ЕЕ СВОЙСТВА
Дуальность окружающего мира События, происходящие вокруг нас, можно разделить на два класса: изменения и целенаправленные действия. В соответствии с этим и объекты, окружающие нас, можно подразделить на те, которые могут только изменяться, и те, которые могут действовать целенаправленно. Ко второму классу относятся события из мира живой природы [1-3]. Изменениями обычно называют все, что происходит с окружающими нас объектами и с нами самими с течением времени, независимо от особенностей и скорости отклонения от того состояния, которое мы можем зафиксировать в некоторый данный момент. Изменяется все: «Ничто не вечно под луной». Происходят изменения в соответствии с законами физики и химии, которые, таким образом, и управляют изменениями окружающего нас мира. Физическая и химическая природа объектов и условий, в которых они находятся, с неизбежностью определяют направления, характер и скорость их изменений, будь то атом, человек или Вселенная. Конечным итогом таких изменений всегда и неизбежно является гибель, распад или иная форма превращения материального объекта. Но некоторые объекты способны так изменяться во внешней среде, что одни процессы в них идут чаще, другие реже, адекватно условиям среды. Рассмотрим по одному примеру из первого и второго классов объектов: рост кристаллов и размножение бактерий. Кристаллы могут расти и размножаться, присоединяя к «матрице» –кристаллу все новые молекулы из исходного раствора. Этот процесс является равновесным. Кристаллы не могут разлагать окружающие их вещества на составные части, а уж из этих частей строить дальше самих себя или свое подобие. Но именно так поступают живые организмы, – в данном примере бактерии, – они разлагают окружающие их вещества и уже из полученных «элементарных кирпичиков» строят заново те молекулы, которые используют для своего роста и размножения. Кристаллы для своего роста используют то, что уже есть, живые организмы создают то, что им нужно, используя окружающие их вещества для получения строительного материала и свободной энергии. Различные живые организмы, попав в ту или иную среду, всегда вызывают в ней изменения, так или иначе различающиеся между собой – различия эти не случайны, а определяются природой организма, и всегда подчинены достижению некоторой цели. Здесь будущее как бы доминирует над прошлым. При этом последовательность таких целенаправленных действий, как бы ни казалась она простой или сложной, всегда имеет в виду конечную цель – размножение данного организма. Когда эта цель достигнута, все начинается сначала и завершается тем же, т.е. новым циклом размножения. Таким образом, конечная цель деятельности любого живого организма – его самовоспроизведение. Чтобы понять природу того или иного изменения, достаточно ответить на вопрос: «Почему?». Вопросы типа «Почему светит Солнце?», «Почему ржавеет железо?», «Почему орел может летать?» полностью исчерпываются, если рассмотреть химическую и физическую природу соответствующих явлений. Но вопросы типа «Для чего светит Солнце?» или «Для чего идет дождь?» лишены смысла и ответов не имеют, тогда как вопросы типа «Для чего летает орел?» вполне осмысленны и предполагают тот или иной ответ. Дело в том, что полет орла, как и другие действия живых объектов, относятся к типу целенаправленных. Когда же речь идет о целенаправленных действиях, доминирующее значение приобретает вопрос «Для чего?». Ответ на вопрос «Почему?» здесь не может объяснить природу события, он может позволить понять лишь механизм его осуществления. «Для чего цветут розы?», «Для чего поют соловьи?» – вопросы всем понятные и, кстати сказать, давно получившие ответы. Осуществляют же растения и животные те или иные действия потому, что они устроены так, а не иначе, для того, чтобы их осуществлять... Казуальность и телелогичность – вот те два принципа, которые управляют окружающей нас действительностью. Царство казуальности, или причинно-следственных связей, где настоящее определяется прошедшим, охватывает всю Вселенную, но полностью подвластны ему лишь объекты неживой природы. В должном месте и в должное время в этом царстве возникают и развиваются островки иного мира, где настоящее подчиняется будущему, где те или иные события происходят не только «потому, что...», но также «для того, чтобы...». Этот вторичный по отношению к миру косной материи мир жизни становится все могущественнее, он постепенно как бы вбирает, трансформирует в себя окружающую среду, все в большей степени контролируя происходящие в ней изменения, направляя их в нужное ему русло. Чтобы избежать возможных недоразумений, заметим, что антропоморфизм таких терминов, как «контролирует», «стремится» и т.п., отнюдь не означает, что весь органический мир наделен свободой воли или способностью осознавать свои действия. Просто нет других терминов, более адекватно отражающих те свойства, которые являются общими для всех живых существ, от вирусов до человека, независимо от того, осознаются они соответствующими объектами или нет. Целенаправленность и целесообразность Таким образом, мы наметили свойство, необходимо присущее всем живым организмам. Свойство это – осуществлять целенаправленные действия. Обеспечивается это тем, что живые организмы устроены так, а не иначе, для того, чтобы иметь возможность это делать, т.е. организованы соответствующим образом, или целесообразно. Сопоставим теперь два термина – «целенаправленность» и «целесообразность». Термин «целенаправленность» характеризует действие в предположении, что цель его известна или может быть установлена. Термин же «целесообразность» допускает двоякую интерпретацию: такую организацию, которая делает возможным достижение данной цели, и такую организацию, которая соответствует заранее намеченной цели. Эти две интерпретации термина «целесообразность» не противоречат одна другой, а друг друга дополняют: целесообразность есть такая организация какого-либо объекта, которая предусматривает возможность осуществления им целенаправленного действия. Очевидно, что обеспечить такую организацию какого-либо объекта можно только одним способом – построить его в соответствии с заранее намеченным планом. Это очень важное утверждение. Смысл его состоит в том, что целесообразно устроенные или организованные объекты не могут возникать случайно, в силу удачного стечения обстоятельств. Интуитивно человек пришел к такому заключению давно, что и получило свое отражение в этимологии терминов, используемых для описания специфики устройства и функционирования живых систем. Интуитивность этого заключения и породила существовавшую вплоть до середины XIX века веру в присущую живым организмам «жизненную силу», или «энтелехию», вызывающую их из небытия и управляющую их жизнедеятельностью и размножением. Целенаправленное действие. Его компоненты и характеристики Специфичность целенаправленного действия для живых организмов, причем для всех без исключения, заставляет обратить на это понятие особое внимание. Определение понятия «целенаправленное действие» попытаемся дать, вычленив то, что есть у него общего с изменениями, происходящими при спонтанном течении событий, а что – специфического. Пусть s – «исходная ситуация» или пространство режимов, в котором могут происходить различные события. Пусть Z - одно из таких событий, вероятность осуществления которого 0≤ р ≤1. Тогда спонтанное осуществление Z можно описать преобразованием (10) где w - другие изменения исходной ситуации, неизбежно сопутствующие осуществлению Z. Назовем событие Z «целью». Будем так воздействовать на процессы, протекающие в s, чтобы вероятность осуществления Z увеличилась до значения Р. Это и будет «целенаправленное действие». Описать его можно как (11) где R - ресурсы, содержащиеся в s и идущие на осуществление действия; Q – «механизм», или оператор, применение которого в условиях s приводит к желаемому результату; I – информация, на основании которой этот оператор построен; и w – события, неизбежно сопутствующие осуществлению Z, или «побочные продукты» достижения цели. Назовем R, s, Q, I, Z и w компонентами целенаправленного действия, а р и Р – его характеристиками. Можно утверждать, что преобразование (11) есть полное определение целенаправленного действия: любое действие, сколь бы ни было оно простым или сложным, можно полностью описать, задав его компоненты и характеристики. Сопоставляя выражения (10) и (11), мы видим, что целенаправленные действия отличаются от спонтанных изменений лишь в одном отношении – наличием компонента Q, или оператора. Собственно, целенаправленность воздействия Q на s, приводящая к увеличению вероятности достижения цели Z, обусловливается только тем, что оператор Q организован так, чтобы его «вмешательство» в спонтанный ход событий приводило к такому результату. Именно поэтому структуру или устройство оператора можно назвать целесообразным. Информация Итак, основное наше утверждение, относящееся к оператору как единственному компоненту целенаправленного действия, отличающему его от спонтанного течения событий, можно сформулировать следующим образом: оператор не может возникнуть случайно, сам по себе, а должен быть построен в соответствии с I, т.е. заранее имеющейся программой или планом. Совокупность приемов, правил или сведений, необходимых для построения оператора, будем называть информацией. Обозначать информацию будем символом I. Запись Q(I) будет означать, что данный оператор Q построен в соответствии с данной информацией I. Информацию можно также определить как совокупность закодированных сведений, необходимых для принятия решений и их реализации. Таким образом, мы определили информацию как «руководство к действию», как то, что необходимо для построения любого оператора [4]. Естественно возникают вопросы о правомочности и адекватности такого определения. Мы используем операционное определение понятия «информация», а по ходу изложения дополним его перечислением свойств того, что это понятие отображает. Выбор такого способа не произволен: опыт показывает, что понятие «информация» невозможно вывести из представлений, относящихся к миру вещей, – ведь, как отмечал Н. Винер [5], «информация есть информация, а не материя и не энергия». Определение информации через описание форм ее проявления и ее свойств представляется вполне правомочным. Формой проявления информации, как мы видели, и является оператор – необходимый компонент целенаправленного действия. Посмотрим теперь, насколько наше определение информации адекватно тем представлениям, которые обычно связывают с этим термином. Обыденное понимание слова «информация» наиболее близко к его исходному значению: это либо «сведения, содержащиеся в сообщении» (имя существительное), либо «процесс передачи сведений» (глагол). В обоих случаях слово «информация» отражает тесную связь между «сведениями» (собственно «информация») и содержащими их сообщениями. Этот термин отражает также то, что сообщения служат для передачи сведений от «отправителя» (источника информации) к «адресату» (ее приемнику), которому, следовательно, они для чего-то нужны. Нужность информации предполагает возможность ее использования, а специфика использования информации определяется ее семантикой. Предполагается при этом, что одни и те же сведения – т.е. информация, обладающая одной и той же семантикой, – могут быть переданы от источника к адресату только в виде сообщений, представляющих собой некий физический феномен, т.е. материальный объект. Само собой разумеется, что природа этого феномена может быть самая разнообразная, вне зависимости от семантики информации, или, что то же самое, что с помощью сообщений одной и той же физической природы можно передавать самую разную информацию. Таким образом, информацию можно создавать, принимать, использовать и передавать. Информацию можно также сохранять. Хранение информации, как необходимый промежуточный этап между ее приемом и использованием или приемом и передачей, позволяет также «запасать информацию впрок», про запас, на всякий случай. Физическая природа сообщений или записей, содержащих информацию, в случаях ее приема, хранения, передачи и использования может быть – и, по существу, всегда бывает – разная. Прием или создание информации, ее хранение, передачу и использование будем называть элементарными информационными актами, а осуществление всей совокупности таких актов – информационным процессом. Из повседневного опыта мы знаем, что ни один из информационных актов не может осуществляться сам по себе, спонтанно, – для этого требуются специальные механизмы или устройства. Совокупность механизмов, обеспечивающих полное осуществление информационного процесса, будем называть информационной системой. Элементарной информационной системой будем называть такую, дальнейшее подразделение которой приведет к расчленению механизмов, обеспечивающих осуществление отдельных элементарных информационных актов. Вне информационной системы информация может лишь сохраняться в виде записей на тех или иных физических носителях, но не может быть ни принятой, ни переданной, ни использованной. Ниже мы увидим, что все эти особенности информации, хорошо знакомые нам из повседневного опыта, являются следствиями из ее свойств, общих для всех известных нам видов информации. Посмотрим теперь, какие реальные объекты окружающей нас действительности могут быть названы информационными системами. При этом мы все время должны иметь ввиду, что информация может существовать только в какой-либо информационной системе, в виде «записи» на том или ином «носителе»; что семантика информации не связана со способом ее записи и физической природой носителя. Так как слово «информация» первоначально использовалось только для обозначения содержательной стороны сообщений, которыми обмениваются между собой люди, то естественно, что первой ставшей нам известной информационной системой был также человек. Сообщества людей представляют собой информационные системы высокого ранга, сложнейшим образом переплетающиеся между собой и входящие в единую общечеловеческую информационную суперсистему. Специфическую для человека информацию, которой обмениваются люди при помощи устной и письменной речи, обычно называют знанием. Информацией называют также те сведения, которыми обмениваются между собой животные и которые, будучи восприняты, существенно влияют на их поведение. Такая информация передается от индивида к индивиду посредством различных сигналов, в ходе обучения (например, родителями детенышей), путем подражания другим особям или создается в мозгу животного заново, на основе собственного жизненного опыта. Это –поведенческая информация. Информационными системами, оперирующими с такой информацией, являются все многоклеточные животные, включая человека, а возможно, и некоторые одноклеточные. Третий известный нам вид биологической информации – генетическая. Генетическая информация записана в нуклеиновых кислотах (обычно ДНК) клеток последовательностью оснований и определяет фенотипические особенности всех без исключения живых существ - животных, растений, грибов, бактерий и вирусов. Специфическими для этой информации системами являются все генетические компоненты живых организмов. Утверждение о том, что информация обязательно присуща всем живым объектам, можно дополнить утверждением, что вне живых систем нет и не может быть биологической информации, которая не была бы создана каким-либо живым объектом. На последнем утверждении стоит дополнительно остановиться. У любого живого объекта может измениться количество и семантика содержащейся в нем информации. Есть только три пути таких изменений: получение новой информации, создание ее и утеря тех или иных фрагментов. Для биологических систем очень характерны передача и утеря информации. Получение информации неразрывно связано с получением сообщения, эту информацию содержащего, с последующим ее хранением или перекодировкой и использованием. Использование информации, очевидно, может быть в том случае, если она попадает в иерархически подобную или более высокую информационную систему. Включение ее в систему будет облегчено в семантически родственных системах. Получение информации бывает связано со случайным или неслучайным изменением носителей информации. Это относится к генетической, поведенческой и особенно к логической информации. Утеря фрагментов информации, например генетической, может иметь разные последствия для организмов, в том числе и положительные, но в определенных ситуациях она может попадать во внешнюю среду вне своей информационной системы и будет там находиться до полного разрушения своих носителей. Она может быть также случайно подобрана из внешней среды и включиться в другую информационную систему (горизонтальный перенос генетической информации, см., например [6, 7]), но роль такого рода процессов в эволюции информации никто специально не рассматривал. Изменение окружающей среды является поводом для создания, но никак не источником новой информации. В любом случае, однако, совершенно ясно, что возникать самостоятельно, вне живых организмов, биологическая информация не способна [8]. Однако как в обыденной жизни, так и в научной литературе «информацией» нередко называют все, что может воздействовать на живой организм извне, независимо от его физической и химической природы и независимо от того, являются ли источниками таких воздействий живые или неживые объекты [9]. В подобном контексте к информации можно свести все виды взаимодействия живых и неживых объектов. Здесь опять исчезают различия между совокупностью сигналов, обладающей семантикой, родственных источнику и приемнику, и «слепым» воздействием одного объекта на другой. Чтобы отличать сигналы или воздействия, содержащие информацию, от сигналов, таковыми не являющихся, нужно всегда помнить об условности фиксации информации на ее носителях. Это отражается в строении записывающего и считывающего устройств соответствующих информационных систем, в особенностях материала носителя, способа фиксации, выбора языка и кода и т.д. Имея это в виду, можно отделять носителей реальной информации от информационно пустых, независимо от того, известен их источник или нет. Действительно, какая информация может содержаться в грохоте грома, вспышке молнии или горном обвале? Кем вписана она в эти физические феномены, кому предназначена и о чем повествует? Другое дело, что, будучи восприняты живыми организмами, подобные «сигналы» могут быть использованы для создания информации о той или иной стороне действительности. Лишь в таком переносном смысле их можно именовать «источниками» информации, – и подобными источниками, действительно, могут служить любые объекты и явления. Это же относится к результатам наблюдений, измерений и т.п. процедур, производимых человеком: обработку их нередко называют «обработкой информации», хотя на самом деле это есть один из этапов создания новой информации в человеческом мозге, а не «извлечение» ее из наблюдений и измерений. Таким образом, внешние воздействия, воспринимаемые живыми организмами, можно подразделить на два класса: сообщения, или «носители информации», источниками которых могут служить только другие живые организмы, и просто воздействия, информации не содержащие, источниками которых могут быть любые объекты или явления. Можно думать, что различные рецепторы живых организмов формировались первоначально для восприятия и дифференцировки именно таких воздействий и лишь позже, в ходе эволюции, некоторые из них были дополнительно адаптированы для приема или передачи информации. Такое различение информационных и неинформационных воздействий, которым подвергаются живые организмы, весьма существенно для ясного понимания того, что именно представляет собой информацию. Выше мы видели три вида биологической информации, и четвертого нам не известно. Это – генетическая информация, поведенческая и логическая, или человеческое знание. Для каждого из этих видов информации характерны свои носители, свои записывающие и считывающие устройства, свои информационные системы. Однако, как бы ни различались эти виды информации, всем им присущи общие свойства, характерные именно для информации как таковой, независимо от ее вида или особенностей ее носителей. Фиксируемость информации. Ее носители Свойства, присущие всем видам информации, можно разделить на две группы, внутри каждой из которых они тесно связаны между собой. Ключевым свойством для одной из этих групп является фиксируемость информации, а для другой – ее действенность. Иные свойства, входящие в эти группы, являются как бы раскрытием, проявлением ключевых особенностей в доступных для регистрации формах. Фиксируемостью мы будем называть ту особенность любой информации, что, не будучи «ни материей, ни энергией», она может существовать только в зафиксированном состоянии. Никто никогда нигде не встречался с информацией, которая была бы в «свободном виде», а не в виде «записи» на том или ином физическом носителе. При этом способы записи или фиксации информации на том или ином носителе всегда условны, т.е. не имеют никакого отношения к ее семантике. Условность способов фиксации информации означает, что любой из таких способов, никак не связанных с семантикой, тем не менее однозначно обусловливается двумя факторами, также не имеющими к семантике информации никакого отношения, – это физическая природа носителя и специфика «считывающего устройства» той информационной системы, к которой данная информация относится. Фиксация информации всегда представляет собой ту или иную деформацию носителя, среднее время релаксации которого должно превышать среднее время считывания, что и ограничивает способы записи информации на том или ином носителе. Адекватность способа фиксации информации способу ее считывания означает, что способ записи, носитель и считающее устройство взаимно обусловлены друг другом и могут возникать только совместно. Все эти способы, однако, должны подчиняться одному требованию: запись информации должна иметь апериодическую форму[2]. Это требование может быть реализовано, если носитель информации способен принимать не менее двух различных состояний. Другими словами, для фиксации информации можно использовать не менее двух различных знаков или букв. Важнейшей особенностью фиксации любой информации является возможность последовательной нумерации использованного для этого множества знаков или символов. Эта особенность отражает тот факт, что любая информация осмысленна, что бессмысленной информации не бывает. Простейшей реализацией этой особенности является линейная последовательность символов или сигналов, используемых для фиксации и передачи информации, или возможность считывания их в линейной последовательности. Все это позволяет сформулировать требования к физическим носителям информации, или, точнее, к тем объектам, которые могут служить таковыми. Потенциальным носителем информации может служить любой физический объект, который может существовать не менее чем в двух последовательно различимых состояниях, выступающих в роли знаков или символов, пригодных для фиксации информации. А так как простейшим вариантом различимых состояний физического объекта может быть его наличие или отсутствие, то из этого следует, что потенциальным носителем информации может быть любой феномен окружающего нас мира, наличие или отсутствие которого можно регулировать произвольным образом. Следует, однако, проводить строгое различие между потенциальными носителями информации и ее реальными носителями. Первые могут содержать информацию, а могут и не содержать, а вторые всегда ее содержат. Это подводит нас к вопросу о том, как можно различать, содержит ли данный объект информацию или нет. Однако, прежде чем рассмотреть возможности распознавания информации, остановимся коротко на двух вопросах, тесно с этим связанных: каковы могут быть виды носителей информации и могут ли они существовать вне своих информационных систем? Пользуясь уже устоявшейся терминологией, можно сказать, что формой фиксации информации являются предложения, составленные на том или ином языке в виде последовательности букв того или иного алфавита, нанесенных тем или иным способом на тот или иной физический объект. Таким образом, собственно носителем информации является предложение, составленное на том или ином языке. В соответствии с этим можно различать четыре вида физических носителей: язык, алфавит, способ «печати» и природу «подложки». Каждый из этих видов носителей может варьировать, разрушаться и исчезать независимо один от другого. Очевидно, однако, носители информации должны быть адекватны системам записи. Поэтому в любой полной информационной системе следует различать: систему записи, систему считывания, систему перекодирования информации и носители, которые могут ее содержать. Физические объекты, содержащие информацию, могут находиться как «внутри» своих информационных систем, так и вне их, выпадая оттуда в процессе передачи информации или в результате разрушения содержавших их информационных систем. Таким путем информация может получать независимое от информационной системы, ее породившей, существование, правда, существование весьма убогое. Действительно, вне информационной системы любая информация обречена лишь на более или менее быстрое разрушение, деградацию. Деградация – удел любой информации, «вырвавшейся» из своей информационной системы. Поэтому, если мы и обнаруживаем информацию вне информационной системы, все равно должны быть твердо убеждены, во-первых, в том, что возникла-то она обязательно в какой-либо из информационных систем, а во-вторых, в том, что сама по себе она лишь «деградирует», но не «существует». Теперь мы вплотную подошли к проблеме распознавания. Если имеется некий физический объект и мы хотим выяснить, содержит ли он информацию, то ответ на этот вопрос предполагает хотя бы потенциальную возможность ответить на три следующих вопроса: к какой информационной системе он относится или может относиться? какие способы фиксации информации здесь использованы? и какова семантика этой информации? Естественно, что здесь предполагается искусственное фиксирование информации на данной подложке, а не спонтанное ее возникновение, проистекающее из самой природы объекта. Ведь сведения, которые мы «получаем», анализируя какой-либо объект, могут быть использованы для создания информации об этом объекте, а это не следует смешивать со считыванием информации, в данном объекте содержащейся, – если, конечно, она там имеется. Инвариантность информации по отношению к носителям С фиксируемостью информации теснейшим образом связано такое ее свойство, как инвариантность по отношению к физической природе носителей [10]. Это важнейшее свойство информации, и представлять его себе следует очень ясно. Свойство, или, точнее, принцип, инвариантности информации означает, что одна и та же информация, независимо от ее семантики, может быть «записана» на любом языке, любым алфавитом, т.е. системой знаков, наносимых любыми способами на любые носители. Другими словами, ни количество, ни семантика никакой информации не зависят от того, какая система записи избрана для ее фиксации и какой для этого использован носитель. Инвариантность информации как бы подчеркивает ее внутреннюю независимость от ее материальных оков, ее автономность и суверенность, которые сохраняются как бы наперекор судьбе, обрекающей информацию быть вечным узником мира вещей – ее физических носителей. Инвариантность информации обусловливает возможность использовать разные способы ее фиксации на разных носителях при осуществлении разных элементарных информационных актов – создания, передачи, приема, хранения и использования информации. Для «перевода» информации с одной системы записи на другую или для перекодировки во многих информационных системах существуют специальные устройства. Перевод информации с одного языка на другой или с одной системы записи на другую возможен только благодаря свойству инвариантности. Таким образом, именно инвариантность лежит в основе возможности понимания информации – перевода ее с чуждого языка (или способа записи) на язык (или способ записи), свойственный данной информационной системе. Свойство инвариантности информации по отношению к системе записи и природе носителя также означает, что результаты ее реализации (или использования) не зависят ни от того, ни от другого, а определяются лишь ее семантикой. Ярчайшим примером инвариантности информации может служить наше понимание генетической информации и создание искусственных генов в соответствии с заранее составленным планом. Количество информации и емкость информационной тары Инвариантность информации по отношению к носителям создает принципиальную возможность записи любой информации на одном и том же языке с помощью одного и того же алфавита, т.е. как бы «сведения ее к единому знаменателю». Это, хотя и не явно, было использовано К.Шенноном при решении вопроса о способе определения количества информации. Для этого можно воспользоваться формулой (12) где М - число букв в тексте, a i - порядковый номер одной буквы в алфавите, использованном для записи информации. Здесь k - коэффициент, величина которого зависит от выбора единиц измерения количества информации и основания логарифмов. Если Н выражать в битах, то при q = 2 величина k = 2. При использовании для записи информации бинарного кода (п = 2, р1 = ро = 0,5) величина Нм = М. Другими словами, количество информации, выраженное в битах, равно числу знаков бинарного алфавита, необходимому для ее записи. Последнее утверждение далеко не тривиально. В основе его лежит, во-первых, свойство инвариантности информации по отношению к носителям; во-вторых, представление о емкости информационной тары; в-третьих, способ количественного измерения этой емкости, которым, по существу, и является формула Шеннона. Рассмотрим эти вопросы более внимательно. Свойство инвариантности, как мы уже видели, позволяет утверждать, что одну и ту же информацию можно фиксировать любыми носителями. Носители информации – языки, алфавиты, способы фиксации и подложки – выступают как бы в роли «информационной тары», которая может содержать информацию, причем любую. Если представление о количестве информации не лишено смысла, то отсюда следует, что для фиксации одного и того же количества информации с помощью разных носителей емкость используемой для этого информационной тары должна быть одной и той же. Полагая элементарные носители информации – отдельные буквы алфавита – дискретными, можно утверждать, что одну и ту же информацию, по меньшей мере в пределах одного и того же языка, можно записывать самыми разными алфавитами, содержащими разное число букв, в том числе и бинарным. Формула (1), показывающая, сколько битов информации содержится в некотором сообщении, по существу означает, что для записи этого сообщения бинарным кодом требуется М букв. Формулу (1) можно записать несколько иначе, а именно: (13) Очевидно, что данная формула показывает, сколько знаков М алфавита, состоящего из п букв, требуется для записи данного количества Н информации. Очевидно, что в основе формулы (13) лежит формула (6), означающая, следовательно, сколько информации может «вместиться» в один из символов данного алфавита. Приняв в качестве единицы количества информации один бит и используя разные значения п и pi, легко убедиться, что информационная емкость отдельных символов может быть выражена любым числом, как целым, так и дробным, в том числе апериодическим. Это лучше согласуется с представлением о континуальности, нежели о дискретности самой информации, в отличие от единиц информационной тары. Итак, мы пришли к выводу, что информационная емкость i- го символа любого алфавита, выраженная в битах, равна –log2pi, где piесть частота встречаемости этого символа в данном языке. Это утверждение, выведенное из формулы (6) К. Шеннона, можно назвать правилом Шеннона. Заметим, однако, что в работах самого К. Шеннона речь идет не об информационной емкости, а о количестве информации. Справедливо полагая, что количество информации, связанной с каким-либо сообщением, не должно зависеть от его семантики, К. Шеннон формулировал вопрос так: сколько информации получает адресат, воспринимая каждую из букв сообщения? Количество такой информации он и предложил выражать через величину Н и постулировал аддитивность этой величины по отношению к любому числу символов, составляющих сообщение. При этом непроизвольно произошла подмена терминов: понятие об информации, как о содержательной стороне сообщения, было подменено понятием о количестве информации, представляющем собой функцию статистических характеристик составляющих сообщение символов. Эта подмена терминов не имела никаких последствий для развития математической теории связи и даже оказалась для нее благотворной: ведь по каналам связи передают не информацию, а ее носителей, и для оптимизации работы систем связи безразлично, какую именно информацию эти носители содержат и содержат ли они ее вообще. Однако для теории информации эти различия весьма существенны, и вот почему. Рассмотрим два сообщения: «Каин убил Авеля» и «инилА ваКу лебя». Оба они состоят из одинаковых 15 знаков, но первое – вполне осмысленно, т.е. содержит информацию, а второе представляет собой случайную последовательность букв и никакой информации не содержит. Согласно формуле (8), однако, с ними обоими связано одно и то же количество информации –около 45 битов. Если принять это утверждение за истинное, то отсюда следует, что информация может быть лишена семантики, что на самом деле нонсенс, ибо бессмысленной информации не бывает. Но возможен другой выход из этого противоречия: считать, что формула (8) является мерой не количества информации, а емкости информационной тары. Первая фраза – это тара, «полностью загруженная информацией», а вторая фраза это совершенно пустая тара. Очевидно, что емкость тары не зависит от того, загружена она или нет, полностью загружена или частично, а также от того, чем именно она загружена. Если тара заполнена, то ее емкость может служить мерой количества содержащегося в ней груза. Эти простые соображения позволяют сделать три вывода. Во-первых, если H-функцию считать емкостью информационной тары, то ее в равной мере можно прилагать и к осмысленным, и к бессмысленным наборам символов, которые могут служить носителями информации. Во-вторых, одни и те же единицы измерения, биты, можно применять для оценки и емкости тары, и количества информации, которая в ней может содержаться. В-третьих, при измерении в битах количество информации В, содержащейся в сообщении, заключено в интервал 0≤В≤Н, где Н – емкость составляющих сообщение носителей информации. Н сообщения, таким образом, – это верхняя граница того количества информации, которое может в нем содержаться, причем В = Н только при абсолютно компактном тексте. К этим же выводам можно прийти и другим путем, рассматривая смысловое содержание понятия «избыточности», или условную вероятность встречаемости i-ro
|