Алфавитный подход к измерению информации
Алфавитный подход к измерению информации позволяет определить количество информации, заключенной в тексте. Алфавитный подход является объективным, т.е. он не зависит от субъекта (человека), воспринимающего текст. Множество символов, используемых при записи текста, называется алфавитом. Полное количество символов в алфавите называется мощностью (размером) алфавита. Если допустить, что все символы алфавита встречаются в тексте с одинаковой частотой (равновероятно), то количество информации, которое несет каждый символ, вычисляется по формуле: I = log 2 N, (1) где N – мощность алфавита. Следовательно, в 2-х символьном алфавите каждый символ «весит» 1 бит; в 4-х символьном алфавите каждый символ несет 2 бита информации; в 8-ми символьном – 3 бита и т.д. Один символ из алфавита мощностью 256 (28) несет в тексте 8 бит информации. Такое количество информации называется байт. Алфавит из 256 символов используется для представления текстов в в компьютере. 1 байт = 8 бит Если весь текст состоит из K символов, то при алфавитном подходе размер содержащейся в нем информации равен: I = K * i, где i – информационный вес одного символа в используемом алфавите. Сегодня 1 байт уже является очень маленькой величиной, поэтому используются более крупные единицы:
1 Кб = 210 б = 1024 байтов 1 Мб = 210 Кб = 1024 Кб = 220 байт = 1 048 576 байт 1 Гб = 210 Мб = 220 Кб = 230 байт = 1 073 741 824 байт 1 Тб = 210 Гб = 220 Мб = 230 Гб = 240 б = 1 099 511 627 776 байт Задача 4. Какова мощность алфавита с помощью которого записано сообщение, содержащее 2048 символов, если его объем составляет 1,25 Кбайта. Решение: Перевести информационный объем сообщения в биты: I = 1,25 * 1024 * 8 = 10240 бит. Определить количество бит, приходящееся на один символ: 10240 бит: 2048 = 5 бит. По формуле I = log 2 N определить количество символов в алфавите: N = 2i = 25=32. Задача 5. Пользователь компьютера, хорошо владеющий навыками ввода информации с клавиатуры, может вводить в минуту 100 знаков. Мощность алфавита, используемого в компьютере равна 256. Какое количество информации в байтах может ввести пользователь в компьютер за 1 минуту? Решение: Определить количество бит, приходящееся на один символ данного алфавита: I = log2256 = 8 бит. Если весь текст состоит из 100 знаков, то количество информации, содержащейся в нем, равно: I = k * i (где k – количество символов, i – информационный объем одного символа в алфавите). I = 100 * 8 бит = 800 бит = 100 байт. Задача 6: Скорость чтения учащегося составляет приблизительно 250 символов в минуту. Приняв мощность используемого алфавита за 64, определите, какой объем информации в килобайтах получит учащийся, если он будет непрерывно читать в течение 40 минут? Решение: Количество информации, которое несет один знак алфавита равен: I = log264 = 6 бит. Количество символов, которые читает учащийся за 40 минут равно: 250 × 40 = 10 000. Количество информации, которое читает учащийся за 40 минут равно: 10 000 × 6 = 60 000 бит = 7,3 Кбайт. Задача 7: Определить количество генетической информации молекулы ДНК человека, которая состоит из около 6 миллиардов нуклеотидов четырех типов (A,G,T,C), которые являются знаками генетического алфавита. Решение: Мощность генетического алфавита равна четырем, следовательно, каждый знак (нуклеотид) несет количество информации, которое можно определить по формуле I = log2N. I = log24 = 2 бита. Объем генетической информации в ДНК человека составляет: 2 бита × 6 000 000 000» 1,4 Гбайт. Задача 8: Какой информационный объем оперативной памяти требуется для хранения текста статьи объемом 4 страницы, на каждой из которых размещены 32 строки по 64 символа? Решение: Информационный объем страницы составляет: 1 байт × 32 × 64 = 2048 байт» 2 Кбайта. Информационный объем 4 страниц составляет: 2 Кбайт × 4 = 8 Кбайт. Соответственно необходимо 8 Кбайт оперативной памяти. Задача 9: Часть страниц многотомной энциклопедии является цветными изображениями в шестнадцатицветной палитре и в формате 320х640 точек; страницы, содержащие текст, имеют формат – 32 строки по 64 символа в строке. Сколько страниц книги можно сохранить на жестком магнитном диске объемом 20 Мб, если каждая девятая страница энциклопедии – цветное изображение? Решение: Найдем, сколько информации содержит одна текстовая страница энциклопедии: Мощность компьютерного алфавита 256. Один символ несет 1байт информации. Значит, страница содержит 32 × 64 = 2048 байт = 2Кбайта информации. Рассчитаем размер страницы, содержащей графический объект: 320 × 640 = 204800 пикселей, каждый пиксель кодируется 16-ю битами, следовательно, объем информации будет равен: 16 бит ×204800 = 3276800 бит = 400Кбайт. Набор из девяти последовательных страниц будет занимать: 2Кбайт × 8 + 400Кбайт = 416Кбайт. На диске объемом 20Мбайт (20480Кбайт) можно записать: 20480/2 = 10240 текстовых страниц, 20480/400 = 51,2 графических страниц, (20480/416) × 9 = 443,67 последовательных страниц энциклопедии (8 текстовых + 1 графическая, 8 текстовых + 1 графическая и т.д.)
|