Язык, как способ представления информации.
Часто сообщения формируются из отдельных знаков. Такие сообщения будем называть дискретными. Дискретным сообщениям принадлежит важная роль в процессах обработки информации. Конечный набор отличных друг от друга знаков, в котором определен порядок, называется алфавитом. Под знаками будем понимать не только буквы и цифры, но и любые отличимые друг от друга объекты. Мощностью алфавита называется количество содержащихся в нем знаков. Примеры алфавитов: алфавит жестов регулировщика движения, алфавит сигналов светофора, алфавит арабских цифр, алфавит русских букв. Совокупность правил построения сообщений из знаков некоторого алфавита и правил интерпретации этих сообщений называется языком. Языки 1) Разговорные языки 2) Языки науки 3) Языки мимики и жестов 4) Специальные языки (азбука Морзе, азбука Брайля для слепых, языки программирования и др.) 5) Языки рисунков и чертежей 6) Языки искусства Возможность дискретизации непрерывного сигнала с любой желаемой точностью (для возрастания точности достаточно уменьшить шаг) принципиально важна с точки зрения информатики. Компьютер - цифровая машина, т. е- внутреннее представление информации в нем дискретно. Дискретизация входной информации (если она непрерывна) позволяет сделать ее пригодной для компьютерной обработки. Существуют и другие вычислительные машины - аналоговые ЭВМ. Они используются обычно для решения задач специального характера и широкой публике практически не известны. Эти ЭВМ в принципе не нуждаются в дискретизации входной информации, так как ее внутреннее представление у них непрерывно. В этом случае все наоборот - если внешняя информация дискретна, то ее «перед употреблением» необходимо преобразовать в непрерывную. Процесс преобразования одного набора знаков в другой набор знаков называется кодированием, а сам результат перевода – кодом. Код характеризуется длиной и структурой. Длиной кода называется количество знаков, которое используется для представления кодируемого символа. Кодирование используется для представления информации в удобной для обработки форме, а иногда – для обеспечения секретности передаваемой информации. В этом случае обычно говорят не «кодирование”, а “шифрование ”. Информация передается в виде сообщений. Дискретная информация записывается с помощью некоторого конечного набора знаков, которые будем называть буквами, не вкладывая в это слово привычного ограниченного значения (типа «русские буквы» или «латинские буквы»). Буква в данном расширенном понимании - любой из знаков, которые некоторым соглашением установлены для общения. Например, при привычной передаче сообщений на русском языке такими знаками будут русские буквы - прописные и строчные, знаки препинания, пробел; если в тексте есть числа - то и цифры. Вообще, буквой будем называть элемент некоторого конечного множества (набора) отличных друг от друга знаков. Множество знаков, в котором определен их порядок, назовем алфавитом (общеизвестен порядок знаков в русском алфавите: А, Б,..., Я). Рассмотрим некоторые примеры алфавитов. 1, Алфавит прописных русских букв: А Б В Г Д Е Е Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я 2. Алфавит Морзе: 3. Алфавит клавиатурных символов ПЭВМ IBM (русифицированная клавиатура):
4. Алфавит знаков правильной шестигранной игральной кости: 5. Алфавит арабских цифр: 6. Алфавит шестнадцатиричных цифр: 0123456789ABCDEF Этот пример, в частности, показывает, что знаки одного алфавита могут образовываться из знаков других алфавитов. 7. Алфавит двоичных цифр: 0 1 Алфавит 7 является одним из примеров, так называемых, «двоичных» алфавитов, т.е. алфавитов, состоящих из двух знаков. Другими примерами являются двоичные алфавиты 8 и 9: 8. Двоичный алфавит «точка, «тире»:. _ 9. Двоичный алфавит «плюс», «минус»: + - 10. Алфавит прописных латинских букв: ABCDEFGHIJKLMNOPQRSTUVWXYZ 11. Алфавит римской системы счисления: I V Х L С D М 12. Алфавит языка блок-схем изображения алгоритмов: 13. Алфавит языка программирования Паскаль. В канале связи сообщение, составленное из символов (букв) одного алфавита, может преобразовываться в сообщение из символов (букв) другого алфавита. Правило, описывающее однозначное соответствие букв алфавитов при таком преобразовании, называют кодом. Саму процедуру преобразования сообщения называют перекодировкой. Подобное преобразование сообщения может осуществляться в момент поступления сообщения от источника в канал связи (кодирование) и в момент приема сообщения получателем (декодирование). Устройства, обеспечивающие кодирование и декодирование, будем называть соответственно кодировщиком и декодировщиком. На рис. 1.3 приведена схема, иллюстрирующая процесс передачи сообщения в случае перекодировки, а также воздействия помех (см. следующий пункт).
Рис. 2.1. Процесс передачи сообщения от источника к приемнику
Рассмотрим некоторые примеры кодов. 1. Азбука Морзе в русском варианте (алфавиту, составленному из алфавита русских заглавных букв и алфавита арабских цифр ставится в соответствие алфавит Морзе): 2. Код Трисиме (знакам латинского алфавита ставятся в соответствие комбинации из трех знаков: 1,2,3):
Код Трисиме является примером, так называемого, равномерного кода (такого, в котором все кодовые комбинации содержат одинаковое число знаков - в данном случае три). Пример неравномерного кода - азбука Морзе. 3. Кодирование чисел знаками различных систем счисления (см. Тему 2.2).
Если мы знаем, как представлен исходный текст и какая таблица используется нашим компьютером, преобразование выполнить очень легко - нужно просто поменять одни коды на другие (по таблице перекодировки). Для этого служат специальные программы - текстовые конверторы. Примеры различных кодировок: Квадрат Полибия»
Код Цезаря» построен таким образом, что каждой букве из верхнего ряда ставится в соответствие буква из нижнего ряда, который получен сдвигом алфавита на три буквы (можно преобразовать код сдвигом на любое количество букв)
«Тарабарская грамота» построен таким образом, что гласные буквы остаются в словах на своих местах, а согласные заменяются по правилу: ищем букву в верхней (нижней) строке и заменяем её на соответствующую букву из нижней (верхней) строки.
«Геометрический шифр»
Код основан на том, что каждой букве ставится в соответствие фигура, в которой она расположена, и фигура с точкой, если эта буква стоит на втором месте. Пример: Д - , Е - С - , Т - Тема 2.2. Кодирование числовой информации с помощью систем счисления Система счисления – это способ представления чисел и соответствующие ему правила действий над числами. В любой системе счисления для представления чисел выбираются некоторые символы (их называют цифрами), а остальные числа получаются в результате каких-либо операций над цифрами данной системы счисления. Для записи чисел в различных системах счисления используется некоторое количество отличных друг от друга знаков. Число таких знаков в позиционной системе счисления называется основанием системы счисления. Ниже приведена табл. 1.4, содержащая наименования некоторых позиционных систем счисления и перечень знаков (цифр), из которых образуются в них числа.
Таблица 2.1. Некоторые системы счисления
Если количество таких цифр равно P, то система счисления называется P-ичной. Основание системы счисления совпадает с количеством цифр, используемых для записи чисел в этой системе счисления. Система называется позиционной, если значение каждой цифры (ее вес) изменяется в зависимости от ее положения (позиции) в последовательности цифр, изображающих число. Примером позиционной системы является общепринятая десятичная система, непозиционной – римская В позиционной системе счисления число может быть представлено в виде суммы произведений коэффициентов на степени основания системы счисления:
AnAn-1An-2 … A1,A0,A-1,A-2 = АnВn + An-1Bn-1 +... + A1B1 + А0В0 + A-1B-1 + А-2В-2 +...
(знак «точка» отделяет целую часть числа от дробной; знак «звездочка» здесь и ниже используется для обозначения операции умножения). Таким образом, значение каждого знака в числе зависит от позиции, которую занимает знак в записи числа. Именно поэтому такие системы счисления называют позиционными. Примеры (десятичный индекс внизу указывает основание системы счисления): 23,43(10) = 2*101 + З*10° + 4*10-1 + З*10-2 (в данном примере знак «З» в одном случае означает число единиц, а в другом - число сотых долей единицы); 692(10) = 6* 102 + 9*101 + 2. («Шестьсот девяносто два» с формальной точки зрения представляется в виде «шесть умножить на десять в степени два, плюс девять умножить на десять в степени один, плюс два»).
1101(2)= 1*23 + 1*22+0*21+ 1*2°; 112(3) = l*32+ 1*31 +2*3°; 341,5(8) =3*82+ 4*81 +1*8° +5*8-1; A1F4(16) = A*162 + 1*161 + F*16° + 4*16-1. В какой системе счисления лучше записывать числа – это вопрос удобства и традиций. С технической точки зрения, в ЭВМ удобно использовать двоичную систему, так как в ней для записи числа используются только две цифры 0 и 1, которые можно представить двумя легко различимыми состояниями “нет сигнала” и “есть сигнал”. Человеку, напротив, неудобно иметь дело с двоичными записями чисел из-за того, что они более длинные, чем десятичные и в них много повторяющихся цифр. Поэтому, при необходимости работать с машинными представлениями чисел используют восьмеричную или шестнадцатеричную системы счисления. Основания этих систем – целые степени двойки, и поэтому числа легко переводятся из этих систем в двоичную и обратно. В шестнадцатеричной системе есть цифры с числовыми значениями 10,11,12, 13,14,15. Для их обозначения используют первые шесть букв латинского алфавита. Приведем таблицу чисел от 0 до 16, записанных в системах счисления с основаниями 10, 2, 8 и 16.
При работе с компьютерами приходится параллельно использовать несколько позиционных систем счисления (чаще всего двоичную, десятичную и шестнадцатиричную), поэтому большое практическое значение имеют процедуры перевода чисел из одной системы счисления в другую.Заметим, что во всех приведенных выше примерах результат является десятичным числом, и, таким образом, способ перевода чисел из любой позиционной системы счисления в десятичную уже продемонстрирован. Чтобы перевести целую часть числа из десятичной системы в систему с основанием В, необходимо разделить ее на В. Остаток даст младший разряд числа. Полученное при этом частное необходимо вновь разделить на В - остаток даст следующий разряд числа и т.д. Для перевода дробной части ее необходимо умножить на В. Целая часть полученного произведения будет первым (после запятой, отделяющей целую часть от дробной) знаком. Дробную же часть произведения необходимо вновь умножить на В. Целая часть полученного числа будет следующим знаком и т.д. Кроме рассмотренных выше позиционных систем счисления существуют такие, в которых значение знака не зависит от того места, которое он занимает в числе. Такие системы счисления называются непозиционными. Наиболее известным примером непозиционной системы является римская. В этой системе используется 7 знаков (I, V, X, L, С, D, М), которые соответствуют следующим величинам: 1(1) V(5) X(10) L(50) С (100) D(500) M(1000) Примеры: III (три), LIX (пятьдесят девять), DLV (пятьсот пятьдесят пять). Недостатком непозиционных систем, из-за которых они представляют лишь исторический интерес, является отсутствие формальных правил записи чисел и, соответственно, арифметических действий над ними (хотя по традиции римскими числами часто пользуются при нумерации глав в книгах, веков в истории и др.). ДВОИЧНАЯ СИСТЕМА СЧИСЛЕНИЯ Способы перевода в двоичный код: http://videouroki.net/view_post.php?id=165 Особая значимость двоичной системы счисления в информатике определяется тем, что внутреннее представление любой информации в компьютере является двоичным, т.е. описываемым наборами только из двух знаков (0 и 1). Конкретизируем описанный выше способ в случае перевода чисел из десятичной системы в двоичную. Целая и дробная части переводятся порознь. Для перевода целой части (или просто целого) числа необходимо разделить ее на основание системы счисления и продолжать делить частные от деления до тех пор, пока частное не станет равным 0. Значения получившихся остатков, взятые в обратной последовательности, образуют искомое двоичное число. Например:
Остаток 25: 2 = 12 (1), 12: 2 = 6 (0), 6: 2 = 3 (0), 3: 2 = 1 (1), 1: 2 = 0 (1).
Таким образом: 25(10)=11001(2).
Для перевода дробной части (или числа, у которого «0» целых) надо умножить ее на 2. Целая часть произведения будет первой цифрой числа в двоичной системе. Затем, отбрасывая у результата целую часть, вновь умножаем на 2 и т.д. Заметим, что конечная десятичная дробь при этом вполне может стать бесконечной {периодической) двоичной. Например:
0,73 • 2 = 1,46 (целая часть 1), 0,46 • 2 = 0,92 (целая часть 0), 0,92 • 2 = 1,84 (целая часть 1), 0,84 • 2 = 1,68 (целая часть 1) и т.д.
В итоге
0,73(10) =0,1011...(2). Над числами, записанными в любой системе счисления, можно; производить различные арифметические операции. Так, для сложения и умножения двоичных чисел необходимо использовать табл. 1.5. Таблица 2.2. Таблицы сложения и умножения в двоичной системе
Заметим, что при двоичном сложении 1 + 1 возникает перенос единицы в старший разряд - точь-в-точь как в десятичной арифметике:
Пример: Перевести данное число из десятичной системы счисления в двоичную: Решение. 464 | 0 380 | 0 |1875 115 | 1 |94 232 | 0 190 | 0 0|375 57 | 1 1|88 116 | 0 95 | 1 0|75 28 | 0 1|76 58 | 0 47 | 1 1|5 14 | 0 1|52 а) 29 | 1 б) 23 | 1 1|0 в) 7 | 1 1|04 14 | 0 11 | 1 3 | 1 0|08 7 | 1 5 | 1 1 | 1 0|16 3 | 1 2 | 0 1 | 1 1 | 1 а) 464(10) = 111010000(2); б) 380,1875(10) = 101111100,0011(2); в) 115,94(10)» 1110011,11110(2) (в настоящем случае было получено шесть знаков после запятой, после чего результат был округлен). ВОСЬМЕРИЧНАЯ И ШЕСТНАДЦАТИРИЧНАЯ СИСТЕМЫ СЧИСЛЕНИЯ С точки зрения изучения принципов представления и обработки информации в компьютере, обсуждаемые в этом пункте системы представляют большой интерес. Хотя компьютер «знает» только двоичную систему счисления, часто с целью уменьшения количества записываемых на бумаге или вводимых с клавиатуры компьютера знаков бывает удобнее пользоваться восьмеричными или шестнадцатиричными числами, тем более что, как будет показано далее, процедура взаимного перевода чисел из каждой из этих систем в двоичную очень проста - гораздо проще переводов между любой из этих трех систем и десятичной. Перевод чисел из десятичной системы счисления в восьмеричную производится (по аналогии с двоичной системой счисления) с помощью делений и умножений на 8. Например, переведем число 58,32(10):
58: 8 = 7 (2 в остатке), 7: 8 = 0 (7 в остатке). 0,32 • 8 = 2,56, 0,56 • 8 = 4,48, 0,48-8=3,84,... Таким образом, 58,32(10) =72,243... (8) (из конечной дроби в одной системе может получиться бесконечная дробь в другой).
Перевод чисел из десятичной системы счисления в шестнадцатеричную производится аналогично. С практической точки зрения представляет интерес процедура взаимного преобразования двоичных, восьмеричных и шестнадцатиричных чисел. Для этого воспользуемся табл. 1.6 чисел от 0 до 15 (в десятичной системе счисления), представленных в других системах счисления. Для перевода целого двоичного числа в восьмеричное необходимо разбить его справа налево на группы по 3 цифры, а затем каждой группе поставить в соответствие ее восьмеричный эквивалент. Например: 11011001= 11011001, т.е. 11011001(2) =331(8). Заметим, что группу из трех двоичных цифр часто называют «двоичной триадой». Перевод целого двоичного числа в шестнадцатиричное производится путем разбиения данного числа на группы по 4 цифры - «двоичные тетрады»: 1100011011001 = 1 1000 1101 1001, т.е. 1100011011001(2)= 18D9(16). Для перевода дробных частей двоичных чисел в восьмеричную или шестнадцатиричную системы аналогичное разбиение на триады или тетрады производится от точки вправо (с дополнением недостающих последних цифр нулями): 0,1100011101(2) =0,110 001 110 100 = 0,6164(8), 0,1100011101(2) = 0,1100 0111 0100 = 0,C74(16). Перевод восьмеричных (шестнадцатиричных) чисел в двоичные производится обратным путем - сопоставлением каждому знаку числа соответствующей тройки (четверки) двоичных цифр. Таблица 2.3 Соответствие чисел в различных системах счисления
Преобразования чисел из двоичной в восьмеричную и шестнадцатиричную системы и наоборот столь просты (по сравнению с операциями между этими тремя системами и привычной нам десятичной) потому, что числа 8 и 16 являются целыми степенями числа 2. Этой простотой и объясняется популярность восьмеричной и шестнадцатиричной систем в вычислительной технике и программировании. Если необходимо перевести число из двоичной системы счисления в систему счисления, основанием которой является степень двойки, достаточно объединить цифры двоичного числа в группы по столько цифр, каков показатель степени, и использовать приведенный ниже алгоритм. Например, если перевод осуществляется в восьмеричную систему, то группы будут содержать три цифры (8 = 23). Итак, в целой части будем производить группировку справа налево, в дробной — слева направо. Если в последней группе недостает цифр, дописываем нули: в целой части — слева, в дробной — справа. Затем каждая группа заменяется соответствующей цифрой новой системы. Соответствия приведены в таблицах.
Для выполнения арифметических операций в системе счисления с основанием P необходимо иметь соответствующие таблицы сложения и умножения. Пример: 1. Сложить числа: 10000000100 223,2 3B3,6 + 111000010 + 427,54 +38B,4 ------------ ------- ----- 10111000110 652,74 73E,A 2. Выполнить вычитание: 1100000011,011 1510,2 27D,D8 - 101010111,1 -1230,54 -191,2 -------------- ------- ------ 110101011,111 257,44 EC,B8 3. Выполнить умножение: 100111 1170,64 61,A *1000111 * 46,3 *40,D ------------- -------------- ---------- 100111 355 234 4F 52 + 100111 + 7324 70 + 1868 100111 47432 0 ---------- 100111 ------------- 18B7,52 ------------- 57334,134
Арифметические действия с числами в шестнадцатиричной системе счисления выполняются по аналогии с двоичной и десятичной системами. Для этого необходимо воспользоваться соответствующими таблицами. Рассмотрим еще один возможный способ перевода чисел из одной позиционной системы счисления в другую - метод вычитания степеней. В этом случае из числа последовательно вычитается максимально допустимая степень требуемого основания, умноженная на максимально возможный коэффициент, меньший основания; этот коэффициент и является значащей цифрой числа в новой системе. Например, число 114(10): 114 - 26 = 114 – 64 = 50, 50 - 25 = 50 – 32 = 18, 18 - 24 = 2, 2 - 21 = 0. Таким образом, 114(10) = 1110010(2).
114 – 1 ∙ 82 = 114 – 64 = 50, 50 – 6 ∙ 81 = 50 – 48 = 2, 2 – 2 ∙ 8° = 2 – 2 = 0. Итак, 114(10)= 162(8).
|