Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

ЗАМЕНЫ И ГАММИРОВАНИЯ





1.1 Основные статистическими характеристиками

открытых текстов

 

Любой метод вскрытия шифра простой замены основан на том обстоятельстве, что с точностью до переобозначений частотные характеристики т -грамм шифртекста и открытого текста одинаковы. При этом используются априорные частотные характеристики предполагаемого открытого текста, получаемые с учетом " характера переписки". Как отмечено в Приложении 1, такие характеристики являются более " рельефными" для литературных текстов и менее " рельефными" для формализованных электронных текстов. Чем менее рельефно распределение знаков текста, тем сложнее задача вскрытия шифра простой замены. Для открытых текстов с " почти равномерным" распределением знаков эта задача становится практически не решаемой. Это следует учитывать и не питать иллюзий о простоте вскрытия шифров простой замены, о которой часто упоминается в популярных книгах по защите информации. Методы " рандомизации" или " сжатия" открытых текстов, например, с использованием компьютерных архиваторов значительно усложняют задачу вскрытия шифра простой замены.

Известно, что рельефность диаграммы текста тесно связана с такой его важной теоретико-информационной характеристикой, как избыточность. Далее мы будем решать задачу вскрытия шифров простой замены лишь при условии, что предполагаемые открытые тексты — это литературные тексты с " приличной" избыточностью. Кроме того, мы будем считать, что при дешифровании мы располагаем достаточно большим числом знаков шифртекста, чтобы опираться не на " фокусы", использованные, например, в известных произведениях Э. А. По и А. КонанДойля, а в большей степени на " статистику".

Алгоритм вскрытия шифров простой замены по тексту криптограммы достаточно сложно формализовать. При любой попытке формализации теряется какой-либо важный нюанс. Поэтому мы укажем лишь основные идеи, лежащие в основе такого алгоритма Обычно выделяют следующие этапы алгоритма:

1. Подсчет частот встречаемости шифробозначений, а также некоторых их сочетаний, например биграмм и триграмм подряд идущих знаков.

2. Выявление шифробозначений, заменяющих гласные и согласные буквы.

3. Выдвижение гипотез о значениях шифробозначений и их проверка.

4. Восстановление истинного значения шифробозначений.

Если длина текста достаточно велика, то найденные на этапе 1 частоты окажутся близкими к табулированным значениям частот знаков (см. табл. 1) [1].

Проведенная на этом этапе работа служит основанием для выдвижения гипотез о значениях шифрвеличин, соответствующих данным шифробозначениям.

Таблица 1.

Частоты букв русского языка (в 32-буквенном алфавите со знаком пробела)

 

¾ 0, 175 O 0, 090 Е, Ё 0, 072 А 0, 062
И 0, 062 Т 0, 053 Н 0, 053 С 0, 045
Р 0, 040 В 0, 038 Л 0, 035 К 0, 028
М 0, 026 Д 0, 025 П 0, 023 У 0, 021
Я 0, 018 Ы 0, 016 З 0, 016 Ь, Ъ 0, 014
Б 0, 014 Г 0, 013 Ч 0, 012 Й 0, 010
Х 0, 009 Ж 0, 007 Ю 0, 006 Ш 0, 006
Ц 0, 004 Щ 0, 004 Э 0, 003 Ф 0, 002

 

При этом учитывается, что каждая буква имеет группу предпочтительных связей (см. табл. 2)[1], которые составляют ее наиболее характерную особенность.

Как правило, такие гипотезы подтверждаются не полностью. Хорошим критерием при этом является " читаемость" восстанавливаемого открытого текста.

Устойчивыми являются также частотные характеристики биграмм, триграмм и четырехграмм осмысленных текстов.

Приведем таблицы частот биграмм для русского языка (табл. 3) (таблица заимствована из книги [2]).

 


Таблица 2

Сочетаемость букв русского языка

Г С Слева   Справа Г С
    л, д, к, т, в, р, н А л, н, с, т, р, в, к, м    
    я, е, у, и, а, о Б о, ы, е, а, р, у    
    я, т, а, е, и, о В о, а, и, ы, с, н, л, р    
    р, у, а, и, е, о Г о, а, р, л, и, в    
    р, я, у, а, и, е, о Д е, а, и, о, н, у, р, в    
    м, и, л, д, т, р, н Е н, т, р, с, л, в, м, и    
    р, е, и, а, у, о Ж е, и, д, а, н    
    о, е, а, и З а, н, в, о, м, д    
    р, т, м, и, о, л, н И с, н, в, и, е, м, к, з    
    ь, в, е, о, а, и, с К о, а, и, р, у, т, л, е    
    г, в, ы, и, е, о, а Л и, е, о, а, ь, я, ю, у    
    я, ы, а, и, е, о М и, е, о, у, а, н, п, ы    
    д, ь, н, о, а, и, е Н о, а, и, е, ы, н, у    
    р, п, к, в, т, н О в, с, т, р, и, д, н, м    
    в, с, у, а, и, е, о П о, р, е, а, у, и, л    
    и, к, т, а, п, о, е Р а, е, о, и, у, я, ы, н    
    с, т, в, а, е, и, о С т, к, о, я, е, ь, с, н    
    ч, у, и, а, е, о, с Т о, а, е, и, ь, в, р, с    
    п, т, к, д, н, м, р У т, п, с, д, н, ю, ж    
    н, а, е, о, и Ф и, е, о, а, е, о, а    
    у, е, о, а, ы, и Х о, и, с, н, в, п, р    
    е, ю, н, а, и Ц и, е, а, ы    
    е, а, у, и, о Ч е, и, т, н    
    ь, у, ы, е, о, а, и, в Ш е, и, н, а, о, л    
    е, б, а, я, ю Щ е, и, а    
    м, р, т, с, б, в, н Ы л, х, е, м, и, в, с, н    
    н, с, т, л Ь н, к, в, п, с, е, о, и    
    с, ы, м, л, д, т, р, н Э н, т, р, с, к    
    ь, о, а, и, л, у Ю д, т, щ, ц, н, п    
    о, н, р, л, а, и, с Я в, с, т, п, д, к, м, л    

 

 


Таблица 3

Таблица частот биграмм русского языка

  А Б В Г Д Е Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ы Ь Э Ю Я
А                                                              
Б                                                              
В                                                              
Г                                                              
Д                                                              
Е                                                              
Ж                                                              
З                                                              
И                                                              
Й                                                              
К                                                              
Л                                                              
М                                                              
Н                                                              
О                                                              
П                                                              
Р                                                              
С                                                              
Т                                                              
У                                                              
Ф                                                              
Х                                                              
Ц                                                              
Ч                                                              
Ш                                                              
Щ                                                              
Ы                                                              
Ь                                                              
Э                                                              
Ю                                                              
Я                                                              
       

Выделение шифробозначений, отвечающих гласным и согласным, основано на характерных свойствах этих букв, учитывающих устойчивую закономерность открытых текстов, связанную с чередованием гласных и согласных букв. Подсчитаны частоты встречаемости биграмм вида гласная-гласная (г, г), гласная-согласная (г, с), согласная-гласная (с, г), согласная-согласная (с, с) в русском тексте длиной в 105 знаков. Результаты подсчета отражены в Таблице 4[1].

Таблица 4

Чередование гласных и согласных

  Г С ВСЕГО
Г      
С      

Для большинства европейских языков характерно следующее свойство. Если шифробозначение часто встречается, равномерно располагается по шифртексту, в отдельных местах чередуется через 1, 2 или 3 знака, сочетается сосредними и редкими (по частоте) шифробозначениями, то это дает основания полагать, что такое шифробозначение скрывает гласную букву. Удвоение гласных в открытом тексте происходит реже, чем согласных. Если некоторое шифробозначение признано гласной, то буква, часто сочетающаяся с ней, скорее всего согласная. В открытом тексте чрезвычайно редко встречаются три, и более, подряд идущие гласные. Четыре, и более, подряд идущие согласные также редки. Важно учитывать также процентное соотношение чисел гласных и согласных в открытом тексте.

При проверке гипотез о значениях шифробозначений полезен поиск в шифртексте слов с характерной структурой, которые часто встречаются в открытом тексте. Для русского языка — это, например, слова сколько, которое, что и т. п. Для английского языка — слова every, that, look, the и т. п. Такие слова выделяются в шифртексте посредством интервалов между повторяющимися частыми буквами, характерными сочетаниями гласных и согласных.

Если с помощью приведенных соображений произведено несколько идентификаций шифробозначений, то дальнейшая работа по вскрытию текста криптограммы не представляет особого труда.







Дата добавления: 2014-11-10; просмотров: 1282. Нарушение авторских прав; Мы поможем в написании вашей работы!




Картограммы и картодиаграммы Картограммы и картодиаграммы применяются для изображения географической характеристики изучаемых явлений...


Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...


Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...


Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

ТЕОРИЯ ЗАЩИТНЫХ МЕХАНИЗМОВ ЛИЧНОСТИ В современной психологической литературе встречаются различные термины, касающиеся феноменов защиты...

Этические проблемы проведения экспериментов на человеке и животных В настоящее время четко определены новые подходы и требования к биомедицинским исследованиям...

Классификация потерь населения в очагах поражения в военное время Ядерное, химическое и бактериологическое (биологическое) оружие является оружием массового поражения...

Метод архитекторов Этот метод является наиболее часто используемым и может применяться в трех модификациях: способ с двумя точками схода, способ с одной точкой схода, способ вертикальной плоскости и опущенного плана...

Примеры задач для самостоятельного решения. 1.Спрос и предложение на обеды в студенческой столовой описываются уравнениями: QD = 2400 – 100P; QS = 1000 + 250P   1.Спрос и предложение на обеды в студенческой столовой описываются уравнениями: QD = 2400 – 100P; QS = 1000 + 250P...

Дизартрии у детей Выделение клинических форм дизартрии у детей является в большой степени условным, так как у них крайне редко бывают локальные поражения мозга, с которыми связаны четко определенные синдромы двигательных нарушений...

Studopedia.info - Студопедия - 2014-2025 год . (0.013 сек.) русская версия | украинская версия