Студопедия — ЗАМЕНЫ И ГАММИРОВАНИЯ
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

ЗАМЕНЫ И ГАММИРОВАНИЯ






1.1 Основные статистическими характеристиками

открытых текстов

 

Любой метод вскрытия шифра простой замены основан на том обстоятельстве, что с точностью до переобозначений частотные характеристики т -грамм шифртекста и открытого текста одинаковы. При этом используются априорные частотные характеристики предполагаемого открытого текста, получаемые с учетом " характера переписки". Как отмечено в Приложении 1, такие характеристики являются более " рельефными" для литературных текстов и менее " рельефными" для формализованных электронных текстов. Чем менее рельефно распределение знаков текста, тем сложнее задача вскрытия шифра простой замены. Для открытых текстов с " почти равномерным" распределением знаков эта задача становится практически не решаемой. Это следует учитывать и не питать иллюзий о простоте вскрытия шифров простой замены, о которой часто упоминается в популярных книгах по защите информации. Методы " рандомизации" или " сжатия" открытых текстов, например, с использованием компьютерных архиваторов значительно усложняют задачу вскрытия шифра простой замены.

Известно, что рельефность диаграммы текста тесно связана с такой его важной теоретико-информационной характеристикой, как избыточность. Далее мы будем решать задачу вскрытия шифров простой замены лишь при условии, что предполагаемые открытые тексты — это литературные тексты с " приличной" избыточностью. Кроме того, мы будем считать, что при дешифровании мы располагаем достаточно большим числом знаков шифртекста, чтобы опираться не на " фокусы", использованные, например, в известных произведениях Э. А. По и А. КонанДойля, а в большей степени на " статистику".

Алгоритм вскрытия шифров простой замены по тексту криптограммы достаточно сложно формализовать. При любой попытке формализации теряется какой-либо важный нюанс. Поэтому мы укажем лишь основные идеи, лежащие в основе такого алгоритма Обычно выделяют следующие этапы алгоритма:

1. Подсчет частот встречаемости шифробозначений, а также некоторых их сочетаний, например биграмм и триграмм подряд идущих знаков.

2. Выявление шифробозначений, заменяющих гласные и согласные буквы.

3. Выдвижение гипотез о значениях шифробозначений и их проверка.

4. Восстановление истинного значения шифробозначений.

Если длина текста достаточно велика, то найденные на этапе 1 частоты окажутся близкими к табулированным значениям частот знаков (см. табл. 1) [1].

Проведенная на этом этапе работа служит основанием для выдвижения гипотез о значениях шифрвеличин, соответствующих данным шифробозначениям.

Таблица 1.

Частоты букв русского языка (в 32-буквенном алфавите со знаком пробела)

 

¾ 0, 175 O 0, 090 Е, Ё 0, 072 А 0, 062
И 0, 062 Т 0, 053 Н 0, 053 С 0, 045
Р 0, 040 В 0, 038 Л 0, 035 К 0, 028
М 0, 026 Д 0, 025 П 0, 023 У 0, 021
Я 0, 018 Ы 0, 016 З 0, 016 Ь, Ъ 0, 014
Б 0, 014 Г 0, 013 Ч 0, 012 Й 0, 010
Х 0, 009 Ж 0, 007 Ю 0, 006 Ш 0, 006
Ц 0, 004 Щ 0, 004 Э 0, 003 Ф 0, 002

 

При этом учитывается, что каждая буква имеет группу предпочтительных связей (см. табл. 2)[1], которые составляют ее наиболее характерную особенность.

Как правило, такие гипотезы подтверждаются не полностью. Хорошим критерием при этом является " читаемость" восстанавливаемого открытого текста.

Устойчивыми являются также частотные характеристики биграмм, триграмм и четырехграмм осмысленных текстов.

Приведем таблицы частот биграмм для русского языка (табл. 3) (таблица заимствована из книги [2]).

 


Таблица 2

Сочетаемость букв русского языка

Г С Слева   Справа Г С
    л, д, к, т, в, р, н А л, н, с, т, р, в, к, м    
    я, е, у, и, а, о Б о, ы, е, а, р, у    
    я, т, а, е, и, о В о, а, и, ы, с, н, л, р    
    р, у, а, и, е, о Г о, а, р, л, и, в    
    р, я, у, а, и, е, о Д е, а, и, о, н, у, р, в    
    м, и, л, д, т, р, н Е н, т, р, с, л, в, м, и    
    р, е, и, а, у, о Ж е, и, д, а, н    
    о, е, а, и З а, н, в, о, м, д    
    р, т, м, и, о, л, н И с, н, в, и, е, м, к, з    
    ь, в, е, о, а, и, с К о, а, и, р, у, т, л, е    
    г, в, ы, и, е, о, а Л и, е, о, а, ь, я, ю, у    
    я, ы, а, и, е, о М и, е, о, у, а, н, п, ы    
    д, ь, н, о, а, и, е Н о, а, и, е, ы, н, у    
    р, п, к, в, т, н О в, с, т, р, и, д, н, м    
    в, с, у, а, и, е, о П о, р, е, а, у, и, л    
    и, к, т, а, п, о, е Р а, е, о, и, у, я, ы, н    
    с, т, в, а, е, и, о С т, к, о, я, е, ь, с, н    
    ч, у, и, а, е, о, с Т о, а, е, и, ь, в, р, с    
    п, т, к, д, н, м, р У т, п, с, д, н, ю, ж    
    н, а, е, о, и Ф и, е, о, а, е, о, а    
    у, е, о, а, ы, и Х о, и, с, н, в, п, р    
    е, ю, н, а, и Ц и, е, а, ы    
    е, а, у, и, о Ч е, и, т, н    
    ь, у, ы, е, о, а, и, в Ш е, и, н, а, о, л    
    е, б, а, я, ю Щ е, и, а    
    м, р, т, с, б, в, н Ы л, х, е, м, и, в, с, н    
    н, с, т, л Ь н, к, в, п, с, е, о, и    
    с, ы, м, л, д, т, р, н Э н, т, р, с, к    
    ь, о, а, и, л, у Ю д, т, щ, ц, н, п    
    о, н, р, л, а, и, с Я в, с, т, п, д, к, м, л    

 

 


Таблица 3

Таблица частот биграмм русского языка

  А Б В Г Д Е Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ы Ь Э Ю Я
А                                                              
Б                                                              
В                                                              
Г                                                              
Д                                                              
Е                                                              
Ж                                                              
З                                                              
И                                                              
Й                                                              
К                                                              
Л                                                              
М                                                              
Н                                                              
О                                                              
П                                                              
Р                                                              
С                                                              
Т                                                              
У                                                              
Ф                                                              
Х                                                              
Ц                                                              
Ч                                                              
Ш                                                              
Щ                                                              
Ы                                                              
Ь                                                              
Э                                                              
Ю                                                              
Я                                                              
       

Выделение шифробозначений, отвечающих гласным и согласным, основано на характерных свойствах этих букв, учитывающих устойчивую закономерность открытых текстов, связанную с чередованием гласных и согласных букв. Подсчитаны частоты встречаемости биграмм вида гласная-гласная (г, г), гласная-согласная (г, с), согласная-гласная (с, г), согласная-согласная (с, с) в русском тексте длиной в 105 знаков. Результаты подсчета отражены в Таблице 4[1].

Таблица 4

Чередование гласных и согласных

  Г С ВСЕГО
Г      
С      

Для большинства европейских языков характерно следующее свойство. Если шифробозначение часто встречается, равномерно располагается по шифртексту, в отдельных местах чередуется через 1, 2 или 3 знака, сочетается сосредними и редкими (по частоте) шифробозначениями, то это дает основания полагать, что такое шифробозначение скрывает гласную букву. Удвоение гласных в открытом тексте происходит реже, чем согласных. Если некоторое шифробозначение признано гласной, то буква, часто сочетающаяся с ней, скорее всего согласная. В открытом тексте чрезвычайно редко встречаются три, и более, подряд идущие гласные. Четыре, и более, подряд идущие согласные также редки. Важно учитывать также процентное соотношение чисел гласных и согласных в открытом тексте.

При проверке гипотез о значениях шифробозначений полезен поиск в шифртексте слов с характерной структурой, которые часто встречаются в открытом тексте. Для русского языка — это, например, слова сколько, которое, что и т. п. Для английского языка — слова every, that, look, the и т. п. Такие слова выделяются в шифртексте посредством интервалов между повторяющимися частыми буквами, характерными сочетаниями гласных и согласных.

Если с помощью приведенных соображений произведено несколько идентификаций шифробозначений, то дальнейшая работа по вскрытию текста криптограммы не представляет особого труда.







Дата добавления: 2014-11-10; просмотров: 1252. Нарушение авторских прав; Мы поможем в написании вашей работы!



Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...

ЛЕКАРСТВЕННЫЕ ФОРМЫ ДЛЯ ИНЪЕКЦИЙ К лекарственным формам для инъекций относятся водные, спиртовые и масляные растворы, суспензии, эмульсии, ново­галеновые препараты, жидкие органопрепараты и жидкие экс­тракты, а также порошки и таблетки для имплантации...

Тема 5. Организационная структура управления гостиницей 1. Виды организационно – управленческих структур. 2. Организационно – управленческая структура современного ТГК...

Методы прогнозирования национальной экономики, их особенности, классификация В настоящее время по оценке специалистов насчитывается свыше 150 различных методов прогнозирования, но на практике, в качестве основных используется около 20 методов...

ТЕХНИКА ПОСЕВА, МЕТОДЫ ВЫДЕЛЕНИЯ ЧИСТЫХ КУЛЬТУР И КУЛЬТУРАЛЬНЫЕ СВОЙСТВА МИКРООРГАНИЗМОВ. ОПРЕДЕЛЕНИЕ КОЛИЧЕСТВА БАКТЕРИЙ Цель занятия. Освоить технику посева микроорганизмов на плотные и жидкие питательные среды и методы выделения чис­тых бактериальных культур. Ознакомить студентов с основными культуральными характеристиками микроорганизмов и методами определения...

САНИТАРНО-МИКРОБИОЛОГИЧЕСКОЕ ИССЛЕДОВАНИЕ ВОДЫ, ВОЗДУХА И ПОЧВЫ Цель занятия.Ознакомить студентов с основными методами и показателями...

Меры безопасности при обращении с оружием и боеприпасами 64. Получение (сдача) оружия и боеприпасов для проведения стрельб осуществляется в установленном порядке[1]. 65. Безопасность при проведении стрельб обеспечивается...

Studopedia.info - Студопедия - 2014-2024 год . (0.01 сек.) русская версия | украинская версия