Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

ЗАМЕНЫ И ГАММИРОВАНИЯ





1.1 Основные статистическими характеристиками

открытых текстов

 

Любой метод вскрытия шифра простой замены основан на том обстоятельстве, что с точностью до переобозначений частотные характеристики т -грамм шифртекста и открытого текста одинаковы. При этом используются априорные частотные характеристики предполагаемого открытого текста, получаемые с учетом " характера переписки". Как отмечено в Приложении 1, такие характеристики являются более " рельефными" для литературных текстов и менее " рельефными" для формализованных электронных текстов. Чем менее рельефно распределение знаков текста, тем сложнее задача вскрытия шифра простой замены. Для открытых текстов с " почти равномерным" распределением знаков эта задача становится практически не решаемой. Это следует учитывать и не питать иллюзий о простоте вскрытия шифров простой замены, о которой часто упоминается в популярных книгах по защите информации. Методы " рандомизации" или " сжатия" открытых текстов, например, с использованием компьютерных архиваторов значительно усложняют задачу вскрытия шифра простой замены.

Известно, что рельефность диаграммы текста тесно связана с такой его важной теоретико-информационной характеристикой, как избыточность. Далее мы будем решать задачу вскрытия шифров простой замены лишь при условии, что предполагаемые открытые тексты — это литературные тексты с " приличной" избыточностью. Кроме того, мы будем считать, что при дешифровании мы располагаем достаточно большим числом знаков шифртекста, чтобы опираться не на " фокусы", использованные, например, в известных произведениях Э. А. По и А. КонанДойля, а в большей степени на " статистику".

Алгоритм вскрытия шифров простой замены по тексту криптограммы достаточно сложно формализовать. При любой попытке формализации теряется какой-либо важный нюанс. Поэтому мы укажем лишь основные идеи, лежащие в основе такого алгоритма Обычно выделяют следующие этапы алгоритма:

1. Подсчет частот встречаемости шифробозначений, а также некоторых их сочетаний, например биграмм и триграмм подряд идущих знаков.

2. Выявление шифробозначений, заменяющих гласные и согласные буквы.

3. Выдвижение гипотез о значениях шифробозначений и их проверка.

4. Восстановление истинного значения шифробозначений.

Если длина текста достаточно велика, то найденные на этапе 1 частоты окажутся близкими к табулированным значениям частот знаков (см. табл. 1) [1].

Проведенная на этом этапе работа служит основанием для выдвижения гипотез о значениях шифрвеличин, соответствующих данным шифробозначениям.

Таблица 1.

Частоты букв русского языка (в 32-буквенном алфавите со знаком пробела)

 

¾ 0, 175 O 0, 090 Е, Ё 0, 072 А 0, 062
И 0, 062 Т 0, 053 Н 0, 053 С 0, 045
Р 0, 040 В 0, 038 Л 0, 035 К 0, 028
М 0, 026 Д 0, 025 П 0, 023 У 0, 021
Я 0, 018 Ы 0, 016 З 0, 016 Ь, Ъ 0, 014
Б 0, 014 Г 0, 013 Ч 0, 012 Й 0, 010
Х 0, 009 Ж 0, 007 Ю 0, 006 Ш 0, 006
Ц 0, 004 Щ 0, 004 Э 0, 003 Ф 0, 002

 

При этом учитывается, что каждая буква имеет группу предпочтительных связей (см. табл. 2)[1], которые составляют ее наиболее характерную особенность.

Как правило, такие гипотезы подтверждаются не полностью. Хорошим критерием при этом является " читаемость" восстанавливаемого открытого текста.

Устойчивыми являются также частотные характеристики биграмм, триграмм и четырехграмм осмысленных текстов.

Приведем таблицы частот биграмм для русского языка (табл. 3) (таблица заимствована из книги [2]).

 


Таблица 2

Сочетаемость букв русского языка

Г С Слева   Справа Г С
    л, д, к, т, в, р, н А л, н, с, т, р, в, к, м    
    я, е, у, и, а, о Б о, ы, е, а, р, у    
    я, т, а, е, и, о В о, а, и, ы, с, н, л, р    
    р, у, а, и, е, о Г о, а, р, л, и, в    
    р, я, у, а, и, е, о Д е, а, и, о, н, у, р, в    
    м, и, л, д, т, р, н Е н, т, р, с, л, в, м, и    
    р, е, и, а, у, о Ж е, и, д, а, н    
    о, е, а, и З а, н, в, о, м, д    
    р, т, м, и, о, л, н И с, н, в, и, е, м, к, з    
    ь, в, е, о, а, и, с К о, а, и, р, у, т, л, е    
    г, в, ы, и, е, о, а Л и, е, о, а, ь, я, ю, у    
    я, ы, а, и, е, о М и, е, о, у, а, н, п, ы    
    д, ь, н, о, а, и, е Н о, а, и, е, ы, н, у    
    р, п, к, в, т, н О в, с, т, р, и, д, н, м    
    в, с, у, а, и, е, о П о, р, е, а, у, и, л    
    и, к, т, а, п, о, е Р а, е, о, и, у, я, ы, н    
    с, т, в, а, е, и, о С т, к, о, я, е, ь, с, н    
    ч, у, и, а, е, о, с Т о, а, е, и, ь, в, р, с    
    п, т, к, д, н, м, р У т, п, с, д, н, ю, ж    
    н, а, е, о, и Ф и, е, о, а, е, о, а    
    у, е, о, а, ы, и Х о, и, с, н, в, п, р    
    е, ю, н, а, и Ц и, е, а, ы    
    е, а, у, и, о Ч е, и, т, н    
    ь, у, ы, е, о, а, и, в Ш е, и, н, а, о, л    
    е, б, а, я, ю Щ е, и, а    
    м, р, т, с, б, в, н Ы л, х, е, м, и, в, с, н    
    н, с, т, л Ь н, к, в, п, с, е, о, и    
    с, ы, м, л, д, т, р, н Э н, т, р, с, к    
    ь, о, а, и, л, у Ю д, т, щ, ц, н, п    
    о, н, р, л, а, и, с Я в, с, т, п, д, к, м, л    

 

 


Таблица 3

Таблица частот биграмм русского языка

  А Б В Г Д Е Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ы Ь Э Ю Я
А                                                              
Б                                                              
В                                                              
Г                                                              
Д                                                              
Е                                                              
Ж                                                              
З                                                              
И                                                              
Й                                                              
К                                                              
Л                                                              
М                                                              
Н                                                              
О                                                              
П                                                              
Р                                                              
С                                                              
Т                                                              
У                                                              
Ф                                                              
Х                                                              
Ц                                                              
Ч                                                              
Ш                                                              
Щ                                                              
Ы                                                              
Ь                                                              
Э                                                              
Ю                                                              
Я                                                              
       

Выделение шифробозначений, отвечающих гласным и согласным, основано на характерных свойствах этих букв, учитывающих устойчивую закономерность открытых текстов, связанную с чередованием гласных и согласных букв. Подсчитаны частоты встречаемости биграмм вида гласная-гласная (г, г), гласная-согласная (г, с), согласная-гласная (с, г), согласная-согласная (с, с) в русском тексте длиной в 105 знаков. Результаты подсчета отражены в Таблице 4[1].

Таблица 4

Чередование гласных и согласных

  Г С ВСЕГО
Г      
С      

Для большинства европейских языков характерно следующее свойство. Если шифробозначение часто встречается, равномерно располагается по шифртексту, в отдельных местах чередуется через 1, 2 или 3 знака, сочетается сосредними и редкими (по частоте) шифробозначениями, то это дает основания полагать, что такое шифробозначение скрывает гласную букву. Удвоение гласных в открытом тексте происходит реже, чем согласных. Если некоторое шифробозначение признано гласной, то буква, часто сочетающаяся с ней, скорее всего согласная. В открытом тексте чрезвычайно редко встречаются три, и более, подряд идущие гласные. Четыре, и более, подряд идущие согласные также редки. Важно учитывать также процентное соотношение чисел гласных и согласных в открытом тексте.

При проверке гипотез о значениях шифробозначений полезен поиск в шифртексте слов с характерной структурой, которые часто встречаются в открытом тексте. Для русского языка — это, например, слова сколько, которое, что и т. п. Для английского языка — слова every, that, look, the и т. п. Такие слова выделяются в шифртексте посредством интервалов между повторяющимися частыми буквами, характерными сочетаниями гласных и согласных.

Если с помощью приведенных соображений произведено несколько идентификаций шифробозначений, то дальнейшая работа по вскрытию текста криптограммы не представляет особого труда.







Дата добавления: 2014-11-10; просмотров: 1282. Нарушение авторских прав; Мы поможем в написании вашей работы!




Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...


Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...


Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...


Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Характерные черты официально-делового стиля Наиболее характерными чертами официально-делового стиля являются: • лаконичность...

Этапы и алгоритм решения педагогической задачи Технология решения педагогической задачи, так же как и любая другая педагогическая технология должна соответствовать критериям концептуальности, системности, эффективности и воспроизводимости...

Понятие и структура педагогической техники Педагогическая техника представляет собой важнейший инструмент педагогической технологии, поскольку обеспечивает учителю и воспитателю возможность добиться гармонии между содержанием профессиональной деятельности и ее внешним проявлением...

Объект, субъект, предмет, цели и задачи управления персоналом Социальная система организации делится на две основные подсистемы: управляющую и управляемую...

Законы Генри, Дальтона, Сеченова. Применение этих законов при лечении кессонной болезни, лечении в барокамере и исследовании электролитного состава крови Закон Генри: Количество газа, растворенного при данной температуре в определенном объеме жидкости, при равновесии прямо пропорциональны давлению газа...

Ганглиоблокаторы. Классификация. Механизм действия. Фармакодинамика. Применение.Побочные эфффекты Никотинчувствительные холинорецепторы (н-холинорецепторы) в основном локализованы на постсинаптических мембранах в синапсах скелетной мускулатуры...

Studopedia.info - Студопедия - 2014-2025 год . (0.008 сек.) русская версия | украинская версия