Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Порядок действий





1. Открываем файл 3.txt из директории «10» через HEX – редактор

 

В стандарте кодирования символов Unicode первые 3, или 2, или 4 байта используются для обозначения формы представления символов (UTF-8, UTF-16, UTF-32) и называются BOM (Byte Order Mark – сигнатура, определяющая UTF)

UTF-8 EF BB BF

UTF-16 BE FE FF

UTF-16 LE FF FE

UTF-32 BE 00 00 FE FF

UTF-32 LE FF FE 00 00

 

В данном случае в начале файла у нас первые 3 байта обозначены как EF BB BF.

Что означает, что наш файл записан в кодировке UTF – 8 и для его редактирования нам понадобится таблица символов кодировки UTF – 8. (это Кириллица) http://unicode-table.com/ru/blocks/cyrillic/

В Unicode каждый символ может кодироваться 2+ байтами, при этом каждый символ кодировки ASCII кодируется все также всего одним байтом.

 

2. Начинаем исправлять содержимое файла. Находим первый не совпадающий с оригиналом символ, он обозначен квадратом, кодируется 2мя байтами и на его месте должна быть буква «н»

3. Находим код символа «н» в нашей таблице – это D0 BD

4. Заменяем код «неверного» символа на код символа «н», исправляя тем самым первую букву в слове «ясной»

5. Следующую букву «й» заменяем по аналогии.

6. Таким образом, пользуясь таблицей UTF – 8 и HEX редактором исправляем всё четверостишие, используем 2 байта - 0D (новая строка) и 0A (возврат каретки) для перехода на новую строчку.

 

7. После редактирования - сохраняем файл нажав на значок дискеты, или через меню File -> Save, или сочетанием клавиш ctrl + s. Потом можно открыть сам файл в блокноте и убедиться в результате.

8. Теперь нужно дописать в конец файла свои инициалы и номер группы, для этого добавим пусты байтов в конец файла через меню Edit -> Paste Zero Bytes…

9. Начинаем с перехода на новую строчку дописываем в начало пустых байтов 0D 0A

 

Затем пользуясь таблицей дописываем символы «НПО 243»

10. Сохраняем, открываем файл через блокнот и смотрим на результат.

Вариант 8

 

На «4» балла:

Кодирование текста алгоритмом Хаффмана.

Порядок выполнения:

1. Открыть из директории «10» текстовый файл в соответствии с вариантом.

2. Составить кодовую таблицу по алгоритму Хаффмана двумя способами:

1) на основе составленной частотной таблицы;

2) на основе известной частотной таблицы букв русского языка (см. например http://dict.ruslang.ru/freq.php?act=show&dic=freq_letters&title=%D7%E0%F1%F2%EE%F2%ED%EE%F1%F2%FC%20%E1%F3%EA%E2%20%F0%F3%F1%F1%EA%EE%E3%EE%20%E0%EB%F4%E0%E2%E8%F2%E0)

3. Вычислить коэффициент сжатия алгоритма для составленной и для известной частотных таблиц.

4. Сравнить результаты сжатия с исходным текстом (объем данных), считая, что он закодирован в: а) ASCII; б) UTF-8.

Порядок действий

1. Открываем файл 8.txt из директории «10»

Содержание файла:


Высокой страсти не имея

Для звуков жизни не щадить,

Не мог он ямба от хорея,

Как мы ни бились, отличить.

Бранил Гомера, Феокрита;

Зато читал Адама Смита

И был глубокой эконом,

То есть умел судить о том,

Как государство богатеет,

И чем живет, и почему

Не нужно золота ему,

Когда простой продукт имеет.

Отец понять его не мог

И земли отдавал в залог.

 

2. Подсчитываем количество символов в файле (без учета регистра):

 

Символ Кол-во Символ Кол-во Символ Кол-во Символ Кол-во
а   и   р   щ  
б   й   с   ы  
в   к   т   ь  
г   л   у   э  
д   м   ф   я  
е,ё   н   х   ,  
ж   о   ц   .  
з   п   ч   ;  

 

Символ Частота
о  
т  
е  
и  
а  
м  
н  
л  
к  
с  
г  
у  
,  
р  
д  
в  
б  
з  
ь  
я  
п  
ч  
ж  
й  
ы  
.  
ф  
х  
ц  
щ  
э  
;  

Статистика:

Всего символов: 286 (без пробелов)

 

Всего видов символов: 32

 

Буквенных символов: 273

 

· Высокий регистр: 18

· Низкий регистр 255

Пунктуационных символов: 13

 

*Пробелов: 49

 

 

 

 







Дата добавления: 2015-06-15; просмотров: 342. Нарушение авторских прав; Мы поможем в написании вашей работы!




Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...


Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...


Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...


Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Понятие метода в психологии. Классификация методов психологии и их характеристика Метод – это путь, способ познания, посредством которого познается предмет науки (С...

ЛЕКАРСТВЕННЫЕ ФОРМЫ ДЛЯ ИНЪЕКЦИЙ К лекарственным формам для инъекций относятся водные, спиртовые и масляные растворы, суспензии, эмульсии, ново­галеновые препараты, жидкие органопрепараты и жидкие экс­тракты, а также порошки и таблетки для имплантации...

Тема 5. Организационная структура управления гостиницей 1. Виды организационно – управленческих структур. 2. Организационно – управленческая структура современного ТГК...

Уравнение волны. Уравнение плоской гармонической волны. Волновое уравнение. Уравнение сферической волны Уравнением упругой волны называют функцию , которая определяет смещение любой частицы среды с координатами относительно своего положения равновесия в произвольный момент времени t...

Медицинская документация родильного дома Учетные формы родильного дома № 111/у Индивидуальная карта беременной и родильницы № 113/у Обменная карта родильного дома...

Основные разделы работы участкового врача-педиатра Ведущей фигурой в организации внебольничной помощи детям является участковый врач-педиатр детской городской поликлиники...

Studopedia.info - Студопедия - 2014-2026 год . (0.012 сек.) русская версия | украинская версия