Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Порядок действий





1. Открываем файл 3.txt из директории «10» через HEX – редактор

 

В стандарте кодирования символов Unicode первые 3, или 2, или 4 байта используются для обозначения формы представления символов (UTF-8, UTF-16, UTF-32) и называются BOM (Byte Order Mark – сигнатура, определяющая UTF)

UTF-8 EF BB BF

UTF-16 BE FE FF

UTF-16 LE FF FE

UTF-32 BE 00 00 FE FF

UTF-32 LE FF FE 00 00

 

В данном случае в начале файла у нас первые 3 байта обозначены как EF BB BF.

Что означает, что наш файл записан в кодировке UTF – 8 и для его редактирования нам понадобится таблица символов кодировки UTF – 8. (это Кириллица) http://unicode-table.com/ru/blocks/cyrillic/

В Unicode каждый символ может кодироваться 2+ байтами, при этом каждый символ кодировки ASCII кодируется все также всего одним байтом.

 

2. Начинаем исправлять содержимое файла. Находим первый не совпадающий с оригиналом символ, он обозначен квадратом, кодируется 2мя байтами и на его месте должна быть буква «н»

3. Находим код символа «н» в нашей таблице – это D0 BD

4. Заменяем код «неверного» символа на код символа «н», исправляя тем самым первую букву в слове «ясной»

5. Следующую букву «й» заменяем по аналогии.

6. Таким образом, пользуясь таблицей UTF – 8 и HEX редактором исправляем всё четверостишие, используем 2 байта - 0D (новая строка) и 0A (возврат каретки) для перехода на новую строчку.

 

7. После редактирования - сохраняем файл нажав на значок дискеты, или через меню File -> Save, или сочетанием клавиш ctrl + s. Потом можно открыть сам файл в блокноте и убедиться в результате.

8. Теперь нужно дописать в конец файла свои инициалы и номер группы, для этого добавим пусты байтов в конец файла через меню Edit -> Paste Zero Bytes…

9. Начинаем с перехода на новую строчку дописываем в начало пустых байтов 0D 0A

 

Затем пользуясь таблицей дописываем символы «НПО 243»

10. Сохраняем, открываем файл через блокнот и смотрим на результат.

Вариант 8

 

На «4» балла:

Кодирование текста алгоритмом Хаффмана.

Порядок выполнения:

1. Открыть из директории «10» текстовый файл в соответствии с вариантом.

2. Составить кодовую таблицу по алгоритму Хаффмана двумя способами:

1) на основе составленной частотной таблицы;

2) на основе известной частотной таблицы букв русского языка (см. например http://dict.ruslang.ru/freq.php?act=show&dic=freq_letters&title=%D7%E0%F1%F2%EE%F2%ED%EE%F1%F2%FC%20%E1%F3%EA%E2%20%F0%F3%F1%F1%EA%EE%E3%EE%20%E0%EB%F4%E0%E2%E8%F2%E0)

3. Вычислить коэффициент сжатия алгоритма для составленной и для известной частотных таблиц.

4. Сравнить результаты сжатия с исходным текстом (объем данных), считая, что он закодирован в: а) ASCII; б) UTF-8.

Порядок действий

1. Открываем файл 8.txt из директории «10»

Содержание файла:


Высокой страсти не имея

Для звуков жизни не щадить,

Не мог он ямба от хорея,

Как мы ни бились, отличить.

Бранил Гомера, Феокрита;

Зато читал Адама Смита

И был глубокой эконом,

То есть умел судить о том,

Как государство богатеет,

И чем живет, и почему

Не нужно золота ему,

Когда простой продукт имеет.

Отец понять его не мог

И земли отдавал в залог.

 

2. Подсчитываем количество символов в файле (без учета регистра):

 

Символ Кол-во Символ Кол-во Символ Кол-во Символ Кол-во
а   и   р   щ  
б   й   с   ы  
в   к   т   ь  
г   л   у   э  
д   м   ф   я  
е,ё   н   х   ,  
ж   о   ц   .  
з   п   ч   ;  

 

Символ Частота
о  
т  
е  
и  
а  
м  
н  
л  
к  
с  
г  
у  
,  
р  
д  
в  
б  
з  
ь  
я  
п  
ч  
ж  
й  
ы  
.  
ф  
х  
ц  
щ  
э  
;  

Статистика:

Всего символов: 286 (без пробелов)

 

Всего видов символов: 32

 

Буквенных символов: 273

 

· Высокий регистр: 18

· Низкий регистр 255

Пунктуационных символов: 13

 

*Пробелов: 49

 

 

 

 







Дата добавления: 2015-06-15; просмотров: 342. Нарушение авторских прав; Мы поможем в написании вашей работы!




Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...


Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...


Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...


Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...

Билиодигестивные анастомозы Показания для наложения билиодигестивных анастомозов: 1. нарушения проходимости терминального отдела холедоха при доброкачественной патологии (стенозы и стриктуры холедоха) 2. опухоли большого дуоденального сосочка...

Сосудистый шов (ручной Карреля, механический шов). Операции при ранениях крупных сосудов 1912 г., Каррель – впервые предложил методику сосудистого шва. Сосудистый шов применяется для восстановления магистрального кровотока при лечении...

Трамадол (Маброн, Плазадол, Трамал, Трамалин) Групповая принадлежность · Наркотический анальгетик со смешанным механизмом действия, агонист опиоидных рецепторов...

Гальванического элемента При контакте двух любых фаз на границе их раздела возникает двойной электрический слой (ДЭС), состоящий из равных по величине, но противоположных по знаку электрических зарядов...

Сущность, виды и функции маркетинга персонала Перснал-маркетинг является новым понятием. В мировой практике маркетинга и управления персоналом он выделился в отдельное направление лишь в начале 90-х гг.XX века...

Разработка товарной и ценовой стратегии фирмы на российском рынке хлебопродуктов В начале 1994 г. английская фирма МОНО совместно с бельгийской ПЮРАТОС приняла решение о начале совместного проекта на российском рынке. Эти фирмы ведут деятельность в сопредельных сферах производства хлебопродуктов. МОНО – крупнейший в Великобритании...

Studopedia.info - Студопедия - 2014-2026 год . (0.022 сек.) русская версия | украинская версия