Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Создание и заполнение баз ТМ





Входной и выходной языки задаются на этапе создания базы Translation Memory и не могут быть изменены в дальнейшем. Если создаваемая база ТМ предназначена для подключения к переводу в лингвистическом редакторе PROMT Editor или в других приложениях системы PROMT 8.0, имеющих функции перевода, диалект входного (выходного) языка не имеет значения.

 

Текст, добавляемый в базу ТМ, разбивается на фрагменты в соответствии с определенными правилами, называемыми правилами сегментации. Сегменты выделяются по знакам препинания, обозначающим конец предложения или смыслового фрагмента текста: точка, вопросительный и восклицательный знаки, знак абзаца, двоеточие. Аббревиатура с точкой не считается границей сегмента. Для входного и выходного языков устанавливаются разные правила сегментации.

Рис. 16. Фрагмент текста, сохраненный в базе Translation Memory

 

Правила сегментации бывают двух типов:

Правило — позволяет задать условия, при которых определенные символы (например, точка в конце предложения) являются границами сегментов;

Исключение — позволяет задать условия, при которых определенные символы (например, точка в конструкции "в т. ч.") не являются границами сегментов.

 

Для каждого языка имеется базовый набор правил сегментации и исключений. Кроме того, существует возможность настройки правил сегментации оригинала и перевода при добавлении в базу ТМ из приложения PROMT Editor, а также при импорте параллельных текстов в базу ТМ. Существуют простые правила сегментации и регулярные выражения. Алгоритм построения простых правил и регулярных выражений подробно описан в справочной системе. Если один и тот же набор символов входит и в правило, и в исключение, приоритет имеет правило.

Рис. 17. Правила сегментации текста

 







Дата добавления: 2015-09-15; просмотров: 549. Нарушение авторских прав; Мы поможем в написании вашей работы!




Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...


Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...


Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...


Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Образование соседних чисел Фрагмент: Программная задача: показать образование числа 4 и числа 3 друг из друга...

Шрифт зодчего Шрифт зодчего состоит из прописных (заглавных), строчных букв и цифр...

Краткая психологическая характеристика возрастных периодов.Первый критический период развития ребенка — период новорожденности Психоаналитики говорят, что это первая травма, которую переживает ребенок, и она настолько сильна, что вся последую­щая жизнь проходит под знаком этой травмы...

Медицинская документация родильного дома Учетные формы родильного дома № 111/у Индивидуальная карта беременной и родильницы № 113/у Обменная карта родильного дома...

Основные разделы работы участкового врача-педиатра Ведущей фигурой в организации внебольничной помощи детям является участковый врач-педиатр детской городской поликлиники...

Ученые, внесшие большой вклад в развитие науки биологии Краткая история развития биологии. Чарльз Дарвин (1809 -1882)- основной труд « О происхождении видов путем естественного отбора или Сохранение благоприятствующих пород в борьбе за жизнь»...

Studopedia.info - Студопедия - 2014-2026 год . (0.008 сек.) русская версия | украинская версия