Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Создание и заполнение баз ТМ





Входной и выходной языки задаются на этапе создания базы Translation Memory и не могут быть изменены в дальнейшем. Если создаваемая база ТМ предназначена для подключения к переводу в лингвистическом редакторе PROMT Editor или в других приложениях системы PROMT 8.0, имеющих функции перевода, диалект входного (выходного) языка не имеет значения.

 

Текст, добавляемый в базу ТМ, разбивается на фрагменты в соответствии с определенными правилами, называемыми правилами сегментации. Сегменты выделяются по знакам препинания, обозначающим конец предложения или смыслового фрагмента текста: точка, вопросительный и восклицательный знаки, знак абзаца, двоеточие. Аббревиатура с точкой не считается границей сегмента. Для входного и выходного языков устанавливаются разные правила сегментации.

Рис. 16. Фрагмент текста, сохраненный в базе Translation Memory

 

Правила сегментации бывают двух типов:

Правило — позволяет задать условия, при которых определенные символы (например, точка в конце предложения) являются границами сегментов;

Исключение — позволяет задать условия, при которых определенные символы (например, точка в конструкции "в т. ч.") не являются границами сегментов.

 

Для каждого языка имеется базовый набор правил сегментации и исключений. Кроме того, существует возможность настройки правил сегментации оригинала и перевода при добавлении в базу ТМ из приложения PROMT Editor, а также при импорте параллельных текстов в базу ТМ. Существуют простые правила сегментации и регулярные выражения. Алгоритм построения простых правил и регулярных выражений подробно описан в справочной системе. Если один и тот же набор символов входит и в правило, и в исключение, приоритет имеет правило.

Рис. 17. Правила сегментации текста

 







Дата добавления: 2015-09-15; просмотров: 549. Нарушение авторских прав; Мы поможем в написании вашей работы!




Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...


Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...


Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...


ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...

Седалищно-прямокишечная ямка Седалищно-прямокишечная (анальная) ямка, fossa ischiorectalis (ischioanalis) – это парное углубление в области промежности, находящееся по бокам от конечного отдела прямой кишки и седалищных бугров, заполненное жировой клетчаткой, сосудами, нервами и...

Основные структурные физиотерапевтические подразделения Физиотерапевтическое подразделение является одним из структурных подразделений лечебно-профилактического учреждения, которое предназначено для оказания физиотерапевтической помощи...

Почему важны муниципальные выборы? Туристическая фирма оставляет за собой право, в случае причин непреодолимого характера, вносить некоторые изменения в программу тура без уменьшения общего объема и качества услуг, в том числе предоставлять замену отеля на равнозначный...

ЛЕЧЕБНО-ПРОФИЛАКТИЧЕСКОЙ ПОМОЩИ НАСЕЛЕНИЮ В УСЛОВИЯХ ОМС 001. Основными путями развития поликлинической помощи взрослому населению в новых экономических условиях являются все...

МЕТОДИКА ИЗУЧЕНИЯ МОРФЕМНОГО СОСТАВА СЛОВА В НАЧАЛЬНЫХ КЛАССАХ В практике речевого общения широко известен следующий факт: как взрослые...

СИНТАКСИЧЕСКАЯ РАБОТА В СИСТЕМЕ РАЗВИТИЯ РЕЧИ УЧАЩИХСЯ В языке различаются уровни — уровень слова (лексический), уровень словосочетания и предложения (синтаксический) и уровень Словосочетание в этом смысле может рассматриваться как переходное звено от лексического уровня к синтаксическому...

Studopedia.info - Студопедия - 2014-2025 год . (0.013 сек.) русская версия | украинская версия