Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Системы машинного перевода





Перевод – вид человеческой языковой деятельности, в результате которой текст на одном языке ставится в соответствие тексту на другом языке при обеспечении их смысловыми эквивалентами.

Типы перевода по степени автоматизации:

1) Ручной

2) Автоматизированный

а) Перевод, выполняемый ПК с помощью человека (ПК обращается за справками к человеку);

б) Перевод, выполняемый человеком с помощью ПК:

- В памяти ПК двуязычный словарь и текстовый редактор;

- Системы ТМ (Translation Memory) – в их основе лежит принцип сбора и хранения фрагментов переведённых человеком текстов на 2 языках, они хранятся в специальном накопителе перевода и служат бесценным подспорьем при последующем выполнении переводов той же тематики.

3) Машинный (автоматический) – выполняемое ПК действие по преобразованию текста на одном языке в текст на другом языке при сохранении эквивалентности).

· Традиционный (выполненный человеком)

· Статистический (машинный)

Первые теоретические разработки по машинному переводу относятся к 30-40-м, но практическое применение идея машинного перевода нашла в 50-е. Первый машинный перевод был выполнен в Джорджстаунском университете в 1954. В Москве первый машинный перевод был выполнен в 1955. Так как большинство слов имеют несколько значений, то основная трудность заключается именно в выборе нужного варианта, для чего человек использует контекст, жизненный опыт, который фактически невозможно формализовать и загрузить в ПК, => идеального машинного перевода быть не может и человек постоянно участвует в редактировании текста.

 


Вопрос 21.

Типы систем МП:

1) На правилах языка (модель перевода человеком)

а) Структуры систем МП, основанных на первой системе:

 

Текст для перевода
Переведённый текст
Двуязычный словарь
Морфологический анализ исходного языка
Синтаксический анализ исходного языка
Синтаксический синтез переводного языка
Синтаксические соответствия (структура)
Морфологический синтез переводного языка

 


- В процессе морфологического анализа слов предложения исходного языка каждое слово получает наборы лексико-грамматических признаков (часть речи, род и т.д.), ПК формирует эти наборы с опорой на специализированные двуязычные словари;

- Синтаксический анализ предложения исходного языка сводится к поиску основных членов предложения;

- Синтаксический синтез заключается:

a. В создании предложения переводного языка определённой синтаксической структуры, определяемой правилами языков;

b. Замена слов исходного языка на их переводные эквиваленты из словарей.

- Морфологический синтез каждого слова предполагаемого родного языка сводится к постановкам каждого слова в нужную форму, для чего ПК использует лексико-грамматические признаки слов переводного языка.

б) Успех СМП зависит от автоматических словарей. Для всех слов закодированного вида указываются грамматические признаки и лексико-семантическая информация.

в) Используются два типа представления лексических единиц в автоматическом словаре:

- В виде словоформ (словарь включает всевозможные лексические единицы и подаётся гнёздами);

- В виде квазиосновы (числа, стоящие после, условно обозначают наборы суффиксов и окончаний, присоединяемых к основе для получения соответствующей формы, эти числа называются типами формообразования, а сами суффиксы и окончания – машинными окончаниями.

г) Выбор типа лексической единицы зависит от:

- Типа языка (для флективных рациональнее использовать квазиоснову, для языков аналитического типа - словоформу);

- От объёма словаря и вычислительных ресурсов ПК;

- От типа системы СМП (для информативного перевода применяют квазиосноу, для профессионального – словоформу).

д) Преимущества систем первой технологии:

- Синтаксическая и морфологическая точность;

- Стабильность и предсказуемость результатов;

- Возможность настройки на предметную область.

е) Недостатки:

- Трудоёмкость и длительность разработки;

- Необходимость пополнения словарей;

- «Машинный» акцент.

2) Системы второй технологии (основаны на поиске наиболее вероятного перевода с использованием данных из параллельных корпусов);

а) Преимущества:

- Легко построить при наличии двуязычного корпуса;

- Перенос технологии на любые пары языков

- Лексическая гладкость.

б) Недостатки:

- Ограниченность параллельных корпусов и их качество;

- Плохая справляемость с морфологией и синтаксисом;

- Искажение информации.

Обе технологии обладают своими преимуществами и недостатками и не решили задачу по достижению качественного МП. Система Promt разработала «Гибридную технологию перевода». Такой перевод сохраняет преимущества традиционной технологии (формирование синтаксически связанного и грамматически правильного текста) и преимущества статистического метода (быстрое обучение, получение данных из параллельных корпусов в автоматическом режиме и гладкость текстов).

 


Вопрос 22.







Дата добавления: 2015-09-15; просмотров: 618. Нарушение авторских прав; Мы поможем в написании вашей работы!




Шрифт зодчего Шрифт зодчего состоит из прописных (заглавных), строчных букв и цифр...


Картограммы и картодиаграммы Картограммы и картодиаграммы применяются для изображения географической характеристики изучаемых явлений...


Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...


Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...

Уравнение волны. Уравнение плоской гармонической волны. Волновое уравнение. Уравнение сферической волны Уравнением упругой волны называют функцию , которая определяет смещение любой частицы среды с координатами относительно своего положения равновесия в произвольный момент времени t...

Медицинская документация родильного дома Учетные формы родильного дома № 111/у Индивидуальная карта беременной и родильницы № 113/у Обменная карта родильного дома...

Основные разделы работы участкового врача-педиатра Ведущей фигурой в организации внебольничной помощи детям является участковый врач-педиатр детской городской поликлиники...

Шрифт зодчего Шрифт зодчего состоит из прописных (заглавных), строчных букв и цифр...

Краткая психологическая характеристика возрастных периодов.Первый критический период развития ребенка — период новорожденности Психоаналитики говорят, что это первая травма, которую переживает ребенок, и она настолько сильна, что вся последую­щая жизнь проходит под знаком этой травмы...

РЕВМАТИЧЕСКИЕ БОЛЕЗНИ Ревматические болезни(или диффузные болезни соединительно ткани(ДБСТ))— это группа заболеваний, характеризующихся первичным системным поражением соединительной ткани в связи с нарушением иммунного гомеостаза...

Studopedia.info - Студопедия - 2014-2026 год . (0.011 сек.) русская версия | украинская версия