Студопедия — Г. Москва. К вопросу совершенствования МП
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Г. Москва. К вопросу совершенствования МП






К вопросу совершенствования МП. Роль современных компьютерных технологий в совершенствовании МП

Под термином «компьютерная лингвистика» обычно понимается широкая область использования компьютерных инструментов – программ, компьютерных технологий организации и обработки данных – для моделирования функционирования языка в тех или иных условиях, ситуациях, проблемных сферах, а также сфера применения компьютерных моделей языка в лингвистике и смежных дисциплинах. Собственно, только в последнем случае и идет речь о ПЛ в строгом смысле, поскольку компьютерное моделирование языка может рассматриваться и как сфера приложения информатики и теории программирования к решению задач науки о языке. На практике, однако, к компьютерной лингвистике относят практически все, что связано с использованием компьютеров в языкознании.

Как особое научное направление компьютерная лингвистика оформилась в 1960-е годы. Русский термин «компьютерная лингвистика» является калькой с английского computational linguistics. Поскольку прилагательное computational по-русски может переводиться и как «вычислительный», в литературе встречается также термин «вычислительная лингвистика», однако в отечественной науке он приобретает более узкое значение, приближающееся к понятию «квантитативной лингвистики». Поток публикаций в этой области очень велик. Кроме тематических сборников, в США ежеквартально выходит журнал «Компьютерная лингвистика». Большую организационную и научную работу проводит Ассоциация по компьютерной лингвистике, которая имеет региональные структуры (в частности, европейское отделение). Каждые два года проходят международные конференции по компьютерной лингвистике – COLING. Соответствующая проблематика обычно бывает широко представлена также на различных конференциях по искусственному интеллекту.

К компетенции компьютерной лингвистики относится МП, переживающий в настоящее время второе рождение.

Оптимизация функционирования языка как средства передачи информации. Наука о переводе (англ. translation studies; нем. Ubersetzungswissenschaft или Translationswissenschaft) включает несколько направлений, среди которых выделяются теория перевода, анализ перевода, методика обучения переводу. Особое место занимает МП – научная и одновременно технологическая дисциплина, связанная и с наукой о переводе, к с компьютерной лингвистикой. Как и многие другие разделы прикладной лингвистики, наука о переводе по существу междисциплинарна и часто заимствует идеи не только из лингвистики, но и из литературоведения, когнитивных наук и культурной антропологии. По характеру переводческой деятельности традиционно выделяются устный и письменный перевод. Хотя с лингвистической точки зрения между этими видами перевода принципиальной разницы нет, психологически они сильно отличаются друг от друга. Прикладной аспект теории перевода связан, в первую очередь, с выявлением проблем несоответствия между грамматическими и лексическими системами различных языков, а также с различиями в прагматическом аспекте функционирования языковой системы. Сюда относятся сложности в категоризации действительности, обусловленные грамматическими особенностями различных языков (например, несовпадение набора грамматических категорий), спецификой лексического значения и т.п. Важнейшая лингвистическая проблема науки о переводе – адекватная передача так называемых «скрытых категорий» – категории неотчуждаемой принадлежности, определенности-неопределенности и пр. Будучи в одних языках грамматическими, в других языках эти аспекты значения могут выражаться не регулярно, а лишь при определенных условиях, что существенно осложняет работу, переводчика.

Современный МП следует отличать от использования компьютеров в помощь человеку-переводчику. В последнем случае имеется в виду автоматический словарь, помогающий человеку быстрее подбирать нужный переводной эквивалент. Хотя и в том, и в другом случае компьютер работает вместе с человеком (переводчиком или редактором), в содержание термина «МП» входит представление о том, что главную, большую часть работы по переводу и отысканию переводных эквивалентов и переводных соответствий машина берет на себя, оставляя человеку лишь контроль и исправление ошибок, в то время как компьютерный словарь в помощь человеку – это чисто вспомогательное средство для быстрого нахождения переводных соответствий; при этом, однако, в такого рода словарях в ограниченной степени могут быть реализованы и некоторые функции, присущие системам МП.

В практике переводческой деятельности и в информационной технологии различаются два основных подхода к МП. С одной стороны, результаты МП могут быть использованы для поверхностного ознакомления с содержанием документа на незнакомом языке. В этом случае он может использоваться как сигнальная информация и не требует тщательного редактирования. Другой подход предполагает использование МП вместо обычного «человеческого». Это предполагает тщательное редактирование и настройку системы перевода на определенную предметную область. Здесь играют роль полнота словаря, ориентированность его на содержание и набор языковых средств переводимых текстов, эффективность способов разрешения лексической многозначности, результативность работы алгоритмов извлечения грамматической информации, нахождения переводных соответствий и алгоритмов синтеза. На практике перевод такого типа становится экономически выгодным, если объем переводимых текстов достаточно велик (не менее нескольких десятков тысяч страниц в год), если тексты достаточно однородны, словари системы полны и допускают дальнейшее расширение, а программное обеспечение удобно для пост-редактирования. Такого рода системы МП используются в организациях, потребности, которых в оперативных и качественных переводах достаточно велики.

Качество перевода зависит от тематики и стиля исходного текста. МП художественных текстов практически всегда оказывается неудовлетворительного качества. Тем не менее для технических документов при наличии специализированных машинных словарей и некоторой настройке системы на особенности того или иного типа текстов возможно получение перевода приемлемого качества, который нуждается лишь в небольшой редакторской корректировке. Чем более формализован стиль исходного документа, тем большего качества перевода можно ожидать. Самых лучших результатов при использовании МП можно достичь для текстов, написанных в техническом (различные описания и руководства) и официально-деловом стиле.

Применение МП без настройки на тематику (или с намеренно неверной настройкой) служит предметом многочисленных бродящих по Интернету шуток. Из пространных примеров наиболее известен текст «Гуртовщики Мыши» (перевод компьютерной документации программой Poliglossum на основе медицинского, коммерческого и юридического словарей); из кратких – фраза «My cat has given birth to four kittens, two yellow, one white and one black», которую, переводчик компании ПРОМТ превращает в «Моя кошка родила четырёх котят, два желтых цвета, одного белого и одного афроамериканца». Главной причиной того, почему программа перевела именно так, было то, что после слова black нужно было добавить kitten, тогда программа переведёт правильно: «Моя кошка родила четырёх котят: двух жёлтых, одного белого и одного чёрного котёнка».

Чаще всего подобные шутки связаны с тем, что программа не распознаёт контекст фразы и переводит термины дословно, к тому же не отличая собственных имён от обычных слов. Тот же переводчик ПРОМТ превращает «bra-ket notation» в «примечание Кети лифчика», «Lie algebra» – в «алгебру Лжи», «eccentricity vector» – в «вектор оригинальности», «Shawnee Smith» в «индеец племени шони Смит» и т.п.

 

Литература:

1. Ахманова О.С. Словарь лингвистических терминов. / О.С. Ахманова. 2-е изд. – М.: Советская энциклопедия, 1969.

2. Блумфилд Л. Язык. / Л. Блумфилд. Пер. с англ. – М.: Прогресс, 1968.

3. Будагов Р.А. Введение в науку о языке. / Р.А. Будагов. 3-е изд. - М.: Добросвет-2000, 2003.

4. Гак В.Г. Языковые преобразования. / В.Г. Гак. – М.: ЯРК, 1998.

5. Гумбольдт В. Избранные труды по языкознанию. / В. Гумбольдт – М.: Прогресс, 1984.

6. Дурново Н.Н. Грамматический словарь (грамматические и лингвистические термины). / Н.Н. Дурново. – М.: Пг., Изд. Л.Д.Френкель, 1924.

7. Есперсен О. Философия грамматики. / О. Есперсен. Пер. с англ. – М.: ИИЛ, 1958.

8. Журинский А.Н. Лингвистика в задачах. / А.Н. Журинский. – М.: Индрик, 1995.

9. Лайонз Дж. Введение в теоретическую лингвистику. Пер. с англ. М., Прогресс, 1978.

10. Лингвистические задачи. – М.: Просвещение, 1983.

11. Марузо Ж. Словарь лингвистических терминов. / Ж. Марузо. – Изд. ИЛ, 1960.

12. Никитина С.Е. Тезаурус по теоретической и прикладной лингвистике. / С.Е. Никитина. – М.: Наука, 1978.

13. Пауль Г. Принципы истории языка. / Г. Пауль. Пер. с нем. – М.: ИИЛ, 1960.

14. Сепир Э. Язык. / Э. Сепир. – М. - Л.: Соцэкгиз, 1934. - Переиздано в кн.: Э. Сепир Избранные труды по языкознанию и культурологии. – М.: 1993.

15. Соссюр Ф. де. Труды по языкознанию. / Ф. де. Соссюр. – М.: Прогресс, 1977.

16. Трубецкой Н.С. Избранные труды по филологии. / Н.С. Трубецкой. – М.: Прогресс, 1987.

17. Хэмп Э. Словарь американской лингвистической терминологии. / Э. Хэмп. – М.: Прогресс, 1964.

18. Шайкевич А.Я. Введение в лингвистику. / А.Я. Шайкевич. – М.: Academia, 2005.

19. Языковедение. Введение в науку о языках. – М.: Добросвет, 2003.

 

 

Галстян С.С.







Дата добавления: 2015-04-16; просмотров: 1122. Нарушение авторских прав; Мы поможем в написании вашей работы!



Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

СИНТАКСИЧЕСКАЯ РАБОТА В СИСТЕМЕ РАЗВИТИЯ РЕЧИ УЧАЩИХСЯ В языке различаются уровни — уровень слова (лексический), уровень словосочетания и предложения (синтаксический) и уровень Словосочетание в этом смысле может рассматриваться как переходное звено от лексического уровня к синтаксическому...

Плейотропное действие генов. Примеры. Плейотропное действие генов - это зависимость нескольких признаков от одного гена, то есть множественное действие одного гена...

Методика обучения письму и письменной речи на иностранном языке в средней школе. Различают письмо и письменную речь. Письмо – объект овладения графической и орфографической системами иностранного языка для фиксации языкового и речевого материала...

Типология суицида. Феномен суицида (самоубийство или попытка самоубийства) чаще всего связывается с представлением о психологическом кризисе личности...

ОСНОВНЫЕ ТИПЫ МОЗГА ПОЗВОНОЧНЫХ Ихтиопсидный тип мозга характерен для низших позвоночных - рыб и амфибий...

Принципы, критерии и методы оценки и аттестации персонала   Аттестация персонала является одной их важнейших функций управления персоналом...

Studopedia.info - Студопедия - 2014-2024 год . (0.016 сек.) русская версия | украинская версия