Студопедия — Задание 2. в котором каждый распознанный знак превращается
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Задание 2. в котором каждый распознанный знак превращается






в котором каждый распознанный знак превращается

в импульсы, передающие его в машину закодированным

по двоичной системе. Однако и этот способ оказался да-

леко не совершенным.

Существует большое количество типографских шриф-

тов, а различных почерков — не счесть. «Эра» могла

читать текст, напечатанный только определенным шриф-

том. Но человек узнает букву, как бы она ни была написана.

В настоящее время разработаны более совершенные

системы считывания текста. В частности, использовался

статистический подход к опознаванию знаков.

Ученые обратили внимание на то, как человек распо-

знает предметы. Очевидно в мозгу все-таки хранятся не

эталоны предметов, а их обобщенные образы. Всех кле-

ток мозга не хватило бы, если бы ему пришлось созда-

вать по эталону на каждый чуть отличающийся от дру-

гого предмет. Мать показывает сынишке елку. Образ ее

запечатлевается у него в памяти без объяснений. И по-

том, уже встретив елку побольше или поменьше, густую

или тощую, он безошибочно называет ее.

Буква «б», например, имеет нечто общее в самых раз-

личных шрифтах. Это «нечто» — кружок и закорючка,

начинающаяся в верхней левой части кружка и идущая

вверх и направо. Но буквы «б» из разных шрифтов мо-

гут совпасть далеко не во всех точках, если мы их по-

пытаемся совместить.

Ученые определили «статистическую меру сходств»

букв из разных шрифтов и как бы создали обобщенный

образ каждой буквы алфавита. Они установили, что точ-

ки совмещенных букв лягут гуще в определенных обла-

стях пространства. Эти кучно лежащие точки и будут

создавать образ, который поможет распознавать все но-

вые и новые варианты одних и тех же букв.

Есть автоматы для чтения, работающие и на других

принципах. Во всяком случае, «видит» машина уже не-

плохо.

Итак, мы вводим в машину английский текст, каждая

буква которого специальной программой обозначается

числом — от 1 до 26. В каждом введенном слове опреде-

ляется число букв, так как в словаре машины все слова

тоже сгруппированы по числу букв (например, все че-

тырехбуквенные слова сгруппированы по алфавиту в од-

ном месте). И сразу же машина начинает искать слово

в словаре, где все буквы закодированы теми же числа-

ми. Слово «age» выглядит в машине так: 1, 7, 5;

Но одновременно с поиском слова в словаре работает

программа исправления искажений. Дело в том, что

считывающий автомат пока еще читает правильно толь-

ко 98 процентов текста, а это значит, что определенное

количество букв в словах может быть искажено. Да и

при вводе текста с перфорированной ленты могут быть

ошибки, так как от них не застрахована даже опытная

перфораторщица.

Короче говоря, машина принимается выполнять обя-

занности корректора, который в любом издательстве вы-

лавливает и исправляет ошибки в корректурных оттис-

ках, перед тем как ротационные машины начнут безо-

становочно печатать весь тираж.

Как же машина справляется с такой работой? В про-

грамме ее предусмотрено много способов исправления

искажений. Она может обратиться к своему словарю,

найти там слово, похожее больше других на наше иска-

женное слово.

Возьмем для примера русское слово «котолый». Вы

скажете, что такого русского слова нет. Я напомню вам,

что слово искажено, и вы тогда сразу догадаетесь, что

в слове ошибка, и станете читать «который». Вы опреде-

лили это простым сопоставлением букв искаженного

и неискаженного слова. Пример нарочно взят легкий,

но он позволит серьезно поговорить о некоторых по-

ложениях теории информации, применимых на прак-

тике.

Один из основоположников теории информации

К. Шеннон считает речь разновидностью вероятностно-

го процесса. Наша речь — это последовательность опре-

деленного числа элементов. И в каждом определенном

месте этой последовательности может оказаться любой

из элементов. (Элементами Шеннон считает буквы.) Но

вот вероятность появления того или иного элемента в оп-

ределенном месте для разных элементов разная. Для

иных она даже нулевая (например, в русском языке

между буквами «ый» не может появиться согласная).

И вообще вероятность появления каждого следующего

элемента во многом зависит от сочетания предыдущих.

Для создания программы исправления искажений

необходимо было изучить закономерности появления

в том или ином месте тех или иных элементов

(букв).

Письменный язык состоит из небольшого числа эле-

ментов (английский из 26), и появление их предсказуе-

мо. Мы знаем частоту встречаемости букв в английском

языке на каждую тысячу букв текста:

Теория информации возникла из практических нужд—

ученые разработали ее, чтобы выяснить, какой код луч-

ше всего подходит для сообщений по телеграфу, как

избавиться от искажений при передаче сигналов. Но за-

тем теория информации перекочевала и в другие нау-

ки — кибернетику, лингвистику, биологию, и даже есть

попытки применить ее в эстетике.

Информация, как и мысль, не бесплотна. Для того

чтобы передать сообщение, нужна какая-то система зна-

ков, звуков, сигналов, понятная всем тем, для кого

предназначено сообщение. Таких систем на свете мно-

жество. Их называют кодами. Многие ученые считают

кодами языки и даже изобразительные и другие средст-

ва, которыми пользуется искусство.

При равновероятностном, совершенно случайном по-

явлении любой из букв алфавита текст выглядел бы со-

вершенно случайным набором букв:

БКСХЪЬЕ КФГОРБУХЗТЧ ЫАПРЖДЛЙЦУХЗЩ

Но раз язык — система, то такого положения в нем

быть не может. Человек не свободен в выборе каждой

следующей буквы, когда он пишет. Так, в английском

языке за буквой «Q» всегда следует «U».

Следовательно, для исправления искажений нужно

было составить таблицы, показывающие наиболее веро-

ятные комбинации двух и трех букв. Если машина не

находила в таблицах встретившееся ей сочетание, то

она меняла его на наиболее вероятное, и статистика по-

казывала, что почти на сто процентов текст оказывался

исправленным.

Но устойчивые комбинации букв встречаются в язы-

ке не очень часто, и тогда в исправлении ошибок очень

помогает избыточность языка. Она заключается в том,

что в языке употребляется больше элементов, чем это

нужно для какого-нибудь сообщения.

«Изменив цифру,— пишет известный американский

ученый Дж. Пирс,— мы получим новое число, но если

мы изменим букву или даже несколько букв в тексте

обычного сообщения, то скорее получим искаженное, но

могущее быть узнанным, чем другое осмысленное сооб-

щение. Буквальный же смысл искаженного текста будет

бессмыслицей. Это является весьма ценным свойством

письменной речи. Благодаря этому свойству мы оказы-

ваемся в состоянии, например, понимать плохой почерк.

Та же избыточность позволяет нам уловить смысл пло-

хо расслышанной фразы и понимать человека, который

в разговоре грамматически неправильно употребляет

слова или говорит с иностранным акцентом».

Из-за избыточности плотность информации на каж-

дую букву языка очень мала. Но именно это помогает

нам избегать многих ошибок и увеличивает не только

число признаков появления той или иной буквы, но н

число признаков, определяющих значение каждого слова.

Слова в языке длиннее, чем они могли бы быть. У нас

есть слова из десяти букв. А великое множество трех-

буквенных сочетаний нами не используется. Чем не хо-

роши слова — «коа», «эню», «лок»? И таких трехбуквен-

ных сочетаний теоретически можно составить тридцать

тысяч. А в русском языке употребляется всего несколько

сот трехбуквенных слов. Каждый язык использует свои,

присущие ему не только трехбуквенные, но и четырех-,

пяти- и т. д. буквенные сочетания.

Например, в русском языке довольно редко прихо-

дится на одно слово сразу четыре согласных, не разде-

ленных гласными (слова типа «монстр всплыл»).

Далеко не каждая буква слова несет информацион-

ную нагрузку. Представьте себе, что вы нашли клочок

газеты, на котором есть такие буквы: «крепить обороно-

спо», а дальше оторвано. Вы легко догадаетесь, что там

должно быть «крепить обороноспособность». В чем тут

дело? В вашей гениальности? Нет. Просто язык облада-

ет избыточностью. Избыточность помогает нам понимать

искаженные телеграммы.

Эта избыточность создается грамматическими пра-

вилами, которые услужливо подставляют к основам слов

те окончания, которые мы ожидаем увидеть. Эта избы-

точность создается определенным порядком слов, узако-

ненным многократным употреблением некоторых фраз.

Нам будут понятны даже такие обрывки фраз в иска-

женной телеграмме: «Поздр нем рожд... же ровья

и...частья. Иванов». («Поздравляю с днем рождения,

желаю здоровья и счастья. Иванов»), хотя никто и ни-

когда так не писал.

Перед нами осмысленный текст, обусловленный яв-

лениями реальной действительности. На этом основано

и определение количества информации по методу, пред-

ложенному Шенноном. Он показывал английский текст

частично, до некоторой буквы, и предлагал угадать сле-

дующую букву. После этого показывалась действитель-

ная следующая буква текста и предлагалось угадать сле-

дующую за ней букву и т. д. Текст содержал 129 букв,

из них 89 были угаданы верно, что составляет 69 про-

центов от всего текста.

Избыточность языка позволила Шампольону расши-

фровать письмена древних египтян. Вспомним, как рас-

шифровывали размытую записку в «Детях капитана

Гранта» или записку о сокровищах в «Золотом жуке».

Для удобства работы алгоритма считается, что вся-

кое новое слово, введенное в машину и отсутствующее

в словаре, искажено. При несовпадении одного знака

с имеющимися в словаре словами орфографическая

ошибка исправляется. Чем длиннее слово, тем больше

букв в нем совпадет со словом в словаре и тем легче

исправить искажение.

Избыточность позволяет «свертывать» или «сжи-

мать» слова для экономии места в памяти машины. При-

мер свертывания: представление имени и отчества ини-

циалами. В старину на Руси определенные слова писа-

ли «под титлами», опуская некоторые сочетания букв

и обозначая их условными надстрочными знаками.

Установлено, что все естественные языки имеют боль-

шую избыточность (с точки зрения теории информации).

Ее можно измерить. Для основных европейских языков

она составляет около 50—80 процентов. В практике ма-

шинного перевода можно заменять слова аббревиатура-

ми, отбрасывать некоторые буквы и т. д.

Как я уже говорил, однивременно идет поиск в сло-

варе всех введенных в машину слов. Но машинный сло-

варь имеет свои особенности. Они заключаются в том,

что все слова в нем без окончаний. Английские существи-

тельные стоят в единственном числе, глаголы—в первом

лице, а прилагательные не имеют степеней сравнения.

И только неправильные глаголы имеют все формы.

А мы ввели в машину текст, и слова в нем имеют

окончания. И тотчас начинает работать программа от-

брасывания окончаний. Слова как бы обрезаются, а

окончания отбрасываются, но не совсем. Их направляют

в определенное место в памяти машины, чтобы «сбегать»

за ними, когда в них будет нужда.

У каждого слова в машине есть своя «ячейка», кото-

рая состоит из нескольких десятков «разрядов» (обычно

это крохотные элементики, способные удерживать по-

ложительный и отрицательный заряды, «ноль» или «еди-

ницу», из которых складываются числа). В «ячейку» за-

писывается слово, его номер, грамматическая и прочая

информация о слове, и вообще все сведения, полученные

в результате работы каждого этапа алгоритма.

Слова без окончаний снова проверяются по словарю,

получают здесь свой (не перевод, нет, до перевода еще

далеко) цифровой эквивалент. Само слово, закодирован-

ное числами, как бы исчезает, и теперь машина имеет

дело до самого конца с его цифровым эквивалентом.

Цифровые эквиваленты слов сыграли большую роль

в накоплении информации о каждом слове. Решение это

пришло уже после того, как были составлены многие

схемы. Схемы были громоздки, они содержали все све-

дения о слове. Работники лаборатории машинного пе-

ревода подумали: а что, если сам номер слова будет,

говорить о том, какая это часть речи, многозначно сло-

во или однозначно?.. Предположим, что мы взяли 50 ты-

сяч номеров и с десятого по десятитысячный отвели для

обозначения однозначных существительных. А если но-

мера с десятого по шеститысячный мы отведем для имен

существительных неодушевленных, а номера с 1000 до

2000 для географических названий, причем номера с 1500

по 1600 присвоим столицам государств? Значит, англий-

ское слово «Moscow» — «Москва» получит, к примеру,

номер 1525, который сам по себе говорит о том, что это

однозначное существительное, неодушевленное, геогра-

фическое название, столица. Число сведений, которые

оказалось возможным передать с помощью номера, прак-

тически не ограничено.

Номером (или цифровым эквивалентом) можно, на-

пример, передать тот факт, что данное существительное

означает должность, организацию, деньги, документ,

группу людей, собравшихся в одном месте, и т. д. Или

что оно — числительное (в машинном переводе нет чис-

лительных: по своим формальным признакам все коли-

чественные числительные стали существительными, а

порядковые — прилагательными). Номер сообщает о гла-

голе, что он модальный, или вспомогательный, или гла-

гол движения и т. д. С помошью номеров мы сразу же

откладываем про запас сведения о любой части речи.

В общем цифровой эквивалент содержит все сведе-

ния, органично присущие данному слову, независимо от

языка и контекста '. На эти сведения мы будем опирать-

1 В тот период способ кодирования классов объектов путем

присвоения элементам этих классов порядковых номеров из задан-

ных числовых интервалов был уже известен в теории и практике

применения счетно-перфорационных машин. В машинном переводе

ся в дальнейшей работе алгоритма и особенно, когда

придет пора согласовывать все русские слова уже в рус-

ской фразе.

И снова «но». Оказалось, что многим словам, входя-

щим в словарь, нельзя давать цифрового эквивалента.

3200 слов из 13,5 тысячи слов словаря оказались омогра-

фами. Они получают для начала служебные эквивален-

ты, так как неизвестно даже, что это за части речи. Спе-

циальный служебный эквивалент получают и слова

новые, не учтенные в словаре.

В английском языке слова, совершенно одинаковые

по написанию, очень часто выступают в роли одновре-

менно и существительного, и глагола, и других частей

речи. В русском языке это явление встречается доволь-

но редко. По-английски «work» — «работа» и «work» —

«работать». Для незнающих английского языка будет

понятен пример: «печь» — существительное и «печь» —

глагол. Богатство суффиксов и окончаний в русском язы-

ке позволяет избежать одинакового написания. Но даже

если слова и одинаковы по написанию, мы безошибочно

определяем, к каким частям речи они относятся.

Как мы это делаем? По контексту, по окружающим

это слово другим словам, по десяткам признаков, кото-

рые мы находим в тексте. Для вас не составит труда

определить, что «печь» в сочетании со словами «хлеб,

картофель» непременно будет глаголом.

Точно так же работают и схемы различения омогра-

фов в алгоритме машинного перевода.

Взгляды лингвистов на определение омографов рас-

ходятся. Но мы не станем вдаваться в ученые споры

такая практика сыграла свою положительную роль. Но преимущест-

ва этого способа обращаются в недостатки, как только объем сло-

варя превышает запланированный. В настоящее время идут поиски

новой системы.

и будем исходить только из практических нужд машин-

ного перевода. Для нас омографы — это разные слова,

имеющие одинаковое написание.

Три тысячи двести омографов. Не определив, к какой

части речи относится каждый из них, мы даже не можем

обратиться к словарю. Действительно, как можно ска-

зать, что значит слово «печь», не зная даже, существи-

тельное это или глагол? А в английском языке есть

слово «round», которое может быть одновременно суще-

ствительным, глаголом, прилагательным, наречием и

предлогом. Это слово можно перевести русскими слова-

ми— круг, округлять, круглый, вокруг и за (углом).

Есть много способов определить часть речи такого

слова. Если подводит один способ, мы обращаемся к дру-

гому. Слово «works» может быть и глаголом в третьем

лице («работает») и существительным во множествен-

ном числе («работы»), о чем говорит такой признак, как

окончание «s». Но в тексте у нас стоит «he works». Про-

верив, является ли слово, стоящее слева, подлежащим,

и убедившись в этом, мы твердо говорим, что это глагол,

и отправляемся в машинный словарь за получением ци-

фрового эквивалента, а впоследствии и перевода.

Но омография не исчерпывается примерами, которые

мы привели. В русском языке встречаются любопытные

омографы: «три» (число) и «три» (от «тереть»), «стекла»

(сущ.) и «стекла» (глаг.), «лечу» (от «лететь») и «лечу»

(от «лечить»). В английском языке примеров омографии

во много раз больше. Там могут совпадать как формы

одного и того же глагола («put», «put», «put»), так и

формы разных глаголов («found» (от «find») — «нашел»

и «found» — «основать»).

Интересна схема разрешения синтаксической омогра-

фии, или схема сложных частей речи. В английском язы-

ке, как и в русском, есть тысячи устойчивых сочетаний

слов. Вот, например, английское «by all means» или рус-

ское «во что бы то ни стало». Все вместе слова, входя-

щие в сочетание, выполняют обычно функцию одного

члена предложения и даже одной части речи (здесь —

наречия). Мы не переводим такое сочетание слово за

словом, а даем перевод русским устойчивым сочетани-

ем. И если бы мы взглянули в словарь, то увидели бы,

что против каждого слова английского сочетания стоят

совсем другие русские слова. Поэтому мы считаем, что

эти слова только совпадают со словами словаря по на-

писанию и являются омографами. Для нас все сочета-

ние — как бы одно слово. Это очень удобно, потому что

уже в машинном словаре мы можем предусмотреть для

очень многих английских выражений красивый, доброт-

ный русский перевод.

Так в приводившемся уже мною примере «Last night I

went to bed at ten o'clock» сочетание «last night» переве-

дется не буквально «последней ночью», а «вчера вече-

ром». В одном из учебников языкознания говорится, что

«не следует смешивать омонимию с многозначностью

слов». Так, по учебникам слова «лук» (растение) и

«лук» (оружие) будут омографами. Но машинная лин-

гвистика часто пренебрегает правилами, созданными

традиционной лингвистикой. Для удобства оба эти

слова считаются одним многозначным словом, много-

численные значения которого могут быть выяснены в ре-

зультате работы специальной схемы. Но мы забегаем

вперед, ибо время работы программы многозначных слов

еще не пришло.

Как видите, мы, собственно, не приступали к работе

алгоритма и еще «копаемся» в словаре, а уже пошли

необычайные сложности.

Если бы мы захотели показать, как переводится

в машине только одна фраза и какой логической обра-

ботке подвергается каждое слово, то для этого понадо-

бился бы пухлый том с массивным приложением в виде

графиков и схем.

Среди них была бы схема, которая определяла бы,

какой частью речи является любое слово, если даже

его нет в нашем автоматическом словаре. По ней маши-

на будет действовать, как те студенты, которым языко-

вед Лев Владимирович Щерба предложил на вступи-

тельной лекции по языкознанию разобрать по частям

речи фразу: «Глокая куздра штеко будланула бокра и

курдячит бокренка».

По чисто формальным признакам мы можем сказать,

где здесь существительное, а где глагол. Мы можем оп-

ределить род, число, падеж, наклонение и многое дру-

гое. В английском языке к формальным признакам от-

носится место слова в предложении, его окончание, со-

четаемость с предлогами и другими словами. Вот такую

«куздру», даже не зная, что она значит, уже можно за-

пускать в машину и опираться на нее в грамматических

схемах.

Очень важным в машинном переводе оказалось зна-

ние возможностей и работы быстродействующих элект-

ронных вычислительных машин. Можно придумывать

какие угодно правила перевода, но если их нельзя «ре-

ализовать» на машине, то грош им цена.

Когда сотрудники лаборатории машинного перевода

создали лексические, грамматические и прочие схемы пе-

ревода, оказалось, что для составления программы ал-

горитма потребуется... 15 миллионов команд, то есть

указаний машине, где какие данные взять и в какое

место направить, произведя то или иное логическое дей-

ствие. Это 250 миллионов битов информации, и для за-

поминания ее потребовалось бы 15 миллионов «ячеек».

Память для этого нужна колоссальная, не говоря

уже о том, что программировать такой алгоритм очень

тяжело. Надо было бы привлечь к работе сотни про-

граммистов. А у каждого программиста своя манера

работать, да и число ошибок при программировании бы-

ло бы велико, потому что людям свойственно ошибать-

ся. И одна ошибка может привести к сбою программы

и застопорить работу всего алгоритма.

Это стало ясно примерно в середине работы над схе-

мами перевода. Мы, лингвисты, чертили десятки тысяч

блоков, указывая в них, какие логические действия де-

лать машине. И мы замечали, что часто повторяемся,

задавая вопросы и требуя на них ответа «да» или «нет».

С каждым годом работы беспокойство росло. Начались

разговоры, что машина не «потянет» и наш громозд-

кий алгоритм ляжет тяжелым и бесполезным грузом

на плечи государственного бюджета.

Встал вопрос, а нет ли в наших схемах одинаковых

операций? Нельзя ли унифицировать команды и зна-

чительно уменьшить их число? Выход был найден,

и 15 миллионов команд свели к пятнадцати тысячам.

Заслуга эта никак не могла принадлежать лингви-

стам. Поистине революционную работу проделали ма-

тематики и логики. В свое время эту идею выдвинула

математик О. С. Кулагина.

Так появились операторы, являющиеся существен-

ной частью того, что теперь называют входным язы-

ком (или машинным языком).

Восемь операторов дают возможность производить

любые проверки, сравнения, лингвистические операции.

С помощью одного оператора проверяют, нет ли

в тексте какого-нибудь конкретного слова справа или

слева от нашего слова (или списка слов — например,

глаголов движения).

Этот оператор очень важен. Вот две русские фразы:

«Я был в городе» и «Я пошел в город». Здесь, несмот-

ря на один и тот же предлог «в», слово «город» сто-

ит в разных падежах. Во втором случае написание «го-

род» обусловливается тем, что перед предлогом стоит

глагол движения.

Для того чтобы выяснить значение слова, важно

знать его окружение. (Вспомните: «выдержать экзамен,

характер...») Перевод часто зависит от вхождения на-

шего слова в определенную устойчивую группу слов.

Ряд операторов позволяет согласовывать друг с дру-

гом различные части речи, находить в тексте любое

нужное слово, отводить накопленные сведения в опре-

деленное место памяти и... наконец, давать слову пе-

ревод. Это конечное распоряжение после выяснения

всех признаков.

Создание операторов очень упростило работу. И это

в первую очередь почувствовали сами лингвисты. В сво-

их схемах они просто указывали номер оператора в со-

ответствии с действием, которое, по их мнению, долж-

на была произвести машина. Такие схемы даже не на-

до было предварительно программировать.

Получив номер оператора, машина сразу включает

его программу, в которой насчитывается около сотни

команд, и выполняет нужное лингвисту действие. Один

из сотрудников лаборатории как-то сравнил операторы

со стандартными деталями, из которых можно сложить

дом любой величины и архитектурного облика — от же-

лезнодорожной будки до восьмиэтажного здания.

Изучить операторы лингвисты могут очень просто.

И таким образом они научатся машинному языку и ста-

нут непосредственно общаться с самой машиной. «Дис-

петчер» или «транслятор» (специальная программа, на-

считывающая три с половиной тысячи команд) «пой-

мет» эти операторы и согласует действие всех программ

алгоритма. «Диспетчер» решает, что делать с данными,

полученными и результате работы каждого оператора.

Он координирует все операции на всех этапах работы

алгоритма и, в случае неполадки, извещает людей.

Остается добавить, что алгоритм, созданный в ла-

боратории машинного перевода, годен для работы на

быстродействующих электронных вычислительных ма-

шинах разных систем. Нужен лишь новый «диспетчер»,

приспособленный для новых условий работы. И этим

снимается обсуждавшаяся некоторыми специалистами

идея создания специализированных переводческих машин.

Итак, машина закончила работу со словарем, узнав

очень многое о всех словах текста, а именно, получив

их цифровые эквиваленты. Эта информация позволит

машине перейти к грамматическому анализу англий-

ского текста.

Считается, что английский язык относится к языкам

аналитическим, а русский — к синтетическим. В анали-

тических языках глагольные формы чаще всего обра-

зуются при помощи вспомогательных глаголов, а вместо

падежных окончаний употребляются предлоги. Ан-

глийский язык имеет твердый порядок слов в предло-

жении, а в русском языке, благодаря богатству форм

слов, порядок свободный.

Лингвисту, занимающемуся машинным переводом,

необходимо установить соответствия и различия струк-

тур языков. Надо знать, что в языках общее и в чем

они отличаются друг от друга. Например, в англий-

ском у неодушевленных существительных нет рода, нет

падежей, и тем не менее при переводе на русский су-

ществительные обретают род и падеж. Откуда же они

берутся?

В алгоритме машинного перевода есть более ста

схем, которые анализируют грамматически английский

текст и поставляют сведения для образования русских

слов и построения русской фразы.

Сначала машина делает как бы разбор предложе-

ния. Она определяет, каким членом предложения яв-

ляется каждое слово. Но машинная грамматика нес-

колько отличается от школьной. Каждое слово входит

в одну из семи групп. Проведя анализ, машина узнает,

является ли слово подлежащим, сказуемым, дополне-

нием, обстоятельством и т. д.

Поступает она точно так же, как школьник, разби-

рающий предложение у классной доски. Например, под-

лежащее она может определить по месту в предложении.

Если машина «видит» слово «I» — «я», то она смело мо-

жет сказать, что это подлежащее, так как иным членом

предложения это слово может быть в одном случае на

миллион. Перечисление всех признаков, по которым мож-

но определить грамматическую группу слова, заняло бы

у нас десятки страниц. (Кстати, в машинной граммати-

ке «я» считается существительным, а прочие местоиме-

ния соответственно существительными или прилагатель-

ными, потому что они полностью подчиняются закопаем,

по которым изменяются эти имена.)

Не зная еще русских слов, машина определит неко-

торые падежи. Подлежащее всегда стоит в именитель-

ном падеже. По так называемой саксонской форме она

определяет родительный падеж. По подлежащему она

узнает лицо стоящего рядом с ним глагола. По разным

признакам она выясняет наклонение, время, число, сте-

пень сравнения, вид, залог и другие грамматические ка-

тегории слов и все сведения аккуратно «записывает» в

«ячейку» каждого введенного слова.

Очень важно разобраться в глаголе. Это центр син-

таксической конструкции. И его анализ является основой

для анализа фразы. При анализе глаголов постепенно

накапливаются грамматические признаки для русского

перевода. Если у глагола есть окончание «s», то мы с са-

мого начала можем дать ему целую характеристику

(3-е лицо, единственное число, сказуемое, настоящее

время). Постепенно мы получаем о глаголе сведений все

больше и больше.

Интересно отметить, что весь грамматический анализ

машина ведет в пределах простого предложения. Но тот,

кто изучал английский язык, знает, что в английских

сложных предложениях запятые между простыми пред-

ложениями ставят редко и даже опускают слова «which»

и «that» («который» и «что»), так помогающие нам раз-

бираться в больших фразах. Казалось бы, здесь мы за-

шли в тупик и окончательно запутаемся. Но лингвисты

нашли выход и из этого положения. В машине преду-

смотрена программа, которая делит сложную фразу на

простые предложения, расставляет запятые и даже вос-

станавливает пропущенные слова «который» и «что».

Но не все сведения для построения русской фразы

можно получить из английской. Тут же нужен русский

эквивалент английского слова. А у нас пока есть толь-

ко его цифровой эквивалент. Из него мы, конечно, зна-

ем многое. Например, слово «table». Мы знаем лишь,

что это неодушевленное существительное. Оно многозна-

чно и переводится на русский и как «стол», и как «таб-

лица», и как «расписание». Только переведя, мы узнаем

род слова. Значит, для дальнейшего грамматического

анализа нам надо выяснить все возможные переводы

этого слова.

И тут работа грамматической части машины преры-

вается, и начинает действовать ПМС (программа мно-

гозначных слов). Это одна из самых трудоемких частей

алгоритма. Слов, имеющих по нескольку значений, ока-

залась добрая четверть из записанных в словаре. Иные

слова, как мы уже говорили раньше, имеют до сотни зна-

чений. И все эти значения надо определить по контек-

сту, но теперь уже опираясь на обильную грамматиче-

скую информацию.

Более того, перевод слова всегда диктовался жела-

нием сделать так, чтобы вся фраза звучала по-русски.

И слово получало все новые и новые эквиваленты. Ти-

пично английские выражения переводились типично рус-

скими.

Давайте вернемся к английской фразе «Last night I

went to bed at ten o'clock». Вспомним, что сочли правиль-

ным следующий ее перевод: «Вчера вечером я лег спать

в десять часов». А ведь если перевести буквально, то у

нас получится: «Прошлой ночью я пошел в постель

в десять часов». Казалось бы, на этом можно успокоить-

ся. Но нет. Во-первых, по схеме омографов мы заменили

«прошлой ночью» на «вчера вечером», а по программе

многозначных слов «went» («пошел»), кроме многочис-

ленных других переводов, из стилистических соображе-

ний получит еще и перевод «лег». Следующие два слова

«to bed» тут же получат перевод «спать» и будут исклю-

чены из дальнейшего анализа. И это очень удобно. -И ма-

шине меньше работы и перевод правильный.

Всякому сведущему в переводческом деле человеку

в первую очередь приходит в голову мысль, что машина-

переводчик, опирающаяся в основном на формальные

признаки, должна грешить буквализмом.

Но она не буквалистка, нет. И это один из парадок-

сов машинного перевода.

В будущем, при очень объемной памяти, она сможет

запомнить все устойчивые выражения, идиомы и наибо-

лее часто употребляющиеся фразы одного языка и сра-

зу передавать их смысл выражениями и идиомами дру-

гого языка. Их, правда, будут не тысячи, а десятки или

даже сотни тысяч. Но уже сейчас машина, встретив фра-

зу «How do you do!», переведет ее как «Здравствуйте!».

Узнав номер каждого русского слова, которым мы

переводим английское, можно теперь получить и осталь-

ные грамматические сведения. На этом этапе мы узна-

ем не только род слова, но и падеж его.

И опять мы опираемся на ближайшее слово. На пред-

лог, например. Мы говорим «на столе», но «под столом».

В этом примере закономерность видна невооруженным

глазом. Но надо было проделать большую работу по

наблюдению над языком, прежде чем выявились все за-

кономерности. А выяснив грамматическую характерис-

тику существительного, мы можем перенести полученные

сведения и на прилагательное, которое в русском языке

обычно согласуется с существительным в роде, числе

и падеже, а в английском просто примыкает к нему.

Теперь, когда мы уже знаем перевод английских слов

и их грамматические характеристики, казалось бы, на-

до приступить к построению русской фразы и дать ее

прочесть нетерпеливым зрителям, собравшимся у букво-

печатающего устройства машины. Но, нет. Машине на-

до еще отредактировать эту фразу. Странно, скажете

вы, редактировать фразу, которой еще нет.

Да, таков еще один из парадоксов машинного пере-

вода.

У английского языка свои законы, а у русского —

свои. У английского языка один порядок слов, а у рус-

ского — другой. В английской фразе никогда не может

быть двух отрицаний, а в русской мы только что упот-

ребили их два: «никогда» и «не». Английская фраза в

буквальном переводе звучала бы так: «В английской

фразе никогда может быть двух отрицаний». Англичане

обходятся одним «никогда», но нам, чтобы машина вы-

ражалась по-русски, пришлось наделить ее программой,

которая вставляла в английскую фразу еще и «не».

Русский язык очень гибок, и он позволяет сохранять

английский порядок слов во фразе. Но не всегда. Ан-

глийская фраза «Не was not ready» буквально переводит-

ся как «Он был не готов». Такой порядок слов режет

слух, и мы меняем английский порядок слов на «Он не

был готов».

Я привел примеры самые простые, но программа ре-

дактирования, реконструкции и перестановки решает за-

дачи и очень сложные, связанные с коренной переработ-

кой английской фразы.

Итак, английские слова расставлены в должном (рус-

ском) порядке, и, наконец, машина может, используя

грамматическую информацию, накопленную при каждом

слове, писать по-русски.

Этому ее научили специалисты в области русского

языка во главе с Еленой Федоровной Калининой. Она

пришла работать в лабораторию машинного перевода

в 1958 году, когда еще только составлялись словарь и

схемы многозначных слов. Я помню ее первые страхи

и колебания, когда она стала понимать всю огромность

дела, которое ей предстояло осуществить. Никаких ру-

ководств и печатных трудов по русской части алгоритма

машинного перевода тогда еще не было.

За рассуждениями лингвистов об эмоциональных ос-

ложнениях и смысловых оттенках в языке надо было

разглядеть конкретные признаки, которыми выражались

все эти сложности. Чтение работ больших русских уче-

ных побуждало к пристальному наблюдению за родным

языком.

«Я чувствовала себя,— говорила впоследствии Кали-

нина,— как человек, не умеющий плавать и брошенный

в воду». Это чувство было знакомо всем нам, взявшим-

ся за создание алгоритма машинного перевода.

Научить машину говорить по-русски? Мы пишем:

«Я вижу дом», но «Я вижу человека». Машина должна

ощущать элемент одушевленности и соответственно на-

делять слова окончаниями.

Калинина начала думать, каким должен быть рус-

ский словарь. В свое время Бельская помещала в сло-

варь существительные в именительном падеже. Калини-

на пришла к выводу, что более правильно брать основы

слов. И не одну основу каждого слова, а несколько.

И тут начинается расхождение с традиционной грам-

матикой. В машинной грамматике потребовалось выде-

лить у существительных две основы, у глаголов — три,

а у прилагательных целых четыре.

Вернемся к нашему примеру «Last night I went to bed...».

Глагол «went», как вы выяснили, переводится словом

«лег» («лечь»). И еще нам известно по форме глагола,

что он прошедшего времени. В машине даны основы сло-

ва «лечь». Они суть «ле», «ляг» и «леж». От них можно

образовать любую форму слова — глагол во всех време-

нах, причастие, деепричастие... По специальной табли-

це машина выясняет, что прошедшее время образуется

от основы «ле». В грамматической информации при этом

слове значится, что глагол должен быть первого лица,

единственного числа и, предположим, мужского рода. По

таблице значится, что при таком сочетании признаков

надо присоединить к основе «г». И у нас получается:

«Вчера вечером я лег...»

В схемах русской части алгоритма указано, как об-

разуются причастия, деепричастия, возвратные глаго-

лы, степени сравнения прилагательных и т. д.

Особенно трудно было разрешить вопрос падежа. Из

английских грамматических схем не всегда можно по-

черпнуть сведения о падеже.

Были составлены списки глаголов, управляющих оп-

ределенными падежами существительных. (Например,

глагол «руководить» требует, чтобы после него сущест-

вительное стояло в творительном падеже— «чем?».) Все

русские слова разбиты на лексические группы, которые

обусловливают определенные грамматические формы.

А всего таких лексических групп семьдесят семь.

Начинающие изучать иностранный язык, переводя

какой-нибудь текст, любят говорить: «Вот здесь я дога-

дался по смыслу». На зачисление слова в ту или иную

лексическую группу влияет главным образом смысл сло-

ва. И здесь уже можно было бы говорить об «осмыслен-

ной» работе машины, если бы до нее смысловой анализ

многих тысяч слов не провели сами люди и не дали ей

эту осмысленность в готовом виде, в форме удобных

для пользования таблиц.

Беглое описание алгоритма машинного перевода

завершено. В таком алгоритме заранее предусмотрены

все логические операции, и фраза попадает в машину

как на конвейер, у которого нет лишних движений.

Однако, если мы хотим увеличить «интеллект» ма-

шины, нам необходимо предусмотреть в ее работе и дру-

гие особенности человеческого мышления. Человек сам

создает для себя алгоритмы и этим облегчает себе ра-

боту. Составив правила перевода, человек следует им.

А нельзя ли и машине составлять для самой себя такие

правила? Например, выявлять категории языка, опреде-

лять одушевленность и неодушевленность существитель-

ных? В Киевском институте кибернетики проделали та-

кой опыт. В машину ввели около двухсот существитель-

ных и глаголов, не указывая их категорий.

Затем составили на основе этого словаря ряд фраз.

Одни из них имели смысл, другие были бессмысленны.

«Женщина варит обед, инженер делает проект, станок

делает гайки, лодка варит обед». Причем всякий раз

вводилась информация, имеет ли фраза смысл или нет.

По программе машина разбила слова на несколько

групп, выделив категорию людей. Проанализировав фра-

зы: «Женщина варит обед» (есть смысл) и «Лодка варит

обед» (нет смысла), она «запомнила», что со словом

«варит» слово «женщина» сочетаться может. Затем ма-

шине поручили самой определять, какие фразы имеют

смысл. Для проверки в машину ввели фразу: «Инженер

варит обед», и машина ответила, что это бессмыслица.

Из анализа предложений «Инженер делает проект» и

«Станок делает гайки» она не могла получить нужной

информации. Она выделила «инженера» в категорию лю-

дей только после того, как встретила это слово с глаго-

лами, сочетающимися только с одушевленными суще-

ствительными.

В этом опыте уже моделировались некоторые связи,

напоминающие ассоциации, которые возникают у че-

ловека.

Американские исследователи опробовали свою систе-

му на 400 элементарных английских предложениях, и

она сама вывела грамматику, по которой при вторичном

прохождении правильно проанализировала все 400 пред-

ложений. В дальнейшем ей дали поучиться на трехстах

предложениях, после чего она правильно разобрала три

четверти из ста новых предложений. Но пока машина

имела дело лишь с упрощенным английским языком...

Наш алгоритм в принципе работает. Может быть,

ему еще не хватает совершенства. Но что совершенно на

свете?

Полное удовлетворение сделанным недостижимо, по-

тому что каждый прожитый день выдвигает новые тре-

бования, и совершенствовать машинный перевод теперь

придется из года в год, так как необходимость в нем

будет расти.

Уже не воспринимается как мечта составление схем

многозначных слов на самой машине. Когда-то это по-

требовало нескольких лет работы большого коллектива

лингвистов. Сегодня делаются наметки программы, ко-

торая позволит машине самой анализировать слово и его

окружение, выбирать признаки и давать перевод.

Уже машина учится выбирать слова и пополнять

ими собственный словарь. Задав некоторую информа-

цию, можно заставить машину саму совершенствовать

таблицы анализа русской части.

Машина научилась русскому языку, но все правила

ей преподносились в готовом виде. Сейчас машина учит-

ся составлять для себя правила — определять род сло-

ва, его основу и т. д. Машинный алгоритм можно ис-

пользовать даже для обучения языку.

Но не будем говорить о том, что еще не завершено,

а вернемся к испытаниям алгоритма.

В машинный зал приходят человек двадцать. Пятеро

работают, остальные любопытствуют, сочувствуют и со-

здают сутолоку. В машину вводятся сначала все про-

граммы алгоритма, а затем английский текст. Перевод

начался.

Но не все идет гладко. Есть еще много «огрехов»

в программах, и ошибки сразу путают все карты. Вот

здесь программист неправильно указал адрес—«ячейку»,

и М|шина, как говорят, «зациклилась». Она вновь и

вновь повторяет одну и ту же операцию и похожа на па-

тефон, игла которого бесконечно ходит по одной бороз-

де пластинки. Надо исправлять программу.

Бывает, что виновата и сама машина. В ней тысячи

и тысячи деталей. Выход из строя хотя бы одной может

вызвать появление разряда-паразита. И вдруг машина

вырабатывает команду — стереть все из своей памяти.

Погибает весь цикл перевода. Поэтому инженеры так

борются за надежность работы машины.

Для избежания подобных аварий разработана специ-

альная программа — система блокировки. Она проверя-

ет правильность работы машины и следит, как выраба-

тывается информация на каждом' этапе алгоритма. Эта

система указывает, что испортилось и где. Сбой ликви-

дируется, и работа машины продолжается или останав-

ливается, чтобы не стерлась полученная информация.

По специальным критериям система даже проверя-

ет правильность информации, и если подлежащее вдруг

окажется в дательном падеже («Ему пришел в гости»),

то об этом будет немедленно сообщено людям. На вы-

работку и совершенствование такой системы ушел це-

лый год работы нескольких специалистов.

Застучал телетайп. Первые строки. Правильно, пра-

вильно... а здесь ошибка. Не обходится и без курьезов.

При переводе статьи из свежей газеты машина переве-

ла фамилию англичанина «Bowels», как «кишки». Она

не так уж ошиблась, перевела правильно. Только здесь

переводить не надо. Следовало написать фамилию Бау-

элс, и все. Ей бы еще немного чувства юмора...

Ошибки можно исправить. Алгоритм еще надо «до-

водить», совершенствовать. Главное — машина может

переводить. Она может заменить переводчика.

Машина не в состоянии переводить любой текст. Но

она уже справляется с газетой, с техническим журна-

лом... Она подает большие надежды. Однако художест-

венным переводом заниматься ей не под силу, потому

что творческие возможности машины весьма ограни-

чены...

лектронные вычислительные маши-

ны становились верными помощниками человека, взяв

на себя некоторые несложные функции управления

производством, счетное дело, перевод с одного языка на

другой... Помогли они и в литературных изысканиях.

Так, один машинный эксперимент дал возможность

разрешить вековой спор, развернувшийся вокруг лите-

ратурной проблемы.

Автором двух самых известных эпических поэм Древ-

ней Греции считается Гомер.

Тысячи лет «Илиада» и «Одиссея» вдохновляли поэ-

тов и были мучением для учеников, которых заставляли

заучивать тяжелые гекзаметры.

«Илиада» повествует об осаде греками малоазиат-

ского города Трои, о спорах богов, сонм которых воз-

главлял всемогущий Зевс, о гневе жестокого героя Ахил-

ла, обидевшегося на царя греков Агамемнона.

Существуют девять жизнеописаний Гомера, но все они

написаны уже во времена римских императоров. По пре-

данию, Гомер был слепым. Честь считаться родиной

Гомера оспаривали семь греческих городов: Кума, Смир-

на, Хиос, Колофон, Пафос, Аргос, Афины. Одни говори-

ли, что он жил во времена Троянской войны, другие —

позже.

Но вот в XVIII веке немецкий филолог Август Вольф,

анализируя поэмы, пришел к выводу, что «Илиада» и

«Одиссея» не могли принадлежать одному поэту, а яв-

лялись плодом творчества многих поэтов и певцов. Он

утверждал, что отдельные песни были объединены в по-

эмы через много столетий после того, как они впервые

исполнялись, и что отредактировали поэмы люди весьма

посредственных умственных способностей.

По Вольфу, такого поэта, как Гомер, никогда не су-

ществовало. Немецкий ученый опирался на серьезные

факты. Еще в Древней Греции многие считали, что Го-

мер совсем не историческая личность, а условное обо-

значение для целого коллектива поэтов. Да и в наше

время академик Н. Я. Марр утверждал, что слово «го-

мер», которое у басков и грузин значит «слепец»,— си-

ноним собирателя, рапсода, поэта, обрабатывавшего

и исполнявшего народные песни.

Так возникла одна из самых запутанных научных про-

блем, которую не могли разрешить сотни лет и называ-

ли «гомеровским вопросом».

«Вольфианцам» противостояли «унитаристы» — сто-

ронники индивидуального творчества. Если первые на-

ходили в поэмах массу несуразностей, то вторые указы-

вали на то, что такие же несуразности можно найти и в

произведениях современных писателей. Так, женой Ге-

феста в «Илиаде» была Харита, а в «Одиссее» — Афро-

дита, у Нестора в «Илиаде» было одиннадцать братьев,

а в «Одиссее» только два, и т. д. «Унитаристы» приво-

дили примеры подобных же несуразиц из Гёте

и Толстого. И те и другие за полтора века написали

тысячи статей и книг, посвященных гомеровскому

вопросу.

Все эти бесконечные споры были разрешены при по-

мощи электронной вычислительной машины. Американ-

ский филолог Джеймс Макдонуг заставил ее проанали-

зировать все 15 693 строки «Илиады». Машина сопоста-

вила метрику стиха разных частей поэмы, выявила не-

которые общие для всего произведения стилистические

особенности. Статистические подсчеты и анализ много-

численных примеров, приведенных машиной, позволили

филологу доказательно утверждать, что поэма написа-

на одним человеком и что Гомер — личность историче-

ская.

В Советском Союзе новосибирские ученые использо-

вали электронную быстродействующую машину для рас-

шифровки письменности древних майя, о чем я в свое

время рассказал в книге «Загадочные письмена».

Будущее сулило гигантское развитие способностей

машин, которые проявляли чудеса оперативности в ре-

шении некоторых логических задач. И вот тогда была

выдвинута идея, что в принципе возможно создание жи-

вых и мыслящих существ, способных к самостоятельному

творчеству.

Сперва, захлебываясь, говорили о возможности вос-

создания творческой личности, потом наступило отрез-

вление. Творцу (писателю, например) нужны воспоми-

нания о восприятии природы, о собственных радостях

и невзгодах в детстве, о муках болезни роста, о собы-

тиях, менявших течение жизни многих людей, о чувствах,

испытанных к людям... Создать модель какого-нибудь

талантливого поэта значит промоделировать все, что он

видел в жизни, все общество, в котором он жил, при-

роду, которую он видел, всех его предков, историю об-

щества, Вселенную...

Федор Михайлович Достоевский, пытавшийся разо-

браться в сущности творчества, писал:

«...Поэма, по-моему, является как самородный драго-

ценный камень, алмаз, в душе поэта, совсем готовый, во

всей своей сущности, и вот это первое дело поэта, как

создателя и творца, первая часть его творения... Затем

уж следует второе дело поэта, уже не так глубокое и та-

инственное, а только как художника: это, получив

алмаз, обделать и оправить его. Тут поэт — почти толь-

ко что ювелир».

Перевод художественных произведений следует от-

нести ко «второму делу», которое тоже делает художник,

но не творец, а опытный, понимающий чужое творчество

и талантливый ремесленник. Это понимание чужого твор-

чества и предусмотрено оговоркой Достоевского («поч-

ти только что ювелир»), оно требует жизненного, чело-

веческого опыта, который лишь отчасти дает образова-

ние и начитанность.

Наделить такими качествами машину, разумеется,

невозможно.

Как работает человеческий мозг? Ответа на этот воп-

рос ищут и психологи, и биохимики, и нейрофизиологи,

и анатомы.

Мозг — загадочная материя, над тайной которой за-

думывались еще мудрецы Древней Греции. Великий

врач средневековья Везалий первым сказал, что «мозг

построен ради главенства разума, а также чувствитель-

ности и движения, зависящего от нашей воли». Декарт

открыл рефлексы, а Павлов — сигнальные системы моз-

га. В конце XIX века нашли, что каждый участок мозга

выполняет определенные функции. Сейчас усиленно ана-

лизируются биотоки мозга. Кибернетика стремится стро-

ить модели, выполняющие отдельные функции его. Од-

нако науку о мозге по-прежнему можно отнести к раз-

ряду описательных, а не точных наук.

Без разума величие Вселенной было бы неполным.

Материя, способная рождать мысль, весит в среднем

1300 граммов. Умственные способности человека не за-

висят от ее веса. Мозг Тургенева весил 2012 г, Голсуор-

си— 1482 г, а Франса — 1017 г, Бехтерева — 1720 г,

а Гаусса — 1492 г. Самый тяжелый мозг оказался у од-

ного слабоумного (2850 г).

На питание мозговых тканей расходуется 1/5 всей

крови человека.

Мозг построен из серого (клетки) и белого (волок-

на) вещества и состоит из многих причудливо перехо-

дящих друг в друга образований. Приходящая информа-

ция анализируется в коре — сером веществе, покрываю-

щем тонким слоем полушария мозга. Это она состоит из

миллиардов нервных клеток, размеры которых колеб-

лются от 5 до 200 микронов. Они способны действовать

безотказно в течение многих лет. Каждая клетка имеет

3—4 тысячи контактов, а для всего головного мозга чис-

ло связей достигает поистине астрономической цифры —

шестидесяти тысяч миллиардов.

Мы можем и дальше продолжать наше описание, но

оно ровно ничего не скажет о процессе рождения мысли.

Потому-то ученые, описывая предположительную рабо-

ту мозга, чаще всего прибегают к аналогиям.

Американец Маккаллох характеризовал мозг чело-

века как трехфунтовую вычислительную машину мощ-

ностью в 25 ватт с емкостью накопителя в 13—15 мил-

лиардов битов, обладающую активным полупериодом

в течение полусуток и регенерацией пяти процентов со-

держания, накопленного за 50 лет.

Остроумно, но не боле...

Американский психолог А. Чапанис предложил та-

кую схему специфических особенностей работы человека

и машины:

Человек Машина

1. Способен решать аль-

тернативы малой вероят-

ности, т. е. отвечать на

неожиданные события

1. Отличается большой

сложностью программи-

рования, так как трудно

предвидеть все возмож-

Человек Машина

2. Способен использовать

восприятие и простран-

ство и превращать об-

рывки информации в зна-

чительное взаимосвязан-

ное целое.

3. Знает различные спо-

собы выполнения дей-

ствий. Может выполнять

те же или подобные дейст-

вия и достигать тех же

результатов другими спо-

собами в случае, если ос-

новные способы приме-

нить невозможно.

4. Обладает ограничен-

ной способностью, как ка-

нал связи, т. е. макси-

мальное количество ин-

формации, обрабатывае-

мое им за единицу време-

ни, невелико.

ные события и составить

программу, предусматри-

вающую все варианты.

2. Характеризуется нуле-

вой или очень ограничен-

ной способностью «осоз-

навать». Структура рабо-

ты машины должна быть

тщательно запрограмми-

рована, причем существу-

ет много различных спо-

собов компоновки струк-

туры из различных эле-

ментов.

3. Альтернативные спосо-

бы выполнения действий

ограничены. Может со-

вершенно выйти из строя

при частичной поломке.

4. Как канал связи, по-

зволяет добиться любой

желаемой пропускной

способности.

Человек

Кроме того, у человека есть еще одна способность,

которая позволяет ему, минуя логический путь, откры-

вать истины непосредственно, как бы видеть их «в оза-

рении» («первое дело» по Достоевскому). Это интуиция.

Еще в XVII веке Декарт считал, что аксиомы, ле-

жащие в основе науки, открыты интуитивно. А уж по-

том при помощи логических рассуждений вывели из них

все остальные знания. В XX веке великий математик

Анри Пуанкаре бросил крылатую фразу: «Посредством

логики доказывают, посредством интуиции изобрета-

ют». Он же пояснил взаимоотношение логики и инту-

иции: «Логика говорит нам, что на таком-то и на та-

ком-то пути мы, наверное, не встретим препятствий; но

она не говорит, каков путь, который ведет к цели. Для

этого надо издали видеть цель, а способность, науча-

ющая нас видеть, есть интуиция. Без нее геометр был бы

похож на того писателя, который безупречен в право-

писании, но у которого нет мыслей».

Было много споров по этому поводу, но и теперь

психологи говорят, что «в настоящее время проблема

логики и интуиции в математике остается открытой».

5. Ввиду утомляемости

и рассеивания внимания

снижает свою работоспо-

собность в сравнительно

короткое время.

6. Производит вычисли-

тельные операции сравни-

тельно медленно и неточ-

но.

5. Ухудшает свое «пове-

дение» лишь спустя зна-

чительный промежуток

времени.

6. Производит вычисли-

тельные операции исклю-

чительно точно и очень

быстро.

Машина

А нужна ли интуиция переводчику? Безусловно. Ра-

зумеется, не для поисков аксиом. Но в переводе есть

свои маленькие открытия, которых не сделать без вдо-

хновения. Например, передать непереводимую и не объ-

ясненную словарями идиому так образно и емко, что

она войдет в золотой фонд родного языка. Таких слу-

чаев было немало. Иногда это делалось интуитивно.

Предусмотреть нечто подобное при составлении ал-

горитма машинного перевода невозможно. С другой

стороны, переводчик-человек обладает «способностью»,

даже не разобравшись до конца в тексте или не найдя

подходящего эквивалента в словаре, перевести непо-

нятное место туманно, но все-таки складно. Это уже

халтура, искажение информации, на которое машина

«не пойдет» — просто не даст перевода. Кстати, в ис-

тории человечества открывалось интуитивно немало

«аксиом», из которых логично выводили целые учения,

оказывавшиеся в конце концов ложными...

Во Всесоюзной патентно-технической библиотеке

хранятся миллионы описаний изобретений, еще не пе-

реведенных на русский язык. Причина все та же. Не

хватает переводчиков. А ведь патентные тексты состав-

ляются так, чтобы в них не было «нюансов и подтек-

стов». Это термины и четкие формулировки. Кому, как

не машине, заняться их переводом. Более десяти лет

разрабатывались специализированные алгоритмы для

перевода патентной информации. В 1969 году в элек-

тронную вычислительную машину «Раздан-3» введен

комплекс из 16 основных и вспомогательных про-

грамм — 20 тысяч машинных команд. Машина тратит

на перевод с английского одной публикации (150—

300 слов) от двух до пяти минут. Скорость перевода по-

ка еще невелика, но на более совершенной машине она

будет выше. Сейчас отдел автоматизации перевода и

индексирования работает над алгоритмом для перевода

японских патентов.

Создана машина, которая переводит с английского

информационные тексты. Только русский автоматичес-

кий словарь ее включает около сорока тысяч лексичес-

ких единиц.

Вопросами машинного перевода занимаются в Ле-

нинграде, Кишиневе, Минске, Махач-Кале, Алма-Ате...

Главное сейчас — добиться высокой рентабельности

перевода. Пока еще велико машинное время, но про-

гресс в этой области уже виден.

Много систем машинного перевода работает за ру-

бежом. Одно перечисление их заняло бы у нас не ме-

нее страницы. Расскажем об одной из них.

На недавней конференции по вопросам американо-

советских торговых отношений, которая была организо-

вана в Вашингтоне Национальной ассоциацией про-

мышленников, участники увидели в вестибюле отеля

«Шорем» входное устройство машины «Логос-1». Его

установила компания «Логос девелопмент», снабдив

письменной рекомендацией: если вы хотите торговать

с Советским Союзом, вам придется рассказывать о сво-

их товарах по-русски.

Желающие диктовали оператору английские фразы

технического порядка, тот нажимал клавиши телетай-

па, сигналы прредавались по проводам в электронную

машину, находившуюся в одном из городков штата

Нью-Йорк. Не проходило и минуты, как аппарат выда-

вал перевод фразы на русский. Фраза иной раз получа-

лась корявая, но технически грамотная. Например: «Ре-

гулирование выхода газов печей для выдержки жидко-

го металла должно быть осуществлено посредством

вытяжного зонта бортовой тяги и четвертого отверстий».

Требовалась правка, но для сведения сошло бы и так...

В рекламном проспекте фирмы говорится, что необ-

ходимость создания машины была вызвана «расширя-

ющеися торговлей между Востоком и Западом, неверо-

ятно возросшей нуждой в переводах с английского на

русский, чешский, румынский и другие языки». Ученые,

мол, признали,







Дата добавления: 2015-10-19; просмотров: 471. Нарушение авторских прав; Мы поможем в написании вашей работы!



Шрифт зодчего Шрифт зодчего состоит из прописных (заглавных), строчных букв и цифр...

Картограммы и картодиаграммы Картограммы и картодиаграммы применяются для изображения географической характеристики изучаемых явлений...

Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...

Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...

Машины и механизмы для нарезки овощей В зависимости от назначения овощерезательные машины подразделяются на две группы: машины для нарезки сырых и вареных овощей...

Классификация и основные элементы конструкций теплового оборудования Многообразие способов тепловой обработки продуктов предопределяет широкую номенклатуру тепловых аппаратов...

Именные части речи, их общие и отличительные признаки Именные части речи в русском языке — это имя существительное, имя прилагательное, имя числительное, местоимение...

Разновидности сальников для насосов и правильный уход за ними   Сальники, используемые в насосном оборудовании, служат для герметизации пространства образованного кожухом и рабочим валом, выходящим через корпус наружу...

Дренирование желчных протоков Показаниями к дренированию желчных протоков являются декомпрессия на фоне внутрипротоковой гипертензии, интраоперационная холангиография, контроль за динамикой восстановления пассажа желчи в 12-перстную кишку...

Деятельность сестер милосердия общин Красного Креста ярко проявилась в период Тритоны – интервалы, в которых содержится три тона. К тритонам относятся увеличенная кварта (ув.4) и уменьшенная квинта (ум.5). Их можно построить на ступенях натурального и гармонического мажора и минора.  ...

Studopedia.info - Студопедия - 2014-2024 год . (0.012 сек.) русская версия | украинская версия