Теоретические предпосылки. Дебаты вокруг проблемы организации ментального лексикона не утихают на протяжении последних двадцати лет
Дебаты вокруг проблемы организации ментального лексикона не утихают на протяжении последних двадцати лет. В основе этих спо-ров лежит фундаментальное для современной когнитивной науки разграничение процессов, организованных по принципу подобия, и процессов, основанных на правилах. Как отмечают У. Хан и Н. Ча-тер [Hahn, Chater 1998], это противостояние восходит к двум разным исследовательским традициям, и довольно часто один подход мо-жет быть заменен другим. Они предполагают, что основное разли-чие между этими двумя способами можно выделить, основываясь на процессе классификации различных репрезентаций: в случае пра-вил сходство объектов должно быть стопроцентным, а в случае по-добия допустимо частичное совпадение. Таким образом, возможна принципиальная интеграция этих двух подходов.
В лингвистике оба подхода нашли отражение, в частности, в ис-следованиях проблемы регулярности и нерегулярности морфоло-гических процедур. В основном исследования данной тематики проводились на материале английских глаголов, и в них разрабаты-валась роль таких важных для речевой деятельности понятий, как дефолт (стандартное решение), частотность глагольного класса, ча-стота встречаемости того или иного глагола в речи, продуктивность классов, прозрачность морфологической структуры и т. д. Структу-ра ментального лексикона обычно рассматривается в рамках двух основных подходов, тем не менее существуют и альтернативные модели.
* Статья подготовлена в соавторстве с: К. Гор, Т. И. Свистунова.
Работа поддержана грантами РФФИ № 06-06 80152а и РГНФ № 07-04-00285а.
Первый подход, так называемый двусистемный, отраженный
в работах в основном исследователей генеративного направления
в лингвистике [Pinker 1991, 1999; Markus et al. 1992; Prasada, Pinker 1993; Ullman 1999], подразумевает наличие двух независимых меха-низмов для обработки регулярных и нерегулярных явлений в язы-ке. Согласно этому подходу, правильные и неправильные формы относятся к разным подмодулям внутри языкового модуля. Эти под-модули обеспечиваются врожденными языковыми алгоритмами, то есть человеческий мозг «генетически» запрограммирован на то, чтобы искать в словоизменительной морфологии регулярные моде-ли словоизменения, делить все словоформы на правильные и непра-вильные, а также искать «стандартное правило», так называемый дефолт. Если обратиться к глагольной морфологии, то для образо-вания форм от регулярных глаголов носителем языка используется система символических правил, тогда как нерегулярные глагольные формы целиком извлекаются из ассоциативной памяти. Если носи-тель языка сталкивается с невозможностью извлечения некоторой формы из памяти, то он, как считается, автоматически будет приме-нять дефолтное регулярное правило.
Одно из следствий данной гипотезы таково: поскольку нерегуляр-ные глаголы хранятся в ассоциативной памяти, то при порождении форм частотность глагола будет влиять на скорость их извлечения у всех носителей языка и на количество ошибок у детей. Для операций с регулярными глаголами частотность роли играть не должна.
Второй, односистемный подход [Rumelhart, McClelland 1986; Plunkett, Marchman 1993; Bybee 1995] предполагает, что формы как регулярных, так и нерегулярных глаголов обрабатываются с помо-щью единого механизма: они извлекаются целиком из ассоциатив-ной памяти. Этот подход был разработан в рамках коннекционизма и других вариантов сетевого представления морфологии. Никакие символические правила в этом подходе не признаются. Частотность той или иной формы влияет на скорость ее извлечения из памяти носителем языка. Кроме этого, существует и другое важное отличие односистемного подхода от двусистемного: он предсказывает, что как нерегулярные, так и регулярные глаголы будут чувствительны к частотности классов слов и словоформ. Таким образом, в основе это-го подхода лежат два понятия: частотность и аналогия. Если носи-тель языка сталкивается с необходимостью порождать формы от но-вых или редких слов, то они образуются по аналогии с теми, которые уже существуют у него в памяти.
Также существует и альтернативная модель усвоения регулярной и нерегулярной глагольной морфологии в английском языке. Ее раз-
работал Ч. Янг [Yang 2002]. Он протестировал материал по детской речи из статьи [Markus et al. 1992] и пришел к выводу, что его мо-дель «конкуренции правил» лучше описывает экспериментальные данные, чем модель, предложенная С. Пинкером [Pinker 1991], соз-данная в рамках двусистемного подхода. Ч. Янг разводит понятия аналогии и правила: если аналогия возникает при фонологической схожести, то правила основываются на неких абстрактных лингви-стических концептах. Автор утверждает, что глаголы в английском языке при усвоении спрягаются по определенным фонологическим правилам, а аналогия большой роли не играет. Фонологические пра-вила могут быть как более общими (в случае регулярных глаголов), так и более частными (в случае нерегулярных глаголов). Конкурен-ция существует между регулярным, дефолтным, правилом и прави-лами, по которым образуются нерегулярные глаголы. Каждое прави-ло имеет определенный вес, который зависит от общего числа всех глаголов того или иного класса в инпуте ребенка. Вероятность при-менения того или иного фонетического правила, с одной стороны, зависит от частотности самого глагола, а с другой — от веса правила. Таким образом, Ч. Янг считает, что как к регулярным, так и к нере-гулярным глаголам при спряжении применяются фонологические правила. Ошибки типа сверхгенерализации (выбор самого высоко-частотного или дефолтного правила) возникают, по его мнению, не за счет проблем с памятью, а вследствие конкуренции правил, при которой высокочастотное правило побеждает.
В рамках споров между сторонниками одно- или двусистемного подходов привлекался самый разнообразный материал и исполь-зовались различные экспериментальные методики. Эксперимен-ты проводились на разнообразных группах испытуемых: на людях со специфическими речевыми нарушениями (SLI), на пациентах с афазиями, с болезнью Альцгеймера и болезнью Паркинсона [Ullman et al. 1997; Ullman, Gopnik 1999; Bird et al. 2003; Brabera et al. 2005; Lambon et al. 2005; Ullman, Pierpont 2005].
Первыми подобный материал стали привлекать сторонники дву-системного подхода. Они обнаружили так называемое явление двой-ного разделения (double dissociation), которое выражается, в частно-сти, в том, что люди с болезнью Альцгеймера и сенсорной афазией (fluent aphasia) не испытывают трудностей при порождении форм от регулярных глаголов, тогда как люди с болезнью Паркинсона и моторной афазией (non-fluent aphasia) хорошо справлялись с по-рождением форм от нерегулярных глаголов. По их мнению, явление двойного разделения является подтверждением существования двух различных механизмов. Тем не менее сторонники односистемного
подхода предприняли попытку объяснить это явление в рамках кон-некционистского подхода [Plunkett, Bandelow 2006]. Им удалось по-вторить явление двойного разделения в рамках компьютерной мо-дели нейронной сети. Они обнаружили, что некоторые нарушения сети приводят к появлению такого явления, как потеря регулярного словоизменения.
Исследования этих процессов с помощью разных методов мозго-вого картирования опять же дают аргументы как в пользу двусистем-ного [Jaeger et al. 1996; Lavric et al. 2001, Ullman 2004], так и в пользу односистемного [Joanisse, Seidenberg 2005] подходов.
Однако все эти гипотезы разрабатывались на материале англий-ского языка, в котором имеется только один регулярный класс и от-сутствует сильно развитая морфологическая система. Очевидно, что они не могут полностью применяться к языкам с более развитой мор-фологической системой. В связи с этим были проведены исследо-вания усвоения глагольной морфологии исландского [Ragnasdóttir et al. 1996], норвежского [Simonsen 2000], итальянского [Orsolini, Marslen-Wilson 1997], немецкого [Clahsen 1999] и финского [Niemi 2006] языков. В результате удалось установить, что, во-первых, ча-стотность, а во-вторых, фонологические факторы важны для по-рождения форм как в регулярных, так и в нерегулярных глагольных классах. Эти результаты очевидным образом вступают в конфликт
с тем, что предсказывает двусистемный подход.
В частности, исследование [Simonsen 2000] порождения глаголь-ных форм в норвежском языке детьми в возрасте четырех, шести и восьми лет и взрослыми носителями показало, что:
• очередность усвоения глагольных классов зависит от частот-ности класса;
• чем выше частотность класса, тем больше вероятность то-го, что его морфологическая модель будет использована при сверхгенерализации;
• у детей частотность самого глагола будет сказываться не толь-ко на порождении форм от нерегулярного класса, но и на по-рождении форм регулярного класса (дефолта);
• количество неправильных ответов при порождении глаголь-ных форм взрослыми носителями языка в дефолтном регу-лярном классе зависит от того, с каким количеством глаголов нерегулярного класса рифмуется данный глагол. Эти данные
Х. Симонсен интерпретирует в пользу одноосновного подхода.
Данные итальянского [Orsolini, Marslen-Wilson 1997] и исланд-ского [Ragnasdóttir et al. 1996] языков также трактуются в пользу од-носистемного подхода.
В то же время исследование [Clahsen 1999] множественного чис-ла существительных и причастий прошедшего времени в немецком языке утверждает, что регулярные и нерегулярные правила обраба-тываются разными механизмами даже в языке с более сложной мор-фологией, чем в английском.
Так или иначе, все эти исследования, независимо от подхода, по-зволяют выделить три основных способа образования глагольных словоформ:
• использование правил (в рамках двусистемного подхода в слу-чае регулярных глаголов);
• извлечение из памяти уже готовой формы (в рамках односи-стемного подхода в случае как регулярных, так и нерегуляр-ных глаголов, в рамках двусистемного — только в случае не-регулярных);
• образование формы по аналогии (в рамках односистемного
подхода в случае столкновения с незнакомым словом).
В. Б. Касевич [Касевич 1998] отмечает, что усвоение глагольной парадигмы играет очень важную роль в усвоении языка вообще, по-скольку, согласно вербоцентрическим концепциям, глагол выступа-ет как синтаксическое и семантическое ядро любого предложения, а значит, невозможно пользоваться предложением как единицей об-щения без овладения глаголом и глагольной морфологией в частно-сти. Отечественная лингвистика многократно обращалась к самым разным аспектам русской глагольной морфологии, однако проблеме усвоения этих процедур детьми до недавнего времени уделялось не-достаточно внимания.
Исследования формирования глагольной системы у детей [Цейт-лин 2000; Гагарина 2001] в основном проводились на лонгитюдных данных и затрагивали исключительно ранний период развития язы-ка (до двух с половиной лет).
Русский язык предоставляет великолепную возможность для та-ких исследований. С одной стороны, это язык со сложной и разви-той морфологической парадигмой, а с другой — он обладает боль-шим числом глагольных классов, в которых разную роль играют те или иные морфологические показатели. Поэтому можно предполо-жить, что резкое противопоставление регулярного и нерегулярного механизмов в русском языке не является продуктивным. В статьях Т. В. Черниговской и К. Гор [Черниговская 2002; Gor, Chernigovskaya 2001, 2003] демонстрируется, что существует иерархия глагольных классов, зависящая от степени сложности парадигмы, то есть от ко-личества применяемых в ней правил, и тем самым вводится новый параметр — «сложность парадигмы глагольного класса».
Экспериментальные исследования разных групп носителей рус-ского языка, в том числе и пилотные исследования детей дошколь-ного возраста [Chernigovskaya, Gor 2000; Черниговская 2002; Gor, Chernigovskaya 2003], показали, что для всех испытуемых существу-ет дефолтное правило, которое применяется, когда не известно, к ка-кому классу отнести тот или иной глагол, например в случае образо-вания форм от квазиглаголов. Дефолтное правило в русском языке не определяется частотностью класса и заключается в прибавлении к основе, образованной путем отбрасывания показателей инфини-тива или прошедшего времени, -j- и необходимых окончаний насто-ящего/будущего времени, например в случае глагола *кисáть 1 ис-пытуемые будут с большой вероятностью образовывать формы по модели -ай класса (киса + j + y). Как взрослые носители языка, так и изучающие его в процессе продуцирования глагольных форм опи-раются на сложность парадигмы и на морфологические маркеры.
Данные эксперимента, проведенного на материале русского язы-ка с разными группами испытуемых, входят в противоречие как с предположениями двусистемного, так и односистемного подхода [Gor, Chernigovskaya 2004]. С одной стороны, результаты показыва-ют, что так или иначе все группы испытуемых опираются на одно дефолтное правило, а с другой — что частотность глагола влияет на продуцирование форм регулярных классов.
В статье [Gor 2004] при описании особенностей порождения рус-ских глаголов носителями и изучающими русский язык развивается теория Ч. Янга [Yang 2002] и предлагается модель «правил и веро-ятностей» усвоения русских глагольных классов. Отмечается суще-ствование двух наиболее общих символических правил: дефолтное «йотовое» правило (конечный гласный основы + j) и «нейотовое» правило (конечный гласный основы +). Эти правила некоторым образом проассоциированы с конечным гласным основы, соответ-ственно, выбор правила в случае столкновения с незнакомым глаго-лом зависит не только от того, является ли оно дефолтным, но и от конечного гласного основы.
Итак, в свете дисскусий об организации ментального лексикона в данной работе ставится вопрос о том, пользуются ли взрослые и де-ти с нормальным речевым развитием при образовании глагольных форм аналогией или правилами и какую роль в этом играют частот-ные характеристики словоформ.
1 Здесь и далее звездочкой (*) отмечены либо формы квазиглаголов, либо неправильные формы реальных глаголов.
Экспериментальная методика и испытуемые
В экспериментальный материал было включено восемьдесят гла-голов четырех глагольных классов по одноосновной системе, раз-работанной Р. О. Якобсоном и его последователями [Jakobson 1948; Davidson et al. 1996]. Выбор именно этой системы описания гла-гольных словоизменительных классов обусловлен тем, что одной из групп пилотного эксперимента стали американцы, изучающие рус-ский язык как иностранный, а система Р. О. Якобсона широко ис-пользуется при обучении русскому языку в американских универси-тетах. Эта система является одним из вариантов описания русских глагольных классов. Она отличается от традиционной (см.: РГ, 1980) тем, что глагольные классы выделяются не через соотношение двух главных глагольных основ, а с помощью одной, классообразующей основы. Это самая длинная из двух традиционных основ (основы настоящего времени и основы инфинитива). Если основы по дли-не совпадают, то выбирается основа настоящего времени. Глаголы делятся на классы в зависимости от типа выделенной основы, с по-мощью которой, зная определенные правила, можно образовать все остальные глагольные формы. Каждый класс при этом описании ха-рактеризуется тождеством формальных показателей (наличием ре-гулярных чередований согласных и гласных в глагольных корнях, наличием регулярных суффиксальных чередований, регулярным выпадением того или иного суффикса в определенных формах, на-личием постоянного ударения на основе у данного класса и т. д.).
В настоящий эксперимент вошло равное число глаголов четырех классов: -а класса, -ай класса, -и класса и -ова класса. Свойства этих классов можно свести в следующую таблицу (табл. 1).
В эксперименте использовались частотные, редкие и квазиглаго-лы каждого класса. Частотные и редкие глаголы составили по 25 % от всех стимулов, а квазиглаголы — 50 %. Половина квазиглаголов была образована от частотных, половина — от редких. Квазиглаго-лы были образованы от реальных глаголов путем замены одного или нескольких звуков в начальном сегменте слова, поэтому такие изме-нения не приводили к переходу глагола в другой словоизменитель-ный класс. Частотность глаголов определялась по частотному слова-рю [Засорина 1977], хотя очевидно, что частотности, отраженные в данном словаре, не всегда совпадают с частотностями, характерны-ми для словоупотребления детей, что связано с выбором текстов, по-служивших материалом для данного словаря. Но в специальной ли-тературе данные по частотности глаголов в детской речи фактически отсутствуют. Включение в экспериментальный материал глаголов
разной частотности позволило посмотреть, влияет ли частотность на количество правильных ответов в том или ином классе, a квазиглаго-лы помогли сымитировать ситуацию столкновения с новым словом.
Таблица 1. Характеристики глагольных классов,вошедших в эксперимент
В качестве стимула в эксперименте выступал либо глагол в фор-ме инфинитива, либо глагол в форме прошедшего времени мно-жественного числа. Глаголы предъявлялись в случайном порядке. Испытуемых просили образовать форму первого лица единственно-го числа и форму третьего лица множественного числа настоящего времени.
Тестирование было оформлено в виде микродиалога:
— Маша и Петя хотят играть. Что они хотят делать?..
— Играть.
— А сейчас они?..
— Играют.
— А ты?..
— Играю.
Или:
— Вчера Маша и Петя играли. А сейчас они?..
— Играют.
— А ты?..
— Играю.
В эксперименте приняли участие двадцать два взрослых носите-ля языка и пятьдесят девять детей с нормальным речевым развити-
ем в возрасте от четырех до шести лет (двадцать детей четырех лет, девятнадцать детей пяти лет и двадцать детей шести лет). Ответы ис-пытуемых фиксировались на магнитную ленту. Каждый респондент принимал участие в обоих вариантах теста; перерыв между выпол-нением тестов составлял от одной недели до одного месяца. Полу-ченные таким образом данные были расшифрованы, был проведен качественный и статистический анализ ответов.
|