СТАТИЧЕСКАЯ И ДИНАМИЧЕСКАЯ ФОРМАНТЫ
Со времени Гельмгольца сложилось убеждение в том, что ротовой и глоточный резонаторы образуют две особые форманты речевого звука. Это было подтверждено в дальнейшем более точным спектральным анализом, например в работах Крендала. Трудность при решении этого вопроса заключается в самом способе оценки и выводов из акустических измерений спектра. Спектр — это ряд частот, обладающих разной амплитудой. Частоты с наибольшими амплитудами признаются формантами. При таком способе учета неясно, какую из амплитуд следуе'т отнести к одной резонаторной полости и какую амплитуду — к другой полости.. Так как иногда в спектре встречаются частоты с тремя и четырьмя большими амплитудами, можно допустить существование трех и четырех областей резонанса. Однако акустическое понятие «область резонанса» и анатомическое понятие «полость резонанса» не совпадают. Можно предположить, что в полости рта будут две или больше областей резонанса, а в полости глотки ни одной, имеющей формантное значение для речевого звука, так как глоточный резонанс может давать частоты с малымж амплитудами. Для решения вопроса необходимо дополнить акустический анализ фактами, существенными Для работы всего механизма речи, а именно наблюдениями из области производства формант и их приема слухо>м, т. е. узнавания. Из первой группы фактов наиболее убедительными, хотя и косвенными, являются данные, представленные Педжетом. Он построил из мастики модели двух спаренных резонаторов, сходных по форме со ртом и глоткой в момент произдесения определенных гласных. При возбуждении звука в одном из концов этих парных резонаторов при помощи пищика слышатся гласные: а, у, и. В зависимости от соотношения объемов этих резонаторов, меняется характер звука. Форма спаренных резонаторов, полученная Педжетом эмпирически путем подгонки их объемо*в, очень напоминает те рентгеноехемы, которые были приведены нами выше (см. рис. 25 на стр. 206). Как в модели, так и в рентгенограммах при звучании а один из резонаторов велик по объему, другой узок. При звучании и соотношение объемов резонаторов меняется. Такое совпадение модели и моделируемого объекта, конечно, говорит об очень многом и заставляет с большой уверенностью признать, что глоточная трубка вносит свою особую форманту и речевой звук. 2434-
Гласная и. /ласная Œ; Рис. 34. Модели Педжета для а и а Однако совпадение структур не всегда соответствует совпадению функций. Можно получить звуки, не пропуская их через какие-нибудь резонаторные трубки, и составить из них ряд частот с определенными амплитудами так, что образовавшийся спектр будет соответствовать определенному характеру резонанса. Это и делается при синтезе искусственных речевых звуков. Критерием для определения количества формант и места их в спектре будет узнаваемость данного звука. Этим способом получается другая группа фактов. Вопрос ставится так: сколько и в какой полосе частот достаточно иметь.гармоник для того, чтобы данный звук узнавался как ß, и, у и т. д. Оказывается, что получаемые таким способом результаты не соответствуют данным Педжета. В исследовании Л. А. Варшавского и И. М. Литвака 1, проведенном по методике синтеза звуков, оказалось, что для различения звуков а, о, у, и достаточно одной форманты, для звука э необходимо две форманты, а для звука ы не менее двух, а возможно и три форманты. В конечном счете ведь и Педжет на своих моделях получал синтезированный, искусственный звук. Надо выяснить, в какой мере его модели соответствовали действительности. Возможно, **то в двух резонирующих полостях модели получаются две форманты, а в двух полостях реального ротоглоточного резонатора могут получиться одна, две или три форманты. Кроме того, надо учесть не весь спектр в целом, а только те его элементы, которые опознаются как характерные для данного звука. Таким образом, следует поставить два вопроса: а) в чем отличие модели из мастики от реальной надставной трубки и б) возможно ли при наличии нескольких составляющих узнать звук только по 'одной из них. Модель из мастики отличается от моделируемого ротоглоточного резонатора тем, что первый обладает твердыми неизменными оттенками, а второй мягкими, постоянно меняющимися. Вполне возможно, что глоточная трубка как раз в момент изменения объема будет вносить в спектр не "только постоянную и всегда неизменную резонансную частоту, 1 Формантный состав звуков русской речи, «Проблемы физиол. акустики», т- И1, 1955, стр. 14. 15* 227 ^ но и будет изменять соотношение формант, образуемых в ротовом резонаторе. При узнавании звука оба явления должны различаться, так как в nepiBOM (случае образуется элемент слога, а во втором случае — слог в целом. Рассмотрим первый случай — образование постоянной глоточной форман'ты. Следует признать, что всякая трубка, через которую проходит звук, будет резонировать. В том случае, когда к ней присоединяется новая резонирующая полость, звук будет узнаваться как комплекс входящих в него элементов. В этом и состоит природа различения тембров. Тембр узнается как целое, без выделения его составляющих. При этом для узнавания достаточно наличия одного или нескольких элементов узнаваемой системы, а не обязательно всех. Во всяком восприятии устраняется избыточность наличных воспринимаемых элементов. Так, увидев характерную часть предмета, например ножку стула, мы узнаем весь стул. Нами проводились опыты с записью да магнитофоне длительно произнесенных звуков речи. Оказалось, что звук, записанный на куске из середины ленты, не узнается как а, о, и, э, если же прослушивается -весь кусок записи в целом, то он узнается на всем протяжении звучания. Это значит, что хотя формантный состав звука в некоторых местах лен'ты был ослаблен, сам звук в целом узнавался по некоторым хорошо сохранившимся в других местах характерным признакам. Та же закономерность применима по отношению к ротовой и глоточной формантам. В § 20 было показано соотношение полостей ротогло-точного резонатора при произнесении гласных. Установлено, что при произнесении а и о ротовая полость значительно больше, чем глоточная — Р>Г. При произнесании же и и у, наоборот, — Р<Г. Различие объемов ротового и глоточного резонаторов в обоих случаях настолько резко и характерно, что, закрыв на рентгенограмме ротовую или глоточную тюлос'ть, можно определить по внешнему виду, произносится ли а, о или у, и. Вообще, как указывалось выше, глоточная трубка дублирует по-своему то, что производит ротовой резонатор при артикуляции звуков речи. Здесь налицо явная избыточность. Для узнавания получающегося резонанса достаточно одного из опознавательных признаков. Другой восстанавливается, так как он во всех случаях неизменно сопутствует первому. Следовательно, вполне правомерно допустить, что реально в спаренном ротоглоточном резонаторе возникают две форманты, однако, если при искусственном синтезе звуков подана лишь одна из них, то этого вполне достаточно для того, чтобы опознать звук. Имея в виду, что глоточная трубка может лишь сжиматься и разжиматься и только этим отвечает на разнообразные артикуляционные позиции в ротовом резонаторе, следует признать, что опознавательной формантой будет та, которая образуется в ротовом резонаторе. Это вполне очевидно, так как, например, без лабиализации (огубления) звук о получиться не может. Иная 'картина наблюдается в том случае, когда произносится звук э. Из рентгенограмм видно, что ротовой и глоточный резонаторы уравниваются в объемах -— Р = Г. В форме ротового резонатора нет такого резко характерного признака, по которому возникший резонанс мог бы быть сразу узнан. Вот почему можно допустить, что при образовании э уже нет избыточности, •— наличия одного из элементов недостаточно для узнавания всего целого. В русском языке звук э по подъему языка является средним. Л. В. Щерба 1 правильно заметил, что подъем языка может образовать целую гамму звуков, различающихся по степени открытости ротового резонатора, что и происходит в некоторых языках, имеющих большее.количество гласных, чем русский. В русском 1 М. И. Ma ту сев и ч, Л. В. Щерба как фонетик, Сб. «Памяти академика Л. В. Щербы», 1951, стр. 75. языке степень подъема языка при произнесении э не имеет фонематического значения. Вследствие недифференцированности этого звука по степени подъема языка, узнавание возникающего резонанса нуждается в поддержке второй форманты, образуемой в глотке. Аналогичное явление происходит и при произнесении ы. Здесь также объемы ротового и глоточного резонаторов выравниваются. Спинка языка поднята значительно меньше, чем при произнесении и и у, вследствие этого ротовой резонатор не перегораживается на две части и вся полость приобретает довольно сложную форму. В результате для узнавания характера резонанса необходимы дополнительные гармоники, подчеркивающие его особенности в разных признаках. Поэтому для узнавания искусственного, синтетического ы необходимы по меньшей мере две форманты — ротовая и глоточная, а возможно, и третья (вследствие сложной формы ротовой полости). Таким образом, резонанс, возникающий в глоточной трубке, входит R состав опознавательных признаков речевого звука лишь в тех некоторых случаях, когда резонанс в ротовой полости недостаточно определенен и узнавание целого по части невозможно'. Это значит, ^то функции ротовой и глоточной формант различны, одна из них (ротовая) выполняет аналитическую, различительную функцию, другая (глоточная) синтетическую функцию связи и слоговой модуляции звуков в процессе квантовайия динамических ступеней. Ротовой резонатор обладает твердыми венками и не модулирует в процессе фонации, принимая всякий раз точно определенную и неизменную форму....,Здесь образуется статическая форманта. Глоточный резонатор обладает мягкими стенками, модулирует в процессе фонации путем перемены объемов и формы, здесь образуется динамическая форманта. Для того чтобы выяснить функцию динамической форманты, следует установить те сдвиги в спектре звука, которые получаются при глоточных модуляциях в пределах формантного отсека1 для данного гласного. Решение этого вопроса осуществлялось следующим образом. В русском языке,для каждого гласного может быть найдено два варианта — более 'открытый и более закрытый. Это различие -не -имеет фонематического значения, но узнается по перемене тембра. В одном случае воспринимается более глухой тембр, в другом — более ясный и сонорный. Эта различия.соответствуют величине модуляции глоточной трубки в пределах формантного отсека. При идентичном положении головы испытуемого через полуминутный интервал снимались две рентгенограммы надставной трубки: а) при открытом произнесении данного звука и б) при закрытом произнесении. Одновременно производилась запись произнесения на магнитофоне, которая в дальнейшем анализировалась на спектрографе. На рисунке 35 дано по два произнесения открытого и закрытого варианта звука а. Сравнение схем показывает, что объем глоточного резонатора, в пределах возможных модуляций, для а больше в закрытом варианте, чем в открытом. Раскрытие рта, как видно, не играет роли. При одном произнесении (схема 2) рот раскрыт больше в закрытом варианте, чем в открытом (схема 1), в другом произнесении (схемы 3 и 4) соотношение другое. Положение языка тоже не определяет различия вариантов. В схемах 1, 2, 3 положение языка почти совершенно одинаково. В схеме 4 язык в закрытом варианте больше отодвинут назад, чем в открытом. Таким образом, расширение глоточной трубки является характерным для закрытого варианта признаком. В связи с изменением объема глоточной трубки происходит перестройка спектров. Для прочтения приводимых ниже спектров напомним, что за спектрометром включался осциллограф, который регистрировал составляющие спектр частоты. На киношюнке через 16 м/сек отмечался кадр, на которого фиксировались импульсы от каждого из ерабо- тавших за этот период фильтров. На рисунке 36 даны' четыре спектра звука а, взятые в разные моменты одного произнесения. Цифрами обозначены номера фильтров (соответствующие им полосы частот даны в таблице, помещенной в главе о методике, стр. 163), низкие частоты расположены налево, высокие — направо. Амплитуды даны в условных, единицах длины. Номера кадров указывают момент периода, которому соответствует данный спектр: кадр 1 — начало произнесения, кадры 7 и 8 — середина произнесения и кадр 14 — ^шнец произнесения. Из сравнения, спектров видно, что соседние средние кадры 7 и 8 сходны как по зонам частот, так и по соотношению амплитуд формант и отличаются только) по дополнительным гармоникам малой амплитуды. Кадры же
, о" открытое „О" закрытое
,а.о" открытое • Рис. 35. Произнесение открытого и закрытого;. вариантов а 1 и 14, взятые с начала и конца записи, значительно отличаются друг от друга и от средних кадров. Так как в процессе образования простого слога а глоточная трубка переходит последовательно от большого объема к минимальному и снова к большому, то различия вспектрах на указанных кадрах показывают, что во время Глоточной модуляции происходят сдвиги спектральных составляющих и амплитуд гармоник. В этом и состоит функция постоянно меняющейся динамической форманты. Для того • *йобы учесть слышимое различие звуков йа всем протяжении звучания в целом, вычислялся средний спектр. На-верхней таблице к рисунку а? пбйзай^ "частость встречаемое^.гармоййки в определений { 3579 11 13 15 17 19 20 7* кадр ном фильтре. На нижней таблице к рисунку 37 даны средние амплитуды максимальных гармоник (медиана, среднее арифметическое и сигма). Помещенные выше спектры составлены по этим таблицам. Здесь, как и дальше, открытый вариант произнесения обозначен в спектре сплошной •линией, закрытый вариант •— пунктирной линией. Сравнение вариантов открытого и закрытого произнесения звука а по спектрам, соответствующим рентгенограммам, показывает следующее. Заметного и закономерного различия в частости появления низких гармоник нет. У открытого варианта звука а они встречаются несколько чаще, чем у. закрытого. Частоты с фильтров б—7, с одной стороны, и g—10, с другой — только совместно можно признать как форманты, так как н;и одна из них по отдельности не появляется в количестве 100 %. Однако в каждом кадре всегда будет одна из пары. Таким образом, при учете целесообразно фильтры 6—7. и 9—10 объединить по-ларно. Значительное различие вариантов обнаруживается в проценте появления высоких гармоник — у открытого а 95%, у закрытого — 3 %. Второе, еще более важное различие можно установить в отношении амплитуд формант. Хотя, как видно, в обоих вариантах более высокая форманта с фильтров 9—10 имеет большую амплитуду, чем с фильтров 6—7, но перевес или прирост амплитуды высокой форманты по сравнению с амплитудой низкой форман- НоНОфипьтро^ ты больше у открытого a, î чем у закрытого. Это различие для открытого варианта составляет — 5,57 (точнее — 5,40), для открыто- ^ го — 0,43. Если взять от- "g ношение амплитуд по фильт- 1 рам 9-ш/б_7, получим: для \ | а открытого 1,31, для закрытого _ 1,05. Кроме того, наблюдается снижение средней абсолютной (величины обеих формант в закрытом варианте. ! _L 9 11 13 15 17 19 20 8^ кадр t Г I 35 79 H 13 15 17 19 20 \ 3 5 7 9 11 13 15 П 19 20 14*кадр ш •• ' Рис. 36. Спектры а в разные моменты произнесения Таким образом, при переходе от а открытого к закрытому, что соответствует увеличению объема > глоточной трубки, уменьшается громкость звука, снижаются амплитуды формант, пропадают вы-ср'кие дополнительные гармоники и высокая форманта (в открытом вари-5Ш превышавшая по амплитуде низшую) уравнивается, по амплитуде с низкой. Следовательно, изменения в объеме глоточной трубки вызывают закономерные изменения в спектре речевого звука как в разные моменты образования слога, так и в разных видах слогов. На рисунке 37 представлены спектры обо-их вариантов произнесений, составленные по разобранным выше таблицам. Оплошной линией показаны амплитуды при произнесении открытого а, пунктиром—закрытого. Соотношения числовых величин, таблицы видны здесь более наглядно. /
Рис. 37. Спектры вариантов открытого и закрытого произнесения а Та же общая закономерность обнаруживается при произнесении вариантов о. На рисунке 38 даны схемы рентгенограмм, из которых видно, что в пределах формантного отсека для о объем глоточной трубки больше у закрытого о, а надгортанник отошел кпереди. Раскрытие рта и положение языка одинаково в обоих вариантах. На рисунке 39 и таблице к нему видно, что в закрытом варианте возросла амплитуда низкой гармоники из 3-го фильтра, хотя процент появления ее в обоих вариантах одинаков. Это характеризует «заглушение» тембра закрытого варианта. Отсутствие частот с фильтров 8 и 9 в закрытом варианте свидетельствует о том же «заглушении». При произнесении о соотношение амплитуд формант иное, чем при а. В оборх вариантах произнесения о преобладает ампли'туда низкой форманты с фильтра 6 над амплитудой высокой с фильтра 10. Соотношение же амплитуд формант в разных вариантах о меняется в том же направлении, как и в вариантах а. Перевес амплитуды частоты с фильтра 6 над.
„О открытое „ 0 "закрытое Рис. 38. Произнесение открытого и закрытого вариантов о амплитудой частоты с фильтра 10 (по медианам) для о открытого —15У, для о закрытого — 20, или щ1 для открытого о —2,36, для закрытого — 2,81. Таким образом, при различиях в распределении частот по спектру и соотношениях амплитуд формант при произнесении а и о, процесс пере- №№срипьтроо
Рис. 39. Спектры произнесения о открытого (сплошная линия) и о закрытого (пунктирная линия) хода от открытого варианта к закрытому сохраняет iy же закономерность. Происходит сдвиг гармоник влево, т. е. увеличение амплитуд низких частот и потеря более высоких частот, соотношение амплитуд формант направлено в сторону преобладания низкой форманты. Такая же картина наблюдается при произнесении закрытого и открытого вариантов э. На рисунке 40 даны схемы рентгенограмм, обнаруживающие различия в объеме глоточной трубки при полном сходстве в.объемах ротового резонатора. На рисунке 41 и таблице к нему видно (по медианам), что в открытом варианте низкая частота из фильтра 5
„Э"открытое»Э закрытое Рис. 40. Произнесение открытого и закрытого вариантов э преобладает по амплитуде над высокой из фильтра 10 на 11 единиц. Соотношение -^j- =2,37. В закрытом варианте преобладание амплитуды той же частоты равно 20, а отношение -^-~ = 3,50.
Рис. 41. Спектры произнесения э открытого (сплошная линия) и э закрытого (пунктирная линия) Сходная, хотя в деталях и несколько отличная картина наблюдается при произнесении вариантов у. Из рентгеносхем видно (рис. 42), что в закрытом варианте изменился объем как ротового, так и глоточного ре-30'Haroipa =в сторр<ну увеличения, что должно ;привести к снижению;их .234 общего тона. Таким образом, зарегистрированный случай менее показателен с точки зрения учета роли глоточной трубки, чем приведенные выше. Соответственно в спектрах произошли более радикальные изменения. В закрытом варианте формантная частота переместилась с фильтра 10 на фильтр 9 (рис. 43). В связи с этим соотношение амплитуд формант
, Ч"открытое ^"закрытое РИС. 42. Произнесение открытого и закрытого вариантов у компенсировалось — открытый вариант щ- = 3,3; закрытый вариант -Ц^- =2,54. В результате, как и в предшествующих [случаях, произошло ослабление и сглаживание характерных качеств у.
|