Студопедия — ИЗМЕРЕНИЕ СТАТИЧЕСКИХ ЭЛЕМЕНТОВ С УЧЕТОМ СЛОГОВОЙ ДИНАМИКИ
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

ИЗМЕРЕНИЕ СТАТИЧЕСКИХ ЭЛЕМЕНТОВ С УЧЕТОМ СЛОГОВОЙ ДИНАМИКИ






На арене слога происходит встреча модуляций основной частоты, силы и времени. Это приводит, с одной стороны, к формированию слоговых количеств и качеств, с другой стороны, к перестройке спектров. Отсчет времени приобретает смысл только тогда, когда есть точки отсчета. Спектр, как таковой, бесконечен и поэтому не поддается учету во времени. Спектр — это чисто теоретическое измерительное понятие, которым обозначаются несамостоятельные компоненты реально протекающего речевого процесса. Как только в этом процессе произошла смена, появились точки отсчета для учета времени. Слабость начавшегося звука, его усиление к середине звучания и новое ослабление к кон-Ду образуют некоторый законченный цикл, который сменяется другим

1 Зонная природа темпа и ритма, 1950, стр. 60—71.

подобным циклом. Так возникают точки отсчета времени. Такой слоговой цикл может сокращаться и растягиваться, внутри его может то нарастать, то падать громкость, основной 'тон может то восходить, то нисходить. В результате всего этого будут меняться включенные в состав слова спектры как его элементы. Это явление обнаруживается с чрезвычайной убедительностью и наглядностью даже при беглом просмотре спектрограммы при произнесении.простого слога, а, о, и и т. п., если такая спектрограмма снята за некоторые микроинтервалы времени, например 15 м}сек. На спектрограмме мы видим постоянно меняющиеся спектры как статические срезы динамического процесса за определенные промежутки времени. Лишь в середине звучания слога два или три отрезка, фиксирующих спектр в этот период, сохраняют устойчивое постоянство.

Если спектры в процессе слогообразования подвергаются таким. значительным перестройкам, каким образом они могут выполнять свою • функцию различения слов? Здесь возникает новая ступень анализа и синтеза звукового процесса. Модуляции частоты, силы и времени несут на себе сигналы синтеза слога. Изменяя спектры, они и их включают в слоговой синтез. Оставшиеся же формантные признаки аналитически отделяются и продолжают выполнять свою словоразличительную функцию. Спрашивается — что осталось от формант и насколько исправно они несут свои различительные сигналы в этих реальных, но значительно изменившихся условиях? Для ответа на этот вопрос в инженерной акустике разработана специальная психологическая методика. Ее психологическое толкование ограничено чисто практическими задачами испытания линий связи, но по своему значению и широте возможного применения она выходит за пределы инженерно-технической области, широко применяясь при оценке дефектов речи, например речи глухонемых. Это так называемая методика артикуляции. После работ Кемп-белла и Крендала методика артикуляции получила достаточно ясные •очертания. У нас обстоятельное изучение этого вопроса дано в книге Ю. С. Быкова 1.

Сущность методики состоит в том, что на входе проверяемой линии связи диктор произносит по заранее составленным специальным таблицам определенный речевой материал, который на выходе принимается группой испытуемых, записывающих переданное сообщение. Разборчивостью речи называется процент правильно принятых элементов от общего количества переданных в данном сообщении. Психологический интерес испытания заключается в различии результатов, получаемых при выборе в качестве элементов или формант, или звуков, или слов, или фраз. Под звуком разумеется полный звук или простой слог. Для определения зависимости разборчивости звуков и слогов от разборчивости формант Ю. С. Быков проводил артикуляционные измерения, срезая фильтрами то нижние, то верхние частоты.

Оказалось, что при 50% различения формант достигается 83% разборчивости звуков и 55% разборчивости слогов. При 90% различения формант — 99% разборчивости звуков и 97% разборчивости слогов. Этим устанавливается мера формантных перестроек в слоге. Зависимость разборчивости слогов от разборчивости звуков выборочно мож-:но иллюстрировать следующими цифрами: 40% различения звуков дает только 8% разборчивости слогов; 60% различения звуков дает 23% разборчивости слогов и 90% различения звуков дает 70% разборчивости слогов. Необходимо различать 100% звуков для того, чтобы слоговой комплекс был принят полностью 2. Эти соотношения получены на материале бессмысленных слогов.

1 Ю. С. Быков, Теория разборчивости речи в линиях связи, Оборонгиз, 1954.

2 Там же, стр. 56.

ИЯРВИР!^^^^^^^

Результаты свидетельствуют о том, что по звукам различают только комплексы, независимо- от их сигнального значения. В этих условиях для различения одного звукокомплекса от другого необходимо различение всех элементов обоих комплексов. Если же в качестве эле-мен'тов учета выбираются слова, входящие в состав лексикона принимающего, т. е. звукокомплексы, обладающие предметным сигнальным значением, то соотношение величин резко меняется. 40% различения звуков дает от 20 до 40% узнава(ния слов; 60'% различения звуков — от 55 до 80% узнавания слов; 90% различения звуков дает 93—100%» узнавания слов. Таким образом, для узнавания слов достаточно различения только части тех звуков, из которых они состоят.

Сравнение первой группы данных со второй группой позволяет -провести отчетливое различие между процессом дифференцировки элементов слова и узнаванием всего слова. Функция формант, находящихся в составе звука, состоит только в дифференцировке звуковых элементов слова, узнавание же слова происходит на основе усвоения его -слоговой структуры. Бессмысленный слоговой комплекс может быть заучен, но при новом предъявлении для различения от другого комплекса снова должны быть дифференцированы все его элементы. Комплекс, лишенный сигнального значения, не узнается, а различается в элементах, так как в нем не'т ничего такого, что соединяло бы элементы. Если даже в группе бессмысленных слогов один выделен ударением, то и тогда нет такой динамической конструкции, которая могла быть узнана, так как ее построение ненормативно.

Мы измеряли у одного и того же испытуемого длительность произнесения комплекса горо и того же гора в слове город. Оказалось, что Б первом случае длительность составляет 525 м/сек, а во втором случае 400 м/сек. Слово в своей звуковой оболочке составляет довольно строгую нормативную структуру. Самое же существенное состоит в том, что при сохранении тождества предметного значения звуковая оболочка слова может изменяться в разных формах. Вследствие этого создается правило замены звуков или правило перестройки формант в слоговых позициях. По такому правилу, например, звук о в слове воды заменяется при переносе ударения на другой звук, похожий на а,вада. В словосочетании же, лишенном предметного значения, т, <е. в неузнаваемом как слово-комплекс, звуковых замен быть не может.

Узнавание — это восстановление целого по элементам, различение же —• это составление целого из элементов. При одной операции (дифференцировка) различаются те элементы, которые есть в комплексе, от тех, которых там нет. Это противопоставленная операция. При.другой операции (узнавания) объединяются только те элементы, которые есть в комплексе. Это восстановительная операция. Известно, что •при разговоре по телефону трудноразличимое сочетание согласных, ^например стр, может быть разъяснено путем замены их словами Соня, Таня, Рита. Здесь восстановительная операция помогает осуществить -противопоставительную.

Еще большие возможности для правильных замен невоспринятых звуков появляются при приеме фраз. 40% различения звуков соответствует от 10 до 50% разборчивости фраз; 60% различения звуков — от 40 до 95% разборчивости фраз; в среднем при 75% различения звуков, разборчивость фраз составляет 90% 1. Составление осмысленного сообщения обусловлено целым рядом правил, применение которых дает основания для восстановления невоспринятых элементов. Не составляет большого труда определить, какие элементы пропущены, например, в такой фразе На ст-ле л-ж-т к-ига. Морфологическая структура слов.

1 Ю. С. Быков, Теория разборчивости речи в линиях связи, Оборонгиз, 1954, *стр. 57.

7 Н. и. Жкнкин 97

синтаксический строй предложения, сочетаемость слов и сами сигнализируемые предметные отношения составляют определенные достаточно жесткие системы, которые могут быть найдены по ограниченному числу составляющих их элементов. После нахождения системы недостающие элементы восстанавливаются без труда. Однако Ч!ем больше элементов входит в систему, тем больше вероятность построения разных систем на общих точках ограниченного числа элементов, т. е. большая вероятность разночтений. Вследствие этого, как видно из вышеприведенных материалов, разброс результатов при определении разборчивости слов и фраз очень велик. Получаемые здесь усредненные показатели практически не имеют смысла. В этих случаях определяется не столько пропускная способность линии связи, сколько догадливость одной группы испытуемых и недогадливость другой группы. Вот почему в инженерной акустике метод артикуляционных таблиц применяется преимущественно на материале бессмысленных слогов.

С психологической точки зрения кратко описанная методика акустических измерений при помощи артикуляционных таблиц представляет интерес в том смысле, что полученные результаты дают возможность установить три ступени анализа и синтеза в речевом процессе. Анализ и синтез формант и звуков, как дифференциальных элементов сообщения, может быть отнесен к уровню восприятия речевого процесса. Ко второму уровню может быть отнесено узнавание слов, как воспроизведение значимых элементов усвоенного человеком лексикона из большого нормативного лексикона языка. И наконец, 'к третьему уровню может быть отнесен самый прием сообщения, т. е. понимание-предметных отношений, обозначенных в сообщении.

Методика-учета по артикуляционным таблицам позволяет отчленить только одну из сторон речевого процесса — восприятие речи. Это дает возможность упростить и свести указанное трехчленное деление к двухчленному, что приобретает большое теоретическое и практическое значение. Речь, в которой воспринимаемые элементы различены и расчленены, может быть названа разборчивой речью. Речь, в которой элементы не только расчленены, но и сопоставлены в динамической системе по уровням и соответственно по значимости, может быть названа выразительной речью.

Речь, поступающая на вход линии связи, является уже выразительной, но на выходе линии, при приеме речи, к технике могут быть предъявлены минимальные требования, ограниченные лишь разборчивостью. Это расширяет возможности 'техники, так как уменьшает количество передаваемых сообщений (в широком и специальном понимании этого термина) и вместе с тем не нарушает передачи объективных предметных отношений в содержании сообщения. Потеря выразительности равна потере нового, дополнительного сообщения о самой произносимой речи. Человек, говорящий Я приду, несомненно, сообщает о своем предстоящем приходе- Однако интонационная модуляция может быть такой, что говорящий сам сомневается в возможности его прихода. Такое дополнительное сообщение о понимании или толковании самим говорящим его собственных слов не войдет в речь, обеспеченную только разборчивостью, а потребует для передачи точного квантования по интсь национным уровням. Шкала этих уровней будет гораздо более тонкой, чем для разборчивости речи. По этой шкале будут модулироваться не только основные частоты, сила и время, но и перестраиваться епейтры. В таком случае к ранее перечисленным видам спектров и, соответственно, тембров (голосовых, языковых, певческих и речевых в узком смысле слова) следует прибавить и эмфатические. Они по необходимости внесут свою выразительную перестройку в спектре звуков, которая, однако, може'т быть срезана помехой, величина которой рассчитана только на то, чтобы не мешать разборчивости.

9S

Хотя при передаче выразительности речи значительно расширяется диапазон высот, громкости и длительности, современная техника при расчете так называемых художественных передач может достичь очень большой точности. Теоретически любое сигнальное значение переносится в каком-то определенном или в группе определенных акустических признаков, поэтому в акустическом эффекте заключено все, что воспроизведено органами речи. Однако для современной инженерной акустики возникает задача не только передать то, что сделано органами речи, но и искусственно сделать то, что они делают. Открывающиеся при этом перспективы представляют большой теоретический и практический интерес.

Еще Гельмгольц построил прибор, состоящий из системы резонаторов, через которые проходил звук камертона так, что при разном наборе резонаторов появлялись тембры, похожие на а, о, е, у. В 1914 г. Д. Миллер сконструировал более совершенное устройство из комбинации органных труб, настроенных на разные гармоники от»определенного основного тона, что дало возможность получения гласных. Регулировка аэродинамических условий путем зажимания резинового шланга, подводящего воздух к трубам, позволяет получить согласные /г, м. В результате могут быть составлены слова — папа, мама.

В 1939 г. Дадли 1 осуществил синтез речи на установке, получившей название «Водер». В этой системе есть два генератора: а) для жужжащих звуков, из которых формируются гласные (прерывистый спектр), и б) для шипящих звуков, из которых образуются согласные (непрерывный спектр). Оператор движением кисти руки включает генератор жужжащих звуков и одновременно пальцем нажимает на клавишу, соответствующую спектру определенного гласного звука. В то же время ногой он нажимает педаль, управляющую изменением высоты основного тона. После этого оператор включает клавишу, регулирующую спектр шипящего звука для получения определенного согласного. В устройстве есть специальное реле для перехода от жужжащих звуков к шипящим и наоборот, а также приспособление для синтеза тонов, составляющих звук. Пользуясь клавишами, можно набрать разные сочетания гласных и согласных и регулировать высоту тона.

У нас искусственный синтез звуков речи применяют И. М. Литвак и Л. А. Варшавский как метод изучения формант. В 1954—1955 гг. эта запись демонстрировалась на конференции по физиологической акустике. Первоначально устанавливается формантный состав звуков речи, потом полученные от генератора звуки, пройдя через определенные фильтры, синтезируют в известной последовательности и записывают на магнитофонной ленте. Синтезированная таким способом речь обладает всеми качествами разборчивости. По набору составленных звуков можно узна1ъ слова и принять переданное сообщение. Однако такая речь лишена -всякой выразительности. Независимо от специфического, не похожего на человеческий голос носового тембра, сами модуляции звуков "ке обладают, теци свойствами, которые имеет живая речь. Так, например, редукция гласных будет меняться в зависимости от места ударения, она количественно и качественно будет разной в разных словах. Следовательно, набор, клавиш или, что то же, набор спектров, должен разрастись до чрезвычайности и совпасть с количеством нормальных редукций 'во всех возможных для отбора словах.

Выше было указано, что в механизме речи слова составляются не из заранее готовых спектров, а каждый из спектров при синтезе перестраивается, в зависимости от предшествующих и последующих звуков. Кроме того, в живой речи изменение высоты основного тона,

1 Описание аппарата Дадли дано по изложению А. Беранека «Акустические измерения», изд-во ин. лит., М.—Л., 1952, стр. 248.

7* 99

громкости и долготы тотчас же закономерно сказывается на перестройке спектров. В искусственно синтезируемой речи не хватает еще динамического устройства, учитывающего упреждение и удержание звуко-комплекса. Не хватает и слогообразователя и елогоделителя. Как видно, шаг, отделяющий разборчивую речь от выразительной, О^ЕНЬ велик. Хотя все элементы выразительности весьма точно передаются акустически, что подтверждае'тся передачей художественно исполненной речи, синтезирование такой же речи станет возможным лишь после того, как законы ее динамики будут исследованы в полной мере. Вот почему теоретически и практически так важно изучение этой стороны механизма речи.

При проектировании аппаратов для производства рета надо решить два основных вопроса: какую работу должен совершить аппарат и что следует подготовить для осуществления этой работы. В разбираемом случае не ставится общая и более сложная проблема отбора слов. Пусть состав слов будет заранее задан и останется постоянным. Искусственный аппарат на этих словах должен произвести такие же акустические выразительные модуляции, которые постоянно производит произносительный аппарат человека. Для решения этой задачи должен; быть построен алгоритм, т. е. точное предписание, определяющее процесс отбора и сочетания тех элементов, из которых создается акустический эффект выразительности речи. Спрашивается, возможно ли построение такого алгоритма? Утвердительный ответ на этот вопрос исходит из предположения, что существуют постоянные единицы выразительности. Подобно тому как существуют постоянные единицы — форманты, слова, морфемы и синтаксические структуры,— должны существовать постоянные единицы выразительности — интонемы; только при этом условии их учтенный набор составит алгоритм и комбинацию алгоритмов. Это значило бы, что тождество есть не только в том, что мы назвали статикой речи, но и в ее динамике. Однако выразительность речи возникает к данному случаю, к постоянно меняющейся ситуации. Возможно ли при этом говорить о каких бы то ни было постоянных?

В главе IX, § 18 этой работы будет представлен фактический материал, который позволяет думать, что ответ на поставленный вопрос может быть положительным. На одних и тех же словах в точно учтенных условиях определенной ситуации у разных людей возникает в основном сходная структура интонационных модуляций, легко фиксируемая акустической аппаратурой. Вместе с тем у тех же людей, на тех же словах, но в другой ситуации возникает резко отличная от первой, хотя и одинаковая у разных лиц другая интонационная структура. Этим доказывается, во-первых, эквивалентность ситуации и структуры выразительной интонации, во-вторых, наличие и определимость постоянных, свойственных речевой динамике живой речи. По заданному сообщению, если его объем достаточен для установления точных словесных значений, может быть найдена ситуация, а по ней соответствующая интонационная структура, которая должна быть разложена в алгоритм акустических сигналов. Это и будет заданием аппарату для воспроизводства синтетической речи, подобной живой, натуральной. Однако решение всех этих вопросов нуждается в большой предварительной психологической работе ряда исследователей.

С большей легкостью уже теперь могут быть найдены некоторые элементы искусственного акустического синтеза, которые позволили бы внести в синтезированную речь разнообразные выразительные модуляции, имея в виду переозначение элементов, как свойственное языку и речи. Можно отфильтровать спектр, например звона бокалов, колокольчика, шума пара, выходящего из паровоза, и т. п., и на этих спектрах модулировать слова. Такие приемы, хотя и не создали бы прототи-

стРУкту-отчетливого'

па живой речи, но, примененные с достаточным искусством мог/т fa быть включены как элементы выразительности в киноленту или îe£ ральное.представление. «пилешу или теат-

Кратко подводя итоги этой главы, можно установить ™

1. Так как акустический анализ следующее.

вых знаний и «£««, »4^

исключения материальные словесные элементы Се

скиерГер:ения безусловна необходимЛ

из ОАГ.КЖЗОТ одним

нии формант, постоянства и изменчивое™

ры интонации фразы возникает вследствие недсТаТочнп

.понимания взаимоотношений °

3. Рассматривая речь как

дует отнести формантные признаки cna o

изменчивости Число формант ограничено в системе данной СЛОГОв определенный исторический момент его развития Чи?ложР &

модуляций безгранично, но шкала квантокятш 6 СЛОГОВЬ1Х

(частоты, силы » времени) постоянна и

произносительной единицей Это чняиит

л£ш!ь как включенные fïTor слов „ D

РОВ. Слог - это регулятор юаи^0ше?ий

и изменчивости речевых звуков. Спектр

та«как он меняется закономерно в

днях слова, то тем самым ^^

формант. Число формант от L^

форманты просто заменяются ЛОУГИМИ пп

вы!; редукций и замен '

устойчивость слоговой

ние статики и динамики сохраняется и во АПЯ«Р

ший диапазон интонационной измГчивос^'в ^ «ей

ные структуры —

Рос

,™

ог ^ло'г

существуют

' я (постоянства)

Г' меняется. но

постоят-

вами слов и понимания речи

восприятия, узна-







Дата добавления: 2015-08-12; просмотров: 475. Нарушение авторских прав; Мы поможем в написании вашей работы!



Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...

Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

Типовые ситуационные задачи. Задача 1. Больной К., 38 лет, шахтер по профессии, во время планового медицинского осмотра предъявил жалобы на появление одышки при значительной физической   Задача 1. Больной К., 38 лет, шахтер по профессии, во время планового медицинского осмотра предъявил жалобы на появление одышки при значительной физической нагрузке. Из медицинской книжки установлено, что он страдает врожденным пороком сердца....

Типовые ситуационные задачи. Задача 1.У больного А., 20 лет, с детства отмечается повышенное АД, уровень которого в настоящее время составляет 180-200/110-120 мм рт Задача 1.У больного А., 20 лет, с детства отмечается повышенное АД, уровень которого в настоящее время составляет 180-200/110-120 мм рт. ст. Влияние психоэмоциональных факторов отсутствует. Колебаний АД практически нет. Головной боли нет. Нормализовать...

Эндоскопическая диагностика язвенной болезни желудка, гастрита, опухоли Хронический гастрит - понятие клинико-анатомическое, характеризующееся определенными патоморфологическими изменениями слизистой оболочки желудка - неспецифическим воспалительным процессом...

Именные части речи, их общие и отличительные признаки Именные части речи в русском языке — это имя существительное, имя прилагательное, имя числительное, местоимение...

Интуитивное мышление Мышление — это пси­хический процесс, обеспечивающий познание сущности предме­тов и явлений и самого субъекта...

Объект, субъект, предмет, цели и задачи управления персоналом Социальная система организации делится на две основные подсистемы: управляющую и управляемую...

Studopedia.info - Студопедия - 2014-2024 год . (0.014 сек.) русская версия | украинская версия