Речевое общение
Рис. 11.1. Основные части системы генерации речи [5]. Copyright 1977 by Наг-court Brace Jovanovich, Inc. Генерация согласных звуков несколько отличается от генерации гласных. При генерации согласных часть ротовой полости видоизменяется таким образом, что поток воздуха ограничивается или полностью блокируется. Основное различие между разными согласными связано с тем, где и как в ротовой полости происходит блокировка, а также с тем, происходит ли при этом вибрация голосовых связок. В табл. 11.2 дается сводка различных условий генерации согласных. Указанные особенности процесса генерации фонем могут дать ключ к формулировке способа классификации любого сегмента речи и выделения в нем передаваемых фонем. Для этого необходимо установить, где и каким образом расположен данный элемент в сегменте, и определить размерности голоса. Однако, как мы уже указывали, конкретная звуковая реализация некоторого сегмента речи зависит как от звуков, предшествующих этому сегменту, так и от звуков, идущих непосредственно вслед за ним. Поэтому задача классификации является сложной. Кроме того, в звучащей речи есть такие составляющие, которые по продолжительности превышают один звучащий сегмент. Примеры — ударение и интонация. Ударение приводит к тому, что в произнесенном предложении по-ра.чному выделяются разные слоги. Обычно это приводит к изменению 568 Глава 11 Рис. 11.2. Схема системы генерации речи. интенсивности, высоты или длительности Части слога, соответствующей гласному збуку. Интонация обычно проявляется как изменение высоты голоса (например, как увеличение высоты в конце вопросительного предложения). Скорость смены фонем в разговорной речи обычно составляет около 12 фонема/с. Мы способны воспринимать речь на слух, когда она по скорости he намного превышает 30 фонема/с [13], II.2.2. Спектрограммы речи Чтобы определить, какие фонемы имеются в сегменте речи. МоЖно вместо того, чтобы пользоваться сведениями о процессе воспроизведения звуков речи, воспользоваться собственно акустической Информацией. Для этого нужно исследовать природу речевого сигнала с точки зрения его звучания. Полезный инструмент такого анализа — спектрограмма речи, показанная на рис, 11.3. По горизонтальной оси на этой спектрограмме отложено время высказывания, а по вертикальной — частота от 0 до 8000 Гц. Степень зачерненное™ линий соответствует интенсивности звука на каждой из частот. На спектрограмме, представленной на рис. 11.3, factors — второе слово, произнесенное диктором. Заметно, что в сегментах речи, соответствующих гласным, выделяются некоторые частоты, а именно частоты, близкие к 800, 2200, 3000 и 4200 Гц. Содержащие Их полосы частот известны как форманты, соответствующие механическим резонансным частотам полостей речевой системы. Если мы изменим, например, местоположение языка, то тем самым изменим объем ротовой полости и гортани, а значит, и те частоты, которые выделяются в результате Наличия этих полостей в спектре звуковых частот, Генерируемых голосовыми связками. Первая форманта имеет самую низкую резонансную частоту. Для согласных ситуация несколько иная. Для них характерны быстрые изменения формант, причем энергия распределена В очень Широком диапазоне и сосредоточена в резких пиках. В некоторых случаях звук проявляется почти как шум. По всей вероятности, в английском языке согласные заключа- Таблица 11.2. Место и способ артикуляции английских гласных [5]
|