Особенности артикуляции Место артикуляции
570 Глава И Рис. 11.3. Спектрограмма произнесенного диктором-женщиной словосочетания human factors (человеческие факторы) (получена Р. Соркином). ют в себе почти всю информацию, содержащуюся в слове. Трудность заключается в том, что между фонемами согласных звуков и связанными с ними отрезками спектрограмм нельзя установить простого взаимно-однозначного соответствия [13]. 11.2.3. Влияние фонемного контекста Для многих согласных звуков вид соответствующих отрезков спектрограммы почти один и тот же. Поэтому для того чтобы определить, какая фонема согласного звука прозвучала, необходимо определить те признаки гласных звуков, которые присутствуют непосредственно после окончания согласного звука. Например, для того чтобы различить согласные /b/, /g/ или /d/, мы должны определить частотные изменения во второй форманте гласной фонемы, которая следует за согласной. Те существенные признаки, которые могут помочь идентифицировать большинство фонем согласных, не связаны с фиксированными акустическими свойствами, а зависят от тех звуков речи, которые следуют за ними во времени. Некоторые звуки речи сравнительно независимы от текущего речевого контекста. В качестве примеров можно назвать гласные и согласные 1st, /г/. /S/, III, Ш, /// [6]. Речевое общение __________571 Другой параметр, зависящий от непосредственного контекста, — время начала фонации, или время включения голоса (ввг), равное промежутку времени между моментом окончания напряжения губ, которое создает давление воздуха, и моментом начала вибраций голосовых связок. Это время фиксируется, например, в таких слогах, как /ba/, /pa/, /da/ и /ta/. Для звука /Ьа/ оио очень незначительно, а для звука /ра/ равно примерно 60 мс. Предположим, что мы записали на магнитофон звук /Ьа/. Мы можем превратить его в звук, соответствующий /ра/, если с правой стороны места записи добавить пустой интервал длительностью 60 мс. Однако предположим, что этот интервал имеет длительность между нулем и 60 мс. Какую фонему мы услышим в этом случае? Эксперименты с такими искусственными звуковыми стимулами демонстрируют важный речевой феномен, известный как категориальное восприятие. Допустим, что вы прослушиваете ряд такого рода звуков, у которых шаг непрерывно меняется от 0 до 60 мс. Вас поразил бы при этом тот факт, что такой ряд при воспроизведении слышен как следующая последовательность: Ьа, Ьа, Ьа, Ьа, ра, ра, ра, ра. Иными словами, в данной фонеме вы слышите, что происходит внезапный переход, хотя на самом деле известно, что данный физический признак медленно меняется от одного предельного значения до другого. Очевидно, наша система восприятия речи заставляет нас разбивать входные стимулы на ряд дискретных категорий, причем этот процесс зависит как от выполняемого нами анализа непосредственного речевого контекста, так и от конкретных звуков речи. Зависимость процесса восприятия речи от стимульного контекста является более глубокой, чем зависимость от предшествующих и последующих фоием. Характеристики голоса диктора влияют на наше восприятие индивидуальных фонем так же, как и грамматика произнесенного предложения, установка слушателя, а также степень знакомства с подаваемым материалом. Все эти контекстные факторы важны для разборчивости сообщений, передаваемых по речевому каналу связи. 11.3. Разборчивость в канале связи и качество В данном разделе рассматривается вопрос об оценке канала связи, по которому передается речь (телефон или радио). Оценка речевого канала зависит от того, какие стороны процесса коммуникации рассматриваются как наиболее важные. Главным фактором может стать разборчивость передаваемой речи. Может оказаться необходимым определить, насколько чувствителен данный канал к воздействию шума. Еще один аспект связан с быстротой передачи сообщения по каналу. 572 Глава И В некоторых случаях, когда речь разборчива, наибольший интерес может представить «качество» звука, т. е. ответ на вопрос, воспринимает ли пользователь данной системы связи речь как качественную? При решении проблем разборчивости речи или качества канала связи можно идти на различные компромиссы как в отношении обучения пользователя, так и в отношении аппаратуры. Поэтому для того чтобы спроектировать эффективную систему, может оказаться важным провести предварительный анализ д;нного канала связи с точки зрения человеческих факторов. 11.3.1. Артикуляция и разборчивость Вообще говоря, понятия «разборчивость» и «артикуляция» имеют прямое отношение к одному главному вопросу: насколько хорошо речь передается по каналу связи? Артикуляционное тестирование обычно означает проверку точности распознавания слогов или фонем, в то время как тестирование на разборчивость обычно означает оценку правильного понимания слов, Таблица 11.3. Тесты на типы артикуляции и разборчивость речи |7.», Ю, 22{
Речевое общение предложений или всего сообщения целиком. Существует множество артикуляционных тестов и тестов на разборчивость речи. Некоторые из них указаны в табл. 11.3. В качестве стимулов в этих тестах используются бессмысленные слоги, слова и предложения. В некоторых случаях правильный ответ можно предсказать с определенной точностью по предыдущему речевому контексту (например, по элементам с высокой прогнози-руемостью в тесте SPIN). 11.3.2. Степень известности сообщения и разборчивость речи Два важных фактора, которые влияют на разборчивость сообщения, передаваемого по каналу связи, — степень известности сообщения для слушателя и способность слушателя восстанавливать данное сообщение, имея только частичную нли зашум-ленную информацию. Вероятность появления определенного сообщения зависит от размера множества сообщений и относительной вероятности его выбора из этого множесра. Прогноз наиболее затруднен в том случае, когда все сообщения равновероятны. Коммуникация оптимальна в ситуации, когда набор сообщений невелик и когда слушатель хорошо знаком со всеми ими. Указанные факторы известности и прогнозируемости взаимодействуют с такими специальными условиями восприятия, как отношение снгнал/шум и способ использования слушателем обоих слуховых каналов (оба уха). В целом при восприятии высокопрогнозируемых сообщений из некоторого набора их допустимо более низкое отношение сигнал/шум. чем для набора малопрогнозируемых сообщений. Указанные закономерности отчетливо проявляются в тех тестах по разборчивости и артикуляции, в которых используется различный тестовый материал и результаты которых даны в табл. 11.3 и на рис. 11.4. На рис. 11.4 показано, что разборчивость увеличивается с ростом отношения сигпал/шум для речи. Следует отметить, что разборчивость для бессмысленных слогов ниже, чем для списка фонетически сбалансированных слов. В списке фонетически сбалансированных слов фонемы встречаются приблизительно с такой же частотой, как в английском языке. Изучение эффектов размера множества сообщений и разборчивости проводилось в работе [16]; было показано, что слова, которые выбираются из фиксированных списков длиной 2, 4, 8, 32, 256 или 1000 слов, идентифицируются тем лучше, чем меньше размер соответствующего списка. Более трудны для восприятия такие множества сообщений, относительно которых у слушателя нет информации об альтер- 574 Глава 11 Рис. 11.4. Зависимость разборчивости различных тестовых материалов от отношения речевой сигнал/шум [26] (copyright 1978 by University Park Press). / — 250 односложных рифмованных слов (ответы с множественными альтернативами); 2 — 1000 односложных слов (с записью ответов); 3 —бессмысленные слоги; 4 — предложения. натнвах ответов и их ограничениях. В таких случаях более заметно отрицательное воздействие шума. Факторы осведомленности слушателя и спецификации множества сообщений в некоторых «коммуникационных средах» используются в определенных словарях. Примером являются межнациональные правила произнесения ряда букв и слов: «альфа», «браво», «Чарли» и т. д. Использование такого словаря позволяет достичь очень высокой разборчивости буквенной информации, передаваемой в условиях шума и в ситуациях, когда дикторы и слушатели относятся к разным национальностям. 11.3.3. Влияние смысла предложения Смысл предложения может значительно повышать разборчивость речи, что хорошо видно из графика, приведенного на рис. 11.4. Наличие у предложения смысла приводит к тому, что размер множества сообщений заметно снижается, а их прогнозируемость увеличивается. Результаты эксперимента Миллера и др. [16] показали, что пять слрв в виде предлоще-
|