Характеристики речевых сигналов
Характеристика речи: Речь частный случай звука (зву ковых колебаний). Звук – это механические колебаний упругой среды. Характеристики звука: 1. Основной тон высоты звука определяется частотой колебаний звуковой волны. Чем меньше период колебания (волны чаще) тем выше сигнал. 2. Тембр – явл. количественной характеристикой звука, позволяющей на слух опред различия между звуками одинаковой высоты, формиру-мые различными источниками. Акустический тембр – характеристика гармоник основного тона и высокочастотных составляющих спектра. Амплитуда – определяет громкость звука. Основные характеристики речевого сигнала: 1).Осциллограмма(зависимость амплитуды от времени). Зависимость времени от частоты –это частотная осциллограмма. Для анализа речевого сигнала исп-ся преобразование Фурье. При применение преоб. Фурье получает числовой ряд, где у каждого элемента ряда имеется коэффициент, указыва-й на наличие определенной частоты в сигнале. Первый элемент ряда, соответ-ет низким частотам, а последующий более высоким. На осн. Частотных коэффициентов вычисляются частотные хар-ти: 1). Спектр речевого сигнала (просмотреть можно в nero); 2). Фазовая характеристика. 2)Спектрограмма (3-х мерная)- показывает относительную амплитуду по каждой частоте, и в каждый момент времени. Пиксиль окрашивается опред. Цветом, который говорит об амплитуде (темные участки о более высокой амплитуде говорят, а светлые о меньшей амплетуде).
Методы обработки речевого сигнала Методы звуковой обработки речевого сигнала: оцифровку сигнала полученного с микрофона выполняет звуковая плата. Различают следующие способы: 1. Квантование звука – из непрерывного сигнала должен получиться дискретный (расширение waw); разбиение звука на части. Звуковая плата преобразует звуковой сигнал в последовательность отчетов. Чем больше отчетов тем точнее звук, но больше объем файла. 2. Время импуль-сное кодирование (клиппирование речи). Клиппирование состоит в фиксации моментов времени, когда звуковой сигнал увеличиваясь достигает верхней границы канала клипируется и уменьшаясь достигает нижней границы. 3. Спектральный анализ – звуковые колебания сложной формы раскладывается на ряд гармоник различной частоты с помощью различных фильтров. 4. Импульсно-кодовая модуляция – выполняет дискретизацию как по времени, так и по амплитуде. С разрешением амплитуды по уровням связано понятие «неразрядной глубины» - звуковые платы поддерживают возможные характеристика в 8 и 16 бит, разрядность преобразования определяет динамический диапазон сигнала. Распознавание речевых сигналов. Минимальной смысла - разделительной единицей языка является Фонемы. В русском языке 42 буквы: 6 гласных и 36 согласных, а в английском языке 44: 20 гласных и 24 согласных. С каждой фонемой связано понятие набора формальных частот- основные частоты, участвующие в организации фонем. При совместном появление различных звуков последовательности происходит их взаимное изменение акустических хар-стик фонем. В результате появляются оттенки фонем, которые наз-ся Аллофоны. Аллофон – это набор звуков, которые имеют одинаковые свойства или одинаково информативны. Аллофоны различают: Комбинированные- обусловлены эффектом коартикуляции (когда один фонем накладывается на другой); позиционные- связан с положением фонемы по отношению к ударному слогу, начала и конца слова. Дифтонги – элемент артикуляции речи, образуемый при переходе в произнесении от одной гласной к другой. При распознавании и синтезе речи используется Морфемы у них устойчивая структура, поэтому выделяются легче. Просодическая структура – связана с понятиями интонации и ударения. Физические интонации и ударения реализуются с помощью след. Акустических средств: - мелодика – изменение частоты основного тона голоса; - ритмика – изменение длительности звуков и пауз; - энергетика – текущее изменение интенсивности звука.
Вопросы 1. Понятие, история развития теории нейронных сетей. 2. Основные свойства мозга, моделируемые нейронными сетями. 3. Основные области применения нейронных сетей. 4. Составляющие модели нейронной сети. 5. Понятие нейрона. 6. Виды искусственных нейронов. 7. Виды и назначение функции активации. 8. Виды архитектуры нейронных сетей. 9. Основные модели динамических нейронных сетей. 10. Парадигмы обучения нейронных сетей. 11. Параметры оптимизации системы, обучаемой по примерам. 12. Правила обучения. 13. Алгоритм обучения персептрона Розен блата. 14. Оценки качества работы нейронной сети. 15. Алгоритм обратного распространения ошибки. 16. Способы обеспечения и ускорения сходимости процесса обучения. 17. Сеть встречного распространения. 18. Модель зрительного восприятия. 19. Виды сегментации изображения. 20. Виды преобразований изображения между классами. 21. Особенности зрительного восприятия человека. 22. Методы пороговой обработки изображений. 23. Методы выделения контуров на изображении. 24. Метод утончения контура. 25. Методы распознавания изображений. 26. Основные проблемы теории искусственного интеллекта. 27. Направления исследований в области систем искусственного интеллекта. 28. Данные и знания. Способ определения понятий. 29. Особенности знаний. 30. Семантические сети. 31. Типы объектов и виды отношений в семантической сети. 32. Фреймовая модель. 33. Сравни-ная характеристика систем представления знаний на основе сетевых моделей. 34. Продукционная система. 35. Логическая модель представления знаний. 36. Сравн-ная характ-ка систем ПЗ на основе продукций и логической модели. 37. Метод резолюций. 38. Виды неопределенности в задачах принятия решений. 39. Понятие лингвисти-кой переменной и основные операции теории нечетких множеств. 40. Характеристики речевых сигналов. 41. Методы обработки речевого сигнала. 42. Распознавание речевых сигналов.
|