Студопедия — Алгоритм обратного распространения ошибки и его недостатки
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Алгоритм обратного распространения ошибки и его недостатки






Данный алгоритм является эффек­тивным средством обучения многослойных нейронных сетей и представляет собой следующую последовательность шагов:

1. Задаются шаг обучения a (0<a<1) и желаемая среднеквадра­тичная ошибка нейронной сети Еm.

2. Инициализируются случайным образом весовые коэффициен­ты и пороговые значения нейронной сети.

3. Подаются последовательно образы из обучающей выборки на вход нейронной сети и для каждого входного образа выпол­няются следующие действия:

3.1. Производится фаза прямого распространения входного образа по нейронной сети. При этом вычисляется выходная активность всех нейронов сети

где индекс j характеризует нейроны следующего слоя по отноше­нию к слою i.

3.2. Осуществляется фаза обратного распространения сигнала, в результате которой определяется ошибка gj , j = 1,2,... нейронных эле­ментов для всех слоев сети. При этом для выходного слоя gj = yj - tj, а для скрытого слоя

3.3. Изменяются веса и пороги нейронов для каждого слоя нейронной сети:

4. Вычисляется суммарная среднеквадратичная ошибка ней­ронной сети

где L – размерность обучающей выборки.

5. Если Е > Еm, то происходит переход к шагу 3 алгоритма. В противном случае алгоритм обратного распространения ошибки заканчивается.

Таким образом, данный алгоритм функционирует до тех пор, пока суммарная среднеквадратичная ошибка сети не станет меньше заданной, т.е. Е £ Еm.

Алгоритм обратного распространения ошибки, основанный на методе градиентного спуска, имеет следующие недостатки:

ü неизвестность выбора числа слоев и количества нейронов в слое;

ü медленная сходимость гра­диентного метода с постоянным шагом обучения;

ü сложность выбора подходя­щей скорости обучения a: слишком малое a увеличивает время обучения и приводит к скатыванию нейронной сети в локальный минимум, большое a может привести к пропуску глобального минимума и сделать процесс обучения расходящимся;

ü невозможность определения точек локального и глобального ми­нимумов, так как градиентный метод их не различает;

ü влияние случайной инициализации весовых коэффициентов нейронной сети на поиск минимума функции среднеквадра­тичной ошибки.

Последний пункт отражает, что при разной инициализации могут получаться различные решения задачи. Это характеризует неустойчивость алгоритма обучения. То, что алгоритм не позволяет в общем случае достичь глобального мини­мума, не уменьшает его достоинств, так как во многих практических задачах достаточно обучить нейронную сеть до требуемой среднеквадратичной ошибки. Является ли при этом найденный минимум локальным или глобальным, не имеет большого значения.

 







Дата добавления: 2015-09-04; просмотров: 1239. Нарушение авторских прав; Мы поможем в написании вашей работы!



Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...

Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...

Стресс-лимитирующие факторы Поскольку в каждом реализующем факторе общего адаптацион­ного синдрома при бесконтрольном его развитии заложена потенци­альная опасность появления патогенных преобразований...

ТЕОРИЯ ЗАЩИТНЫХ МЕХАНИЗМОВ ЛИЧНОСТИ В современной психологической литературе встречаются различные термины, касающиеся феноменов защиты...

Этические проблемы проведения экспериментов на человеке и животных В настоящее время четко определены новые подходы и требования к биомедицинским исследованиям...

Экспертная оценка как метод психологического исследования Экспертная оценка – диагностический метод измерения, с помощью которого качественные особенности психических явлений получают свое числовое выражение в форме количественных оценок...

В теории государства и права выделяют два пути возникновения государства: восточный и западный Восточный путь возникновения государства представляет собой плавный переход, перерастание первобытного общества в государство...

Закон Гука при растяжении и сжатии   Напряжения и деформации при растяжении и сжатии связаны между собой зависимостью, которая называется законом Гука, по имени установившего этот закон английского физика Роберта Гука в 1678 году...

Studopedia.info - Студопедия - 2014-2024 год . (0.01 сек.) русская версия | украинская версия