Студопедия — Рекомендации по обучению и архитектуре многослойных нейронных сетей
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Рекомендации по обучению и архитектуре многослойных нейронных сетей






Эффективность обучения многослойных нейронных сетей зави­сит от числа слоев, числа элементов в скрытых слоях нейронной сети и начальной инициализации весовых коэффициентов. Рассмотрим эти вопросы более подробно.

Как отмечалось, разная инициализация весовых коэффициентов нейронной сети может приводить к различ­ным решениям задачи. Важную роль здесь играет величина случайно инициализируемых синаптических связей. Так, для сигмоидной функции активации, если весовые коэффи­циенты будут иметь большие значения (положительные или отрица­тельные), то выходная активность нейронов будет близка к единице или нулю и веса будут изменяться незначительно. Это приведет к тому, что процесс обучения остановится в ближайшем локальном минимуме от старто­вой точки. Рекомендуется случайно выбирать значения весов по правилу:

где n (i) – число нейронных элементов в слое i

или случайно инициализиро­вать их в диапазонах [-0,05; 0,05] или [-0,1; 0,1].

При этом пороговые значения нейронных элементов устанавливаются в начальный момент времени в единичные значения.

Большую роль для эффективности обучения играет архитектура НС. Размерность вх. и вых. слоев определяется из условия задачи или обучающей вы­борки. При помощи трехслойной НС можно аппроксимировать любую функцию с любой за­данной точностью. При этом точность аппроксимации возрастает при увеличении чис­ла нейронов в скрытом слое. Однако при слишком большой размерности скрыто­го слоя может наступить явление, называемое перетренировкой сети.

На первом рисунке показана нейронная сеть с 5-ю скрытыми, а на втором – с 20-ю скрытыми нейронными элементами. Объем обучающей выборки при этом равняется 12. Как следует из рисунков, нейронная сеть с пя­тью скрытыми нейронами достаточно точно аппроксимирует функ­цию на тех данных, которым ее не учили (сплошная линия). Нейрон­ная сеть с 20-ю скрытыми нейронами хорошо аппроксимирует функ­цию только на тренировочных наборах (на рис. они представлены кружками). Отсюда следует, что слишком большое число нейронов в скрытом слое ухудшает их обобщающие способности. Поэтому их число в скрытом слое должно быть меньше числа тренировочных образцов. С другой стороны, при слиш­ком малой размерности скрытого слоя можно попасть в локальный минимум или процесс обучения будет слишком дли­тельным. Здесь необходим разумный компромисс.

Для обеспечения требуемой точности и обобщающей способно­сти можно использовать нейронную сеть с двумя скрытыми слоями, размерность которых меньше, чем при использовании трехслойной сети. Однако нейронные сети, которые имеют несколько скрытых слоев, обучаются значительно медленнее.

Как отмечалось ранее, одним из недостатков метода градиентного спуска является застревание его в нежелательных локальных минимумах. Для нейтрализации этого недостатка можно использовать метод тяжелого шарика. В этом случае модификация синаптических связей сети происходит в соответствии с выражением

где g – величина постоянная, которая называется моментным па­раметром.

Его значение выбирается из диапазона [0, 1], но часто ис­пользуется g = 0.9.

Слагаемое g D wij (t) называется моментным термом. Он позволяет выходить из небольших локальных минимумов.

Исходя из приведенных рассуждений, можно сделать следующие выводы:

ü нейронная сеть с одним скрытым слоем позволяет осуществить любое ото­бражение входных сигналов в выходные;

ü число нейронных элементов в промежуточном слое должно быть меньше числа тренировочных образцов;

ü мощность нейронной сети можно увеличивать как за счет числа нейронов в слое, так и за счет числа слоев. Если на нейронную сеть накладываются ограничения п.2 и она не может решить поставленную задачу, то необходимо увеличивать число скрытых слоев нейронной сети;

ü случайная инициализация весовых коэффициентов нейронной сети должна проходить в достаточно узком диапазоне значений.

 

 







Дата добавления: 2015-09-04; просмотров: 1038. Нарушение авторских прав; Мы поможем в написании вашей работы!



Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...

Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...

Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Правила наложения мягкой бинтовой повязки 1. Во время наложения повязки больному (раненому) следует придать удобное положение: он должен удобно сидеть или лежать...

ТЕХНИКА ПОСЕВА, МЕТОДЫ ВЫДЕЛЕНИЯ ЧИСТЫХ КУЛЬТУР И КУЛЬТУРАЛЬНЫЕ СВОЙСТВА МИКРООРГАНИЗМОВ. ОПРЕДЕЛЕНИЕ КОЛИЧЕСТВА БАКТЕРИЙ Цель занятия. Освоить технику посева микроорганизмов на плотные и жидкие питательные среды и методы выделения чис­тых бактериальных культур. Ознакомить студентов с основными культуральными характеристиками микроорганизмов и методами определения...

САНИТАРНО-МИКРОБИОЛОГИЧЕСКОЕ ИССЛЕДОВАНИЕ ВОДЫ, ВОЗДУХА И ПОЧВЫ Цель занятия.Ознакомить студентов с основными методами и показателями...

Конституционно-правовые нормы, их особенности и виды Характеристика отрасли права немыслима без уяснения особенностей составляющих ее норм...

Толкование Конституции Российской Федерации: виды, способы, юридическое значение Толкование права – это специальный вид юридической деятельности по раскрытию смыслового содержания правовых норм, необходимый в процессе как законотворчества, так и реализации права...

Значення творчості Г.Сковороди для розвитку української культури Важливий внесок в історію всієї духовної культури українського народу та її барокової літературно-філософської традиції зробив, зокрема, Григорій Савич Сковорода (1722—1794 pp...

Studopedia.info - Студопедия - 2014-2024 год . (0.012 сек.) русская версия | украинская версия