Обучение сети
После создания нейронной сети необходимо задать параметры обучения в окне на рис. 2.7. Здесь Использовать для обучения сети % выборки - все примеры, подаваемые на вход нейросети, делятся на 2 множества – обучающее и тестовое. Этот параметр определяет, сколько процентов примеров будут использоваться в обучающей выборке. Записи, используемые для тестирования, выбираются случайно, но пропорции сохраняются. Скорость обучения - параметр определяет амплитуду коррекции весов на каждом шаге обучения. Момент - параметр определяет степень воздействия i -ой коррекции весов на i +1-ую. Распознана, если ошибка по примеру< - если результат прогнозирования отличается от значения из обучаемого множества меньше указанной величины, то пример считается распознанным. Использовать тестовое множество как валидационное - при выборе этой опции обучение будет прекращено, как только ошибка на тестовом множестве начнет увеличиваться. Это помогает избежать ситуации переобучения сети. Критерии остановки обучения – осуществляется выбор условия завершения процесса обучения нейронной сети. Рис. 2.7 – Окно задания параметров обучения
Далее, в окне на рис. 2.8 можно запустить процесс обучения и наблюдать ход обучения нейронной сети Здесь Пуск обучения/остановка обучения - запуск процесса обучения. В таблице над кнопкой можно наблюдать, как меняется ошибка обучения. Распределение ошибки - на диаграмме отображается распределение ошибки. Зеленые столбцы – ошибка на обучающей выборке, красные – на тестовой выборке. Чем правее столбец, тем выше значение ошибки. Шкала от 0 до 1. Чем выше столбец, тем больше примеров с указанной ошибкой. Распределение примеров в обучающей/тестовой выборке - на этих графиках можно отслеживать насколько результаты, предсказанные нейронной сетью, совпадают со значениями в обучающей (слева) и тестовой (справа) выборке. Каждый пример обозначен на графике точкой. Если точка попадает на выделенную линию (диагональ), то значит, сеть предсказала результат с достаточно высокой точностью. Если точка находится выше диагонали, значит, сеть недооценила, ниже – переоценила. Необходимо добиваться, чтобы точки располагались как можно ближе к диагонали. Рис. 2.8 – Ход и результаты обучения сети
|