Работа с пакетом Excel Neural Package Winnet 3.0
Возможны два варианта работы с системой. В первом случае вы впервые работаете с данными, во втором - обученная в прошлом нейросеть используется для работы с новыми данными. Если вы впервые работаете с данными, в этом случае ваша задача – обучить нейросеть на заданном наборе данных. При этом нейросеть построит аппроксимацию многомерных данных, автоматически подбирая свои внутренние параметры – веса нейронов. Для этого вам необходимо выполнить следующее. • Загрузить данные из книги MS Excel в систему. • Определить данные: что является входной информацией, а что – выходной. • Предобработать данные, т.е. пронормировать их. • Попутно можно оценить значимость различных входов для выходной информации и, если необходимо, изменить (удалить/добавить) входы. • Создать нейросеть. • Обучить нейросеть на определенном вами множестве примеров и оценить работу на тестовом множестве. • Сохранить предсказанные (обработанные) данные в книге MS Excel. • Если это необходимо, сохранить обученную нейросеть для дальнейшей работы. Разберем эти действия по шагам. 1. Для работы с данными выделите область на листе книги MS Excel. По определению данные на листе располагаются следующим образом: входы и выходы – столбцы, а строки – это обучающие примеры. Выделяемая область может включать в первой строке названия входов как на русском, так и на английском языке. 2. Щелкните мышкой по кнопке с изображением нейрона на панели инструментов «Neural Analysis». В ответ появится диалоговое окно «Select data source», предлагающее уточнить параметры области данных для работы. 3. Если параметры ввода вас удовлетворяют, нажмите кнопку «ОК». 4. Перед вами откроется основное окно Winnet 3.0 - программы-эмулятора многослойного персептрона. Окно содержит четыре табулированных листа: «Data», «Network», «Training» и «Output», ассоциированных с общими этапами работы. 5. Открывшийся перед вами лист «Data»позволяет определить и предобработать данные для последующего использования. Кроме того, с этого листа можно сохранить обученную нейросеть («Save Project…») или загрузить уже сохраненный в прошлом проект («Load Project…»). Первое, что вам надо сделать, - это определить входы, для чего нажмите кнопку «Select Inputs…». 6. В открывшемся диалоговом окне «Select Inputs» выберите в окне списка «All Data» необходимые входы и с помощью кнопки «> >» переведите в окно списка «Inputs». Корректировку выбранных входов можно провести, используя кнопку «<». 7. Поскольку конкретные значения входов могут быть любого диапазона, то рекомендуется выполнить их нормировку. Для большинства случаев подходит нормировка входных значений «Mean/Variance». При этом данные переводятся в безразмерную форму вычитанием среднего и нормированием на их дисперсию. Таким образом, все входы нейросети становятся сравнимыми по порядку величины. Другие возможные способы нормировки – линейное приведение к диапазону «-1+1» («[-1+1] normalization») и нелинейное преобразование гиперболическим тангенсом («than-normalization»). Нажмите кнопку «Normalization…» и выберите в открывшемся окне «Inputs normalization» соответствующую позицию переключателя. Подтвердите ваш выбор нажатием кнопки «Ок». Вернувшись в окно «Select Inputs», также подтвердите ваш выбор нажатием кнопки «Ок». 8. Нажав кнопку «Select Outputs…», аналогично пп.6 и 7 самостоятельно определите и нормализуйте выходы системы. 9. Теперь начинается один из самых творческих моментов – определение значимости входной информации для предсказания выходной. Нажмите кнопку «Boxcouting…» - и система самостоятельно, используя новейший алгоритм Boxcouting, определит статистическую значимость входов для заданных выходов. В открывшемся после непродолжительной работы программы окне «Boxcouting results» в удобном для восприятия графическом виде представлена результирующая информация.
Основные закономерности: • чем выше столбец гистограммы для данного входа, тем значимее его информация; • чем больше отношение Mean predictability/Variance отличается от 1, тем большего успеха можно достичь в предсказании выходной информации. Не имеет смысла использовать для предсказания входы, значимость которых равна или близка к нулю. Поэтому, вернувшись в основное окно, удалите эти входы из списка «Inputs». Данную процедуру по определению значимости входов можно повторить несколько раз. Дело в том, что уменьшение количества входов даст вам возможность в будущем существенно сократить время обучения нейросети либо и увеличить ее нелинейные свойства. 10. Следующий этап – создание нейросети как многослойного персептрона. Перейдите на закладку «Network» и нажмите кнопку «Create Net…». В открывшемся окне «Network Construction » вы можете полностью определить структуру и топологию нейросети: · количество слоев; · тип выходной функции нейронов данного слоя; · число нейронов в слое; · порядок нелинейности нейронов данного слоя. При создании нейросети необходимо руководствоваться следующими простыми соображениями: · Если вы хотите, чтобы построенная нейросеть хорошо аппроксимировала исходные данные (находила статистически значимые закономерности), общее число связей сети (весов) должно быть в несколько раз, в лучшем случае - на порядок меньше числа обучающих примеров. Это обеспечит достаточно гладкую аппроксимацию данных. В противном случае построенная нейросеть просто " запомнит" ваши данные, потеряв возможность делать статистически значимые предсказания на новых данных. Это нежелательное явление называется " переобучением". · В большинстве задач аппроксимации нет смысла использовать архитектуру нейросети с количеством скрытых слоев более одного. Нелинейный же характер нейросети определяется количеством нейронов в этом скрытом слое. · Мы рекомендуем использование порядка нелинейности нейрона более единицы только «особо продвинутым» пользователям.
|