Формирование наборов данных
Набор обучающих данных должен представлять для нейронной сети графическое изображение цифр от 0 до 9. Каждая цифра представляется сеткой 9х7:
Для создания набора обучающих данных можно применить два способа.
Первый способ
Создать в пакете STATISTICA Neural Networks набор данных (Data Set). Число вход-ных переменных должно быть равно 63 (по числу пикселей). Значение входной перемен-ной равно 1, если соответствующий пиксель черный, иначе значение равно 0. Выходная переменная – одна, её значения должны быть номинальными (zero, one, two, three,…, nine).
Число наблюдений обучающего набора данных – 10 (по числу цифр).
Второй способ
Воспользоваться приложением «Рисование цифр», генерирующим текстовый файл, содержащий набор данных. Приложение включает таблицу 9х7 с возможностью уста-новки пикселей.
Текстовые файлы с разделителями (знаками табуляции – TAB, запятыми – Comma, пробелами – Space, точками с запятой – Semi-colon) можно импортировать в пакет STA-TISTICA Neural Networks. При этом, по желанию, первую строку файла можно оставлять для имен переменных, а первый столбец – для имен наблюдений.
При открытии текстового файла STATISTICA Neural Networks покажет диалоговое окно Text Import Wizard, которое позволит вам определить способ структурирования тек-ста.
После импорта набора данных определите выходную переменную и сделайте её но-минальной.
Создание и обучение нейронной сети
Создайте новую нейронную сеть с числом слоев равным 3 (один слой – входной, один – скрытый и один – выходной). Число нейронов скрытого слоя выбрать произволь-но.
Обучите нейронную сеть методом обратного распространения (Back Propagation). Следите за среднеквадратичной ошибкой по графику (Training Error Graph).
Проверка работы нейронной сети
После окончания обучения следует проверить качество работы нейронной сети.
Сначала проверьте способность к распознаванию на обучающем наборе. Естествен-но, на этом наборе все изображения цифр сеть должна распознавать правильно.
Затем создайте новый набор данных, в который входят зашумленные (искаженные) в разной степени изображения цифр. Например, в один такой набор могут входить циф-ры с измененными (добавленными или удаленными) одним-двумя пикселями. Во второй набор – цифры с измененными тремя-четырьмя пикселями и т. д.
Сделайте вывод, при каком искажении (в процентах) сеть способна правильно рас-познавать цифры. Меру искажения определяйте по формуле:
Искажение = (Число искаженных пикселей / Общее число пикселей)*100%.
[1] Далее так будем называть количество уровней
[2] Для любого узла ключ слева не должен превосходить, а ключ справа должен превосходить ключ узла
[3] В работе С. Д. Кондратьевой [2] данное действие называлось малым левым поворотом.
[4] Балансом узла условимся называть разность между высотами правой и левой веток узла
[5] В данном случае удаление узла влечет за собой изменение высоты ветки
[6] Этот поворот называют малым правым поворотом
[7] Здесь если размер стека не превосходит 64Кбайт, то данный недостаток перестает быть актуальным
[8] здесь, положительную разницу условимся понимать как большую высоту правого поддерева.
[9] В данном случае высота всегда изменяется на единицу.
[10] Это как раз те данные, которые позволяют рассматривать частные случаи поворотов.
[11] Случай, показанный на рис. 11б может возникнуть только при удалении узла из правого поддерева.







