«Обучение нейронных сетей. Алгоритм обратного распространения ошибки»


Download 0.6 Mb.
Sana18.06.2023
Hajmi0.6 Mb.
#1558921
Bog'liq
Rashidov N

«Алгоритмы прямого и обратного распространения нейронных сетей»

Выполнил: студент 3-го курса

Группы 617-20

Рашидов.Н

Современные парадигмы обучения нейронных сетей

  • с учителем
  • без учителя

Есть готовый ответ
Самообучение

Определение

Алгоритм обратного распространения ошибки - это один из методов обучения многослойных нейронных сетей прямого распространения

Сети прямого распространения

  • все связи направлены строго от входных нейронов к выходным. К таким сетям относятся, например: простейший персептрон (разработанный Розенблаттом) и многослойный персептрон.
  • Реккурентные нейронные сети – сигнал с выходных нейронов или нейронов скрытого слоя частично передается обратно на входы нейронов входного слоя.

Алгоритм. Шаг 1

сеть функционирует в нормальном режиме - вычисляются выходные данные

Алгоритм. Шаг 2

  • сравнение выходных данных с известными выходными данными для данного входного набора.
  • вычисление вектора ошибки.

Алгоритм. Шаг 3

  • использование вектора ошибки для изменения весовых коэффициентов выходного слоя
  • для уменьшения вектора ошибки при повторной подаче того же набора входных данных

Алгоритм. Шаг 4

  • изменение весовых коэффициентов скрытого слоя

Алгоритм. Шаг 5

  • если в сети существует входной слой (именно слой, а не ряд входных значений), с ним проводятся аналогичные действия

Особенность обучения сети

  • сеть обучается путем предъявления каждого входного набора данных и последующего распространения ошибки
  • цикл повторяется много раз

Недостатки алгоритма

  • Паралич сети
  • Локальные минимумы
  • Размер шага
  • Переобучение сети

  • %-)

Заключение

  • Современные искусственные нейронные сети представляют собой устройства, использующие огромное число искусственных нейронов и связей между ними. Несмотря на то, что конечная цель разработки нейронных сетей - полное моделирование процесса мышления человека так и не была достигнута, уже сейчас они применяются для решения очень многих задач обработки изображений, управления роботами и непрерывными производствами, для понимания и синтеза речи, для диагностики заболеваний людей и технических неполадок в машинах и приборах, для предсказания курсов валют и тд

Download 0.6 Mb.

Do'stlaringiz bilan baham:




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling