Обучение с подкреплением
- система подкрепления, при которой веса всех активных связей cij, которые оканчиваются на некотором элементе uj, изменяются на одинаковую величину Δvij(t) = η, или с постоянной скоростью в течение всего времени действия подкрепления, причем веса неактивных связей за это время не изменяются.
- Перцептрон, в котором используется α-система подкрепления, называется α-перцептроном.
- Подкрепление называется дискретным, если величина изменения веса является фиксированной, и непрерывным, если эта величина может принимать произвольное значение.
Альфа-система подкрепления
- такое правило изменения весовых коэффициентов некоторого элемента, при котором веса всех активных связей сначала изменяются на равную величину, а затем из их всех весов связей вычитается другая величина, равная полному изменению весов всех активных связей, деленному на число всех связей.
- Эта система обладает свойством консервативности относительно весов, так как у нее полная сумма весов всех связей не может ни возрастать, ни убывать.
Гамма-система подкрепления
Машинное обучение
Искусственные нейронные сети
- математические модели, а также их программные или аппаратные реализации, построенные по принципу организации и функционирования биологических нейронных сетей — сетей нервных клеток живого организма. Это понятие возникло при изучении процессов, протекающих в мозге, и при попытке смоделировать эти процессы.
Искусственные нейронные сети
- ИНС представляют собой систему соединённых и взаимодействующих между собой простых процессоров (искусственных нейронов). Каждый процессор подобной сети имеет дело только с сигналами, которые он периодически получает, и сигналами, которые он периодически посылает другим процессорам. И тем не менее, будучи соединёнными в достаточно большую сеть с управляемым взаимодействием, такие локально простые процессоры вместе способны выполнять довольно сложные задачи.
- С математической точки зрения, обучение нейронных сетей — это многопараметрическая задача нелинейной оптимизации. Технически обучение заключается в нахождении коэффициентов связей между нейронами. В процессе обучения нейронная сеть способна выявлять сложные зависимости между входными данными и выходными, а также выполнять обобщение. Это значит, что в случае успешного обучения сеть сможет вернуть верный результат на основании данных, которые отсутствовали в обучающей выборке, а также неполных и/или «зашумленных», частично искаженных данных.
- Сети прямого распространения (Feedforward)
- Многослойный перцептрон
- Сети Ворда
- Рекуррентные нейронные сети
- Сеть Хопфилда
- Сеть Хемминга
- Сеть Коско
- Радиально-базисные функции (RBF)
- Самоорганизующаяся карта Кохонена (SOM)
Do'stlaringiz bilan baham: |