Книга представляет собой введение в основные понятия, методы и ал


Download 0.87 Mb.
bet7/21
Sana18.03.2023
Hajmi0.87 Mb.
#1283133
TuriКнига
1   2   3   4   5   6   7   8   9   10   ...   21
Bog'liq
machine-learning-mironov

Проблема переобучения


Переобучение – это чрезмерно точная подгонка АФ 𝑎𝑆 под обучаю- щую выборку 𝑆, которая дает сильные отклонения значений 𝑎𝑆() от правильных значений (т.е. от 𝑓 ()) для многих объектов , не входящих в обучающую выборку 𝑆.
Причины возникновения переобучения:


излишние степени свободы в предсказательной модели 𝑎(, ), при- водящие к учету при построении 𝑎𝑆 различных шумов, неточностей и ошибок в данных,

  • неполнота обучающей выборки 𝑆.

Переобучение можно обнаружить следующими способами.
  1. Cкользящий контроль (LOO, leave-one-out).


Пусть задана обучающая выборка 𝑆 = {(, ) | = 1, . . . , }.
∀ = 1, . . . , обозначим записью 𝑆 − выборку
{(, ) | = 1, . . . , − 1, + 1, . . . , }.
Признаком переобучения является высокое значение выражения




∑︁1

(𝑎


=1
𝑆−
, )

Данный способ контроля переобучения можно представить в ви- де одного из условий оптимальности алгоритма обучения: данное условие имеет вид






∑︁1

(𝑎


=1
𝑆−
, ) → min



  1. Кросс-проверка (cross-validation).


Делается разбиение выборки на две части 𝑆1 и 𝑆2, обучение идет по 𝑆1, а 𝑆2 используется для проверки качества обучения.
Признаком переобучения является высокое значение выражения
𝑄(𝑎𝑆1 , 𝑆2).


1

2

1

2
Данный способ контроля переобучения тоже можно представить в виде одного из условий оптимальности алгоритма обучения: выби- рается 𝑁 различных разбиений обучающей выборки 𝑆 на две части (︁𝑆(1), 𝑆(1))︁, . . . , (︁𝑆(𝑁 ), 𝑆(𝑁 ))︁,

и одно из условий оптимальности алгоритма обучения имеет вид






∑︁
𝑁

1
𝑄(𝑎
=1
𝑆()
, 𝑆()) → min




Download 0.87 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   10   ...   21




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling