Ko'p bosqichli qarorlar jarayonini ko'rib chiqing, ya'ni dinamikasi bilan NLP tengligi cheklangan
bu
yerda k - diskret vaqt ko'rsatkichi, xk - k vaqtning holati, uk - qo'llaniladigan boshqarish qarori
vaqt k, N vaqt gorizonti, gk (·, ·) bir lahzali qiymat, gN (·) esa yakuniy yoki terminal
qiymati.
Bir so'z bilan aytganda, optimizm printsipi quyidagicha. O'z vaqtida k qadamini bersangiz, deb bilasiz
kelajakda eng maqbul qarorlar, ya'ni
∗
(k + 1), u ∗
(k + 2), · · ·, u ∗
(N - 1). Shunda siz eng yaxshisini hisoblashingiz mumkin
joriy vaqt bosqichi uchun echim va kelajakdagi qarorlar bilan bog'lanish. Buni rekursiv ravishda bajarish mumkin
N-1 oxiridan boshlab va orqaga qarab harakat qilish orqali.
Matematik jihatdan optimizm printsipi aniq quyidagicha ifodalanishi mumkin. Vk (xk) ni aniqlang
eng maqbul "xarajat qilish" (a.k.a.
N, hozirgi holati xk ni hisobga olsak.
quyidagicha:
Do'stlaringiz bilan baham: |