1. Критерии и показатели эффективности системы управления


Интегральный функционал Летова-Калмана


Download 72.11 Kb.
bet2/2
Sana08.02.2023
Hajmi72.11 Kb.
#1168766
1   2
Bog'liq
Ответы.на.вопросы

2. Интегральный функционал Летова-Калмана.

Формулировка нелинейной задачи управления А.М. Летова. Пусть имеется стационарный объект управления, движение которого описывается нелинейным векторно-матричным уравнением:


X(t) = A[X(t)]+ B[X(t)] U(t)⋅ , (4.1)
причем составляющие xi, i = 1, 2,…,n вектора состояния X имеют смысл отклонений траектории от заданного (невозмущенного) движения.
Предполагается, что компоненты функциональных матриц A(X), B(X)
размерностей n×n и n×m этого уравнения представляют собой полиномиальные зависимости или разложимы в ряд Тейлора в окрестности точки x1 =...= xn = 0:
n n n

  1. ( X)i = ∑a i j x j + ∑ a ijk x xj ka ijk l x xj k x l + ..., i =1,2,...,n ; (4.2)

j 1= j,k 1=
n n

  1. (X)ij = b + b x + bijklx xk l +", i =1,2,...,n , j =1,2,…,m . (4.3)

Требуется найти m-мерное управление
U = U(X) ≡ U(x ,x ,..,x )1 2 n , (4.4)
которое в совокупности с объектом (4.1) образует асимптотически устойчивую систему, переводящее ее из начального состояния X(t=0) = X0 в конечное нулевое состояние X(t→∞) = 0 с минимальным значением квадратичного функционала:
I (X (t)QX(t)T + U (t)RU(t) dtT ) , (4.5)
где R, Q − симметричные вещественные положительно-определенные матрицы размерностей n×n и m×m весовых коэффициентов критерия.
Подчеркнем, что в задаче А.М. Летова ограничения на координаты векторов X, U не накладываются.
Наиболее приспособленным к решению сформулированной вариационной задачи управления является метод динамического программирования Р.Беллмана, который в отличие от классического вариационного исчисления и принципа максимума Л.С. Понтрягина позволяет определять оптимальное управление непосредственно в форме обратной связи. Для объекта управления первого порядка задача (4.1) – (4.5) была решена в подразд. 2.4, посвященном изложению метода Р. Беллмана. Применяя матричные операции, указанное решение распространим на многомерную задачу АКОР (4.1) – (4.5).
Переходя к решению задачи (4.1)–(4.5), запишем основное функциональное уравнение Р. Беллмана
⎧dS[X(t)] T T
min⎨ + X QX + U RU⎬ = 0. (4.6)
U ⎩ dt ⎭
Учтем, что
dS[X(t)] n ∂S[X(t)]
= ∑ ⋅x (t) i . (4.7) dt i 1= ∂xi
Введем в рассмотрение вектор T
∂S[X] ⎛ ∂S ∂S ∂S ⎞

X ⎝∂x1 , x2 ,...,xn ⎟⎟, (4.8) = ⎜

с помощью которого выражение (4.7) можно записать так: dS[X(t)] ⎛∂S[X]⎞T ⎛ ∂S ⎞T
= ⎜ ⎟ ⋅ X = ⎜ ⎟ (A(X) + B(X)U). (4.9) dt ⎝ ∂X ⎠ ⎝ ∂X⎠
С учетом соотношения (4.9) уравнение Беллмана (4.6) принимает вид
⎧⎪⎛ ∂S ⎞T T T ⎫⎪
min⎨⎜ ⎟ (A(X) + B(X)U)+ X QX + U RU⎬ = 0. (4.10)
U ⎝∂X⎠ ⎪⎭

Для определения оптимального управления дифференцируем выражение в фигурных скобках по U; с учетом того, что согласно соотношениям (3.41) df d ( T ) ( T )T T
= U RU = U R + RU = R U + RU = 2RU, (4.11) dU dU
получаем
T

⎛⎜⎛ ∂S T ⎞⎟ + 2RU = 0. ⎜⎜∂ ⎟ B(X)⎟
⎝⎝ X⎠ ⎠
Отсюда находим оптимальное управление
1 1 T ∂S
U = − R B(X) . (4.12)
2 ∂X
Подставим это управление в уравнение Беллмана (4.10):
T T
⎛ ∂S ⎞ 1⎛ ∂S ⎞ 1 T ∂S T
⎜ ⎟ A(X) − ⎜ B(X)R B (X) + X QX +
⎝ ∂X ⎠ 2⎝ ∂X ⎠ ∂X
(4.13)
T
1⎛ −1 T ∂S ⎞ ⎛ −1 T ∂S ⎞
+ R B (X) ⋅ R ⋅R B (X) = 0.
4⎝ ∂X ⎠ ⎝ ∂X ⎠
Последнее слагаемое в уравнении (4.13) с учетом симметрии матрицы R = RT и матричного равенства
(R1)T = (RT)1 (4.14)
преобразуется к виду
T T
1 ⎛ ∂S ⎞ ⋅ (R −1B (X)T )T ⋅ B (X)T ∂S = 1 ⎜⎛ ∂S ⎟⎞ B(X)R −1B (X)T ∂S .
⎜ ⎟
4 ⎝∂X ⎠ ∂X 4 ⎝∂X ⎠ ∂X
Таким образом, уравнение (4.13) принимает вид
T T
⎛ ∂S ⎞ 1 ⎛ ∂S ⎞ 1 T ∂S T
⎜ ⎟ A(X) − ⎜ ⎟ B(X)R B (X) + X QX = 0, (4.15)
⎝∂X ⎠ 4 ⎝ ∂X ⎠ ∂X которое является уравнением Гамильтона–Якоби–Беллмана для рассматриваемой задачи оптимального управления.
Если мы сможем найти решение нелинейного уравнения в частных производных (4.15) относительно функции S(X) при граничном условии S[X(t)] = 0 (оно непосредственно вытекает из определения функции Беллмана), то в соответствии с уравнением (4.12) легко определим искомый оптимальный закон обратной связи. Таким образом, в прикладном плане задача синтеза регулятора сведена к поиску решений уравнения Гамильтона–Якоби–Беллмана.
Необходимо отметить, что хотя уравнение (4.15) известно более 40 лет, однако общие методы решения этого уравнения в настоящее время по существу отсутствуют и синтез оптимальных управлений нелинейными объектами наталкивается на серьезные математические трудности поиска численного и, тем более, аналитического решения данного уравнения [9].
Общее решение уравнения в частных производных (4.15) установлено только для линейных объектов управления.
Download 72.11 Kb.

Do'stlaringiz bilan baham:
1   2




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling