1. Критерии и показатели эффективности системы управления
Интегральный функционал Летова-Калмана
Download 72.11 Kb.
|
1 2
Bog'liqОтветы.на.вопросы
2. Интегральный функционал Летова-Калмана.
Формулировка нелинейной задачи управления А.М. Летова. Пусть имеется стационарный объект управления, движение которого описывается нелинейным векторно-матричным уравнением: X(t) = A[X(t)]+ B[X(t)] U(t)⋅ , (4.1) причем составляющие xi, i = 1, 2,…,n вектора состояния X имеют смысл отклонений траектории от заданного (невозмущенного) движения. Предполагается, что компоненты функциональных матриц A(X), B(X) размерностей n×n и n×m этого уравнения представляют собой полиномиальные зависимости или разложимы в ряд Тейлора в окрестности точки x1 =...= xn = 0: n n n ( X)i = ∑a i j x j + ∑ a ijk x xj ka ijk l x xj k x l + ..., i =1,2,...,n ; (4.2) j 1= j,k 1= n n (X)ij = b + b x + bijklx xk l +", i =1,2,...,n , j =1,2,…,m . (4.3) Требуется найти m-мерное управление U = U(X) ≡ U(x ,x ,..,x )1 2 n , (4.4) которое в совокупности с объектом (4.1) образует асимптотически устойчивую систему, переводящее ее из начального состояния X(t=0) = X0 в конечное нулевое состояние X(t→∞) = 0 с минимальным значением квадратичного функционала: I (X (t)QX(t)T + U (t)RU(t) dtT ) , (4.5) где R, Q − симметричные вещественные положительно-определенные матрицы размерностей n×n и m×m весовых коэффициентов критерия. Подчеркнем, что в задаче А.М. Летова ограничения на координаты векторов X, U не накладываются. Наиболее приспособленным к решению сформулированной вариационной задачи управления является метод динамического программирования Р.Беллмана, который в отличие от классического вариационного исчисления и принципа максимума Л.С. Понтрягина позволяет определять оптимальное управление непосредственно в форме обратной связи. Для объекта управления первого порядка задача (4.1) – (4.5) была решена в подразд. 2.4, посвященном изложению метода Р. Беллмана. Применяя матричные операции, указанное решение распространим на многомерную задачу АКОР (4.1) – (4.5). Переходя к решению задачи (4.1)–(4.5), запишем основное функциональное уравнение Р. Беллмана ⎧dS[X(t)] T T ⎫ min⎨ + X QX + U RU⎬ = 0. (4.6) U ⎩ dt ⎭ Учтем, что dS[X(t)] n ∂S[X(t)] = ∑ ⋅x (t) i . (4.7) dt i 1= ∂xi Введем в рассмотрение вектор T ∂S[X] ⎛ ∂S ∂S ∂S ⎞ ∂X ⎜⎝∂x1 , ∂x2 ,...,∂xn ⎟⎟⎠ , (4.8) = ⎜ с помощью которого выражение (4.7) можно записать так: dS[X(t)] ⎛∂S[X]⎞T ⎛ ∂S ⎞T = ⎜ ⎟ ⋅ X = ⎜ ⎟ (A(X) + B(X)U). (4.9) dt ⎝ ∂X ⎠ ⎝ ∂X⎠ С учетом соотношения (4.9) уравнение Беллмана (4.6) принимает вид ⎧⎪⎛ ∂S ⎞T T T ⎫⎪ min⎨⎜ ⎟ (A(X) + B(X)U)+ X QX + U RU⎬ = 0. (4.10) U ⎪⎩⎝∂X⎠ ⎪⎭ Для определения оптимального управления дифференцируем выражение в фигурных скобках по U; с учетом того, что согласно соотношениям (3.41) df d ( T ) ( T )T T = U RU = U R + RU = R U + RU = 2RU, (4.11) dU dU получаем T ⎛⎜⎛ ∂S ⎞T ⎞⎟ + 2RU = 0. ⎜⎜∂ ⎟ B(X)⎟ ⎝⎝ X⎠ ⎠ Отсюда находим оптимальное управление 1 −1 T ∂S U = − R B(X) . (4.12) 2 ∂X Подставим это управление в уравнение Беллмана (4.10): T T ⎛ ∂S ⎞ 1⎛ ∂S ⎞ −1 T ∂S T ⎜ ⎟ A(X) − ⎜ ⎟ B(X)R B (X) + X QX + ⎝ ∂X ⎠ 2⎝ ∂X ⎠ ∂X (4.13) T 1⎛ −1 T ∂S ⎞ ⎛ −1 T ∂S ⎞ + ⎜R B (X) ⎟ ⋅ R ⋅⎜R B (X) ⎟ = 0. 4⎝ ∂X ⎠ ⎝ ∂X ⎠ Последнее слагаемое в уравнении (4.13) с учетом симметрии матрицы R = RT и матричного равенства (R−1)T = (RT)−1 (4.14) преобразуется к виду T T 1 ⎛ ∂S ⎞ ⋅ (R −1B (X)T )T ⋅ B (X)T ∂S = 1 ⎜⎛ ∂S ⎟⎞ B(X)R −1B (X)T ∂S . ⎜ ⎟ 4 ⎝∂X ⎠ ∂X 4 ⎝∂X ⎠ ∂X Таким образом, уравнение (4.13) принимает вид T T ⎛ ∂S ⎞ 1 ⎛ ∂S ⎞ −1 T ∂S T ⎜ ⎟ A(X) − ⎜ ⎟ B(X)R B (X) + X QX = 0, (4.15) ⎝∂X ⎠ 4 ⎝ ∂X ⎠ ∂X которое является уравнением Гамильтона–Якоби–Беллмана для рассматриваемой задачи оптимального управления. Если мы сможем найти решение нелинейного уравнения в частных производных (4.15) относительно функции S(X) при граничном условии S[X(t∞)] = 0 (оно непосредственно вытекает из определения функции Беллмана), то в соответствии с уравнением (4.12) легко определим искомый оптимальный закон обратной связи. Таким образом, в прикладном плане задача синтеза регулятора сведена к поиску решений уравнения Гамильтона–Якоби–Беллмана. Необходимо отметить, что хотя уравнение (4.15) известно более 40 лет, однако общие методы решения этого уравнения в настоящее время по существу отсутствуют и синтез оптимальных управлений нелинейными объектами наталкивается на серьезные математические трудности поиска численного и, тем более, аналитического решения данного уравнения [9]. Общее решение уравнения в частных производных (4.15) установлено только для линейных объектов управления. Download 72.11 Kb. Do'stlaringiz bilan baham: |
1 2
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling