0:00
[МУЗЫКА]
[МУЗЫКА]
Рассмотрим задачу оптимального управления мимнимально-фазовыми объектами.
Обычно курсы оптимального управления начинают с линейно-квадратичной задачи.
Но наш курс вводный, и мы можем себе позволить рассмотреть
самую простую из постановок просто потому, что специальным,
более развернутым разделам могут быть посвящены отдельные курсы.
Итак, мы будем
рассматривать дискретные объекты управления,
которые описываются подчеркнутым уравнением.
α и β — это многочлены,
∇ — сдвиг вперед на один такт,
степень α = n, степень β — n − 1, это означает,
что старший коэффициент отличен от нуля.
И кроме того, имеется неотрицательное запаздывание l,
которое задерживает значение управляющего воздействия на входе.
Возмущение предполагается
ограниченным и в остальном произвольным.
Это означает, что мы рассматриваем минимаксную постановку задачи.
Можно считать, что возмущением управляет некий противник,
супостат, который борется с регулятором,
направленным на достижение цели стабилизации.
Показателем качества достижения этой цели служит функционал J.
J от управления,
а управление мы ищем в виде обратной связи от выхода,
это супремум по всем
желтым возмущениям
верхнего предела по времени |yk|.
Стоит посмотреть на этот функционал.
Верхний предел снимает зависимость от времени,
это означает, что мы пренебрегаем всеми переходными процессами.
А взятие супремума означает,
что мы рассматриваем наихудший для нас выбор возмущений.
Таким образом, оптимальный регулятор,
построенный в смысле этого функционала, он самый осторожный.
Тот уровень функционала, который он гарантирует,
гарантирован тем самым для любого возмущения из рассматриваемого класса.
Как же решается эта задача?
Давайте определим многочлен с единственным
ненулевым единичным коэффициентом, многочлен λ в степени (n + l).
И разделим его на многочлен α с остатком.
Разделить с остатком — значит,
найти такие многочлены δ(λ) и γ(λ),
чтобы выполнялось выделенное равенство,
и при этом степень γ была меньше степени α.
Ясно, между прочим,
что старший коэффициент δ(λ) должен быть равен 1,
поскольку в левой части у нас коэффициент 1 при λ в
степени n + l, и у α старший коэффициент 1.
Определив такие многочлены, мы можем
вычислить y в момент k + n + l.
В силу нашего тождества для введенных многочленов,
это δ(∇) α(∇), примененные к yk,
+ γ(∇), тоже примененной к yk.
А теперь α(∇) yk можно заменить,
используя уравнение объекта управления,
заменить на правую часть этого уравнения.
Затем мы объединяем в фигурных скобках все слагаемые,
куда не входит возмущение.
И обозначаем их r k + n − 1.
А оставшиеся слагаемые
это многочлен δ(∇), примененный к возмущению.
Довольно очевидно,
что занулив фигурную скобку рыжую,
мы получаем оптимальное управление.
Почему это так?
Ну, во-первых, на любом регуляторе можно найти
возмущение v из рассматриваемого класса ограниченных возмущений,
вот оно выписано, которое максимизирует
модуль y k + n + l.
Это возмущение максимальное по модулю, а знак
выбран так описанным способом,
чтобы модуль выхода был равен
сумме модуля фигурной
скобки и максимального значения
слагаемых, зависящих от возмущения.
Вот выписано это максимальное значение.
Мы обозначаем сумму модулей коэффициентов многочлена δ как его норму.
Действительно, l1 норма,
если рассматривать многочлен как вектор его коэффициентов.
Итак, для любого регулятора
предъявленное возмущение обеспечивает
значение функционала не меньше, чем J надчеркнутое,
а если мы занулим
фигурную скобку, то есть выберем такое u,
чтобы фигурная скобка стала равна 0,
то |y| будет меньше или равен надчеркнутого J.
То есть таким образом
уравнение {...} = 0 действительно задает оптимальный регулятор.
Надо еще проверить и убедиться с легкостью,
что оно является допустимой обратной связью.
Это действительно так, потому что старший коэффициент β не нулевой,
старший коэффициент δ = 1, а γ имеет степень,
не превосходящую n − 1.
Таким образом, это условие неупреждаемости
для этого уравнения соблюдено.
[БЕЗ_ЗВУКА]