Regulator liniowo-kwadratowy

Wikipedia:Weryfikowalność
Ten artykuł od 2011-04 wymaga zweryfikowania podanych informacji.
Należy podać wiarygodne źródła w formie przypisów bibliograficznych.
Część lub nawet wszystkie informacje w artykule mogą być nieprawdziwe. Jako pozbawione źródeł mogą zostać zakwestionowane i usunięte.
Sprawdź w źródłach: Encyklopedia PWN • Google Books • Google Scholar • Federacja Bibliotek Cyfrowych • BazHum • BazTech • RCIN • Internet Archive (texts / inlibrary)
Po wyeliminowaniu niedoskonałości należy usunąć szablon {{Dopracować}} z tego artykułu.

Regulator liniowo-kwadratowy (LQR, ang. Linear-quadratic regulator) – regulator ze sprzężeniem zwrotnym, który określa rozwiązanie dla tzw. problemu LQ – to jest dla przypadku, w którym układ dynamiczny został opisany przez układ liniowych równań różniczkowych, a koszt (który ma być zminimalizowany zgodnie z zasadami teorii sterowania optymalnego) opisany jest funkcjonałem kwadratowym.

Wstęp

Regulator liniowo-kwadratowy stanowi istotną część w rozwiązaniu dla problemu LQG (ang. Linear-quadratic-Gaussian). Zarówno regulator liniowo-kwadratowy (LQR), jak i problem LQG zaliczają się do fundamentalnych zagadnień w teorii sterowania.

Poglądowo rzecz ujmując, w regulacji liniowo-kwadratowej chodzi o określanie nastaw regulatora sterującego np. maszyną lub procesem z wykorzystaniem algorytmu matematycznego, który minimalizuje funkcję kosztów. Parametrami tej funkcji są wagi podane przez inżyniera. Koszt (w istocie jego funkcja) jest najczęściej zdefiniowany jako suma pomierzonych odchyłek od wartości zadanych. Algorytm znajduje więc takie nastawy regulatora, które minimalizują niepożądane odchyłki pomiarów (np. temperatury, wysokości itp.). Czasami w powyższej sumie ujmuje się też samą wielkość związaną z działaniem sterującym, tak by energia zużyta na działanie sterujące była jak najmniejsza.

Taki regulator wyręcza więc inżyniera w żmudnej pracy związanej z optymalizacją regulacji. Jednak inżynier i tak musi wyspecyfikować wagi i sprawdzić jakie efekty dało ich zastosowanie w praktyce (często takie działanie przybiera charakter iteracyjny, gdyż specyfikacje i sprawdzenia trzeba powtarzać do czasu osiągnięcia zadowalających wyników).

Algorytm regulatora liniowo-kwadratowego jest w istocie zautomatyzowaną metodą doboru regulatora ze sprzężeniem zwrotnym opisanego zmiennymi stanu. Konieczność specyfikacji wag stanowi znaczną niedogodność w tej metodzie. Często inżynierowie preferują alternatywne metody takiego doboru (np. poprzez określanie położenia biegunów), które dają im lepszy wgląd w powiązanie pomiędzy zmianą parametrów a zmianami w obserwowanym systemie.

LQR w czasie ciągłym ze skończonym horyzontem

Dla liniowego systemu czasu ciągłego określonego na przedziale t [ t 0 , t 1 ] {\displaystyle t\in [t_{0},t_{1}]} równaniem

x ˙ = A x + B u {\displaystyle {\dot {x}}=Ax+Bu}

z kwadratową funkcją kosztu

J = x T ( t 1 ) F ( t 1 ) x ( t 1 ) + t 0 t 1 ( x T Q x + u T R u ) d t , {\displaystyle J=x^{T}(t_{1})F(t_{1})x(t_{1})+\int \limits _{t_{0}}^{t_{1}}\left(x^{T}Qx+u^{T}Ru\right)dt,}

sterowanie, ze sprzężeniem zwrotnym minimalizujące koszt, określone jest przez równanie

u = K x , {\displaystyle u=-Kx,}

gdzie K {\displaystyle K} dane jest wzorem

K = R 1 B T P ( t ) , {\displaystyle K=R^{-1}B^{T}P(t),}

a P {\displaystyle P} można znaleźć, rozwiązując równanie różniczkowe Riccatiego dla czasu ciągłego:

A T P ( t ) + P ( t ) A P ( t ) B R 1 B T P ( t ) + Q = P ˙ ( t ) {\displaystyle A^{T}P(t)+P(t)A-P(t)BR^{-1}B^{T}P(t)+Q=-{\dot {P}}(t)}

z warunkiem brzegowym:

P ( t 1 ) = F ( t 1 ) . {\displaystyle P(t_{1})=F(t_{1}).}

LQR w czasie ciągłym z nieskończonym horyzontem

Dla liniowego systemu czasu ciągłego określonego równaniem

x ˙ = A x + B u {\displaystyle {\dot {x}}=Ax+Bu}

z funkcją kosztu

J = 0 ( x T Q x + u T R u ) d t {\displaystyle J=\int _{0}^{\infty }\left(x^{T}Qx+u^{T}Ru\right)dt}

sterowanie, ze sprzężeniem zwrotnym minimalizujące koszt, określone jest przez równanie

u = K x , {\displaystyle u=-Kx,}

gdzie K {\displaystyle K} jest dane równaniem

K = R 1 B T P , {\displaystyle K=R^{-1}B^{T}P,}

a P {\displaystyle P} można znaleźć rozwiązując algebraiczne równanie Riccatiego dla czasu ciągłego:

A T P + P A P B R 1 B T P + Q = 0. {\displaystyle A^{T}P+PA-PBR^{-1}B^{T}P+Q=0.}

LQR w czasie dyskretnym ze skończonym horyzontem

Dla liniowego systemu dyskretnego określonego przez równanie

x k = A x k 1 + B u k {\displaystyle x_{k}=Ax_{k-1}+Bu_{k}}

z miarą jakości określoną przez

J = k = 0 N ( x k T Q x k + u k T R u k ) , {\displaystyle J=\sum \limits _{k=0}^{N}\left(x_{k}^{T}Qx_{k}+u_{k}^{T}Ru_{k}\right),}

optymalna sekwencja sterująca minimalizująca miarę jakości dana jest jako:

u k = F k x k 1 , {\displaystyle u_{k}=-F_{k}x_{k-1},}

gdzie:

F k = ( R + B T P k B ) 1 B T P k A , {\displaystyle F_{k}=(R+B^{T}P_{k}B)^{-1}B^{T}P_{k}A,}

a P k {\displaystyle P_{k}} można znaleźć poprzez iterację wstecz w czasie z wykorzystaniem dynamicznego równania Riccatiego:

P k 1 = Q + A T ( P k P k B ( R + B T P k B ) 1 B T P k ) A {\displaystyle P_{k-1}=Q+A^{T}\left(P_{k}-P_{k}B\left(R+B^{T}P_{k}B\right)^{-1}B^{T}P_{k}\right)A}

z warunkiem początkowym P N = Q . {\displaystyle P_{N}=Q.}

Uwaga (notacja zwyczajowa)

Funkcja minimalizująca (która nakłada „kary” na wartości kwadratów odchyłek sygnału na wejściu u {\displaystyle u} i zmiennych stanu układu x {\displaystyle x} ) zawiera odrębne, odpowiednie macierze wag Q {\displaystyle Q} i R {\displaystyle R} dla obu tych wartości. Przyjął się następujący zapis:

J = k = 0 N ( x k Q 2 + u k R 2 ) , {\displaystyle J=\sum \limits _{k=0}^{N}\left(\|\mathbf {x_{k}} \|_{Q}^{2}+\|\mathbf {u_{k}} \|_{R}^{2}\right),}

gdzie wyrażenia unormowane określone są jak poniżej:

x k Q 2 = x k T Q x k , {\displaystyle \|\mathbf {x_{k}} \|_{Q}^{2}=x_{k}^{T}Qx_{k},}
u k R 2 = u k T R u k . {\displaystyle \|\mathbf {u_{k}} \|_{R}^{2}=u_{k}^{T}Ru_{k}.}

LQR w czasie dyskretnym z nieskończonym horyzontem

Dla liniowego systemu dyskretnego określonego równaniem

x k + 1 = A x k + B u k {\displaystyle x_{k+1}=Ax_{k}+Bu_{k}}

z miarą jakości określoną przez

J = k = 0 ( x k T Q x k + u k T R u k ) , {\displaystyle J=\sum \limits _{k=0}^{\infty }\left(x_{k}^{T}Qx_{k}+u_{k}^{T}Ru_{k}\right),}

optymalna sekwencja sterująca minimalizująca miarę jakości dana jest jako:

u k = F x k , {\displaystyle u_{k}=-Fx_{k},}

gdzie:

F = ( R + B T P B ) 1 B T P A , {\displaystyle F=(R+B^{T}PB)^{-1}B^{T}PA,}

a P {\displaystyle P} jest jednoznacznym dodatnio określonym rozwiązaniem algebraicznego równania Riccati’ego dla czasu dyskretnego:

P = Q + A T ( P P B ( R + B T P B ) 1 B T P ) A . {\displaystyle P=Q+A^{T}\left(P-PB\left(R+B^{T}PB\right)^{-1}B^{T}P\right)A.}

Jedna z metod znalezienia rozwiązania tego równania polega na iteracji dynamicznego równania Riccatiego dla przypadku ze skończonym horyzontem, tak długo, aż osiągnie się zbieżność.

Zobacz też

  • p
  • d
  • e
Klasy układów
Wybrane typy regulacji
Metody klasyczne
Nowoczesna teoria sterowania
Inne zagadnienia
Dziedziny powiązane
Perspektywa historyczna