Adaptivní systémy s referenčním modelem

Pavel Píša ( pisa@cmp.felk.cvut.cz )

Adaptace s referenčním modelem

Účelem adaptace s referenčním modelem, je taková změna dynamiky řízeného systému, aby se choval stejně jako model požadované dynamiky systému. Většinou je před řízený systém přidán regulátor a odezva sytému složeného z regulátoru a řízeného systému je porovnávána s odezvou modelu požadovaného chování. Dále je celý systém doplněn pomalejší zpětnou vazbou obsahující adaptační pravidla, která má za úkol nastavit parametry regulátoru tak, aby minimalizoval odchylku mezi výstupem z řízeného systému a modelem.
V následujícím textu bude nejdříve odvozen gradientní přístup k minimalizaci odchylky využívající kriteriální funkce. Ve druhé části bude ovozena ljapunovská metoda pro nastavování pravidel, která se snaží řešit nejen stabilitu vlastního regulátoru, ale celé soustavy obsahující i model a adaptační pravidla.
Hlavním cílem této práce bylo odvodit co nejobecnější pravidla použitelná pro lineární systémy libovolného řádu s jedním vstupem a výstupem. Výsledky byly testovány v prostředí Simulinku, kde byly sestaveny následující modely :
Navržené modely se vyznačují poměrně dobrou adaptací a možností testování pro libovolný řád regulátoru, parametry modelu a řízeného systému. Modely obsahují i možnost vyvolání příkladových parametrů pro regulátory a systémy prvního až třetího řádu. Experimenty ovšem ukazují, že navržené modely ztrácí dobré vlastnosti rychlosti a stability adaptace pro vyšší řády (  3  ) systému a regulátoru.

Gradientní metody

Adaptační pravidla mají za úkol nastavit parametry regulátoru Θ R tak, aby rozdíl e mezi výstupem y regulovaného systému S a výstupem y m modelu požadovaného chování S m byl nulový. Obecný tvar lineárního regulátoru pro systém s jedním vstupem i výstupem je lineární regulátor se dvěma stupni volnosti, který lze charakterizovat parametry přenosových funkcí R , S a T . Schéma je uvedeno na obrázku 1. Přenos celé soustavy F w/y = BT AR+BS by se měl po adaptaci blížit přenosu modelu B m A m .
image: fig/mras_grs.png
Pro parametry regulátoru platí následující podmínky :
Dostatečně stabilní nuly obsažené v B + se nemusí nacházet v modelu ( B m ), protože je lze krátit. Nestabilní nuly ( B - ) krátit nelze, protože po jejich vykrácení by se v systému objevily neřiditelné nestabilní stavy. Proto model požadovaného chování musí nestabilní část B - obsahovat v B m . Pak pro parametry R , S platí rovnice AR+BS= B + A m Q (1) ve které Q představuje libovolný stabilní polynom dostatečného stupně odpovídající dynamice observeru. Minimální stupeň vychází z nerovností   degTdegR   a   degSdegR  . Protože B + dělitelí B musí ke splnění rovnosti dělit i R , pak R= B + R 1 . Předchozí rovnici lze tedy řešit jako diofantovskou rovnici: A R 1 + B - S= A m Q (2) jejím vyřešením jsou získány hodnoty R 1 a S a po dosazení bude platit i rovnice (1). Polynom T lze vypočítat z rovnice T= B m Q B - = B m 'Q (3) kde B m ' získáme po krácení polynomu B m polynomem B - .
Podmínky řešitelnosti rovnic a návrhu regulátoru :
  1. degQ2degA-deg A m -deg- B + 1
  2. deg A m -deg B m degA-degB   nelze zmenšovat
  3. B - / B m     nelze odstranit nestabilní nuly     je nutné je znát předem a zahrnout do modelu
Předchozí výpočty ukazují, že pro každý systém lze za splnění předchozích podmínek regulátorem docílit jeho chování shodné s modelem požadované dynamiky. Nyní je nutné odvodit adaptační pravidla, která budou nastavovat parametry regulátoru Θ R , konkrétně R , S a T tak, aby se chyba sledování e blížila nule.
Gradientní metoda využívá minimalizace kriteriální funkce J( Θ R ) změnou parametrů d dt Θ R =-k Θ R J . V předchozím vztahu je nutné k volit dostatečně malé, aby nedošlo k destabilizaci celého regulačního obvodu. Konkrétní volba kritéria ovlivňuje výsledná adaptační pravidla. Nejčastěli používaná pravidla :
Na obrázku 2 je opět zobrazen regulátor a regulovaný systém doplněný modelem požadovaného chování. Systém lze popsat následujícími rovnicemi :
image: fig/mras_gmod.png
Ze vhodně zvolených přenosů v systému lze vyjádřit citlivostní funkce v jednoduchém tvaru. Pro jejich výpočet není nutné uvažovat v rozdílu Θ R e= Θ R y- Θ R y m parciální derivaci y m , protože model S m není na ladění parametrů závislý.
Je nutné upozornit, že indexy v polynomech R , S a T jsou v tomto případě uvažovány od nejvyšší mocniny p směrem k mocnině nejnižší ( obdobně jako v modelech v Matlabu, kde je ovšem indexace prováděna od 1 do n+1  ). Po zkonvergování parametrů do ideálního stavu bude platit AR+BS A m B + Q a tuto aproximaci lze většinou použít i v počátku adaptace. Adaptační pravidla stále obsahují B - . Polynom B + v předchozí aproximaci lze však zkrátit podle (2). Pro systém obsahující pouze stabilní nuly lze psát B= B + b 0 . Po zkrácení zbývá pouze b 0 . Konstantu b 0 lze zahrnout do konstanty rychlosti adaptace k , pouze je nutné respektovat její znaménko. Pak lze předchozí rovnice dosadit do rovnic pro adaptaci parametrů Θ R regulátoru ( například do (4) ) :
Na obrázku 4 je model spojitého adaptivního systému obecného řádu, který využívá výše odvozené gradientní metody. Obrázek 3 zobrazuje filtr pro výpočet vektor členů citlivostních funkcí ( p k-i=0 k A m Q ) . Shodný tvar filtru je použit pro všechny tři nastavované parametry, ovšem pro parametr r 0 je výsledek násoben nulou a integrátor je přednastaven na hodnotu 1 . Podobný model lze sestrojit i pro diskrétní systém.
image: fig/mras_mitsf.png
image: fig/mras_mit.png

Ljapunovská metoda

Ljapunovská metoda se nesnaží stabilizovat pouze adaptovaný systém, ale vyšetřuje stabilitu celé soustavy složené z řízeného systému, modelu, regulátoru a adaptačních pravidel. Základem vyšetřování stability ve velkém je hledání ljapunovské funkce, kterou si lze představit jako součet veškeré “energie” v systému. Je-li derivace v čase této funkce až na jeden bod stavového prostoru x o záporná, musí postupně dojít k úniku/vyčerpání “energie” ze systému a k přechodu systému do bodu x o . Následuje matematický zápis požadavků na ljapunovskou funkci za předpokladu, že rovnovážný bod systému se nachází v počátku souřadného systému ( transformace x o = 0  ):
Potom je systém v okolí počátku stabilní, jestliže platí
V následujících odstavcích je odvozeno jak lze využít ljapunovské stability pro syntézu stabilního adaptivního regulátoru.
Úkolem je pro systém S nalézt takový regulátor a adaptační pravidla aby se systém choval shodně jako zadaný modelový systém S m . Úloha nebude řešena zcela obecně. Jak je upozorněno v [HAV_ASY_PRED] pro sestrojení takovéhoto adaptivního regulátoru vyššího řádu je nutné, aby byly všechny stavy regulovaného systému S měřitelné. Proto jako výstup systému i modelu budou brány stavy x a x m . Adaptační pravidla mají za úkol ladit parametry regulátoru Θ R tak, aby se limitně blížily optimálnímu nastavení regulátoru Θ R a rozdíl výstupů modelu a systému e = x - x m se blížil 0 . Je tedy nutné hledat hyperstabilitu systému se stavem ( e , Θ R - Θ R ) .
Pro zjednodušení problému bude uvažován pouze požadovaný model chování systému ve tvaru filtru n -tého řádu s nastavitelným zesílením ( b 0 p n + a n-1 p n-1 +...+ a 1 p+ a 0 ). Tento předpoklad není příliš omezující, protože právě výsledná odezva ve tvaru filtru s vhodným tlumením je většinou požadována. Při programovém řízení lze jiného chování též docílit transformací průběhu vstupního signálu.
Dále jak bylo ukázáno v [S_TDS] lze dynamiku ( vlastní čísla λ matice systému A  ) libovolného systému téměř libovolně změnit zavedením stavové zpětné vazby h do vstupu systému S . Pro další výpočty je vhodné předpokládat model požadovaného chování S m s maticemi A m a B m ve Frobeniově kanonickém tvaru. Tento předpoklad neomezuje obecnost řešení, protože jak bylo ukázano v [S_TDS] lze stavy a matice každého systému do tohoto tvaru převést. Při jiném než Frobeniově tvaru požadovaného chování je tedy nutné stav modelu x m i měřený stav regulovaného systému x násobit transformační maticí Q -1 , kterou lze vypočítat Q= R m R m ' -1 . R m a R m ' jsou matice dosažitelnosti původního a transformovaného modelu systému R m = b m , A m b m ,..., A m n-1 b m a R m '= b m ' , A m ' b m ' ,..., A m ' n-1 b m ' .
Za uvedených předpokladů zle sestavit následující rovnice pro chování systému S a modelu S m .
  1. d dt x =A x + b u   ,   u=- h x +lw
  2. d dt x m = A m x m + b m w
Kde w je vstup do systému, A , b , A m a b m jsou matice řízeného systému S a modelu S m , x a x m jsou stavy řízeného systému a modelu a u je vstup do řízeného systému S . Řádkový vektor h představuje stavovou zpětnou vazbu přidanou k systému S a skalár l řídí zesílení vstupního signálu do systému S . Pak lze rozdíl e mezi skutečným stavem x systému S požadovaným stavem x m vyjádřit :
d dt e = dx dt - d x m dt d dt e =A x - b h x + b lw- A m x m - b m w po přidání členu A m x m - A m x m lze rovnici upravit : d dt e = A m e + ( A- A m - b h ) x + ( b l- b m ) w Pro každý z výrazů označených je nutné aby se po provedení adaptace blížily nule. Podaří-li se provedením adaptace vynulovat poslední dva výrazy, dojde postupně k vynulováni odchylky, protože diferenciální rovnice d dt e = A m e obsahuje matici modelu A m , která odpovídá stabilnímu systému. Frobeniův tvar matice A m byl zvolen pro vhodné vyjádření druhého z výrazů , který lze znázornit pro systém třetího řádu následovně : [ 0 1 0 0 0 1 - a 0 - a 1 - a 2 ]-[ 0 1 0 0 0 1 - a m0 - a m1 - a m2 ]-[ 0 0 b 0 ][ h o h 1 h 2 ] Po úpravě přejde na matici, která bude dále označvána jako A e [ 0 0 0 0 0 0 - a 0 + a m0 - b 0 h 0 - a 1 + a m1 - b 0 h 1 - a 2 + a m2 - b 0 h 2 ]=[ 0 0 0 0 0 0 a e0 a e1 a e2 ]= A e Jak je vidět, že lze vhodným nastavením zpětné vazby h docílit vyulování tohoto výrazu. Třetí výraz lze též upravit a bude dále označován jako b e [ 0 0 b 0 ]l-[ 0 0 b m0 ]=[ 0 0 b 0 l- b m0 ]=[ 0 0 b e0 ]= b e
Nyní lze sestrojit ljapunovskou funkci s parametry, které budou vyjadřovat vzdálenost od požadovaného stavu, kdy dojde k vynulování všech výrazů . V( e , h ,l ) = 1 2 ( e T e + 1 b 0 k ( A- A m - b h )(A- A m - b h ) T + . . + 1 b 0 k ( b l- b m ) T ( b l- b m ) ) Součet skalárů s maticemi ve výrazu lze přepsat jako součet matice a jednotkové matice násobené skalárem. Derivce ljapunovské funkce v čase tedy bude d dt V( e , h ,l ) = ( e T d dt e + 1 b 0 k ( A- A m - b h )(- b d dt h ) T + . . + 1 b 0 k ( b d dt l ) T ( b l- b m ) ) Zápis se zjednoduší při náhradě výrazů v závorkách výše zavedenými symboly A e a b e . d dt V( e , h ,l )=( e T d dt e + 1 b 0 k ( A e )(- b d dt h ) T + 1 b 0 k ( b d dt l ) T ( b e ) ) Dále lze dosadit za d dt e d dt V( e , h ,l ) = ( e T A m e + e T A e x + e T b e w+ . . + 1 b 0 k A e (- b d dt h ) T + 1 b 0 k ( b d dt l ) T b e ) Matice stabilního modelu A m je negativně definitní, proto člen ( e T A m e ) bude pro nenulové e záporný. Ostatní členy lze vhodnou volbou adaptačních pravidel také zajistit nulové. A e ( b d dt h ) T =k b 0 e T A e x ( b d dt l ) T b e =-k b 0 e T b e w Při předpokládaném tvaru matice A e a vektoru b e lze vzorce rozepsat a e0 d dt h 1 + a e1 d dt h 2 + + a en-1 d dt h n =k( e 1 a e0 x 1 + e 2 a e1 x 2 + + e n a en-1 x n ) d dt l b e0 =- e n b e0 w Aby výrazy nabývaly nulové hodnoty pro všechny hodnoty A e a b e , je nutné aby si v předchozích rovnicích byly rovné jednotlivé členy v rozepsaných tvarech. Po další úpravě lze výsledky psát ve tvaru d dt h =k e . x d dt l=-k e n w
Na obrázku 5 je zobrazen model s výše uvedenými adaptačními pravidly. Tento model vykazuje velmi uspokojivé výsledky pro první a druhý řád. Doba adaptace pro třetí řád systému je již poměrně dlouhá.
image: fig/mras_ljap.png
Obsah
1 Adaptace s referenčním modelem >
2 Gradientní metody >
3 Ljapunovská metoda >

References

1Přednášky z předmětu adaptivní systémy, Havlena, Praha 1997
2Teorie dynamických systémů, Štecha Havlena, Praha 1993