Professional Documents
Culture Documents
Antonio Bicchi
Universit`a di Pisa
Versione del 12 Novembre 2014.
Alcune parti della dispensa sono in corso di integrazione o
riscrittura.
Si consiglia di procedere ad aggiornarle circa mensilmente.
Indice
1 Introduzione
1.1 Finalit`a e Organizzazione del Corso . . . . .
1.1.1 Obiettivi . . . . . . . . . . . . . . . .
1.1.2 Metodologia del Corso . . . . . . . .
1.1.3 Pre-requisiti . . . . . . . . . . . . . .
1.1.4 Modalit`a di verifica . . . . . . . . . .
1.1.5 Contenuti e Articolazione Temporale
1.1.6 Testi suggeriti . . . . . . . . . . . . .
1.2 Di che si tratta . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2 Stabilit`
a
2.1 Definizioni . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Sistemi LTI . . . . . . . . . . . . . . . . . . . . . . . . .
2.3 Peculiarit`a dei Sistemi Nonlineari . . . . . . . . . . . . .
2.4 Teoremi di Lyapunov . . . . . . . . . . . . . . . . . . . .
2.4.1 Metodo indiretto di Lyapunov . . . . . . . . . . .
2.4.2 Metodo diretto di Lyapunov. . . . . . . . . . . . .
2.4.3 Teoremi del Metodo Diretto di Lyapunov . . . . .
2.4.4 Estensione al caso di Globale Asintotica Stabilit`a
2.5 Teorema dellInsieme Invariante Massimo . . . . . . . . .
2.5.1 Applicazione alla Stima della R.A.S. . . . . . . .
2.5.2 Applicazioni alla sintesi del controllo . . . . . . .
2.6 Teoremi inversi e di instabilit`a . . . . . . . . . . . . . . .
2.7 Stabilit`a dei Sistemi Lineari Stazionari con Lyapunov . .
2.7.1 Sistemi Lineari Tempo-Continui . . . . . . . . . .
2.7.2 Sistemi Lineari Tempo-Discreti . . . . . . . . . .
2.7.3 Dimostrazione del metodo di linearizzazione . . .
2.8 Stima numerica della RAS . . . . . . . . . . . . . . . . .
2.9 Velocit`a di Convergenza . . . . . . . . . . . . . . . . . .
2.10 Costruzione di Krasovski . . . . . . . . . . . . . . . . . .
2.11 Sistemi non stazionari . . . . . . . . . . . . . . . . . . .
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7
. 7
. 7
. 8
. 8
. 8
. 8
. 9
. 10
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
11
11
14
17
19
19
20
21
23
24
25
30
33
35
35
37
38
39
40
42
43
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
INDICE
2.11.1 Studio di sistemi non stazionari con il metodo di Lyapunov 44
2.12 Appendice: Simulazioni con Matlab . . . . . . . . . . . . . . . 48
3 Raggiungibilit`
a e Controllabilit`
a
3.1 Insieme di raggiungibilit`a . . . . . . . . . .
3.1.1 Sistemi LTITC . . . . . . . . . . .
3.1.2 Sistemi LTITD . . . . . . . . . . .
3.1.3 Controllabilit`a allorigine . . . . . .
3.1.4 Raggiungibilit`a di sistemi non LTI
3.2 Cambiamenti di Coordinate . . . . . . . .
3.3 Scomposizione Standard dei Sistemi . . . .
3.3.1 Sottospazi invarianti . . . . . . . .
3.3.2 Forma Standard di Raggiungibilit`a
3.4 Lemma P.B.H. . . . . . . . . . . . . . . .
3.5 Forma canonica di controllo . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
53
54
54
56
57
58
60
60
60
62
64
67
4 Pianificazione Ottima
71
4.1 Minimizzazione del costo di controllo . . . . . . . . . . . . . . 71
4.1.1 Sistemi LTITD . . . . . . . . . . . . . . . . . . . . . . 72
4.1.2 Sistemi LTITC . . . . . . . . . . . . . . . . . . . . . . 73
4.1.3 Sistemi LTITC: Campionamento e Approssimazione TD 74
4.2 Applicazioni ed Estensioni . . . . . . . . . . . . . . . . . . . . 76
4.2.1 Minima norma del controllo non vincolato . . . . . . . 77
4.2.2 Minima norma del controllo e controllo vincolato . . . 85
4.2.3 Minima norma del controllo e delluscita di prestazione con controllo vincola
4.2.4 Variazione del tempo di campionamento e autorit`a del controllo 89
5 Retroazione degli stati
5.1 Retroazione lineare degli stati nei sistemi LTI . . . .
5.1.1 Formule per lAllocazione dei Poli . . . . . . .
5.1.2 Invarianza degli zeri per retroazione . . . . . .
5.1.3 Retroazione degli stati in sistemi a pi`
u ingressi
6 Osservabilit`
a e Ricostruibilit`
a
6.1 Insieme indistinguibile per sistemi LTI
6.1.1 Sistemi LTITC . . . . . . . . .
6.1.2 Sistemi LTITD . . . . . . . . .
6.1.3 Ricostruibilit`a . . . . . . . . . .
6.1.4 Cambiamenti di Coordinate . .
6.2 Stima ottima . . . . . . . . . . . . . .
6.2.1 Stima ottima LTITD . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
91
91
94
96
96
.
.
.
.
.
.
.
99
99
100
102
104
105
105
106
INDICE
6.3
6.4
6.5
6.6
6.7
6.8
5
6.2.2 Stima ottima LTITC . .
Dualit`a . . . . . . . . . . . . . .
Osservabilit`a di sistemi non LTI
Forma Standard di Osservabilit`a
Lemma P.B.H. . . . . . . . . .
Forma canonica di osservazione
Iniezione delle Uscite . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
107
108
109
109
112
113
114
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
117
. 117
. 119
. 126
. 127
. 128
. 128
. 131
. 132
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
153
. 153
. 155
. 157
. 157
. 157
. 158
. 160
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
135
136
138
140
142
146
146
148
149
INDICE
Capitolo 1
Introduzione
Queste dispense di Fondamenti di Automatica II Parte sono rivolte agli
studenti di un corso di secondo livello (Laurea specialistica) in Ingegneria, e coprono materiale didattico corrispondente a circa 6 Crediti Formativi
Universitari, tra cui 1 di attivit`a di laboratorio.
1.1
Finalit`
a e Organizzazione del Corso
1.1.1
Obiettivi
CAPITOLO 1. INTRODUZIONE
1.1.2
1.1.3
Pre-requisiti
1.1.4
Modalit`
a di verifica
1.1.5
Pianificazione ottima, pseudoinversa di Moore-Penrose e decomposizione ai valori singolari di una matrice. Raggiungibilit`a di sistemi lineari
tempo varianti. Definizione di sottospazi invarianti e forma standard di
controllabilit`a. Ripartizione degli autovalori della matrice di aggiornamento dello stato tra sottospazio raggiungibile e non. Verifiche dirette
di raggiungibilit`a. Raggiungibilit`a di sistemi SISO. Lemma P.B.H..
Forma canonica di controllo. Raggiungibilit`a di sistemi MIMO.
4. Retroazione degli stati. Controllo di sistemi lineari mediante retroazione degli stati. Invarianza delle propriet`a di raggiungibilit`a di un
sistema rispetto alla retroazione degli stati. Autovalori fissi e autovalori modificabili dalla retroazione. Algoritmi di allocazione degli autovalori. Invarianza degli zeri di trasmissione. Sistemi a pi ingressi.
Stabilizzabilit`a di un sistema lineare.
5. Osservabilit`a e Ricostruibilit`a. Osservabilit`a di sistemi lineari tempo
invarianti (TC e TD). Insieme indistinguibile in funzione del tempo.
Osservabilit`a e cambiamenti di coordinate lineari. Ricostruibilit`a dello
stato. Sottospazi invarianti e forma standard di osservabilit`a. Stima
Ottima. Osservabilit`a di sistemi lineari tempo varianti. Ripartizione
degli autovalori della matrice di aggiornamento dello stato tra sottospazio inosservabile e non. Funzione di trasferimento e sottospazio
inosservabile. Verifiche dirette di osservabilit`a. Osservabilit`a di sistemi
SISO. Lemma P.B.H. di osservabilit`a. Forma canonica di osservazione.
Scomposizione di Kalman.
6. Regolazione di sistemi e retroazione delle uscite. Retroazione statica
delle uscite. Retroazione dinamica delle uscite. Osservatore asintotico
dello stato. Realizzazione di sistemi. Regolatore.
1.1.6
Testi suggeriti
E. Fornasini, G. Marchesini: Appunti di Teoria dei Sistemi (ed Esercizi di Teoria dei Sistemi), Ed. Libreria Progetto;
P. Bolzern, R. Scattolini, N. Schiavoni: Fondamenti di Controlli Automatici, McGraw-Hill
G. Marro, Controlli Automatici, Zanichelli
10
CAPITOLO 1. INTRODUZIONE
1.2
Di che si tratta
Capitolo 2
Stabilit`
a
Consideriamo un sistema tempoinvarianti generale definito in uno spazio di
stato x IRn del tipo
IDx = f (x, u), x(0) = x0
e le sue soluzioni (o movimenti) x(x0 , u, t), tra cui in particolare quelli che
abbiamo chiamato di equilibrio (per i quali u e x sono costanti). Sia inoltre
data una norma k k per i vettori in IRn .
Intuitivamente associato al concetto di equilibrio `e quello di stabilit`a (si
pensi al caso di un pendolo), in particolare rispetto alle variazioni delle condizioni iniziali. Considereremo cio`e comparativamente le soluzioni del sistema
in condizioni nominali x(x0 , u, t) e in condizioni perturbate x(x , u, t), e diremo stabili quei movimenti che sono poco alterati da piccole alterazioni
delle condizioni iniziali. Cercheremo di rendere preciso questo concetto, e di
stabilire tecniche per decidere della stabilit`a o meno di un equilibrio.
2.1
Definizioni
Poiche in quel che segue considereremo sempre u come una particolare funzione o successione di ingresso, si potr`a fare a meno di citarla esplicitamente
nella descrizione del sistema e delle sue soluzioni:
Dx = f (x), x(0) = x0
(2.1)
se > 0, > 0 tale che se kx x0 k < , allora kx(x , t) x(x0 , t)k < , t
(vedi fig. 2.1).
11
12
`
CAPITOLO 2. STABILITA
2.1. DEFINIZIONI
13
Equilibrio stabile
`
CAPITOLO 2. STABILITA
14
2.2
Sistemi LTI
15
16
`
CAPITOLO 2. STABILITA
Nel caso del sistema 6), `e necessario considerare moti perturbati che consistono di rotazioni attorno agli spigoli con transizioni modellabili come urti
col piano. Se gli urti sono perfettamente elastici, lequilibrio `e marginalmente
stabile, in quanto il corpo si manterrebbe indefinitamente in oscillazione (di
ampiezza limitata e proporzionale alle condizioni iniziali). Se gli urti sono
anelastici, lequilibrio `e asintoticamente stabile.
Lo stato di equilibrio del sistema 7) rappresentato in figura `e instabile,
poiche se lo stato iniziale non coincide esattamente con quello di equilibrio il
sistema si allontana indefinitamente da questultimo.
2.3
17
Peculiarit`
a dei Sistemi Nonlineari
f (x) =
`
CAPITOLO 2. STABILITA
18
1.5
0.5
0.5
1.5
1.5
0.5
0.5
1.5
(2.2)
(2.3)
19
4
2.5
1.5
0.5
0.5
1.5
2.5
2.4
Teoremi di Lyapunov
I pi`
u importanti strumenti di cui disponiamo per lo studio della stabilit`a dei
sistemi nonlineari sono i teoremi di Lyapunov:
2.4.1
`
CAPITOLO 2. STABILITA
20
Si osservi che, sulla base di queste due proposizioni, nulla si pu`o dire sulla stabilit`a della origine per Dx = f (x) se Dx = Ax non ha modi esponenzialmente
divergenti, ma ne possiede almeno uno non convergente.
Si osservi che il caso 2) occorre per sistemi TC se A ha almeno un autovalore a parte reale strettamente positiva, e per sistemi TD se A ha almeno
un autovalore con modulo strettamente maggiore di uno.
La inconcludenza del teorema si verifica nei sistemi TC se il linearizzato
ha tutti autvalori a parte reale non positiva e almeno un autovalore a parte
reale nulla; per sistemi TD se il linearizzato ha tutti autovalori a modulo non
maggiore di uno, con almeno un autovalore a modulo unitario.
Il metodo indiretto, il cui contenuto `e abbastanza intuitivo, necessita
` stato presentato prima in
per la dimostrazione del successivo teorema. E
quanto metodo di rapida applicazione, anche se di molto minor potenza, del
successivo.
2.4.2
Il metodo diretto di Lyapunov pu`o essere visto come una importante generalizzazione dei criteri di stabilit`a per sistemi meccanici basati sullo studio
della energia del sistema. Qualitativamente, una funzione di energia generalizzata `e una funzione scalare dello stato, che `e sempre positiva eccetto che
nella configurazione di quiete (equilibrio) del sistema, dove ha un minimo.
` opportuno introdurre alcune definizioni. Una funzione V (x) : IRn IR si
E
dice
positiva definita (p.d.) se V (0) = 0 e se esiste un intorno Br dellorigine
per cui vale x Br \ 0, V (x) > 0;
positiva semidefinita (p.s.d.) se Br tale che V (x) 0, x Br ;
negativa definita e semidefinita risp. se V (x) `e p.d. o p.s.d.;
globalmente positiva definita se V (x) > 0 x IRn \ 0, positiva semi
definita se V (x) 0 x IRn \ 0; etc..
Esempio: Per x IR2 , V = x21 + x22 `e globalmente p.d.; V = x21 +
x22 x31 `e localmente p.d.; V = x21 + sin2 (x2 ) `e p.d. localmente, p.s.d.
globalmente; V = x21 + sin2 (x1 ) `e globalmente p.s.d.; V (x) = x21 x22 si
dice non-definita.
21
2.4.3
22
`
CAPITOLO 2. STABILITA
Dimostrazione del metodo diretto di Lyapunov T.C.:
Stabilit`
a: Si consideri un intorno sferico B dellorigine, tutto contenuto in una regione S in cui Lf V 0: poiche V `e continua e p.d.,
esiste M = minx(B ) V (x), ed esister`a un B : V (x) < M, x
B . Supponiamo per assurdo che una traiettoria del sistema x(x0 , t)
che parta da x0 B al tempo 0, esca da B per t > 0: sarebbe
V (x(x0 , t)) > M > V (x0 )). Daltronde, se si considera la funzione
V (x(t, x0 )) come funzione del tempo, si ha che la sua derivata totale
x(x0 ,t)
vale V = dtd V = V
= V
f (x) = Lf V , quindi dalla ipotesi che
x
t
x
Lf V (x) sia negativa semi-definita discende che V `e monotona non crescente nel tempo, il che dimostra lassurdo.
Asintotica stabilit`
a: si consideri ancora un intorno B che garantisce che
la traiettoria non esca mai da B . Poich`e V `e limitata inferiormente e
strettamente decrescente nel tempo (V = Lf V n.d.), essa deve tendere
ad un limite limt V (x(t)) = W 0. Dobbiamo escludere il caso
W > 0: se cos` fosse, infatti, le traiettorie iniziate in B al tempo 0 non
potrebbero mai entrare in un intorno BW : maxxBW V (x) < W . Ma,
poich`e anche V `e continua e n.d., deve avere un massimo (negativo)
w < 0 sullinsieme B \ BW , quindi V decresce almeno con velocit`a
|w|. Una traiettoria del sistema, in x0 B al tempo 0, dopo al piu un
tempo t = (V (x0 )W )/w, porterebbe a V (t > t) < W , che dimostra
lassurdo.
Instabilit`
a: Dato > 0, si supponga per assurdo che esista un quale richiesto nella definizione di stabilit`a. Sia V = minxB V (x).
Si consideri inoltre 0 < < e gli intorni sferici B e B . Sia
minxB \B Lf V (x) = m > 0. Una evoluzione dello stato che inizi in
B \B uscir`a certamente da B in un tempo non superiore a t = V /m,
dimostrando lassurdo.
Una funzione V (x) p.d. tale che Lf V (x) ovvero f V (x) `e n.s.d. (compreso il caso n.d.), si dice una funzione di Lyapunov per il sistema x = f (x)
nellequilibrio considerato.
23
2.4.4
Se, oltre alle ipotesi del metodo diretto di Lyapunov nel caso di asintotica
stabilit`a di un equilibrio, vale anche
lim V (x) =
kxk
`
CAPITOLO 2. STABILITA
24
x1
x1 +x2
Esempio: Analizzare il sistema x 1 = 2x2 6 (1+x
2 = 2 (1+x
2 )2 ;, x
2 )2 ,
x21
1+x21
x22
50
45
40
35
30
25
20
15
10
10
15
20
25
30
35
40
2.5
25
`e una unione di orbite. Anche una regione contenuta allinterno di una superficie di livello chiusa di una funzione di Lyapunov per un sistema dato, `e
un insieme invariante (come consegue direttamente dalla dimostrazione del
teorema di Lyapunov).
Teorema dellInsieme Invariante Massimo.
Sia V (x) p.d. e sia S un sottoinsieme aperto dello spazio di stato contenente
lorigine nel quale vale Lf V (x) 0, x S. Si supponga che, per qualche
l, le superfici di livello V (x) = l siano curve chiuse e delimitino linsieme
l = {x|V (x) < l}, e sia l S.
Sia R = {x l |Lf V (x) = 0} e M il massimo (nel senso insiemistico)
insieme invariante contenuto in R. Allora, ogni traiettoria x(x0 , t) con x0
l converge allinsieme M (cio`e, limt inf m(t)M kx(x0 , t) mk = 0).
Dimostrazione (cenno). V (x(t)) `e non crescente, limitata inferiormente: quindi possiede un limite per t . Inoltre Lf V (x(t)) `e uniformemente continua rispetto a t e di conseguenza (per il lemma di Barbalat)
limt V (x(t)) = 0 (overo V = 0 in t.d.). Poiche l `e limitato, la traiettoria non pu`o che tendere a M .
Osservazione Si noti che il teorema vale per funzioni V non esplicitamente dipendenti dal tempo. Nel caso fosse V (x, t), il teorema resta valido
nella ulteriore ipotesi (in t.c.) che Lf V (x(t), t) sia uniformemente continua
in t, ci`o che si pu`o dimostrare ad es. facendo vedere che dtd Lf V `e limitata
per ogni t.
Corollario: se per una funzione di Lyapunov V (x) p.d. con Lf V (x)
n.s.d. lunica orbita del sistema contenuta in R `e un equilibrio, allora questo
`e stabile asintoticamente.
Il teorema dellInsieme Invariante Massimo `e noto anche come teorema
di LaSalle, che lo ha formulato in questa forma; oppure come teorema di
Krasovski, che ne aveva dimostrato in precedenza il corollario.
2.5.1
Supponiamo che V (x) sia una funzione di Lyapunov per il sistema x = f (x)
con origine asintoticamente stabile. Dato uno stato iniziale x, come possiamo
sapere se la traiettoria a partire da x converger`a allorigine?
Ovviamente, la condizione Lf V (
x) < 0 non `e sufficiente: la traiettoria
x(
x, t) `e infatti costretta a portarsi verso livelli inferiori di V sino a che rimane in S, ma potrebbe poi uscirne e quindi allontanarsi (vedi fig. 2.7). Una
condizione sufficiente `e la seguente:
`
CAPITOLO 2. STABILITA
26
Figura 2.7: Applicazione del Teorema di Lasalle alla stima della RAS
27
difficile. Spesso per`o la restrizione allo studio degli insiemi invarianti contenuti in R permette una facile e completa analisi: basta infatti utilizzare le
relazioni che definiscono R stessa (cio`e Lf V (x) 0, x R) e applicarle
alla dinamica del sistema x = f (x).
Esempio: Si consideri lequazione di un pendolo
mR2 + b + mgR sin = 0,
ovvero, in forma di stato,
x 1 =
x2
b
x 2 = mR2 x2 Rg sin x1 .
(2.4)
g
b
x2 sin x1 ) = bx22
2
mR
R
`
CAPITOLO 2. STABILITA
28
29
0 1
0 0
Avendo il linearizzato autovalori nulli, non ci permette di dedurre alcunche riguardo alla stabilita del sistema. Introduciamo allora una candidata di Lyapunov definita come lenergia meccanica del sistema, che `e
data dalla somma Rdella energia cinetica T = 21 my 2 e della energia poteny
ziale elastica U = 0 kw3 dw = k4 y 4 . Posto V = U + T = k4 x41 + 21 mx22 , si
ottiene
V = cx42 ,
quindi il sistema, per k > 0 e c > 0, `e stabile. Per concludere sulla asintotica stabilit`a `e necessario studiare ulteriormente il sistema col criterio
dellI.I.M.: le traiettorie che rimangono nel luogo in cui si verifica V 0
hanno x2 0, quindi anche x 2 = 0, e ci`o, per la seconda equazione
30
`
CAPITOLO 2. STABILITA
2.5.2
Le tecniche di analisi alla Lyapunov possono essre molto utili anche nella
sintesi di leggi di controllo per sistemi non lineari. Si consideri il problema
31
seguente:
Dato un sistema controllato x = f (x) + g(x)u, trovare una legge di retroazione degli stati sugli ingressi u = u(x) tale che per il nuovo sistema
autonomo x = f(x) = f (x) + g(x)u(x) lorigine sia A.S..
Per una candidata di Lyapunov V (x), sia V = Lf V (x) + Lg V (x)u(x): se
posso scegliere u(x) tale che V sia una funzione di Lyapunov, si `e ottenuto
lo scopo.
Esempio: Per il sistema
x 1 = x32
x 2 = x31 + u
si consideri V (x) = x21 + x22 . Si ha Lf V = 2x1 x32 + 2x2 x31 e Lg V = 2x2 ,
per cui la scelta
2x1 x32 + 2x2 x31
u(x) =
+ x2
2x2
fa s` che V si n.s.d. Il controllore proposto in questo caso rende
marginalmente stabile lorigine.
h
q
T
h
h n.s.d.. Questa tecnica `e nota nel calcolo numerico come
khT h
q q
metodo del gradiente ( o speepest descent).
1
B) scegliendo (dove possibile!) u(q) = k h
h(q) si ha V =
q
`
CAPITOLO 2. STABILITA
32
h
u(t) + O(u2 (t)),
q
h
u(t) + O(u2 (t)).
q
Scegliendo
u(t) = k
ovvero
u(t) = k
T
h(q(t))
1
h(q(t)),
h
q
h
q
Lf V
Lg V, > 0
Lg V
si otterrebbe immediatamente
V = L2g V
`
2.6. TEOREMI INVERSI E DI INSTABILITA
33
che `e almeno semidefinita negativa. Questa legge potrebbe non essere applicabile in seguitro alle possibili discontinuit`a della retroazione in vvicinanza
dellequilibrio.
In casi abbastanza generali la formula (di Artstein-Sontag) fornisce una
retroazione continua nella forma
(
se Lg V (x) = 0
0, 2
4
u(x) =
(L
V
)
+(L
V
)
g
L V
f
Lfg V
altrove
Lg V
che stabilizza globalmente asintoticamente il sistema nellorigine.
Esempio: Si consideri il sistema
3
x1
x1
x =
u
+
3
x2
0
T
16
2
4
2
4
u(x) =
16x1 +2(x1 x2 )
(x x )
1x4 2
x1 6= 0
2x4
1
2.6
`
CAPITOLO 2. STABILITA
34
2.7
2.7.1
Stabilit`
a dei Sistemi Lineari Stazionari
con Lyapunov
Sistemi Lineari Tempo-Continui
`
CAPITOLO 2. STABILITA
36
R
0
T
T
AT eA t QeAt + eA t QeAt A dt
R AT t At
=
d e Qe
i
h 0
T
eA t QeAt
= 0 Q,
0
dove si `e usato il fatto che eA0 = I e che, se tutti gli autovalori di A sono a
parte reale negativa, limt eAt = 0.
Poich`e la soluzione del problema M p = q esiste per qualsiasi q, lo spazio
nullo di M `e vuoto, quindi la soluzione `e unica2 .
Nota: se x = Ax `e marginalmente stabile, lequazione di Lyapunov
AT P + P A = Q non pu`o ovviamente avere soluzioni P p.d. per Q p.d..
Sappiamo comunque dal teorema inverso di Lyapunov che una funzione di
Lyapunov esiste per il sistema: si tratta quindi di cercare una soluzione con
Q semidefinita positiva.
Questa soluzione non esister`a sempre, ma solo per opportune Q. Quando
la soluzione P esiste, non sar`a di conseguenza unica.
0 0
0 Jn
T
P0 Pd
Pd Pn
P0 Pd
Pd Pn
0 0
0 Jn
Q0 Qd
Qd Qn
2.7.2
=
=
def
(AT )k QAk
k=0
serie che esiste se i modi di A convergono, e che `e p.d. perch`e composta dalla
somma di un primo termine (Q) p.d., con latri tutti p.s.d.
`
CAPITOLO 2. STABILITA
38
infatti
AT P A P = AT
=
=
AT
P
k=
P
k=
T k
k
T k
k
A
(A
)
QA
(A
)
QA
k=0
k=0
T
Q + A QA + . . . A Q + AT QA + . . .
Q
2.7.3
AT1 0
0 AT2
P1
0
0 P2
P1
0
0 P2
A1 0
0 A2
I 0
0 I
39
2.8
Si consideri un sistema
x = f (x, u)
y = h(x)
x r = Ar xr + Br y = Ar xr + Br Cx + Br h(x)
Indicando con z = [xT , xTr ]T lo stato complessivo, si pu`o riscrivere
z = Af z + f(z), dove
g(x, xr )
A + Br Dr C BCr
Af =
; f (z) =
.
Br C
Ar
Br h(x)
Si noti che, quando il termine di errore f() fosse nullo, il sistema non-lineare
complessivo coinciderebbe con quello linearizzato che sappiamo essere stato
stabilizzato. Per tale sistema linearizzato si pu`o agevolmente trovare una funzione di Lyapunov del tipo VQ = z T PQ z, con PQ soluzione della equazione di
`
CAPITOLO 2. STABILITA
40
2.9
Velocit`
a di Convergenza
` DI CONVERGENZA
2.9. VELOCITA
41
min (Q)
.
max (P )
`
CAPITOLO 2. STABILITA
42
(P )
quindi kk2 min1 (P ) V (t) max
k0 k2 et da cui infine kk e 2 t . In
min (P )
conclusione, la velocit`a di convergenza di un sistema lineare `e non inferiore
min (Q)
a /2 = 12 max
.
(P )
Questa stima dipende ovviamente dalla scelta di Q. Si pu`o dimostrare
che la migliore stima della velocit`a di convergenza si ottiene nel caso in cui
si scelga Q = I. In questo caso, supponendo per semplicit`a che la matrice
dinamica abbia tutti autovalori reali e distinti, possiamo porre il sistema nelle coordinate in cui la matrice dinamica Af `e diagonale. La soluzione della
equazione di Lyapunov P Af + ATf P = I `e in questo caso P = 1/2A1
f ,
da cui si ha che = 2max (Af ): quindi, lautovalore pi`
u lento (dominante)
del sistema rappresenta proprio la velocit`a di convergenza.
Dato un sistema nonlineare il cui linearizzato approssimato ha velocit`a
di convergenza esponenziale /2, si pu`o dimostrare che il sistema nonlineare
ha la stessa velocit`a di convergenza verso lequilibrio. Infatti, la definizione
di velocit`a di convergenza `e locale, cio`e per condizioni iniziali 0 sufficientemente piccole. Usando la stessa funzione di Lyapunov T P per il sistema
()k
nonlineare, si ha V = T Q + 2 T P f(), con lim0 kfkk
0. Fissato > 0,
()k
min (P )
con > , si pu`o scegliere quindi 0 tale per cui kfkk
< max
, quindi
(P )
V ( )V , dove pu`o essere fissato arbitrariamente piccolo.
2.10
Costruzione di Krasovski
Quando il linearizzato di un sistema non `e asintoticamente stabile, non abbiamo alcun metodo generale per costruire funzioni di Lyapunov per il sistema. Una tecnica talvolta utile `e la costruzione di Krasovski. Per il sistema
x = f (x), con x = 0 punto di equilibrio, si consideri la candidata V (x) =
il jacobiano di f (x) e F (x) = A(x) + AT (x) la
f (x)T f (x). Detto A(x) = f
x
sua parte simmetrica, se F (x) `e negativa definita (localmente o globalmente),
allora si ha asintotica stabilit`a (locale o globale) dellequilibrio 4 .
Si ha infatti
Lf V (x) = f T (x)A(x)f (x) + f T (x)AT (x)f (x) = f (x)T F (x)f (x).
che `e definita negativa. Infatti, F (x) `e negativa definita per ipotesi: per
dimostrare che Lf V (x) = 0 solo in x = 0 (almeno localmente), dobbiamo an
Si osservi esplicitamente che A(0) = f
`e la matrice dinamica del linearizzato,
x
x=0
che ovviamente non si richiede qui essere definita negativa.
4
43
2.11
Nel caso di un sistema non stazionario, ovvero con dipendenza esplicita dal
tempo del tipo IDx = f (x, t), i metodi di studio della stabilit`a devono essere
posti con maggiore cautela.
Questo `e gi`a evidente dallo studio dei sistemi lineari tempo varianti, nei
quali gi`a si osservano importanti differenze col caso tempo invariante.
Per un sistema lineare tempo variante
x = A(t)x
la condizione che la parte reale degli autovalori di A(t) sia negativa per ogni
t non `e sufficiente per affermare la stabilit`a.
Si consideri infatti ad esempio il sistema LTCTV
1 a(t)
x
(2.5)
x = Ax =
0 1
che ha spettro (A(t) = {1, 1} per ogni t. Questo non `e sufficiente a
garantire la sua stabilit`a: basta considerare ad esempio il caso a(t) = e2t , le
cui soluzioni chiaramente divergono.
Non `e sufficiente neppure aggiungere unipotesi di limitatezza delle funzioni che formano A(t), ad esempio imponendo che una norma di A(t) sia
`
CAPITOLO 2. STABILITA
44
15 sin 12 t11
2
15 cos 12 t
2
15 cos 12 t
2
t+11
15 sin 12
2
ii) kA(t)k
, t con > 0 sufficientemente piccolo
Una determinazione quantitativa esplicita (ma solo sufficiente) del bound
4n2
2
. Le
del teorema di Rosenbrock `e disponibile nella forma < 2n1
2M 4n4
dimostrazioni di questi ultimi risultati si appoggiano sulluso di funzioni di
Lyapunov tempo varianti, oggetto del prossimo paragrafo.
2.11.1
Per studiare i sistemi non stazionari, anche quando lineari, pu`o dunque
essere necessario usare tecniche alla Lyapunov, anche se queste richiedono
particolare attenzione.
45
(2.6)
Candidate stazionarie
Per studiare la stabilit`a di un equilibrio, consideriamo innanzitutto il caso in cui si usi una candidata di Lyapunov stazionaria V (x). La funzione V = Lf V (x, t) `e in generale non stazionaria: una condizione sufficiente
per lasintotica stabilit`a dellequilibrio `e che Lf V (x, t) sia uniformemente
negativa definita, cio`e che m > 0 : Lf V (x, t) < mkxk, x Br (0), t.
La necessit`a della condizione di uniforme n.d. `e illustrata da questo
esempio: sia x = a(t)x, con a(t) < 0, t, e sia V (x) = x2 . Pur avendosi
Lf V (x) = 2a(t)x2 < 0 in ogni istante, la uniformit`a nel tempo di questa
propriet`a non `e garantita per qualsiasi a(t). In effetti, se si pone ad esempio
a(t) = e2t , il sistema non converge allequilibrio nellorigine.
Dal precedente risultato si deriva immediatamente che una condizione
sufficiente per la stabilit`a di un sistema LTCTV `e che gli autovalori della sua
parte simmetrica abbiano parte reale uniformemente negativa. Dato infatti
x = A(t)x, si consideri la candidata tempo invariante V (x) = 21 xT x, per la
T (t)
)x.
quale si ha V = xT ( A(t)+A
2
Nellesempio (2.5), il polinomio caratteristico della parte simmetrica di
A(t) vale () = 2 + 2 + 1 a2 /4, quindi Lf V (x, t) `e uniformemente n.d.
se M tale che, t, valga |a(t)| M < 2. Questa condizione `e ovviamente
molto cautelativa: basta pensare che nel caso di a costante, il sistema `e
stabile per qualsiasi valore di a.
`
CAPITOLO 2. STABILITA
46
Candidate non stazionarie
V
V
V =
+
f (x, t) 3 (kxk)
t
x
allora si ha che lequilibrio `e:
1. uniformemente stabile se 1 e 2 sono funzioni di classe K e 3 (x) 0,
x ;
2. uniformemente asintoticamente stabile se tutte le i sono funzioni di
classe K in , i = 1, 2, 3;
47
`
CAPITOLO 2. STABILITA
48
2.12
49
4
2.5
1.5
0.5
>>type vinograd.m
function dx = vinograd(t,x);
% ODE file for Vinograd system
x1=x(1);
x2=x(2);
r=x1^2+x2^2;
q=1+(x1^2+x2^2)^2;
dx(1,1) = x1^2*(x2-x1)+x2^5;
dx(2,1) = x2^2*(x2-2*x1);
dx=dx/(r*q);
0.5
1.5
2.5
`
CAPITOLO 2. STABILITA
50
1.5
0.5
0.5
1.5
1.5
0.5
0.5
1.5
>>>>help meshgrid
MESHGRID X and Y arrays for 3-D plots. [X,Y] = MESHGRID(x,y) transforms
the domain specified by vectors x and y into arrays X and Y that can be used for
the evaluation of functions of two variables and 3-D surface plots. The rows of the
output array X are copies of the vector x and the columns of the output array Y
are copies of the vector y.
[X,Y] = MESHGRID(x) is an abbreviation for [X,Y] = MESHGRID(x,x).
[X,Y,Z] = MESHGRID(x,y,z) produces 3-D arrays that can be used to evaluate
functions of three variables and 3-D volumetric plots.
>>[X,Y]=meshgrid(-10:.5:10, -5:.2:5);
>>V=0.2*X.^2 + Y.^2;
>>mesh(V)
>>print -deps mesh.eps
45
40
35
30
25
20
15
10
5
0
60
50
50
40
40
30
30
20
20
10
10
0
51
>>contour(V)
>>grid
>>print -deps contour.eps
50
45
40
35
30
25
20
15
10
10
15
20
25
30
35
40
>>V=(X.^2)./(1+X.^2) + Y.^2;
>>mesh(V)
>>print -deps mesh2.eps
30
25
20
15
10
5
0
60
50
50
40
40
30
30
20
20
10
10
0
>>contour(V)
>>contour(V,[0.01:.2:2])
>>print -deps contour2.eps
>>diary off
`
CAPITOLO 2. STABILITA
52
50
45
40
35
30
25
20
15
10
>>diary off
10
15
20
25
30
35
40
Capitolo 3
Raggiungibilit`
ae
Controllabilit`
a
Un problema di rilievo nella teoria dei sistemi che coinvolge gli stati e gli
ingressi `e quello del raggiungimento di un desiderato stato finale a partire
da un dato stato iniziale, mediante applicazione di un opportuna azione di
controllo.
Questo problema ha applicazioni dirette nel senso della pianificazione
delle azioni di controllo da esercitare su un sistema in anello aperto, cio`e
basandosi esclusivamente sulla conoscenza a priori del modello del sistema e
del suo stato iniziale.
Inoltre, esso ha importantissime conseguenze sulle propriet`a ottenibili dal
sistema in anello chiuso, cio`e quando nella scelta del controllo si utilizzino
anche misure effettuate sullo stato o sulle uscite.
Nei problemi di pianificazione, ci troveremo spesso di fronte a problemi
che possono essere ricondotti a sistemi di equazioni in pi`
u incognite, per i
quali si pongono i problemi di esistenza delle soluzioni (problema di raggiungibilit`a) e di nonunicit`a, e quindi di scelta, tra le soluzioni (problema di
controllo ottimo).
Consideriamo un sistema tempo invariante in forma di stato
IDx(t) = f (x(t), u(t)),
con x IRn , e u() U , dove U `e lo spazio di funzioni o successioni in cui `e
possibile scegliere i controlli. Sia al solito x(x0 , u(), t) il valore della soluzione
corrispondente a x(0) = x0 e controllo u( ), [0, t], al tempo t.
U pu`o ad esempio rappresentare un insieme di controlli ad ampiezza limitata (U = {u|ku()k 1}), o a quadrato sommabile limitato (U =
{u|ku()k2 1}); la classe pi`
u generale usualmente considerata `e quella dei
53
54
` E CONTROLLABILITA
`
CAPITOLO 3. RAGGIUNGIBILITA
3.1
3.1.1
Insieme di raggiungibilit`
a
Sistemi LTITC
(3.1)
nellipotesi che tutte le componenti dellingresso u(t) siano funzioni analitiche in [0, t], cio`e funzioni lisce (differenziabili con continuit`a infinite volte)
e sviluppabili in serie di potenze. Usando per semplicit`a ft per indicare la
funzione f (t) valutata in t (quindi ad esempio u0 indica u(0)), si ha
ut =
(k) t
u0
k!
k=0
(0)
(k) t
x0
k=0
Differenziando (3.1) si
nella serie:
x(1)
x(2)
x(3)
..
.
x(k)
k!
X
k=0
Ak
k
X
k
X
tk
(i1) t
Aki Bu0
x0 +
.
k!
k!
k=1 i=1
`
3.1. INSIEME DI RAGGIUNGIBILITA
55
Bu0 t + ABu0
k=0
P
Pk=0
k=0
(k) tk+1
(k+1)!
(k) tk+2
u0 (k+2)!
(k) tk+3
u0 (k+3)!
u0
At
2
r1
x(x0 , u, t) = e x0 + B|AB|A B| |A B|
..
.
P
u(k) tk+r
k=0 0 (k+r)!
..
.
Si osservi a questo punto che le serie che appaiono nel vettore di infinite componenti a destra convergono agli integrali indefiniti successivi degli
ingressi ut . Infatti, poich`e si `e ipotizzato ut liscia, quindi senza impulsi
nellorigine, si ha
def
(1)
ut
(2)
ut
=
=
Rt
(1)
(1) 2
u(t1 )dt1 = u0 + u00 t + u0 t2 + =
0
P
(k) tk+1
k=0 u0 (k+1)!
R t R t1
2
(2)
(1)
u(t2 )dt2 dt1 = u0 + u0 t + u00 t2 + =
0 0
P
(k) tk+2
k=0 u0 (k+2)!
def
=
=
e in generale
rvolte
(r)
ut
zZ Z}| Z{
t
k+r
X
(k) t
=
u() =
u0
(k + r)!
0
k=0
(1)
ut
(2)
ut
(3)
ut
..
.
x(x0 , u, t) = eAt x0 + B|AB|A2 B| |Ar1 B|
(r)
ut
..
.
56
` E CONTROLLABILITA
`
CAPITOLO 3. RAGGIUNGIBILITA
Linsieme raggiungibile dallorigine al tempo t `e dunque raggiungibile in effetti in tempo arbitrario, lo stesso stato essendo raggiunto in tempo pi`
u breve
a costo di un pi`
u energico controllo. Questo insieme `e poi un sottospazio vettoriale, detto sottospazio di raggiungibilit`a del sistema. La matrice R viene
detta matrice di raggiungibilit`a del sistema.
Linsieme degli stati raggiungibili a partire dallo stato generico x(0) = x0
al tempo t `e pertanto dato da
Rt (x0 ) = x = eAt x0 + r, r R
ed `e quindi un iperpiano, parallelo al sottospazio di raggiungibilit`a, passante
per eAt x0 . Al variare di t, linsieme raggiungibile descrive una famiglia di
iperpiani paralleli, la cui unione costituisce linsieme degli stati raggiungibili.
Si noti che linsieme dei punti raggiungibili `e lintero spazio di stato nel
caso in cui dim (R) = rank (R) = n; tutti gli stati sono in effetti raggiungibili in tempo arbitrariamente piccolo. In questo caso, il sistema stesso si
dice completamente raggiungibile.
3.1.2
Sistemi LTITD
(3.2)
x(x0 , u, t) = A x0 +
t1
X
Atk1 Bu(k)
k=0
u(t 1)
u(t 2)
u(t 3)
..
.
u(0)
`
3.1. INSIEME DI RAGGIUNGIBILITA
57
At1 B
che, in modo del tutto analogo al caso TC, viene detto sottospazio di raggiungibilit`
a in t passi del sistema, mentre la matrice R viene detta matrice
di raggiungibilit`a in t passi del sistema.
` evidente che il sottospazio di raggiungibilit`a in t+1 passi Rt+1 contiene
E
Rt , e che quindi la successione definita dalle dimensioni dei sottospazi di raggiungibilit`a al crescere del numero di passi `e non decrescente; essa `e peraltro
superiormente limitata dalla dimensione dello spazio di stato n, per cui la successione si stabilizzer`a in un valore finito. Per il teorema di CayleyHamilton,
il sottospazio di raggiungibilit`a in un numero arbitrariamente grande di passi
pu`o essere calcolato arrestandosi allnesimo passo,
def
R = Im (R) = Im ( B AB
An1 B ).
Questo viene detto sottospazio di raggiungibilit`a del sistema, mentre la matrice R viene detta matrice di raggiungibilit`a del sistema. Ogni stato raggiungibile a partire dallorigine in un numero qualsiasi di passi pu`o essere
anche raggiunto in non pi`
u di n passi.
Linsieme degli stati raggiungibili a partire dallo stato generico x(0) = x0
al tempo t `e pertanto dato da
Rt (x0 ) = x = At x0 + r, r Rt
3.1.3
Controllabilit`
a allorigine
58
` E CONTROLLABILITA
`
CAPITOLO 3. RAGGIUNGIBILITA
t1
X
Atk1 Bu(k)
k=0
Naturalmente, la raggiungibilit`a implica la controllabilit`a, ma non viceversa. Ad esempio, un sistema con matrice A nulla `e certamente controllabile,
mentre non `e raggiungibile a meno che vi siano almeno tanti ingressi quanti
stati e rank (B) = n. Controllabilit`a e raggiungibilit`a nei sistemi LTITD
sono sinonimi se A `e nonsingolare.
Nei sistemi LTITC, linsieme controllabile a zero in tempo t `e definito in
modo analogo come linsieme degli stati che risolvono lequazione
Z t
At
0 = e x +
eA(t ) Bu( )d
0
quindi, per quanto visto sopra, essendo sempre eAt invertibile Ct = Rt . Nei
sistemi tempocontinui, i concetti di controllabilit`a e raggiungibilit`a di uno
stato sono coincidenti.
3.1.4
Raggiungibilit`
a di sistemi non LTI
Lanalisi della raggiungibilit`a per sistemi tempovarianti e nonlineari in generale `e sostanzialmente pi`
u complessa che nei casi sinora visti. Daremo perci`o
`
3.1. INSIEME DI RAGGIUNGIBILITA
59
X
k=0
x(k) (0)
tk
k!
dove
x(1)
x(2)
x(3)
..
.
= Ax + Bu
+ Bu
= A2 x + ABu + B u + Ax
+ AAx
+ Bu
+ Ax
= A3 x + A2 Bu + AB u + B u + AAx
+ ABu
+ ABu
.
= ..
def
Introducendo loperatore = A dtd , valutando le derivate in t = 0,
sostituendo e raccogliendo opportunamente si ottiene, per x0 = 0
x(0, u, t) Im B|B|2 B| |r1 B|
x
v cos
y = v sin
w
60
3.2
` E CONTROLLABILITA
`
CAPITOLO 3. RAGGIUNGIBILITA
Cambiamenti di Coordinate
Le propriet`a di raggiungibilit`a e controllabilit`a non sono alterate da cambiamenti di coordinate (si dicono per questo propriet`a strutturali). Si consideri infatti il cambiamento di coordinate x = T z, e il sistema IDz =
T 1 AT z + T 1 Bu, per il quale si ha
= T 1 B|T 1 AT T 1 B| |T 1 An1 T T 1 B = T 1 R
R
3.3
3.3.1
61
`e invertibile, e Vc rappresenta una matrice n (n nv ) di colonne indipendenti tra loro e da quelle di V (cio`e una matrice di base complementare a V
per IRn ). Se le nuove coordinate di xv sono zv , cio`e se xv = T zv , allora le
ultime n nv coordinate di zv sono nulle.
Infatti, suddividendo a blocchi, si deve poter scrivere
z1
xv = V y = V V c
= V z1 + Vc z2
z2
z1 = y, z2 = 0nnv 1
Un sottospazio V si dice invariante rispetto ad una matrice A se xv V,
anche Axv V.
Ad esempio, lo spazio generato da un numero qualsiasi di autovettori
associati allo stesso autovalore `e uno sottospazio invariante; cos` anche per
gli autospazi generalizzati incontrati nella forma di Jordan. Lintero spazio,
cos` come lo spazio banale (comprendente solo lorigine) sono ovviamente
spazi invarianti.
Nelle coordinate T sopra associate ad un sottospazio, se questo `e A
invariante, la matrice A ha anchessa struttura a blocchi, e poiche vale
1
v
T Axv =
= T 1 AT zv = Az
0
A11 A12
=
0
A21 A22
(dove denota un vettore non nullo in generale la cui espressione qui non
interessa), deve essere A21 = 0, cio`e
A =
A11 A12
0 A22
62
` E CONTROLLABILITA
`
CAPITOLO 3. RAGGIUNGIBILITA
tk
k=0 k! Ak x0
x0 Ax0 A2 x0
t
t2
2
..
.
3.3.2
63
(3.4)
R =
= T 1 R
0
0
0
quindi, avendo R rango r come R, le sue prime r righe, le sole non nulle,
sono indipendenti. La presenza del termine incrociato ARN non influenza
la raggiungibilit`a di un arbitrario stato zN (t) desiderato a partire da qualsiasi stato iniziale zN (0) del sottosistema (in tempo t arbitrario per sistemi
TC, e almeno in t = r passi per sistemi TD), essendo questo sottosistema
completamente controllabile.
La forma (3.4) viene detta forma standard di raggiungibilit`a del sistema.
Il sottosistema (AR , BR ) (o (AR , BR , CR = CTR , D) se si include lequazione
di uscita) `e detto sottosistema raggiungibile; il sottosistema (AN , BN , CN =
CTN , D) `
e detto sottosistema non raggiungibile.
La scelta delle matrici di base TR e complementare TN `e arbitraria: qualsiasi matrice TR = TR QR e TN = TN QN , con QR IRrr e QN IR(nr)(nr)
invertibili, potrebbero essere usate per costruire la forma standard. Si avrebbe in tal caso T = [TR QR |TN QN ] = T diag (QR , QN ) e la forma standard
risultante
IDwR
IDwN
1
Q1
R AR QR QR ARN QN
0
Q1
N AN QN
wR
wN
B R QR
0
` E CONTROLLABILITA
`
CAPITOLO 3. RAGGIUNGIBILITA
64
CR CN
(sIr AR )1
M
0
(sInr AN )1
BR
0
+D =
= CR (sIr AR )1 BR + D
(dove M indica una matrice il cui calcolo esplicito `e superfluo).
Il fatto che la f.d.t di un sistema non dipenda dal sottosistema non raggiungibile, e che quindi il sottosistema non raggiungibile non influenzi il rapporto ingressouscita, ha importanti implicazioni. In particolare, tra i poli
della G(s) non appariranno gli autovalori di AN : ci`o significa che questi ultimi
vengono sistematicamente cancellati da zeri coincidenti nella espressione
G(s) =
3.4
C adj (sI A) B
+D
det (sI A)
Lemma P.B.H.
B1 1 B1 21 B1
B2 2 B2 22 B2
R=
Bn n Bn 2n Bn
1n1 B1
2n1 B2
nn1 Bn
65
1
1
R = diag (B1 , B2 , . . . , Bn )
1
1
2
21
22
2n
1n1
2n1
nn1
(3.6)
B AB
An1 B
=0
66
` E CONTROLLABILITA
`
CAPITOLO 3. RAGGIUNGIBILITA
qRT AN = i qRT
Applichiamo il lemma PBH al caso di una coppia (A, B) con A
di Jordan, con p miniblocchi:
1 1 0
0 1 0
0
...
0 1
.
; B =
.
A=
.
0
0
p 1 0
...
0
0 p
in forma
B11
B12
..
.
B1,m1
..
.
Bp,1
Bp,2
..
.
Bp,mp
Risulta che, per essere raggiungibile, le ultime righe Bi,mi per ogni miniblocco corrispondente ad autovalori coincidenti, devono essere linearmente
indipendenti. Infatti la matrice i I A ha tante righe nulle quante sono
i miniblocchi associati a i , cio`e la molteplicit`a geometrica i di i , ed il
rango di P (i ) non diminuisce se e solo se le corrispondenti righe estratte da
B hanno rango i .
In particolare, per un sistema SISO, `e necessario che la molteplicit`a geometrica di tutti gli autovalori sia pari a uno, e che B abbia almeno tanti
elementi diversi da zero quanti gli autovalori distinti di A
Se in un sistema SISO vi sono pi`
u catene di autovalori generalizzati corrispondenti ad uno stesso autovalore, solo i modi di (al pi`
u) la pi`
u lunga di
queste catene potranno apparire nella risposta forzata del sistema. In altri
termini, nella f.d.t. il polo corrispondente apparir`a con molteplicit`a pari (al
pi`
u) alla dimensione del miniblocco di ordine pi`
u elevato.
Esempio: Per il sistema
T
C1
B1
1 1
0
A = 0 1 0 , B = B2 ; C = C2 ; D = 0
C3
B3
0
0 1
67
si ha
( + 1)2 ( + 1)
0
B
0
( + 1)2
0
C
2
0
0
( + 1)
C1 B2 + (C1 B1 + C2 B2 + C3 B3 )( + 1)
=
G(s) =
3
( + 1)
( + 1)2
3.5
1
0
0
0
0
0
1
0
.
..
..
..
...
Ac = ...
; Bc = .. .
.
.
.
0
0
0
1
1
a0 a1 a2 an1
La forma di Ac si dice compagna orizzontale inferiore. Il polinomio caratteristico (o compagno) c (s) di una matrice Ac,n di dimensione n in questa
forma, si pu`o calcolare ricorsivamente sviluppando il determinante secondo
gli elementi della prima colonna:
0
s 1 0
0 s 1
..
.
.
.
.
.
.
.
.
c (s) = det(sI Ac,n ) =
det .
=
.
.
.
.
0 0
0
1
a0 a1 a2 s + an1
=
(1)n1
a0(1)n1 + s det(sI Ac,n1 ) =
0
s 1 0
0 s 1
0
..
..
..
.. . .
= a0 + s det .
.
.
.
.
0 0
0
1
a1 a2 a3 s + an1
` E CONTROLLABILITA
`
CAPITOLO 3. RAGGIUNGIBILITA
68
da cui
0
0
1
0
0
0
0
an1
..
..
..
.
.
.
.
Rc = .
0
1
1
an1
2
1 an1 an2 + an1
Se (A, B) `e raggiungibile, R ha rango pieno, quindi esiste una T invertibile, data da T = RRc1 , che trasforma le coordinate in modo tale da
avere T 1 AT = Ac , T 1 B = Bc .
La forma (Ac , Bc ) in cui possono essere messi tutti e soli i sistemi completamente raggiungibili si chiama canonica di controllo.
La matrice Rc1 ha una forma particolare (detta di Hankel) di facile
memorizzazione (verificare per esercizio):
a1 a2 an1 1
a2 a3
1
0
0
0
Rc1 = a3 a4
.. .. . .
..
..
. .
.
.
.
1 0
0
0
69
Sulla base di queste osservazioni, `e facile portare un sistema LTI raggiungibile SISO (A, B, C, D) nella forma canonica di controllo. Si procede infatti
come segue:
1. Si costruisce la matrice di raggiungibilit`a R e se ne verifica linvertibilit`a;
2. Si calcola il polinomio caratteristico di A, det(sI A) = sn +an1 sn1 +
+ a1 s + a0 ;
3. Con i coefficienti del polinomio caratteristico si costruiscono le matrici
Ac e Rc ;
4. Si calcola T = RRc1 ;
5. Si trova Cc = CT .
Si ricorda che la matrice D rimane invariata per cambiamento di variabili di
stato.
Ricordiamo che, dato un sistema SISO in forma normale
n
ID y(t) =
n1
X
i=0
ai ID y(t) +
n
X
bj IDj u(t)
i=0
b0 + b1 s + + bn s n
U (s)
a0 + a1 s + + an s n
0
0
1
0
0
0
0
0
1
0
0
.
..
.
.
.
.
.
.
..
..
..
..
..
..
IDz = .
z + ..
0
0
0
0
0
0
0
1
1
a0 a1 a2 am am+1 an1
y = bo bn a0 b1 bn a1 b2 bn a2 . . . bn1 bn an1 x + [bn ] u
Dato un sistema LTI SISO in forma normale, `e dunque sempre possibile scrivere un sistema in forma di stato con matrici (A, B, C, D) ad esso
equivalente con (A, B) in forma canonica di controllo (quindi raggiungibile).
Equivalente si intende nel senso che, dato un ingresso e delle condizioni iniziali per il primo, esistono degli stati iniziali tali per cui luscita del secondo
sistema corrispondente allo stesso ingresso `e la stessa.
70
` E CONTROLLABILITA
`
CAPITOLO 3. RAGGIUNGIBILITA
0
0 1 0
1 0 0 , B = 1 ;
A =
1
1 1 0
2 1 0 , D =0
C =
Capitolo 4
Pianificazione Ottima
Come gi`a discusso nel capitolo precedente, qualora il problema di raggiungimento di uno stato x a partire da x0 abbia soluzione per un qualche t,
esso pu`o averne infinite. Si desidera in questo capitolo studiare tecniche per
scegliere una tra queste possibili soluzioni. La scelta potr`a essere fatta ad
esmepio seguendo un criterio di ottimalit`a - la massimizzazione di una prestazione, o la minimizzazione di un costo. Vedremo anche che talvolta la
scelta dellingresso pu`o essere soggetta a vincoli imposti sugli ingressi o sulla evoluzione degli stati del sistema, e accenneremo ai metodi per trattare
questi problemi.
4.1
t
X
uT ( )Wu u( )
=0
e generalizzata in TC come
ku()k2[0,t] =
uT ( )Wu u( )d
0
In queste espressioni, la matrice simmetrica e positiva definita Wu rappresenta un fattore di peso relativo tra i diversi ingressi di un sistema MIMO,
71
72
4.1.1
Sistemi LTITD
73
t+
La matrice RW
= W 1 RtT (Rt W 1 RtT )1 , che nel caso particolare W = I
diviene RtT (Rt RtT )1 , `e la pseudoinversa (pesata con W 1 ) di Rt : questa
definizione `e valida se Rt ha pieno rango colonne, cio`e righe indipendenti.
Nel caso in cui Rt non abbia righe indipendenti (ma resti valida la ipotesi
di esistenza di una soluzione), si dovr`a utilizzare una formula pi`
u generale
della pseudoinversa di matrice (vedi appendice).
4.1.2
Sistemi LTITC
x(t) e x0 =
eA(t ) But ( )d
Rt
0
uTt ()Wu ut ( )d +
Rt
0
F (ut )d + T
Rt
eA(t ) But ( )d
0
x(t) eAt x0
+T x(t) eAt x0
d F
F
=0
dt u t ut
che in questo caso, essendo F () indipendente dalle derivate di ut , si semplifica
in
F
= 2uTt ( )Wu T eA(t ) B = 0.
ut
Da questa si ottiene
1
T
ut ( ) = Wu1 B T eA (t ) ,
2
74
Z
A(t )
T
BWu1 B T eA (t ) d
def
1
Gt
2
ut = Wu1 B T eA
4.1.3
T (t )
Per quanto si siano descritti in precedenza gli strumenti teorici della pianificazione ottima in tempo continuo, nella pratica del calcolo la soluzione
numerica si ottiene spesso mediante una discretizzazione dellasse dei tempi.
Questo comporta che la legge di controllo in grado di risolvere il problema di
pianificazione venga pensata come una funzione anchessa discretizzata, ad
esempio costante a tratti (a scalinata). Inoltre, il modello tempo continuo
del sistema deve essere trasformato in un modello tempo discreto, che dovr`a
approssimare quanto meglio possibile il primo.
Sia T il periodo di discretizzazione considerato. La nota tecnica detta di
Eulero in avanti corrisponde alla approssimazione
x
xk+1 xk
,
T
dove xk rappresenta lo stato del sistema tempo discreto al passo k. Sostituendo in (4.2) si ottiene
xk+1 xk
= Axk + Buk
T
= xk+1 = (T A + I) xk + T Buk
= xk+1 = Ad xk + Bd uk ,
75
x(t ) = e
A(t t0 )
x(t0 ) +
eA(t t0 ) Bu( )d
t0
A(Ts )
x(kTs ) +
Z
Ts
A(Ts )
Bu(k)
Ts
eA(Ts ) d B,
per il quale vale lesatta uguaglianza con il sistema originale tempo continuo
agli istanti di campionamento, cio`e xZ (kTs ) = x(t = kTs ).
Il calcolo delle matrici AZ e BZ `e reso molto semplice dalluguaglianza
AZ BZ
A B
,
(4.1)
Ts =
exp
0
I
0 0
76
dove exp(a) = ea , e gli zeri nella matrice che appare nellesponenziale sono
di dimensioni opportune per rendere la matrice stessa quadrata. La formula
`e verificata applicando la definizione di esponenziale di matrice,
exp
A B
0 0
Ts
k k
X
Ts
A B
=
0 0
k!
k=0
A B
0 0
k
Ak Ak1 B
0
0
P
k
(k)
F (t) =
(0) tk!
k=0 F
2
= F (0) + F (0)t + F (2) (0) t2! + . . .
Rt
Rt
= 0 + (A 0 eA(t ) d + I) t + (A2 0 eA(t ) d + A)
t=0
t=0
P
k1 tk
=
A
,
k=1
k!
t2
2!
+ ...
4.2
Applicazioni ed Estensioni
77
(4.2)
0
.
B=
1
4.2.1
78
(4.3)
soggetto a:
xk+1 = Ad xk + Bd uk
x0 = xo
xp = xf .
Questultimo ammette soluzione se lo stato xf `e raggiungibile da xo in un
numero di passi l p. Per calcolare tale soluzione `e sufficiente esplicitare i
primi p passi dellevoluzione completa del sistema
xp = Apd x0 + Ap1
d Bd u0 + . . . + Bd up1
up1
= Apd x0 + Rp ... ,
u0
(4.4)
(4.5)
soggetto a:
up1
xf = Apd xo + Rp ... .
u0
(4.6)
79
Riconsideriamo il sistema carrello-molla-smorzatore e discretizziamolo utilizzando la tecnica Eulero in avanti. Scegliendo un tempo di campionamento T = 0.05 s, otteniamo:
1
0.05
Ad =
0.05 0.95
0
.
Bd =
0.05
Supponiamo di avere come stato iniziale xo = [0 0]T , cio`e posizione e velocit`a
nulle, e di voler raggiungere la posizione z = 10 con velocit`a nulla, cio`e xf =
[10 0]T . Se la completa raggiungibilit`a del sistema `e conservata attraverso la
discretizzazione del sistema tempo continuo (questa propriet`a non `e detto che
si conservi, e deve quindi essere verificata), lo stato xf pu`o essere raggiunto
da xo in due passi, ma non in uno, dal sistema precedente. Quindi il tempo
minimo con questa discretizzazione `e 2T = 0.1 sec. Usando la (4.6) si ottiene:
4000
u0
.
=
u2passi =
3800
u1
Si fa notare che nella precedente relazione il vettore di controllo `e ordinato
per tempi crescenti, al contrario di come `e fornito dalla (4.6), in modo da
rispettare lordine temporale con cui i valori sono forniti al sistema. Di
seguito si riportano i grafici degli stati per il sistema tempo discreto e per il
tempo continuo (fig. 4.2-a,-b).
Come si nota i valori dei controlli sono piuttosto elevati. Questo dipende
dal fatto che si `e forzato il sistema a raggiungere lo stato finale in tempo
minimo. Se si allunga lorizzonte temporale in cui si desidera raggiungere
tale stato, senza modificare il tempo di campionamento, si ottengono valori di
controllo pi`
u bassi e andamenti degli stati pi`
u morbidi. Queste considerazioni
risultano evidenti gi`a con una pianificazione ottima a 6 passi (fig. 4.3 e fig. 4.4a,-b).
80
200
200
z
dz / dt
z
dz / dt
150
150
100
100
50
50
10
0
10
0
0.05
0.1
0.15
0.05
0.1
Tempo [s]
Tempo [s]
a)
b)
0.15
81
600
400
200
200
400
600
0.05
0.1
0.15
Tempo [s]
0.2
0.25
0.3
Figura 4.3: Controlli calcolati secondo la legge (4.6) con 6 passi (sistema
discretizzato con Eulero in avanti T = 0.05 s).
60
60
z
dz / dt
z
dz / dt
50
50
40
40
30
30
20
20
10
10
10
0.05
0.1
0.15
Tempo [s]
a)
0.2
0.25
0.3
10
0.05
0.1
0.15
Tempo [s]
0.2
0.25
0.3
b)
82
15
10
10
0.2
0.4
0.6
0.8
1
Tempo [s]
1.2
1.4
1.6
Figura 4.5: Controlli calcolati secondo la legge (4.6) con 35 passi (sistema
discretizzato con Eulero in avanti T = 0.05 s).
10
10
z
dz / dt
0.2
0.4
0.6
0.8
1
Tempo [s]
a)
1.2
1.4
1.6
z
dz / dt
0.2
0.4
0.6
0.8
1
Tempo [s]
1.2
1.4
1.6
b)
I controlli ottenuti fino ad ora risolvono il problema di pianificazione ottima (4.5), permettendo al sistema carrello-molla-smorzatore di raggiungere
lo stato desiderato in un prefissato numero di passi. Il raggiungimento di un
prefissato stato mediante una opportuna legge di controllo in generale non
garantisce che il sistema si mantenga in tale stato per un tempo indefinito.
83
12
z
dz / dt
z
dz / dt
50
10
40
30
20
10
0.05
0.1
0.15
Tempo [s]
0.2
0.25
a)
0.3
0.2
0.4
0.6
0.8
1
Tempo [s]
1.2
1.4
1.6
b)
Figura 4.7: Stati del sistema tempo continuo controllato con la sequenza
calcolata sulla base del modello tempo discreto ZOH, a partire da xo = [0 0]T :
a) controllo u6passi ; b) controllo u35passi .
Per soddisfare ad un tale requisito, si pu`o procedere imponendo che il valore
dello stato al passo p coincida con quello al passo p 1, ovvero pari al valore
desiderato xf
p1
x
X(p 1)
Ad xo
+
= f =
xf
X(p)
Apd xo
0
Bd Ad Bd A2d Bd
2
Bd Ad Bd A2d Bd AN
Bd
d
u(p)
u(p 1)
u(p 2)
N 2
Ad Bd
..
1
AN
B
d
.
d
u(1)
u(0)
u(p)
u(p 1)
p1
u(p 2)
xf
A x
,
dp o
= Rp
..
xf
Ad xo
u(1)
u(0)
84
AN
Bd
d
.
Rp =
2
1
Bd Ad Bd A2d Bd AN
Bd AN
Bd
d
d
Alternativamente si poteva procedere calcolando preliminarmente il valore della forza F di attuazione capace di mantenere il carrello in equilibrio in
xf , ovvero u(p) = F = Kzo = 10 N. Lo stato al passo p `e dato da
u(p)
u(p 1)
u(p 2)
p1
X(p) = xf = Apd xo + Bd Ad Bd A2d Bd Ap2
..
d Bd Ad Bd
u(1)
u(0)
ovvero,
u(p 1)
u(p 2)
..
p
xf = Apd xo + Bd u(p) + R
u(1)
u(0)
(4.7)
u(p 1)
u(p 2)
..
p (xf Ap xo Bd u(p)) ,
=R
.
d
u(1)
u(0)
85
12
z
dz / dt
10
z
dz / dt
10
6
8
4
0
4
2
4
2
6
0.5
1.5
2.5
0.5
Tempo [s]
1.5
2.5
Tempo [s]
a)
b)
4.2.2
Valori troppo elevati del segnale di controllo potrebbero danneggiare il sistema e gli attuatori, o semplicemente potrebbero non essere generabili. In
tali situazioni `e utile formulare un problema di ottimizzazione che prevede
esplicitamente dei vincoli sul valore massimo dei segnali di controllo. Purtroppo non possiamo pi`
u fare ricorso alla soluzione mediante pseudoinversa
della matrice di raggiungibilit`a, ma dobbiamo risolvere un nuovo problema
di ottimizzazione vincolata:
min kuk2
u
soggetto a:
xk+1 = Ad xk + Bd uk
x0 = x0
xp = xt
l b uk ub .
(4.8)
86
15
10
10
15
0.5
1.5
1.75
2.5
Tempo [s]
(4.9)
soggetto a:
xt Apd x0 = Rp u
l b uk ub ,
T
con u = up1 u0 . Questo problema appartiene alla classe dei problemi di minimi quadrati vincolati e non pu`o essere cos` facilmente risolto
come i precedenti, ma richiede strumenti di calcolo numerico pi`
u complessi.
Lesistenza stessa di una soluzione non `e garantita per un numero di passi
fissato a priori.
Matlab mette a disposizione la funzione lsqlin per risolvere problemi ai
minimi quadrati vincolati1 . Se lapplicazione dellalgoritmo non trova soluzioni in un numero p di passi, si incrementa p e si prova ancora. In questo
modo si pu`o ottenere anche una soluzione del problema di trovare il numero
di passi minimo con vincoli sul controllo.
1
tale che:
Axb
Aeq x = beq
lb x u b ,
87
Imponendo il vincolo 15 uk 15 sul controllo e risolvendo il problema (4.9) per il sistema discretizzato con Eulero in avanti facendo uso della
funzione lsqlin di Matlab, si ottengono i risultati riportati nelle fig. 4.10.
Controlli (Eul. in avanti, u vincolato T = 0.05 p = 35)
15
z
dz/dt
10
Stati del sistema tempo continuo (Eul. in avanti, u vincolato, T = 0.05 p = 35)
z
dz/dt
10
10
8
10
0
15
0
0.2
0.4
0.6
0.8
Time (sec)
1.2
1.4
1.6
0.2
0.4
0.6
(a)
0.8
1
Time (sec)
1.2
1.4
1.6
0.2
0.4
0.6
(b)
0.8
1
Time (sec)
1.2
1.4
1.6
(c)
Figura 4.10: Soluzione del problema di minimi quadrati vincolati (4.9) con
35 passi e discretizzazione con Eulero in avanti per T = 0.05s: a) Controlli;
b) Stati del sistema TD; c) Stati del sistema TC.
Per verificare la differenza insita nella soluzione del problema (4.9) rispetto al problema (4.3), calcoliamo la legge di controllo con la formula (4.6) per
lo stesso numero di passi e tempo di campionamento (cio`e stesso orizzonte
temporale). Come si pu`o notare dalla fig. 4.11 (a) i segnali di controllo nei
primi e ultimi istanti violano il vincolo 15 uk 15 anche se producono un
andamento per la velocit`a pi`
u morbido (fig. 4.11 (b) e (c)). Una soluzione al
problema con controlli vincolati si sarebbe potuta ottenere anche nella forma
(4.6), ma avrebbe richiesto un numero maggiore di passi. Limpiego di un
numero minore di passi, di contro, ha leffetto di alzare il valore della norma
del controllo. A parit`a di passi, infatti, il problema (4.9) produce vettori di
controllo con norme maggiori uguali di quelle dei vettori soluzione di (4.3).
Controlli (Eul. in avanti, T = 0.05 p = 35)
20
z
dz/dt
10
10
15
10
5
0
5
10
15
0
20
0
0.2
0.4
0.6
0.8
1
Time (sec)
(a)
1.2
1.4
1.6
0.2
0.4
0.6
0.8
1
Time (sec)
(b)
1.2
1.4
1.6
0.2
0.4
0.6
0.8
1
Time (sec)
1.2
1.4
(c)
Figura 4.11: Soluzione del problema di minimi quadrati senza vincoli (4.6)
con 35 passi e discretizzazione con Eulero in avanti per T = 0.05s: a)
Controlli; b) Stati del sistema TD; c) Stati del sistema TC.
1.6
88
4.2.3
f (x)
c(x) 0
ceq (x) = 0
Axb
Aeq x = beq
lb x u b ,
89
10
10
z
dz/dt
z
dz/dt
10
10
15
0
0.2
0.4
0.6
0.8
1
Time (sec)
(a)
1.2
1.4
1.6
1.8
0
0
0.2
0.4
0.6
0.8
1
Time (sec)
(b)
1.2
1.4
1.6
1.8
0.2
0.4
0.6
0.8
1
Time (sec)
1.2
1.4
1.6
(c)
Figura 4.12: Soluzione del problema di ottimizzazione (4.2.3) con vincoli con
37 passi e discretizzazione con Eulero in avanti per T = 0.05s: a) Controlli;
b) Stati del sistema TD; c) Stati del sistema TC.
4.2.4
Per concludere consideriamo leffetto della variazione del tempo di campionamento sul problema di pianificazione. Se T viene ridotto e non si impone
alcun vincolo sul valore massimo dei segnali di controllo, allora il sistema
tempo continuo raggiunge lo stato desiderato in meno tempo. Le matrici dei
sistemi discretizzati varieranno in conformit`a al nuovo valore di T , ma non
cambier`a il numero di passi necessario per raggiungere lo stato desiderato
(salvo violazione delle propriet`a di raggiungibilit`a, che si pu`o avere per alcuni particolari valori di T ). Ovviamente, perche ci`o sia possibile, aumenter`a
il valore dei segnali di controllo. Questo legame si capisce intuitivamente se
si pensa al fatto che per far raggiungere al carrello la sua posizione finale in
minor tempo, bisogner`a spingerlo con pi`
u forza. Daltro canto se T tende
a zero, lapprossimazione discreta della derivata tende al suo valore tempo
continuo e la condizione di raggiungibilit`a torna ad essere quella in tempo
nullo dei sistemi continui, ammissibile solo con controlli illimitati.
Se, invece, si riduce T , ma si conserva il vincolo sui controlli, il numero
di passi che il sistema tempo discreto dovr`a effettuare per raggiungere lo
stato desiderato aumenter`a. Questo `e dovuto al fatto che la soluzione del
problema (4.9) con numero minimo di passi tende a saturare il valore del
controllo, cio`e a fornire segnali che assumono quasi sempre i valori minimo
e massimo. In tal senso la soluzione a tale problema `e unapprossimazione
della soluzione dellequivalente problema di ottimo tempo continuo e per esso
fornisce una soluzione in tempo minimo pT . Diminuire T , comporta pertanto
un aumento di p in modo da avvicinarsi al precedente valore pT . In molti casi
il valore di p aumenta anche oltre quello indicato dalla precedente relazione
1.8
90
Capitolo 5
Retroazione degli stati
Nella grande maggioranza delle applicazioni, il controllo basato esclusivamente sulla esatta conoscenza dello stato iniziale e del modello del sistema
(come lo si `e visto nel caso della pianificazione in anello aperto) non d`a risulatati soddisfacenti, in seguito alla presenza di disturbi (che possono alterare
lo stato del sistema) e di errori di modello.
Lo strumento principale dellingegnere del controllo `e la retroazione, cio`e
lutilizzo di informazioni provenienti da opportuni sensori sullo stato attuale
effettivo del sistema. Tipicamente, come gi`a si `e visto nellintroduzione, si
dovr`a pensare di avere a disposizione solo la conoscenza dei valori di un certo
numero di uscite misurabili, cio`e di note funzioni degli stati incogniti. Per il
momento, comunque, supporremo di avere a disposizione la misura di tutti
gli stati.
Il concetto di retroazione degli stati sugli ingressi per un sistema IDx =
f (x, u) consiste nel realizzare ingressi calcolati istante per istante in funzione
dello stato presente: u(t) = (x(t)) + (x(t))v(t). Come gi`a accennato trattando della stabilit`a, la retroazione `e spesso usata al fine di rendere stabile
un sistema che originalmente non lo `e, ovvero di migliorarne le caratteristiche
di stabilit`a (ad esempio, migliorando la velocit`a di convergenza).
5.1
92
BH (A + BK)BH
(A + BK)n1 BH
Rf =
B AB A B
...
AR ARN
0
AN
AR + BR KR ARN + BR KN
0
AN
BR
0
KR KN
A + BK =
0
0
..
.
1
0
..
.
0
1
..
.
...
0
0
0
a0 + k0 a1 + k1 a2 + k2
0
0
0
1
an1 + kn1
93
1
1 0 1
A = 2 1 0 ; B = 0 ; C = 1 0 0 ; D = 0;
1
0 1 0
Il sistema `e raggiungibile:
1 2 2
R = 0 2 6 ,
1 0 2
0
0 1 0
Ac = 0 0 1 ; Bc = 0
1
2 1 2
Essendo poi
94
1 0 1
1 2 1
0 0 1
2 0
Rc = 0 1 2 ; Rc1 = 2 1 0 ; T = 2
3 2 1
1
0 0
1 2 3
si ha Cc = CT = 1 0 1 .
Se si desidera porre gli autovalori
in 3, 2 j, si calcola il
P2ad esempio
3
i
3
nuovo polinomio caratteristico s + i=0 ci s = s +7s2 +17s+15, e si risolvono in ki le equazioni ai + ki = ci , ottenendo k0 = 17, k1 = 16, k2 = 9.
La legge di controllo, espressa nelle originali coordinate, `e dunque data da
u(x) = Kc T 1 x + v =
5.1.1
T
1
22 29 5
x1 x2 x3
+v
3
() `e data da
K = (a a
)Rc R1
con
Rc1 =
a1 a2 1
a2 a3 0
.. .. . .
. 0
. .
1 0 0
dove
(A) = An + a
n1 An1 + . . . + a
1 A + a
0 I. Il comando Matlab K =
acker(A, B, a) esegue questo algoritmo.
Le formule di allocazione dei poli possono essere numericamente instabili
per diversi motivi. Innanzitutto, se vengono applicate ad un sistema che sia
95
s` completamente raggiungibile, ma con matrice di raggiungibilit`a R malcondizionata, cio`e pressoch`e non invertibile1 , produrr`a ovviamente un risultato
molto elevato in termini dei coefficienti che appaiono in K e molto sensibile a variazioni anche piccole della posizione degli autovalori di partenza e
desiderati.
Un secondo caso in cui si ha forte sensibilit`a dei risultati alle piccole
variazioni numeriche dei dati `e quello in cui si richieda di allocare pi`
u poli in
posizioni coincidenti o molto vicine: questo tipo di allocazione `e quindi da
evitare.
Infine, anche al di fuori di questi casi, gli algoritmi diretto e di Ackermann
sopra visti possono essere numericamente instabili, e non produce risultati
attendibili, per sistemi con un elevato numero di stati (dellordine di alcune
decine). Esistono algoritmi pi`
u robusti numericamente, ad esempio quello
realizzato nel comando Matlab K = place(A, B, a).
Osservazione. Dalla discussione precedente, risulta che la retroazione degli stati pu`o assegnare dinamica arbitrariamente veloce ad un sistema
purche raggiungibile. Naturalmente questo `e vero solo allinterno delle ipotesi di validit`a del modello che stiamo considerando, in particolare della sua
linearit`a e della illimitata autorit`a del controllo.
Si consideri come esempio un sistema costituito da un veicolo di massa
inerziale m, spinto dalla azione u di un propulsore, e si consideri come uscita
y la sua velocit`a. Una retroazione opportuna pu`o piazzare lautovalore del sistema tanto a sinistra sullasse reale, da fare in modo che il sistema raggiunga
il valore di regime di un gradino di riferimento, ad esempio i 100Km/h dei
test stradali, in tempo arbitrariamente piccolo. Questo sarebbe ovviamente
ottenuto mediante valori molto elevati di K, che si traducono in valori elevati
del segnale di controllo u - corrispondenti ad azioni che il propulsore non `e
in realt`a in grado di fornire.
Questo semplice esempio mostra come la saturazione, ed in generale la
limitata autorit`a ed il costo delle azioni di controllo, siano i limiti fisici che si
frappongono in realt`a allottenimento di modifiche arbitrarie alle dinamiche
di sistemi reali. Ne segue in generale che la scelta della dinamica da assegnarsi
in anello chiuso `e da farsi con attenzione alle richieste che ne risultano sugli
ingressi, come si vedr`a pi`
u avanti nel corso.
1
si ricorda che una matrice `e malcondizionata quando il rapporto tra il suo valore
singolare massimo e quello minimo `e molto maggiore di uno. I valori singolari di una
matrice R sono le radici quadrate degli autovalori di RT R. Una matrice che ha un valore
singolare nullo non `e invertibile. Per le matrici normali, ed in particolare per le matrici
simmetriche, i valori singolari coincidono con i valori assoluti degli autovalori.
96
5.1.2
5.1.3
per allocare i poli baster`a scegliere opportunamente gli elementi K1,1 , . . . , Kn,1
e porre tutti gli altri a 0 in K per ottenere lo scopo.
Se, nonostante il sistema sia raggiungibile, non esiste nessuna colonna di
B che da sola pu`o garantire la raggiungibilit`a, rimane possibile retroazionare
gli stati in modo da allocare gli autovalori arbitrariamente mediante il Lemma
di Heymann. Questo consiste nellapplicare preventivamente al sistema una
retroazione u = KHi x + v tale che (A + BKHi , Bi ) sia controllabile, per poi
allocare gli autovalori di A+BKHi con una ulteriore retroazione v = Kx+w.
Il lemma di Heymann afferma che una tale matrice esiste, purch`e il sistema sia raggiungibile e Bi sia non nulla, e fornisce la seguente formula per il
calcolo della matrice KHi (data nel caso i = 1 senza perdere generalit`a).
Si costruisca la successione di vettori B1 , AB1 , A2 B1 , . . . , A1 1 B1 , arrestandosi al passo in cui si trova A1 B1 linearmente dipendente dai precedenti.
Si procede in modo analogo con B2 , calcolando B2 , AB2 , . . . , A2 1 B2 , arrestandosi al passo in cui si trova A2 B2 linearmente dipendente da B1 , . . .,
A1 1 , B2 , . . ., A2 1 .
Se necessario, si procede con B3 etc. sinche si ottiene una matrice invertibile
97
Q =
= B1 AB1 A1 1 B1 B2 AB2 A2 1 B2
Bp1 ABp1 Ap1 1 Bp1 Bp ABp Ap 1 Bp
Si costruisce inoltre la matrice S IRmn
S = 0 0 e2 0 0 e3 0
0 ep 0
0 0
98
autovalori scegliendo tra le infinite retroazioni K possibili quella che minimizza la sensitivit`a della posizione degli autovalori in anello chiuso alle
perturbazioni dei dati del modello, cio`e dei coefficienti delle matrici A e B.
Capitolo 6
Osservabilit`
a e Ricostruibilit`
a
Si `e in passato gi`a sottolineato il fatto che, nel modello in forma di stato di un
sistema, luscita (di misura) ha il significato di specificare quelle grandezze di
cui, a differenza dello stato, si ha a disposizione una misura ad ogni istante
del processo. Essendo la conoscenza degli stati necessaria per effettuare la
loro retroazione, `e perci`o fondamentale determinare se, dalla conoscenza delle
uscite (e degli ingressi, che sono ovviamente a nostra disposizione), `e possibile
conoscere (o pi`
u in generale stimare) lo stato attuale del sistema.
La capacit`a di stimare lo stato di un sistema `e daltronde importante
anche in senso diretto in molte applicazioni, dove `e importante risalire dalla
osservazione di fenomeni misurabili alla situazione interna del sistema, di
per se non accessibile.
Se i dati di ingresso/uscita sono misurati in un intervallo [0, t], il problema
di ricavare informazione sullo stato x(0) al tempo 0 si dice di osservazione
dello stato; viceversa, il problema di ricavare lo stato x(t) al tempo t si dice
di ricostruzione dello stato. Si vedr`a che i due problemi sono equivalenti per
sistemi LTITC, ma non per sistemi LTITD.
Nelle questioni di osservazione/ricostruzione, ci troveremo spesso di fronte a problemi che possono essere ricondotti a sistemi di equazioni lineari
sovradeterminati (con meno incognite che equazioni), che in pratica saranno spesso inconsistenti. Per questi problemi si porranno quindi questioni di
approssimazione ottima ad una soluzione impossibile.
6.1
` E RICOSTRUIBILITA
`
CAPITOLO 6. OSSERVABILITA
100
It (
x) = {
x1 IRn |y(
x, u, ) = y(
x1 , u, ) [0, t], u U } .
Ovviamente, se questo insieme contiene altri punti diversi da x stesso, non
sar`a possibile determinare univocamente lo stato dalle uscite.
6.1.1
Sistemi LTITC
(6.1)
101
si ha
y(
x, u, 0) y(
x1 , u, 0)
y(
x, u, 0) y(
x1 , u, 0)
..
.
= C(
x x1 )
= CA(
x x1 )
..
= .
y (k) (
x, u, 0) y (k) (
x1 , u, 0) = CAk (
x x1 )
y(0)
C
y(1) (0) CA
(2)
y (0) CA2
.
..
= . x
.
.
(k)
y (0) CAk
..
..
.
.
` E RICOSTRUIBILITA
`
CAPITOLO 6. OSSERVABILITA
102
dove y(t) = y(
x, u, t) y(
x1 , u, t).
Dunque x `e non osservabile (ovvero x1 `e indistinguibile da x) se appartiene allo spazio nullo della matrice composta con infinite righe sopra riportata. In seguito al teorema di CayleyHamilton, sappiamo comunque che
ogni gruppo di righe CAr con r n `e combinazione lineare delle prime n
righe della matrice stessa. Possiamo dunque dire che linsieme dei punti non
osservabili nellintervallo [0, t] `e in effetti un sottospazio, detto sottospazio di
inosservabilit`a, dato da
def
C
CA
CA2
..
.
CAn1
It (
x) = x = x + r, r O
ed `e quindi un iperpiano, parallelo al sottospazio di inosservabilit`a, passante per x ed anchesso indipendente da t. Nessun punto, eccetto x, `e
indistinguibile da x nel caso che il sistema sia osservabile.
6.1.2
Sistemi LTITD
(6.2)
103
La soluzione per le uscite della equazione alle differenze (6.2) (che indicheremo con y(
x, u, )) `e data da
y(
x, u, ) = CA x +
1
X
CA k1 Bu(k)
k=0
y( ) = y(
x, u, ) y(
x1 , u, ).
Impilando in un solo vettore i vettori di differenze tra le uscite negli istanti
0, 1, . . . , t si pu`o scrivere
C
y(0)
y(1) CA
def
x x1 ) = Ot x
.. = .. (
. .
CAt
y(t)
C
CA
..
.
n1
CA
104
` E RICOSTRUIBILITA
`
CAPITOLO 6. OSSERVABILITA
6.1.3
Ricostruibilit`
a
Il problema di ricostruire, a partire dalle misure delle uscite in un intervallo [T t, T ], lo stato allistante T stesso riveste particolare importanza in
relazione alla possibilit`a di retroazionare lo stato.
Due stati del sistema al tempo T , x1 (T ) e x2 (T ), si dicono indistinguibili
nel passato in t passi se entrambi sono possibili soluzioni del sistema a partire
da condizioni iniziali compatibili con le misure compiute sullintervallo [T
t, T ].
Per la tempoinvarianza del sistema considerato, posso porre T = t.
Scrivendo la soluzione dello stato al tempo t a partire dallo stato iniziale x1
si ha
1
X
def
t
x1 (t) = x(
x1 , u, t) = A x1 +
Atk1 Bu(k)
k=0
Se, in base alle misure delle uscite fatte nei passi da 0 a t, posso osservare x1 ,
certamente potr`o anche stabilire univocamente x1 (t). Nel caso per`o in cui
esista un insieme non banale di indistinguibilit`a in t passi, non sar`o in grado
di distinguere, sulla base delle misure di uscita, lo stato iniziale x1 da uno
stato x2 se (
x2 x1 ) = x ker Ot . Daltronde, lo stato al passo t a partire
da x2 vale
P 1 tk1
def
x2 (t) = x(
x2 , u, t) = At x2 + k=0
A
Bu(k) =
= At x + x(
x1 , u, t) = At x + x1 (t)
quindi lindistinguibilit`a dello stato iniziale `e irrilevante ai fini della determinazione dello stato al tempo t (linsieme dei punti indistinguibili nel passato
da x1 in t passi contiene solo x1 ) se x ker (At ).
Questo vale in generale per qualsiasi stato iniziale indistinguibile (nel
futuro) se e solo se
ker (O)t ker (At )
Se questa condizione `e verificata, si dice che il sistema `e ricostruibile in t
passi.
Il sistema si dice ricostruibile se `e ricostruibile per qualche t. Per il
teorema di CayleyHamilton, questo equivale alla condizione ker (O)
ker (An )
105
6.1.4
Cambiamenti di Coordinate
Le propriet`a di osservabilit`a e ricostruibilit`a non sono alterate da cambiamenti di coordinate (sono propriet`a strutturali). Si consideri infatti il cambiamento di coordinate x = T z, e il sistema
Dz = T 1 AT z + T 1 Bu
y =
CT z + Du,
per il quale si ha
=
O
CT
CT T 1 AT
..
.
CT T 1 An1 T
= OT
OT O
sono quadrate e invertibili, per cui si ha semplicemente
nel caso SISO, O e O
T = O1 O
6.2
Stima ottima
Torniamo a considerare il problema di stimare lo stato iniziale x di un sistema conoscendone esattamente il modello e gli ingressi nellintervallo [0, t],
oltreche le uscite nello stesso intervallo. Nel caso LTITD la conoscenza esatta
del valore delle uscite su n campioni determina esattamente lo stato: se il
106
` E RICOSTRUIBILITA
`
CAPITOLO 6. OSSERVABILITA
numero di misure N `e maggiore, se ne possono in linea di principio trascurare N n. Nel caso LTITC ci troviamo davanti ad una serie continua di
misure su [0, t]: anche in questo caso `e concepibile utilizzare solo il numero strettamente necessario di misure prese ad istanti discreti nellintervallo,
trascurando le altre infinite misure disponibili che non possono che essere
linearmente dipendenti da quelle considerate.
Naturalmente questo approccio alla stima dello stato `e molto riduttivo, e
non ci dice nulla ne sul come scegliere le misure da utilizzare, ne sul perche si
debbano scartare misure che comunque contengono informazione sul sistema.
Per una migliore comprensione del problema, `e necessario considerare che
la conoscenza delle uscite ad un dato istante non pu`o che essere pensata,
nella grande maggioranza delle applicazioni, come affetta da errori di misura.
Questi ultimi possono essere introdotti nel modello del sistema aggiungendo
un termine non noto di errore y, cio`e
Dx(t) = Ax(t) + Bu(t)
y(t) = Cx + Du + y(t)
Non si faranno in questa sede considerazioni sulla caratterizzazione del
termine di errore di misura, che potrebbe essere fatta in termini probabilistici
(media, varianza etc.) o deterministici (massimo valore dellerrore nel peggior
caso), lasciandole a corsi specialistici. Ci limiteremo qui a supporre che y
sia piccolo rispetto alle misure y.
6.2.1
107
il quale, assumendo di avere misure sufficienti a rendere determinato il problema, quindi pt > n, risulter`a inconsistente (non esister`a cio`e alcuna soluzione
esatta). Avr`a senso quindi porsi il problema di trovare la stima migliore di
x nel senso di minimizzare una norma degli errori residui, cio`e
x = arg min kY Ot xk
x
x = (OtT Wy Ot )1 OtT Wy Y
Il significato che pu`o essere dato alla matrice di pesi Wy `e quello di affidabilit`a
delle misure (per un sistema SISO, lelemento diagonale i-esimo `e tanto maggiore quanto maggiore `e laffidabilit`a della misura al passo iesimo); questo
concetto si formalizza meglio, in presenza di una caratterizzazione statistica
degli errori di misura, con la inversa della covarianza degli stessi. Altra importante funzione di Wy `e quella di normalizzare le dimensioni fisiche delle
equazioni, e di rendere quindi la soluzione invariante al variare dei sistemi di
riferimento e di unit`a di misura.
6.2.2
dove la norma della funzione residuo `e da intendersi come una norma su uno
spazio di funzioni definite su [0, t].
Considerando in particolare la norma due pesata, o meglio il suo quadrato, si ha
` E RICOSTRUIBILITA
`
CAPITOLO 6. OSSERVABILITA
108
x = arg min
x
t
0
AT
C Wy ( )y( )d =
def
eA C T Wy ( )CeA xd = GOt x
x = GOt
eA C T Wy y( )d
0
6.3
Dualit`
a
:
y = B T x + Du
109
6.4
Osservabilit`
a di sistemi non LTI
x
v cos
v sin
y =
w
y1
= + arctan( xy )
y1
= + arctan( yd
)
x
6.5
Il sottospazio di inosservabilit`a, sia nel caso LTITC che LTITD, ha anchesso una caratterizzazione geometrica: esso `e il pi`
u grande sottospazio
` E RICOSTRUIBILITA
`
CAPITOLO 6. OSSERVABILITA
110
C
CA
ker
..
.
CA(n1)
S O.
Sia TO IRno una matrice di base per il sottospazio di inosservabilit`a
= ker (O) del sistema LTI
O
Dx = Ax + Bu,
y = Cx + Du
e TO IRn(no) una matrice di base complementare. Nelle nuove coordinate
descritte da
zO
def
x = T z = TO TO
zO
il sistema diviene
ovvero
Dz = T 1 AT z + T 1 B
y =
CT z + Du
DzO
DzO
y
=
=
0
AO
AOO AO
CO
zO
BO
+
u
zO
BO
zO
+ Du
zO
(6.3)
`
6.5. FORMA STANDARD DI OSSERVABILITA
111
O =
CO
CO AO
..
.
0
0
..
.
n1
CO AO
0
= OT
CO 0
"
sI(no) AO
M
1
= CO (sIno AO )1 BO + D
0
(sIo AO )1
# B
O
+D =
BO
` E RICOSTRUIBILITA
`
CAPITOLO 6. OSSERVABILITA
112
6.6
C adj (sI A) B
+D
det (sI A)
Lemma P.B.H.
1
0
A =
C =
1
1
0
0
0
0
...
C11 C21
Cm1 ,1
;
0
1 0
p 0
...
0 p
0
...
p
0
Cp,1 C2,p
Cmp ,p
113
Risulta che, per essere osservabile, le prime colonne per ogni miniblocco
corrispondente ad autovalori coincidenti, devono essere linearmente indipendenti. In particolare, per un sistema SISO, `e necessario che la molteplicit`a
geometrica di tutti gli autovalori sia pari a uno, e che C abbia almeno tanti
elementi diversi da zero quanti gli autovalori distinti di A. Un sistema con
i miniblocchi associati ad un unico autovalore i pu`o essere osservabile solo
se ha almeno i uscite indipendenti.
6.7
Per un sistema SISO con matrici dinamica e di uscita nella particolare forma
0 0 0 a0
1 0 0 a1
Ao = .. .. . . ..
;
..
. .
. .
.
0 0 1 an1
1
0 0 0
Co =
(la forma di Ao si dice compagna verticale destra), la matrice di osservabilit`a ha la stessa forma della matrice di raggiungibilit`a della forma canonica
di controllo. Infatti
0
0
1
0
0
0
0
an1
..
..
..
.
.
.
.
Oo = .
0
1
1
an1
2
1 an1 an2 + an1
114
` E RICOSTRUIBILITA
`
CAPITOLO 6. OSSERVABILITA
6.8
Loperazione duale della reazione degli stati sugli ingressi `e una operazione
mediante la quale luscita di un sistema viene riportata a influenzare direttamente l evoluzione degli stati, e si dice iniezione delle uscite. Anche se
questa operazione pu`o apparire fisicamente impossibile in questi termini, ne
troveremo pi`
u avanti una spiegazione ed una specifica utilit`a. Liniezione
lineare delle uscite sugli stati avviene attraverso una matrice G IRnp :
Dx = Ax + Bu + Gy = (A + GC)x + (B + GD)u
y = Cx + Du
Cos` come la retroazione degli stati non altera la raggiungibilit`a di un sistema,
la iniezione delle uscite non ne altera la osservabilit`a (la dimostrazione `e
115
` evidente (ricorrendo
analoga, e pu`o essere fatta ad esempio per dualit`a). E
ancora alla dualit`a) che, in un sistema completamente osservabile, la scelta
opportuna della matrice G pu`o allocare gli autovalori della matrice A + GC
dove desiderato.
116
` E RICOSTRUIBILITA
`
CAPITOLO 6. OSSERVABILITA
Capitolo 7
Realizzazioni e Connessioni di
Sistemi
7.1
Si `e visto in precedenza che un sistema LTI pu`o essere scritto in due forme
standard, che riflettono le sue propriet`a di raggiungibilit`a e osservabilit`a.
Combinando questi due risultati, si giunge ad una forma pi`
u articolata, che
li contiene entrambe.
Siano dunque per il sistema LTI con matrici (A, B, C) rispettivamente
i sottospazi di raggiungibilit`a e inosservabilit`a. Essendo entrambe
R e O
`e una base di ker [TR |TO ], allora TRO = TR N1 = TO N2 `e una base del
sottospazio cercato. Unalgoritmo `e realizzato ad esempio in linguaggio
Matlab come segue:
function [C]=intersect(A,B);
% C: Basis Matrix for Intersection
%
of Range(A) with Range(B)
[ra,ca]=size(A);
[rb,cb]=size(B);
117
118
C=null([A B]);
if length(C) > 0
C=orth(A*C(1:ca,:));
else
C=[];
end
Le funzioni Matlab null.m e orth.m sono usate per calcolare rispettivamente lo spazio nullo di una matrice, e per operare una ortogonalizzazione
di GramSchmidt sulle colonne di una matrice (luso della ortogonalizzazione non `e necessario, ma migliora il condizionamento numerico della
base ottenuta).
Si consideri inoltre una matrice di base TRO complementare a TRO per R.
Esempio: Anche questa operazione si pu`o effettuare con un semplice
algoritmo, espresso in linguaggio Matlab come segue:
function [D] = base_compl(A,B)
% D : base di range(A) complementare a B
[ra,ca] = size(A);
[rb,cb] = size(B);
D = gramschmidt([B A]);
[rd,cd] = size(D);
D = D(:,cb+1:cd);
Si proceda allo stesso modo a costruire una matrice di base TR O com Infine, si costruisca una matrice di base TRO
plementare a TRO per O.
n
complementare a [TRO |TRO |TR O ] per lintero spazio IR .
La matrice [TRO |TRO |TRO
e quadrata e invertibile. Se usata per
|TR
O
] `
cambiare le coordinate del sistema, si ottiene la forma
A =
C =
ARO
0
ARO,RO ARO
0
0
0
0
CRO
0
ARO,RO
0
BRO
ARO,R
A
BRO
O
RO,RO
; B=
AR,O
0
0
ARO,
A
0
R
O
O
R
CRO
0
.
119
7.2
Realizzazione di sistemi
120
con condizioni iniziali y(0) = 0, si ottiene che le evoluzioni dei due sistemisono coincidenti per qualsiasi sequenza di ingresso, quindi sono equivalenti.
1
Al secondo sistema corrisponde la f.d.t. G(z) = z+1
, eguale alla precedente eccetto che per la semplificazione tra i fattori comuni a numeratore e
denominatore.
Dato un rapporto ingressouscita LTI, esiste una e una sola rappresentazione in termini di f.d.t. che abbia grado minimo e coefficiente unitario della
potenza pi`
u alta della variabile complessa (che indicheremo con p) a denominatore. Una tale f.d.t, che pu`o essere ottenuta semplicemente mediante
divisione di polinomi, si dir`a ridotta ai minimi termini o coprima.
Diremo che un sistema LTI descritto dalle sue matrici (A, B, C, D) `e una
realizzazione della m.d.t. G(p) se vale
G(p) = C (pI A)1 B + D.
Una realizzazione (A, B, C, D) nello spazio di stato si dice minima se qualsiasi altra realizzazione (A , B , C , D ) che d`a luogo alla stessa f.d.t. coprima,
ha numero di stati uguale o superiore. Una realizzazione `e minima solo se
`e completamente raggiungibile ed osservabile. Se cos` non fosse, infatti, il
sistema
(ARO , BRO , CRO , D),
che realizza la stessa f.d.t. a meno di cancellazioni polozero, avrebbe numero
di stati inferiore.
Una realizzazione di una data f.d.t. non pu`o avere dimensione inferiore
al numero di poli della f.d.t. stessa (si ricordi che i poli sono un sottoinsieme
degli autovalori). Pertanto, una realizzazione in foma canonica di controllo
di un sistema SISO descritto da una f.d.t coprima, `e minimo, quindi anche
osservabile. Vale il viceversa per una realizzazione in forma canonica di
osservazione.
Se si applica la costruzione delle forme canoniche ad una f.d.t. non coprima, si otterranno invece delle realizzazioni raggiungibili ma non osservabili,
ovvero osservabili ma non raggiungibili, quindi non minime.
Ogni realizzazione minima di una f.d.t. `e algebricamente equivalente ad
ogni altra, cio`e esiste una matrice di trasformazione di coordinate che le lega.
Le formule esplicite per il calcolo di tale cambiamento di base utilizzano le
matrici di raggiungibilit`a o osservabilit`a dei due sistemi, e sono gi`a state viste
in passato.
Esempio: Con riferimento alla figura, si discuta la raggiungibilit`a
e la osservabilit`a del sistema sottoposto ad ingresso f al variare della
121
costante elastica della molla, nei due casi in cui la misura disponibile sia
alternativamente la posizione della prima o della seconda massa.
0
0
0
1 0
0
0
0 1
x + 0 f,
x =
1/m1
k/m1 k/m1 0 0
k/m2 k/m2 0 0
0
1 0 0 0
C1
y1
x.
x=
=
0 1 0 0
C2
y2
Si trova immediatamente
0
1/m1
0
k/m21
0
0
0
k/(m1 m2 )
R=
2
1/m1
0
k/m1
0
0
0
k/(m1 m2 )
0
Per la prima uscita y1 si ha
1
0
0
0
0
0
1
0
O1 =
k/m1 k/m1
0
0
0
0
k/m1 k/m1
0
1
0
0
0
0
0
1
.
O2 =
k/m2 k/m2
0
0
0
0
k/m2 k/m2
122
m 2 s2 + k
F (s).
s2 [m1 m2 s2 + (m1 + m2 )k]
Per k 6= 0 la funzione di trasferimento non presenta cancellazioni polo zero, quindi il sistema `e completamente raggiungibile e osservabile. Per
k = 0, invece, si hanno due cancellazioni nella funzione di trasferimento,
e si ottiene Y1 (s) = m11s2 F (s). Questa relazione esprime nel dominio delle
frequenze la legge del moto della massa m1 soggetta alla sola forza f .
Questa funzione di trasferimento `e coprima, quindi i due stati di una
realizzazione minima sono sono sia raggiungibili che osservabili. Se si
sceglie una realizzazione in forma canonica di controllo, si ottiene ancora
la dinamica della massa m1 con stati y1 e y 1 . Gli stati y2 e y 2 sono invece
non raggiungibili e non osservabili.
Si consideri ora il caso in cui luscita disponibile sia la posizione y2
della massa m2 ; la funzione di trasferimento che descrive il sistema `e la
seguente:
k
F (s)
Y2 (s) = 2
s [m1 m2 s2 + (m1 + m2 )k]
Per k 6= 0 la funzione di trasferimento non presenta cancellazioni, quindi
il sistema `e completamente raggiungibile e osservabile (come gi`a visto per
altra via). Per k = 0, invece, la funzione di trasferimento `e nulla. Questo `e
conseguente al fatto prima osservato che gli stati y1 e y 1 sono raggiungibili
ma non osservabili, mentre gli stati y2 e y 2 sono non osservabili ma non
raggiungibili. Non vi `e quindi alcuna connessione tra lingresso e luscita,
il che `e rappresentato da una f.d.t. nulla.
123
e infine
k2
k2
p1 (s) 1 3
p2 (s) p3 (s)
Y1 (s) = F (s),
p2 (s)p3 (s)
Y1 (s)
=
.
F (s)
p1 (s)p2 (s)p3 (s) k12 p3 (s) k32 p2 (s)
Essendo il denominatore della f.d.t. considerata di ordine 6 (ogni polinomio pi (s) `e del secondo ordine), il sistema di tre masse `e completamente raggiungibile ed osservabile se e solo se non vi sono cancellazioni
polo/zero.
Si pu`o avere una cancellazione se k1 = 0: in tal caso infatti, le radici
(immaginarie) di p2 (s) = 0 sono comuni a numeratore e denominatore.
Il modo oscillante corrispondente `e quindi non osservabile, oppure non
raggiungibile, o entrambe. Dalla osservazione fisica del sistema, si capisce
124
0
0
0
0
0
0
0
0
0
A=
k1
k3
k1m+k3
m1
m1
1
k1
2
k1m+k
0
m2
2
k3
k3 +k4
0
m3
m3
C=
1
0
0
0
0
0
0
1
0
0
0
0
1 0 0 0 0 0
0
0
1
0
0
0
B=
0
0
0
1
0
0
125
3
0 1
0
k1m+k
1
k1
0 0
0
m2
0 0
k3
0
m3
R=
3
0
1 0 k1m+k
1
k1
0 0
0
m2
k3
0
0 0
m3
sono
1
0
0
1
0
0
0
0
0
0
0
3
k1m+k
1
0
k1
m2
k3
m3
k1 +k3
O=
m1
0
a
0
0
0
0
k1
m2
k3
m3
0
b
0
c
0
0
0
a
b
c
a
b
c
0
0
0
dove si `e posto
a=
b=
k12
k32
(k1 +k3 )2
+ m1 m
+ m1 m
,
m21
2
3
3
2
+ k1m+k
,
mk12 k1m+k
1
2
c = mk33
k1 +k3
m1
k3 +k4
m3
3
a
1 k1m+k
1
k1
b .
M = 0
m2
k3
0
c
m3
Sia R che O perdono rango esattamente dove perde rango M , cio`e quando
c
ovvero quando
k1 k3
m2 m3
da cui
k1
k3
b
= 0,
m2
m3
k1 + k2 k3 + k4
m2
m3
= 0,
126
2
4
se k1 6= 0, k3 6= 0, e k1m+k
6= k3m+k
, il sistema `e completamente
2
3
controllabile con f e osservabile da y1 ;
7.3
Di questo risultato `e possibile dare una interpretazione in termini di luogo delle radici
per la f.d.t. del sistema con retroazione proporzionale delluscita e guadagno k = KG IR:
i poli sono tutti spostati dalla reazione lungo i rami del luogo, ma non raggiungono gli zeri
per nessun k finito
127
In modo analogo, si consideri il (sotto)sistema raggiungibile e osservabile in forma canonica di osservazione (Ao , Bo , Co , Do ), e si proceda ad una
iniezione delle uscite sugli stati, cio`e
x = Ao x + Bo u + GCo x = (Ao + GCo )x + Bo u
Anche in questo caso, gli autovalori di Ao , cio`e i poli della f.d.t. corrispondente, sono spostati ad arbitrio dalla retroazione, mentre gli zeri restano fissi (i
coefficienti del polinomio degli zeri sono in Bo ). Se qualche coppia polo/zero
si cancella, la realizzazione non `e pi`
u minima, nel qual caso la propriet`a
venuta a mancare non pu`o che essere la raggiungibilit`a.
7.4
Grado Relativo
Si dice grado relativo di una f.d.t. SISO la differenza tra il grado del denominatore e quello del numeratore, ovvero tra il numero dei poli (n) e quello
degli zeri (m):
b0 + b1 s + + bm s m
G(s) =
a0 + a1 s + + s n
Per il grado relativo n m = r di un sistema proprio vale r 0; se
strettamente proprio, r > 0.
Il grado relativo ha una diretta interpretazione fisica nei sistemi TD: esso
rappresenta il tempo (numero di istanti) dopo il quale si manifesta nella
uscita leffetto dellingresso. Si ricordi infatti che (per D = 0) vale
y(0)
y(1)
y(2)
..
.
= Cx(0)
= CAx(0) + CBu(0)
= CA2 x(0) + CABu(0) + CBu(1)
.
= ..
CB CAB CA2 B
b0
bm 0
= CR
=
0
0
0
0
0
0
.
..
.
.
..
.
0 .
0
0
1
0
1
an1
1 an1 an2 + a2n1
1
an1
...
128
7.5
Raggiungibilit
a e Osservabilit
a di Sistemi
Connessi
7.5.1
Connessione in Parallelo
Possiamo facilmente costruire una realizzazione del sistema risultante dalla connessione in parallelo dei sistemi 1 e 2 , costruendo un nuovo stato
aggregato xT = (xT1 , xT2 ) e ponendo u1 = u2 = u e y = y1 + y2 in (7.1):
B1
A1 0
u
x +
ID
x=
B2
(7.2)
0 A2
y = C1 C2 x + (D1 + D2 )u
E OSSERVABILITA
DI SISTEMI CONNESSI129
7.5. RAGGIUNGIBILITA
si pu`o avere quindi una cancellazione se e solo se d1 (p) e d2 (p) hanno una
radice in comune, cio`e se i due sistemi hanno un polo in comune. In questo
caso, la f.d.t. risultante pu`o essere semplificata: pertanto, la rappresentazione
in forma di stato sopra ottenuta, che usa tutti gli stati di 1 e 2 , non risulta
pi`
u minima: si deve essere persa almeno una delle propriet`a strutturali di
raggiungibilit`a e/o di osservabilit`a.
` possibile stabilire che in realt`a la cancellazione polo/zero che interviene
E
per due sistemi in parallelo con un polo a comune implica che lautovalore
corrispondente perde entrambe le propriet`a.
Infatti, per il lemma PBH la matrice
(sI A|B) =
sI1 A1
0
0
sI2 A2
B1
B2
(7.3)
valutata per s pari allautovalore in comune, non pu`o aver rango pieno (il
rango del blocco a sinistra diminuisce di due, mentre il blocco a destra `e una
singola colonna). In modo del tutto analogo si procede per il caso duale della
osservabilit`a:
sI A
C
sI1 A1
0
0
sI2 A2
C1
C2
(7.4)
130
tratteggio, si ha
1
x1
p1 0
IDx1
u
+
=
1
x2
0 p1
IDx2
x1
y1
1 0
=
x2
0 1
y2
E OSSERVABILITA
DI SISTEMI CONNESSI131
7.5. RAGGIUNGIBILITA
7.5.2
Connessione in Serie
Nella connessione in serie luscita del primo sistema costituisce lingresso del
secondo. Ponendo u2 = y1 , u = u1 e y = y2 in (7.1), si ha
B1
A1
0
u
x +
ID
x=
B 2 D1
B2 C1 A2
(7.5)
y = D2 C1 C2 x + D2 D1 u
n1 (p) n2 (p)
n1 (p)n2 (p)
=
d1 (p) d2 (p)
d1 (p)d2 (p)
si pu`o avere quindi una cancellazione se e solo se n1 (p) e d2 (p) hanno una
radice in comune, ovvero se la hanno n2 (p) e d1 (p). In entrambe i casi, la
f.d.t. risultante pu`o essere semplificata: pertanto, unaa rappresentazione in
forma di stato che usi tutti gli stati di 1 e 2 , non risulta pi`
u minima.
Il fatto che nel primo caso si perda la raggiungibilit`a dellautovalore corrispondente al polo cancellato in d2 (p) `e piuttosto intuitivo: infatti, il rapporto
tra gli stati del sistema 2 e luscita non viene alterato in alcun modo dalla
connessione, e pertanto lautovalore corrispondente al polo cancellato non
pu`o aver perso la sua osservabilit`a.
Viceversa, che nel secondo caso si perda la osservabilit`a dellautovalore
corrispondente al polo cancellato in d1 (p) discende dal fatto che il rapporto
132
tra gli ingressi e gli stati del sistema 1 non viene alterato dalla connessione,
e pertanto lautovalore corrispondente al polo cancellato non pu`o aver perso
la sua raggiungibilit`a.
7.5.3
Connessione in Retroazione
E OSSERVABILITA
DI SISTEMI CONNESSI133
7.5. RAGGIUNGIBILITA
La situazione sinora descritta in massima generalit`a, che ammette che
entrambe i sistemi siano proprii ma non strettamente (abbiano cio`e grado
relativo nullo) creando cosi un cosidetto anello algebrico, `e comunque
assai rara anche quando ammissibile. Il caso di gran lunga pi`
u frequente nelle
applicazioni `e quello in cui sia il sistema in catena diretta sia strettamente
proprio (D1 = 0), per cui si ha
B1
A1 B1 C1 D2 B1 C2
r
x +
ID
x=
0
B2 C1
A2
y = C1 0 x .
Se il sistema in catena diretta non `e strettamente proprio, il sistema in
retroazione viene spesso scelto in modo da esserlo (D2 = 0), per cui si ha
B1
A1
B1 C2
r
x +
ID
x=
B 2 D1
B2 C1 A2 B2 C2 D1
y = C1 D1 C2 x + D1 r .
Proposizione Il sistema retroazionato (7.6) `e raggiungibile e osservabile se e solo se 1 non ha zeri coincidenti con poli di 2 . Non `e completamente raggiungibile ne osservabile altrimenti.
n1 (p)d2 (p)
.
d1 (p)d2 (p) n1 (p)n2 (p)
134
Si pu`o avere quindi una cancellazione se e solo se n1 (p) e d2 (p) hanno una
radice in comune. Il fatto che lautovalore corrispondente al polo cancellato
divenga sia irraggiungibile che inosservabile, pu`o essere spiegata come segue.
Si consideri lo schema equivalente a quello di figura (7.4) riportato in alto
nella figura (7.5): la cancellazione di un polo in d2 comporta la perdita
di osservabilit`a del sistema-serie in catena diretta. Sappiamo che peraltro
la retroazione della uscita non altera ne la raggiungibilit`a ne losservabilit`a
di un sistema, quindi lautovalore corrispondendte al polo cancellato resta
inosservabile anche nel sistema retroazionato.
Si consideri adesso lulteriore schema equivalente riportato nella stessa
figura in basso. La cancellazione di un polo in d2 comporta questa volta la
perdita di raggiungibilit`a del sistema-serie in catena diretta. Per i motivi
sopra detti, anche il sistema in retroazione resta irraggiungibile.
Capitolo 8
Regolazione dei sistemi
Si `e visto in passato che la retroazione degli stati sugli ingressi u(t) =
Kx(t) + v(t) `e in grado di allocare arbitrariamente tutti gli autovalori interni al sottospazio raggiungibile. Difficilmente per`o nei casi pratici lo stato
`e noto direttamente: linformazione sullo stato disponibile al progettista del
sistema di controllo `e infatti contenuta nelle uscite, e in particolare in quelle
di misura. Queste, in numero di p in un sistema MIMO, sono in generale insufficienti a determinare lo stato (che ha dimensione n) direttamente,
essendo in ogni caso pratico p < n.
Lutilizzo di una retroazione statica delle sole uscite per il controllo, cio`e
la sintesi di un controllore del tipo u(t) = K y(t) + v(t), pu`o essere talvolta
usata utilmente. Nel caso generale, per`o, i gradi di libert`a del progetto (che
sono gli elementi della matrice K , in numero di mp) sono insufficienti ad
ottenere comportamenti adeguati alle specifiche. Nel caso SISO, ad esempio,
la retroazione delle uscite `e specificata dalla scelta di un solo scalare: al
variare di K, la posizione di ciascun autovalore (del sottosistema osservabile
e raggiungibile) descrive una variet`a unidimensionale, cio`e una curva nel
piano complesso, detta luogo delle radici.
Gli autovalori esterni al sottospazio raggiungibile e interni a quello inosservabile sono invece fissi. I primi sono fissi anche per retroazione dello stato,
di cui la retroazione delle uscite `e solo un caso particolare (K = K C).
Per mostrare che anche gli autovalori del sottosistema inosservabile sono
fissi con la retroazione delle uscite, basta applicare la reazione u = K Cx al
sistema nella base canonica di Kalman, e osservare che in quella base vale
BRO K CRO
BK C =
0
0
135
0
0
0
0
0
0
0
0
0
0
136
che, sommata alla matrice A, ne lascia inalterata la struttura triangolare a blocchi, e ne altera unicamente gli autovalori corrispondenti al blocco
ARO + BRO K CRO .
Per ovviare alle limitazioni della retroazione statica delle uscite, si pu`o
ricorrere al fatto che, come si `e visto, se il sistema `e osservabile `e possibile
ottenere dalle uscite una stima dello stato iniziale, e da questa, per soluzione
esplicita del sistema, lo stato attuale al tempo t, che `e quanto serve per
calcolare la retroazione.
Questo procedimento non `e per`o spesso praticabile direttamente per due
principali motivi:
1. per la complicazione del calcolo numerico necessario a ottenere la stima
dello stato iniziale;
2. per la sensibilit`a che la ricostruzione dello stato finale a partire da quello
iniziale e dalla conoscenza degli ingressi mostra agli errori di stima dello
stato iniziale, tanto maggiori quanto pi`
u `e lungo il tempo per il quale
si deve integrare il modello.
8.1
138
8.2
Avendo da un osservatore una stima x dello stato presente, che asintoticamente converge al valore vero, si pu`o pensare di utilizzarla per il calcolo della
retroazione dello stato al posto dello stato inaccessibile x. Si realizza in questo modo un sistema a 2n stati (se si usa un osservatore identit`a), con la
struttura (nel caso strettamente proprio)
IDx
ID
x
y
u
=
=
=
=
Ax + Bu
A
x + Bu L(y C x)
Cx
K x + v
DX
X
1
s
B* u
Step
Y
C* u
C
Scope
A* u
A
K
K*u
L* u
B* u
DXs
1
s
Xs
G
C* u
C
A* u
A
Sostituendo le espressioni del controllo e della uscita, e calcolando la dinamica dellerrore IDe = IDx ID
x, si ha
IDx = Ax + BK x + Bv = (A + BK)x BKe + Bv
ID
x = (A + BK + LC)
x LCx + Bv
IDe = (A + LC)e
139
quindi sono lunione degli autovalori del sistema regolato (nelle posizioni allocate dalla scelta di K) e degli autovalori dellosservatore (nelle posizioni
allocate dalla scelta di L): questo risultato, per nulla ovvio a priori, va sotto
il nome di propriet`
a di separazione, e garantisce che le allocazioni dei poli
dellosservatore e del sistema retroazionato possono essere fatte indipendentemente luna dallaltra. Ci`o vale anche nel caso in cui si usino osservatori
ridotti anziche identit`a.
Il sistema globale (sistema originale + regolatore) pu`o essere dunque reso
asintoticamente stabile se la coppia (A, B) `e stabilizzabile, e la coppia (A, C)
`e detettabile. In TD, si pu`o costruire un regolatore deadbeat che porti lo
stato a zero in un numero finito di passi se e solo se tutti gli autovalori esterni
al sottospazio di raggiungibilit`a, ed interni al sottospazio di inosservabilit`a,
sono nulli.
La funzione di trasferimento di questo sistema con 2n stati `e data da
G(p) =
= C
(pI A BK)1
0
0
(pI A LC)1
= C (pI A BK)1 B
B
0
quindi coincide con quella ottenuta dalla retroazione degli stati effettivi: lutilizzo degli stati stimati non ha effetti da questo punto di vista. Gli autovalori relativi allerrore di osservazione sono irraggiungibili dallingresso (come
evidente dalla espressione (8.1)).
Osservazione. Dalla discussione precedente, risulta che la dinamica assegnata allerrore di osservazione non partecipa al rapporto ingresso/uscita
del sistema complessivo. Questo significa che la risposta forzata, ad esempio al gradino, di due sistemi identici ma regolati con differente scelta della
140
8.2.1
Esempio
1
Km
2
s (Js + B)(La s + Ra ) + Km
K
s3 + s2 + s
Possiamo pensare di costruire il regolatore a partire da una retroazione degli stati di una qualsiasi realizzazione raggiungibile di G(s), che inizialmente
possiamo supporre noti, grazie al principio di separazione.
La scelta della matrice di retroazione K `e fatta semplicemente nel caso
che questa realizzazione sia in forma canonica di controllo, cio`e
x c = Ac xc + Bc u
y = C c x c + Dc u
con
0 1
0
1 ;
Ac = 0 0
0
Cc = K 0 0 ;
0
Bc = 0 ;
1
D = [0].
141
a1 a2 an1 1
a2 a3
1
0
a3 a4
0
0
O1
=
o
.. .. . .
..
..
. .
.
.
.
1 0
0
0
possiamo facilmente ottenere nel nostro
=
O1
o
1
caso
1
1 0
0 0
142
il che significa che la matrice di iniezione cercata, nelle coordinate scelte per
la realizzazione del regolatore, `e data da
Lo1
0 0
1
Lo2
L = Tco Lo = 0 1
2
Lo3
1
Lo3
Lo2 Lo3
2
Lo1 Lo2 + ( )Lo3
8.3
Reference
Generator
143
u
C
Controller
Plant
144
IDx
ID
x
A
BK
LC A + BK + LC
x
x
B
B
posto in retroazione come in fig. 8.2 ottiene la identica allocazione dei poli
ottenuta dal regolatore standard.
Si noti esplicitamente che questo controllore pu`o avere sia poli che zeri
a parte reale positiva, non potendosi dire nulla a priori sulla posizione degli
autovalori di A+BK+LC. In taluni casi, quando il sistema da stabilizzare ha
esso stesso singolarit`a a parte reale positiva, un controllore di per se instabile
`e strettamente necessario (pu`o essere utile qui ricordare alcuni risultati di
stabilizzazione sul luogo delle radici).
Introducendo la variabile x = x xC , le equazioni del sistema con questo
controllore sono
0
x
A + BK BK
Dx
v.
(8.3)
+
=
L
x
0
A + LC
D
x
La f.d.t. in anello chiuso tra v e y risulta quindi
G (p) =
= C
= CM L,
(pI A BK)1
M
0
(pI A LC)1
0
L
145
dove
G0 (p) = K(pI A LC)1 L,
da cui si vede che la f.d.t. ottenuta dal montaggio con osservatore completo
di fig. 8.1 `e alterata nel montaggio di fig. 8.2 per aggiunta in serie di un
termine con i poli (tipicamente in alta frequenza) scelti per losservatore.
Le differenze tra il controllore (8.2) ed il regolatore standard sono quindi
gli autovalori relativi alla dinamica di x = x xC non sono pi`
u in
generale irraggiungibili dallingresso v (la forma (8.3) non `e standard
di raggiungibilit`a). Di conseguenza, lo stato del controllore xC non
insegue asintoticamente lo stato x, essendo la dinamica della differenza
x eccitata dallingresso v;
nella f.d.t. in anello chiuso dellintero sistema compaiono anche gli
autovalori dellosservatore (cio`e di A + LC).
Sarebbe possibile eliminare la presenza dei poli dellosservatore con un
precompensatore F (p) che realizzasse una f.d.t pari alla inversa di Go (p), come mostrato in fig. 8.3 Questo precompensatore non `e fisicamente realizzabile
V
Y
fsys
rsys
sys
PRECOMPENSATORE
CONTROLLORE
IMPIANTO
Figura 8.3:
Montaggio del compensatore in catena diretta con
precompensatore.
no (p)
,
do (p)
si pu`o comunque
do (p) 1
,
no (p) df (p)
146
8.3.1
Il progetto di un compensatore basato sul regolatore consiste fondamentalmente nella scelta delle due matrici di guadagno K e L. Questa scelta,
direttamente legata alla posizione dei poli dellanello chiuso, deve venir fatta
sulla base delle specifiche imposte al funzionamento del sistema.
Lallocazione dei poli dellanello chiuso pu`o essere spesso fatta in modo da
avere un comportamento a uno o due poli dominanti, e quindi le specifiche di
rapidit`a di risposta e di sovraelongazione possono esssere implementate come
vincoli sulle regioni del piano complesso in cui piazzare i poli stessi. Non `e
questo il caso per sistemi complessi, o con zeri in prossimit`a della origine, o
peggio a fase non minima. In questi casi, le approssimazioni a poli dominanti non valgono ed `e necessario procedere con tecniche di progettazione pi`
u
sofisticate, quali quelle di controllo ottimo (ad es. LQR/LQG) che verranno
viste in corsi pi`
u avanzati.
` invece opportuno considerare qui una tecnica per ottenere che il sistema
E
in anello chiuso insegua riferimenti (ovvero reietti disturbi) costanti con errore
nullo a regime. Se il sistema non ha di per se un polo nellorigine, questo
dovr`a essere presente nel controllore.
Per ottenere questo, una semplice procedura consiste nel predisporre un
integratore in serie allimpianto, come illustrato in fig. 8.4, e nel calcolare un
compensatore (di dimensione n + 1) che allochi dove desiderato gli autovalori
in anello chiuso del sistema esteso dato da
x = Ax + Bu
u = w
y = Cx
ovvero
x
u
A B
0 0
x
u
0
1
w.
Si osservi che il sistema esteso rimane completamente raggiungibile ed osservabile se tale `e il sistema originale. Una volta progettate le matrici di
retroazione e iniezione per questo sistema esteso, il polo nellorigine sar`a poi
realizzato nel compensatore stesso (che diviene quindi di dimensione n + 2).
8.3.2
Un compensatore basato sul regolatore pu`o essere montato alternativamente nella catena di retroazione, come mostrato in fig. 8.5, dove si considera
anche laggiunta di un precompensatore F (p). Le equazioni del sistema in
w
rsys
Reference
Generator
Controller
147
u 1
s
Integrator
y
G
Plant
Figura 8.4: Montaggio di un compensatore basato su regolatore per rispondere ad una specifica di errore nullo a regime per ingresso a gradino.
V
Reference
Generator
fsys
sys
PRECOMPENSATORE
IMPIANTO
Scope
rsys
CONTROLLORE
=
=
=
=
Ax ByC + Br
AC xC + BC y
Cx
C C x C + DC y
G (p) = G(p) 1 + K(pI A LC)1 B ,
da cui si vede che la f.d.t. G(p) ottenuta dal montaggio con osservatore
completo di fig. 8.1 `e alterata per aggiunta in parallelo di un termine con i
poli (tipicamente in alta frequenza) scelti per losservatore.
Il precompensatore permette di recuperare esattamente la f.d.t. G(p)
complessiva del sistema con osservatore, se si pone
F (p) = 1 + K (pI A LC)1 B.
Si noti per`o che questo montaggio richiede in effetti la realizzazione di un
sistema di controllo di complessit`a maggiore (con un numero di stati doppi). Inoltre, se il controllore C(p) che risulta dal progetto `e instabile, anche
F (p) lo `e: trovandosi questa, a differenza di C(p), in anello aperto, gli stati di
148
1
s
Integrator
K
Gain
sys
LTI System1
rsys
LTI System
Ax + Bu
v Cx
x
K Kz
u =
z
Si noti che non vi `e bisogno di osservare lo stato w, che `e noto per costruzione.
8.3.3
Esempio
Consideriamo il sistema TC
G(s) =
s2 + 2s + 3
s3 3s2 2s 1
Desideriamo allocare gli autovalori del sistema in (1, 2, 3), e quelli dellosservatore in (5, 10, 15) Usando ad esempio il comando place di Matlab,
si trovano la matrice di retroazione `e K = [4.5, 3.25, 1.75] e la matrice
149
da cui si vede come i tre modi dellosservatore sono cancellati in quanto non
raggiungibili.
Applicando invece il controllore in retroazione sopra visto, la cui espressione risulta
C(s) = K(sI A BK LC)1 L =
8.4
Sintesi analitica
Dalle considerazioni svolte sinora sulla retroazione delle uscite e sulle propriet`a dei sistemi connessi, posiamo trarre alcune importanti conclusioni sulle
possibilit`a offerte dalla scelta dei compensatori dinamici per sistemi LTI.
Con riferimento alla figura (8.7), si consideri il compensatore C(p) =
nc (p)
in catena diretta col sistema G(p) = n(p)
, e la f.d.t. in anello chiuso
dc (p)
d(p)
risultante, Gc (p) =
nc (p)n(p)
.
nc (p)n(p)+dc (p)d(p)
150
appare anche nella Gc (p) `e quello nel quale C(p) presenta un polo nella stessa
posizione, cio`e se si ha una cancellazione tra dc (p) e n(p). In questo caso,
lautovalore corrispondente al polo cancellato diviene sia irraggiungibile che
inosservabile (valgono infatti le stesse considerazioni fatte sulla connessione
in retroazione), e rimane pertanto fisso con la retroazione. Nel caso in cui
lo zero cancellato (e quindi il polo) fosse al di fuori della regione di stabilit`a
(semipiano sinistro per LTITC o cerchio unitario per LTITD), il risultato `e
inaccettabile, in quanto il sistema conterrebbe un modo instabile che, per
quanto non influenzi il rapporto ingresso-uscita, divergerebbe allontanando
irrimediabilmente il sistema dalla zona di funzionamento in cui il modello
lineare adottato `e valido. La cancellazione di uno zero a parte reale positiva
con un polo instabile del compensatore `e peraltro inaccettabile anche per altri
motivi: si pensi infatti al caso in cui uno zero instabile del sistema G(p) della
forma (p a) sia imperfettamente cancellato (come non pu`o che avvenire in
pratica) da un polo (p a ) in Gc (p), con || > 0 arbitrariamente piccolo.
Nella f.d.t. in anello chiuso, si trover`a un polo situato tra a e a + (si pensi
al luogo delle radici corrispondente), quindi ancora certamente instabile (per
piccolo), il quale darebbe luogo a divergenza della uscita.
Anche nel caso in cui il compensatore venisse scelto in modo da cancellare
con uno zero uno dei poli del sistema, cio`e se nc (p) avesse fattori comuni a
d(p), il sistema perderebbe raggiungibilit`a e osservabilit`a, e lautovalore corrispondente resterebbe immodificabile per retroazione. Per gli stessi motivi
esposti sopra, questo comportamento `e inaccettabile se il polo in questione `e
instabile.
Le cancellazioni tra compensatore e impianto sono spesso usate nei pi`
u
elementari approcci alla regolazione dei sistemi, quali la cosiddetta sintesi
analitica, che si riassume qui a titolo esemplificativo. La tecnica consiste nella
soluzione di una semplice equazione tra la f.d.t. in anello chiuso del sistema
compensato Gc (p) ed una f.d.t. obiettivo Go (p) assegnata come desiderabile,
nella incognita rappresentata dalla f.d.t. del compensatore C(p):
Gc (p) =
C(p)G(p)
nc (p)n(p)
no (p)
=
= Go (p) =
,
1 + C(p)G(p)
nc (p)n(p) + dc (p)d(p)
do (p)
Go (p)
no (p)
1
d(p)
=
.
1 Go (p) G(p)
do (p) no (p) n(p)
Il metodo consiste praticamente nel cancellare tutti i poli e gli zeri del sistema
originale, rendendoli inosservabili e irraggiungibili, e nellintrodurne di nuovi;
`e pertanto da attendersi che il metodo abbia forti limitazioni nella sua pratica
applicazione.
151
152
Appendice A
Richiami di Algebra Lineare
A.1
A IRnm
condizione si ha
AT
x=
,
2
quindi
AAT = 2b
153
154
Nella ipotesi che A abbia pieno rango righe, AAT `e invertibile: infatti,
questa matrice `e quadrata, ed essendo le righe di A indipendenti, tali sono
anche le colonne di AT , che quindi non ha spazio nullo (cio`e, non esiste alcun
y tale che AT y = 0). Inoltre, poich`e sappiamo dal teorema fondamentale
dellalgebra che Im (AT ) = ker (A), nessun vettore nellimmagine di AT
pu`o appartenere al kernel di A. Quindi si ha che la soluzione di minima
lunghezza `e
x = AT (AAT )1 b
def
A.2
156
1
AV
i
A.3
A.3.1
157
A.3.2
Norma matriciale
In base alle relazioni sopra viste, il vettore della base canonica x = ei (le cui
componenti sono nulle eccetto che la i-esima, che vale 1) viene trasformato
da in i ei , quindi la sua lunghezza passa da 1 a i . Le lunghezze (o norme
euclidee) dei vettori corrispondenti nelle coordinate originali stanno nello
stesso rapporto. Infatti, posto xi = V ei = V (:, i), si ha
kAxi k2
=
kxi k2
p
p
p
i2
xi
xTi AT Axi
xTi T
p
= p
=
= i
1
xTi xi
xTi xi
158
kAxk2
xT AT Ax
kAk2 = max
,
= max
x
x
kxk2
xT x
per cui
kAk2 = 1
Si noti che la norma due di una matrice coincide col massimo autovalore solo
se A `e simmetrica.
A.3.3
159
ovvero
Ax = b.
Vale la maggiorazione tra norme
kxk kA1 k kbk
che, nel caso si scelga la norma due, diviene
kxk2 1/n kbk2 .
Nel peggior caso, quindi, una perturbazione pu`o venire amplificata nella soluzione tanto pi`
u quanto pi`
u `e piccolo il minimo valore singolare della matrice.
La sensibilit`a alla perturbazione tende a infinito quando il minimo valore
singolare tende a zero - nel qual caso, A tende a perdere rango.
Esempio: In un problema di stima ottima del tipo Y = O
x con
Y IRt e x IRn , n < t, supponendo il sistema osservabile, siano
1 , . . . , n i valori singolari della matrice di osservabilit`a. La stima ai
minimi quadrati risente quindi massimamente degli errori di misura nella
direzione associata al valore singolare minimo: quando questo tende a
zero (cio`e il sistema tende a perdere osservabilit`a), un errore di misura
anche piccolo pu`o provocare grandi errori di stima.
Pi`
u in generale, una misura di quanto una matrice sia vicina alla perdita
di rango (in particolare, vicino alla singolarit`a nel caso di matrici quadrate
n = m) `e il minimo
valore singolare, e non il minimo autovalore: si consideri
1 1/
, in cui gli autovalori sono sempre 1, ma i valori
ad esempio A =
0 1
singolari sono invece dellordine di e 1/ per piccoli (la matrice tende
chiaramente alla singolarit`a per 0).
In molti casi, invece della valutazione della massima perturbazione assoluta kxk (che pu`o cambiare semplicemente moltiplicando entrambe i termini dellequazione per una costante), `e interessante valutare quella relativa,
kk/kxk. Essendo kAkkxk kbk, si pu`o scrivere
kxk
kbk
kAk kA1 k
kxk
kbk
Nel caso in cui si abbia perturbazione dei termini della matrice A, si pu`o
scrivere
(A + A)(x + x) = b
160
da cui
Ax + A(x + x) = 0
quindi
x = A1 A(x + x).
Passando alle norme, si ha
kxk kA1 kkAkkx + xk
quindi, in termini relativi, si ha
kxk
kAk
kAk kA1 k
.
kx + xk
kAk
La quantit`a kAk kA1 k che determina la sensibilit`a delle soluzioni sia alle
prturbazioni dei dati che a quelle della matrice, `e detta numero di condizione
di A. Se si usa la norma due, si ha
kA1 k kAk =
1
,
n
A.3.4
Compressione di dati