Introduzione
Definizione
Uno stato $\hat x$ è detto raggiungibile in un tempo $\hat t$ se esiste un controllo $\hat u(\tau)$, con $\tau \in \left[ 0, \hat t \right]$ (andamento del segnale di controllo) tale che se $x(0^-) = 0$ allora $x(\hat t) = \hat x$.
Dato un sistema inizialmente a riposo nello stato 0, se può essere portato nello stato $\hat x$ attraverso il controllo dopo un tempo $\hat t$, allora quello stato è detto raggiungibile.
Definizione
Uno stato $\hat x$ è detto controllabile in un tempo $\hat t$ se esiste un controllo $\hat u(\tau)$, con $\tau \in \left[ 0, \hat t \right]$ tale che se $x(0^-) = 0$ allora $x(\hat t) = \hat x$.
Dato un sistema posizionato in uno stato $\hat x$, se può essere portato nello stato 0 attraverso il controllo dopo un tempo $\hat t$, allora quello stato è detto controllabile.
Si definiscono inoltre:
- $X_R (\hat t)$ l'insieme degli stati raggiungibili in tempo $\hat t$
- $X_C (\hat t)$ l'insieme degli stati controllabili in tempo $\hat t$
$X_R (\hat t)$ e $X_C (\hat t)$ sono sottospazi di $R^n$.
Siano $\hat{X}_1$ e $\hat{X}_2$ sue stati raggiungibili. Allora per definizione esistono dei controlli $\hat U_1$ e $\hat U_2$ tali che $x(\hat t) = \hat{X}_1$ e $x(\hat t) = \hat{X}_2$. Essendo un sistema lineare, applicando un controllo
(1)per il principio di sovrapposizione, si può raggiungere uno stato $\hat X$ che è una combinazione lineare di $\hat{X}_1$ e $\hat{X}_2$, ovvero $\alpha \hat{X}_1 + \beta \hat{X}_2$.
Qualunque combinazione lineare degli stati $\hat{X}_1$ e $\hat{X}_2$ può essere raggiunta applicando un'opportuna combinazione lineare dei controlli $\hat U_1$ e $\hat U_2$.
Questo principio è sempre valido, anche nei sistemi lineari a tempo discreto. Sostituendo lo stato iniziale con l'origine si possono ottenere gli stessi risultati anche nell'ambito della controllabilità.
Uno stato raggiungibile in t è anche controllabile: se $\hat x \in X_R(\hat t)$, allora $\hat x \in X_C(\hat t)$. Se si può portare un sistema nello stato $\hat x$ a partire dallo stato 0, è possibile tornare allo stato 0. In altre parole, l'insieme degli stati raggiungibili è contenuto nell'insieme di quelli controllabili. Non vale il contrario.
(2)Solo per i sistemi LTI a tempo continuo si ha:
(3)tutti gli stati raggiungibili sono anche controllabili: se $\hat x \in X_R$ allora $\hat x in X_C$ e viceversa, inoltre
(4)la proprietà di raggiungibilità e di controllabilità, nei sistemi a tempo continuo, non dipendono dal tempo $\hat t$.
Sistemi a tempo discreto
Nei sistemi a tempo discreto l'evoluzione dello stato è descritta dall'equazione seguente:
(5)per lo studio della controllabilità e della raggiungibilità è inutile considerare l'equazione relativa all'uscita del sistema, poiché esse sono caratteristiche dello stato.
Si suppone che il sistema si trovi nello stato 0, ovvero $X_{(0)} = 0$. Dopo un passo, gli stati raggiungibili sono:
il termine $U_{(0)}$ è liberamente assegnabile, mentre $X_{(0)} = 0$ no. Gli stati raggiungibili sono quindi:
(7)ovvero, tutti gli stati che sono combinazione lineare delle colonne di B, infatti dato $U \in R^m$ si ottiene:
(9)Se la matrice B è invertibile, allora tutte le colonne saranno linearmente indipendenti e si potranno raggiungere tutti gli stati. Al passo successivo si ha:
(10)ovvero tutte le combinazioni lineari di B e della matrice $[B \vert AB ]$. Al generico passo n $X_R (n)$ è la combinazione lineare delle colonne della matrice seguente:
(11)e nel passo successivo $n+1$ lo spazio degli stati raggiungibili è quello generato dalle colonne della matrice:
(12)la matrice $A^n$ si può ottenere come combinazione lineare di $A^{n-1}$, …, $A$.
Esempio
Sia $X(k+1)$ la matrice seguente:
(13)Lo spazio degli spazi raggiungibili è:
(14)Sistemi a tempo continuo
Se uno stato è raggiungibile in un tempo $t'$, allora lo sarà in qualunque altro tempo $t'' >\ t'$, poiché è sempre possibile far restare il sistema, inizialmente nello stato 0, in quello stato per un tempo $t'' - t'$ e in seguito impiegare un tempo $t'$ per raggiungere lo stato.
La matrice $e^{At}$ è sempre invertibile e valgono anche nel case matriciale le proprietà dell'esponenziale:
(16)Si può semplice calcolare $e^{At}$, ed è ricavabile come l'antitrasformata della matrice $(sI - A)^{-1}$:
(17)$(sI - A)^{-1}$ è l'inversa di una matrice con colonne linearmente indipendenti. Si ha la seguente formula:
(18)La matrice a tempo discreto $A^k$ non è sempre invertibile, poiché nel caso $A$ sia nulla, allora lo sarà anche $A^k$ e non è invertibile.
Teorema di Kalman di raggiungibilità
Il sottospazio $X_R$ è generato dalle colonne della matrice $P$ seguente:
(19)Un sistema è completamente raggiungibile, ovvero $X_R \equiv \mathbb{R^n}$ (e nel caso di un sistema a tempo continuo anche controllabile) quando la combinazione lineare delle colonne di $P$ può generare qualunque vettore di $R^n$, ovvero il rango di $P$ è uguale a n:
(20)Definizione
Sia $n_R$ la dimensione di $X_R$, ovvero $dim\:X_R \triangleq n_R$. La dimensione di uno sottospazio indica quanti vettori linearmente indipendenti possiede il sottospazio. Quindi:
(21)Se si verificasse $\rho(B) = n$, allora il sistema è completamente raggiungibile, e non sarebbe necessario calcolare i componenti $AB$, $A^2 B$, ecc. della matrice di Kalman.
Metodo operativo per la costruzione della matrice P
Si calcola la matrice $AB$ in modo consueto, mentre per calcolare $A^2 B$ si moltiplica a sinistra per la matrice A. Moltiplicando successivamente per la matrice A di ottiene $A^3 B$, e così via per gli altri termini.
Esempio
Si considera il sistema seguente:
(22)gli stati raggiungibili possono essere calcolati in questo modo:
(23)Essendo $\rho(P) = 1$, lo spazio di raggiungibilità è dato dalla combinazione lineare di una colonna di $P$:
(24)Osseervando questo sistema, si può notare che una delle due varibili dello stato non è influenzata dal controllo, essendo presente uno zero nella matrice B relativo alla variabile $x_2$ ed inoltre non è influenzata dalle altre variabili, essendo presente una riga di zeri nella matrice A, relativi alla variabile $x_2$. Infatti la coppia di equazioni dello stato del sistema è la seguente:
(25)La componente $x_2$ dello stato non è controllabile, perché non è influenzata da nessun'altra variabile. Quindi si può immediatamente notare che il sistema non è completamente controllabile.
Esempio
Si considera il sistema seguente:
(26)gli stati raggiungibili possono essere calcolati in questo modo:
(27)Essendo $\rho(P) = 2$, il sistema è completamente controllabile $X_R = R^2$, perché la matrice P ha colonne linearmente indipendenti.
In questo secondo esempio, il sistema ha le seguenti equazioni:
(28)dove si può notare che la prima variabile è influenzata direttamente dalla seconda, la quale è influenzata dal controllo.
Esempio
Si considera il sistema seguente:
(29)La matrice di Kalman è:
(30)si ha $\rho(P) = 3$, ed essendo a rango pieno, il sistema è completamente raggiungibile.
Esempio
Si considera il sistema seguente:
(31)che ha tre variabili di stato $x_1$, $x_2$, $x_3$ e due variabili di controllo $u_1$ e $u_2$. La matrice di Kalmann è:
(32)quindi $\rho(P) = 3$ e il sistema è completamente raggiungibile $X_R \equiv R^3$.
Si può controllare il sistema con uno solo dei due controlli? Considerando solo il controllo $u_1$ si ottiene il seguente sistema:
la cui matrice di Kalman è:
(34)essendo $\rho(P) = 2$, il sistema non è controllabile completamente, e lo spazio degli stati controllabili (e raggiungibili) è dato da:
(35)considerando invece il controllo $u_2$ si ottiene
(36)la cui matrice di Kalman è:
(37)essendo $\rho(P) = 2$, allora il sistema non è completamente controllabile, e lo spazio degli stati è dato da:
(38)Non si può quindi controllare completamente il sistema con un solo controllo.
Esempio
Si considera il sistema seguente:
(39)la matrice di Kalman è:
(40)il sistema è completamente controllabile. Si verifica se un solo controllo è sufficiente per controllare completamente il sistema. Inizialmente si considera solo il controllo $u_1$: la matrice di Kalman relativa è la seguente
(41)poichè $\rho(P) = 2$, il sistema non è completamente controllabile. Se invece si considera il controllo $u_2$, allora la matrice di Kalman è:
(42)che ha $\rho(P) = 3$, quindi con il solo controllo $u_2$ è sufficiente per controllare completamente il sistema.
Raggiungibilità e cambiamento di base
La proprietà di raggiungibilità è indipendente dal cambiamento di base. Infatti, considerando un nuovo vettore per lo stato $z$, tale che:
(43)essendo $\tilde{A} = T^{-1}AT$ e $\tilde{B} = T^{-1}B$, l'equazione di stato diventa, nella nuova variabile:
(44)la matrice di Kalmann diventa:
(45)sostituendo:
(46)il rango $\rho(\tilde{P}) = \rho(T^{-1}P)$ è pari a: $min \left\lbrace \rho(T^{-1}), \rho(P) \right\rbrace$. Ma $T^{-1}$ è una matrice invertibile per definizione, quindi ha rango massimo. Quindi $\rho(\tilde{P}) = \rho(P)$.
Cambiando base non si modifica il rango della matrice di Kalmann, e quindi non viene modificata la raggiungibilità del sistema.
Si definisce un sottospazio $X_{NR}$ come il complemento ortogonale dello spazio $X_R$. In altre parole, dati $X_1 \in X_R$ e $X_1 \in X_{NR}$ allora $X_1 \circ X_2 = X_1^T X_2 = X_1 X_2^T = 0$.
Il prodotto scalare $(\circ)$ è definito in questo modo: dati due vettori $a$ e $b$, allora
(47)se uno dei due vettoi è nullo, allora sicuramente sarà nullo anche il suo prodotto.
La dimensione dello spazio di non raggiungibilità è la seguente:
(48)Si possono costruire due matrici, chiamate $T_R$ e $T_{NR}$ in questo modo: $T_R$ è la matrice ottenuta affiancando le $n_R$ colonne linearmente indipendenti di $X_R$. Quindi
(49)la matrice $T_{NR}$ è ottenuta affiancando le colonne linearmente indipendenti di $X_{NR}$. La matrice
(50)ha le prime $n_R$ colonne linearmente indipendenti tra loro, e le ultime $n - n_R$ indipendenti tra loro. La matrice ha rango pieno perché è unione di due gruppi di vettori linearmente indipendenti.
Effettuando il cambiamento di base $x = Tz$, impiegando la amtrice $T$ come matrice per il cambiamento di base, si ottiene:
(51)si dimostra che le matrici $\tilde{A}$ e $\tilde{B}$ tali che, spezzando il vettore z in $Z_R$ (detta parte raggiungibile dello stato) e $Z_{NR}$ (detta parte non raggiungibile dello stato) si ottiene
(52)dove $\tilde{A}_{11} \in M_{nr x nr}$, $\tilde{A}_{22} \in M_{n-nr x n-nr}$.
Costruendo la matrice T in questo modo si possono notare alcune particolarità:
- $z'_{NR}$ non è influenzata dal controllo a causa del termine nullo nella matrice $A$ e non è influenzato da $z_R$ a causa del termine nullo nella matrice $B$.
- $Z_{NR}$ ha una dinamica autonoma, essendo influenzata solo da se stessa: $z'_{NR} = \tilde{A}_{22} z_{NR}$
quindi il sistema può essere scomposto nella parte raggiungibile (e controllabile) e nella sua parte non raggiungibile (e non controllabile)
le equazioni sono:
(53)Questo cambiamento di base, che determina la suddivisione del vettore di stato in componenti raggiungibili e non raggiungibili è detta decomposizione di Kalman di raggiungibilità (o controllabilità).
Si deve notare che $X_R$ è un sottospazio costituito da tutti e soli i punti raggiungibili, ovvero i valori raggiungibili dallo stato in quelche tempo (purché il sistema sia a tempo continuo). L'origine fa sempre parte di un sottospazio.
Esempio
Se $n=2$ e $dim X_R = 1$, allora graficamente, solo i punti della retta passante per l'origine sono raggiungibili. Tutti i punti non appartenenti alla retta sono NON raggiungibili, ovvero l'insieme dei punti $R^2 \ X_R$. Quest'ultimo non è un sottospazio perché non è compresa l'origine e non è sotto forma di retta o piano.
Il sottospazio $X_{NR}$ è ortogonale a $X_R$ e ha dimensione $n - n_R = 1$, ovvero una retta. $X_{NR}$ non è l'insieme di tutti i soli i punti di non raggiungibilità, anche se viene detto sottospazio di non raggiungibilità.
Esempio
Si considera il sistema seguente:
(54)La matrice di Kalman è
(55)si ha: $\rho(P) = 1$, $n_R = 1$. Il sottospazio $X_R$ è generato da una qualunque colonna di P: ad esempio
(56)un generico vettore apparenente a $X_R$ è $\left[ \alpha \alpha \right]^T$. Il sottospazio $X_{NR}$ è costruito calcolando il prodotto scalare con un generico vettore di $X_R$, imponendo il risultato nullo. Un generico vettore è: $\left[ k_1 k_2 \right]^T$. Il prodotto scalare tra il generico vettore e un vettore di $X_R$ è:
(57)quindi si ha $k_1 = - k_2$, quindi un generico vettore di $X_{NR}$ è $\left[ k_1 -k_1 \right]^T$
La matrice $T$ è la seguente:
svolgendo i calcoli si ha:
(59)la scomposizione da Kalman del sistema è la seguente:
(61)Il vettore dello stato $z$ è:
(62)che si può interpretare nel modo seguente: è controllabile la somma delle due variabili di stato ma non la loro differenza.
Cambiamento di base e polinomio caratteristico
Si può dimostrare che il polinomio caratteristico del sistema è invariante rispetto al cambiamento di base. Il polinomio caratteristico è stato definito come:
(63)e il polinomio caratteristico di controllabilità come:
(64)si ha: $x(0^-) = 0$ e $z(0^-) = 0$. Allora, effettuando il cambiamento di base si ha:
(65)Si considera la matrice $(sI - A)^{-1} B$ e si effettua la decomposizione di Kalman di controllabilità. Effettuando il cambiamento di base si ottiene:
(66)si effettua la trasformata di Laplcae
(67)dove
(68)essendo $s$ una quantità scalare, valgono le proprietà associative, quindi l'espressione diventa:
(69)l'inverso del prodotto è il prodotto delle matrici inverse, con l'ordine scambiato: $(ABC)^{-1} = C^{-1}B^{-1}A^{-1}$, quindi
(70)La matrice di partenza viene premoltiplicata per una matrice a rango pieno, e possiede lo stesso polinomio caratteristico. La matrice può essere scritta come:
(71)Le matrici $I_{11}$ e $I_{22}$ sono matrici identità con dimensione opportuna. Essendo una matrice triangolare a blocchi, il calcolo dell'inversa viene effettuato in questo modo:
(72)applicandola alla matrice $(sI - A)^{-1} B $ si ottiene:
(73)quindi sono rilevanti solo le matrici $\tilde{A}_{11}$ e $\tilde{B}_1$, mentre non lo sono le matrici $\tilde{A}_{22}$ e $\tilde{A}_{12}$. Il polinomio caratteristico relativo alla matrice $(sI - \tilde{A})^{-1} \tilde{B}$, ovvero $\tilde{\varphi}_C (s)$ dipende solo da $\tilde{A}_{11}$ e $\tilde{B}_1$.
Il polinomio caratteristico del sistema $\tilde{\varphi}(s)$ è il seguente:
(74)Il primo termine ha come radici gli $n_R$ autovalori, ovvero tutti e soli gli autovalori del polinomio della matrice
(75)ed è chiamato $\tilde{\varphi_C}(s)$. Per calcolare tutti e soli gli autovalori della parte controllabile del sistema si può quindi utilizzare $\tilde{\varphi_C}(s)$. Il cambiamento di base fa sparire gli autovalori della parte non controllabile del sistema.
Il polinomio caratteristico di controllabilità $\varphi_C(s)$ relativo a $(sI-A)^{-1}B$ coincide con $\tilde{\varphi}_C (s)$. Non è dunque necessario effettuare il cambiamento di base per calcolare $\tilde{\varphi}_C(s)$ ma si può calcolare $\varphi_C(s)$, con grado pari a $n_R$: $deg(\varphi_C(s)) = n_R$.
La controllabilità definisce le proprietà di andamento forzato dello stato: un sistema situato nello stato zero può raggiungere un certo stato controllabile attraverso un determinato controllo. Si può pensare allo stato come ad una possibile uscita del sistema e la matrice $(sI-A)^{-1}B$ come una matrice di trasferimento controllo-stato.
(76)il grado del polinomio caratteristico di controllabilità è uguale alla dimensione del sottospazio di raggiungibilità e quindi è uguale al rango di P: $n_R = \rho(P)$.
L'analisi della raggiungibilità e della controllabilità può essere effettuata:
- applicando il teorema di Kelman con la matrice $P = [B \vert AB \vert \dots \vert A^{n-1}B]$. Si ottiene $X_R$ scegliendo $n_R$ colonne linearmente indipendenti di P.
- con il polinomio caratteristico di controllabilità $\varphi_C(s)$, calcolando il determinante della matrice $(sI - A)^{-1} B$ e ottenendo $n_R$. Non si ottiene $X_R$, ma si possono ricavare le radici di $\varphi_C(s)$. Queste radici sono detti poli controllabili o autovalori controllabili del sistema.