Raggiungibilità e Controllabilità

Introduzione

Definizione

Uno stato $\hat x$ è detto raggiungibile in un tempo $\hat t$ se esiste un controllo $\hat u(\tau)$, con $\tau \in \left[ 0, \hat t \right]$ (andamento del segnale di controllo) tale che se $x(0^-) = 0$ allora $x(\hat t) = \hat x$.

Dato un sistema inizialmente a riposo nello stato 0, se può essere portato nello stato $\hat x$ attraverso il controllo dopo un tempo $\hat t$, allora quello stato è detto raggiungibile.

Definizione

Uno stato $\hat x$ è detto controllabile in un tempo $\hat t$ se esiste un controllo $\hat u(\tau)$, con $\tau \in \left[ 0, \hat t \right]$ tale che se $x(0^-) = 0$ allora $x(\hat t) = \hat x$.

Dato un sistema posizionato in uno stato $\hat x$, se può essere portato nello stato 0 attraverso il controllo dopo un tempo $\hat t$, allora quello stato è detto controllabile.

Si definiscono inoltre:

  • $X_R (\hat t)$ l'insieme degli stati raggiungibili in tempo $\hat t$
  • $X_C (\hat t)$ l'insieme degli stati controllabili in tempo $\hat t$

$X_R (\hat t)$ e $X_C (\hat t)$ sono sottospazi di $R^n$.

Siano $\hat{X}_1$ e $\hat{X}_2$ sue stati raggiungibili. Allora per definizione esistono dei controlli $\hat U_1$ e $\hat U_2$ tali che $x(\hat t) = \hat{X}_1$ e $x(\hat t) = \hat{X}_2$. Essendo un sistema lineare, applicando un controllo

(1)
\begin{align} \hat U = \alpha \hat{u}_1 + \beta \hat{u}_2 \end{align}

per il principio di sovrapposizione, si può raggiungere uno stato $\hat X$ che è una combinazione lineare di $\hat{X}_1$ e $\hat{X}_2$, ovvero $\alpha \hat{X}_1 + \beta \hat{X}_2$.
Qualunque combinazione lineare degli stati $\hat{X}_1$ e $\hat{X}_2$ può essere raggiunta applicando un'opportuna combinazione lineare dei controlli $\hat U_1$ e $\hat U_2$.
Questo principio è sempre valido, anche nei sistemi lineari a tempo discreto. Sostituendo lo stato iniziale con l'origine si possono ottenere gli stessi risultati anche nell'ambito della controllabilità.

Uno stato raggiungibile in t è anche controllabile: se $\hat x \in X_R(\hat t)$, allora $\hat x \in X_C(\hat t)$. Se si può portare un sistema nello stato $\hat x$ a partire dallo stato 0, è possibile tornare allo stato 0. In altre parole, l'insieme degli stati raggiungibili è contenuto nell'insieme di quelli controllabili. Non vale il contrario.

(2)
\begin{align} X_R \subset X_C \end{align}
stati.pdf

Fig 5.1 Stato raggiungibile e stato controllabile

Solo per i sistemi LTI a tempo continuo si ha:

(3)
\begin{align} X_R (\hat t) = X_C (\hat t) \end{align}

tutti gli stati raggiungibili sono anche controllabili: se $\hat x \in X_R$ allora $\hat x in X_C$ e viceversa, inoltre

(4)
\begin{align} X_R (\hat t) = X_C (\hat t) = X_C \end{align}

la proprietà di raggiungibilità e di controllabilità, nei sistemi a tempo continuo, non dipendono dal tempo $\hat t$.

Sistemi a tempo discreto

Nei sistemi a tempo discreto l'evoluzione dello stato è descritta dall'equazione seguente:

(5)
\begin{equation} X_{(k+1)} = A X_{(k)} + B U_{(k)} \end{equation}

per lo studio della controllabilità e della raggiungibilità è inutile considerare l'equazione relativa all'uscita del sistema, poiché esse sono caratteristiche dello stato.
Si suppone che il sistema si trovi nello stato 0, ovvero $X_{(0)} = 0$. Dopo un passo, gli stati raggiungibili sono:

(6)
\begin{equation} X_ {(1)} = A X_{(0)} + B U_{(0)} \end{equation}

il termine $U_{(0)}$ è liberamente assegnabile, mentre $X_{(0)} = 0$ no. Gli stati raggiungibili sono quindi:

(7)
\begin{equation} X_{(1)} = B U_{(0)} \end{equation}
(8)
\begin{equation} X_R (1) = B U(0) \end{equation}

ovvero, tutti gli stati che sono combinazione lineare delle colonne di B, infatti dato $U \in R^m$ si ottiene:

(9)
\begin{align} B U_{(0)} = \left[ b_1 \vert b_2 \vert \dots \vert b_m \right] \left[ \begin{array}{c} U_1 (0) \\ U_2 (0) \\ \dots \\ U_m (0) \end{array} \right] = U_1 (0) b_1 + \dots + U_m (0) b_m \end{align}

Se la matrice B è invertibile, allora tutte le colonne saranno linearmente indipendenti e si potranno raggiungere tutti gli stati. Al passo successivo si ha:

(10)
\begin{equation} X_R (2) = A X(1) + B U(1) = A B U(0) + B U(1) \end{equation}

ovvero tutte le combinazioni lineari di B e della matrice $[B \vert AB ]$. Al generico passo n $X_R (n)$ è la combinazione lineare delle colonne della matrice seguente:

(11)
\begin{align} \left[ B \vert AB \vert \dots \vert A^{n-1} B \right] \end{align}

e nel passo successivo $n+1$ lo spazio degli stati raggiungibili è quello generato dalle colonne della matrice:

(12)
\begin{align} \left[ B \vert AB \vert \dots \vert A^{n-1} B \vert A^{n} B \right] \end{align}

la matrice $A^n$ si può ottenere come combinazione lineare di $A^{n-1}$, …, $A$.

Esempio

Sia $X(k+1)$ la matrice seguente:

(13)
\begin{align} X(k+1) = \left[ \begin{array}{cc} 1 & 0 \\ 1 & 1 \end{array} \right] X(k) + \left[ \begin{array}{c} 1 \\ 0 \end{array} \right] U(k) \end{align}

Lo spazio degli spazi raggiungibili è:

(14)
\begin{align} X_R(1) = \alpha \left[ \begin{array}{c} 1 \\ 0 \end{array} \right] \end{align}
(15)
\begin{align} X_R(2) = \alpha \left[ \begin{array}{c} 1 \\ 0 \end{array} \right] + \beta \left[ \begin{array}{c} 1 \\ 1 \end{array} \right] \end{align}

Sistemi a tempo continuo

Se uno stato è raggiungibile in un tempo $t'$, allora lo sarà in qualunque altro tempo $t'' >\ t'$, poiché è sempre possibile far restare il sistema, inizialmente nello stato 0, in quello stato per un tempo $t'' - t'$ e in seguito impiegare un tempo $t'$ per raggiungere lo stato.

La matrice $e^{At}$ è sempre invertibile e valgono anche nel case matriciale le proprietà dell'esponenziale:

(16)
\begin{equation} e^{-At} = e^{At} = e^0 = I \end{equation}

Si può semplice calcolare $e^{At}$, ed è ricavabile come l'antitrasformata della matrice $(sI - A)^{-1}$:

(17)
\begin{align} e^{At} = \mathscr{L}^{-1} \left\lbrace (sI - A)^{-1} \right\rbrace \end{align}

$(sI - A)^{-1}$ è l'inversa di una matrice con colonne linearmente indipendenti. Si ha la seguente formula:

(18)
\begin{align} e^{-At} = \mathscr{L}^{-1} \left\lbrace (sI + A)^{-1} \right\rbrace \end{align}

La matrice a tempo discreto $A^k$ non è sempre invertibile, poiché nel caso $A$ sia nulla, allora lo sarà anche $A^k$ e non è invertibile.

Teorema di Kalman di raggiungibilità

Il sottospazio $X_R$ è generato dalle colonne della matrice $P$ seguente:

(19)
\begin{align} P = \left[ B \vert AB \vert A^2 B \vert \dots \vert A^{n-1} B \right] \end{align}

Un sistema è completamente raggiungibile, ovvero $X_R \equiv \mathbb{R^n}$ (e nel caso di un sistema a tempo continuo anche controllabile) quando la combinazione lineare delle colonne di $P$ può generare qualunque vettore di $R^n$, ovvero il rango di $P$ è uguale a n:

(20)
\begin{align} \rho(P) = n \end{align}

Definizione

Sia $n_R$ la dimensione di $X_R$, ovvero $dim\:X_R \triangleq n_R$. La dimensione di uno sottospazio indica quanti vettori linearmente indipendenti possiede il sottospazio. Quindi:

(21)
\begin{align} n_R \triangleq dim\:X_R = \rho(P) \end{align}

Se si verificasse $\rho(B) = n$, allora il sistema è completamente raggiungibile, e non sarebbe necessario calcolare i componenti $AB$, $A^2 B$, ecc. della matrice di Kalman.

Metodo operativo per la costruzione della matrice P

Si calcola la matrice $AB$ in modo consueto, mentre per calcolare $A^2 B$ si moltiplica a sinistra per la matrice A. Moltiplicando successivamente per la matrice A di ottiene $A^3 B$, e così via per gli altri termini.

Esempio

Si considera il sistema seguente:

(22)
\begin{align} x' = \left[ \begin{array}{cc} 0 & 1 \\ 0 & 0 \end{array} \right] x + \left[ \begin{array}{c} 1 \\ 0 \end{array} \right] \end{align}

gli stati raggiungibili possono essere calcolati in questo modo:

(23)
\begin{align} P = \left[ B \vert AB \right] = \left[ \begin{array}{cc} 1 & 0 \\ 0 & 0 \end{array} \right] \end{align}

Essendo $\rho(P) = 1$, lo spazio di raggiungibilità è dato dalla combinazione lineare di una colonna di $P$:

(24)
\begin{align} X_R = \alpha \left[ \begin{array}{c} 1 \\ 0 \end{array} \right] \end{align}

Osseervando questo sistema, si può notare che una delle due varibili dello stato non è influenzata dal controllo, essendo presente uno zero nella matrice B relativo alla variabile $x_2$ ed inoltre non è influenzata dalle altre variabili, essendo presente una riga di zeri nella matrice A, relativi alla variabile $x_2$. Infatti la coppia di equazioni dello stato del sistema è la seguente:

(25)
\begin{align} \left\lbrace \begin{array}{ccc} x'_1 &=& x_2 + U \\ x'_2 &=& 0 \end{array} \right. \end{align}

La componente $x_2$ dello stato non è controllabile, perché non è influenzata da nessun'altra variabile. Quindi si può immediatamente notare che il sistema non è completamente controllabile.

Esempio

Si considera il sistema seguente:

(26)
\begin{align} x' = \left[ \begin{array}{cc} 0 & 1 \\ 0 & 0 \end{array} \right] x + \left[ \begin{array}{c} 0 \\ 1 \end{array} \right] \end{align}

gli stati raggiungibili possono essere calcolati in questo modo:

(27)
\begin{align} P = \left[ B \vert AB \right] = \left[ \begin{array}{cc} 0 & 1 \\ 1 & 0 \end{array} \right] \end{align}

Essendo $\rho(P) = 2$, il sistema è completamente controllabile $X_R = R^2$, perché la matrice P ha colonne linearmente indipendenti.

In questo secondo esempio, il sistema ha le seguenti equazioni:

(28)
\begin{align} \left\lbrace \begin{array}{ccc} x'_1 &=& x_2 \\ x'_2 &=& U_2 \end{array} \right. \end{align}

dove si può notare che la prima variabile è influenzata direttamente dalla seconda, la quale è influenzata dal controllo.

Esempio

Si considera il sistema seguente:

(29)
\begin{align} x' = \left[ \begin{array}{ccc} 0 & 1 & 0 \\ 0 & 0 & 1 \\ 0 & 0 & 0 \end{array} \right] x + \left[ \begin{array}{c} 0 \\ 0 \\ 1 \end{array} \right] U \end{align}

La matrice di Kalman è:

(30)
\begin{align} P = \left[ B \vert AB \vert A^2 B \right] = \left[ \begin{array}{ccc} 0 & 0 & 1 \\ 0 & 1 & 0 \\ 1 & 0 & 0 \end{array} \right] \end{align}

si ha $\rho(P) = 3$, ed essendo a rango pieno, il sistema è completamente raggiungibile.

Esempio

Si considera il sistema seguente:

(31)
\begin{align} x' = \left[ \begin{array}{ccc} 0 & 1 & 1 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{array} \right] x + \left[ \begin{array}{cc} 0 & 0 \\ 1 & 0 \\ 0 & 1 \end{array} \right] U \end{align}

che ha tre variabili di stato $x_1$, $x_2$, $x_3$ e due variabili di controllo $u_1$ e $u_2$. La matrice di Kalmann è:

(32)
\begin{align} P = \left[ B \vert AB \right] = \left[ \begin{array}{cccc} 0 & 0 & 1 & 1 \\ 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \end{array} \right] \end{align}

quindi $\rho(P) = 3$ e il sistema è completamente raggiungibile $X_R \equiv R^3$.
Si può controllare il sistema con uno solo dei due controlli? Considerando solo il controllo $u_1$ si ottiene il seguente sistema:

(33)
\begin{align} x' = \left[ \begin{array}{ccc} 0 & 1 & 1 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{array} \right] x + \left[ \begin{array}{c} 0 \\ 1 \\ 0 \end{array} \right] u_1 \end{align}

la cui matrice di Kalman è:

(34)
\begin{align} P = \left[ \begin{array}{ccc} 0 & 1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 0 \end{array} \right] \end{align}

essendo $\rho(P) = 2$, il sistema non è controllabile completamente, e lo spazio degli stati controllabili (e raggiungibili) è dato da:

(35)
\begin{align} X_R = \alpha \left[ \begin{array}{c} 1 \\ 0 \\ 0 \end{array} \right] + \beta \left[ \begin{array}{c} 0 \\ 1 \\ 0 \end{array} \right] \end{align}

considerando invece il controllo $u_2$ si ottiene

(36)
\begin{align} x' = \left[ \begin{array}{ccc} 0 & 1 & 1 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{array} \right] x + \left[ \begin{array}{c} 0 \\ 0 \\ 1 \end{array} \right] u_2 \end{align}

la cui matrice di Kalman è:

(37)
\begin{align} P = \left[ \begin{array}{ccc} 0 & 1 & 0 \\ 0 & 0 & 0 \\ 1 & 0 & 0 \end{array} \right] \end{align}

essendo $\rho(P) = 2$, allora il sistema non è completamente controllabile, e lo spazio degli stati è dato da:

(38)
\begin{align} X_R = \alpha \left[ \begin{array}{c} 0 \\ 0 \\ 1 \end{array} \right] + \beta \left[ \begin{array}{c} 1 \\ 0 \\ 0 \end{array} \right] \end{align}

Non si può quindi controllare completamente il sistema con un solo controllo.

Esempio

Si considera il sistema seguente:

(39)
\begin{align} x' = \left[ \begin{array}{ccc} 0 & 1 & 1 \\ 0 & 0 & 1 \\ 0 & 0 & 0 \end{array} \right] x + \left[ \begin{array}{cc} 0 & 0 \\ 1 & 0 \\ 0 & 1 \end{array} \right] U \end{align}

la matrice di Kalman è:

(40)
\begin{align} P = \left[ \begin{array}{cccc} 0 & 0 & 1 & 1 \\ 1 & 0 & 0 & 1 \\ 0 & 1 & 0 & 0 \end{array} \right] \end{align}

il sistema è completamente controllabile. Si verifica se un solo controllo è sufficiente per controllare completamente il sistema. Inizialmente si considera solo il controllo $u_1$: la matrice di Kalman relativa è la seguente

(41)
\begin{align} P = \left[ \begin{array}{ccc} 0 & 1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 0 \end{array} \right] \end{align}

poichè $\rho(P) = 2$, il sistema non è completamente controllabile. Se invece si considera il controllo $u_2$, allora la matrice di Kalman è:

(42)
\begin{align} P = \left[ \begin{array}{ccc} 0 & 1 & 1 \\ 0 & 1 & 0 \\ 1 & 0 & 0 \end{array} \right] \end{align}

che ha $\rho(P) = 3$, quindi con il solo controllo $u_2$ è sufficiente per controllare completamente il sistema.

Raggiungibilità e cambiamento di base

La proprietà di raggiungibilità è indipendente dal cambiamento di base. Infatti, considerando un nuovo vettore per lo stato $z$, tale che:

(43)
\begin{equation} z = T^{-1} x \end{equation}

essendo $\tilde{A} = T^{-1}AT$ e $\tilde{B} = T^{-1}B$, l'equazione di stato diventa, nella nuova variabile:

(44)
\begin{equation} z' = T^{-1}ATz + T^{-1}Bu \end{equation}

la matrice di Kalmann diventa:

(45)
\begin{align} \tilde{P} = \left[ \tilde{B} \vert \tilde{A} \tilde{B} \vert \tilde{A}^2 \tilde{B} \vert \dots \vert \tilde{A}^{n-1} \tilde{B} \right] \end{align}

sostituendo:

(46)
\begin{eqnarray} \tilde{P} &=& \left[ T^{-1}B \vert T^{-1}AT T^{-1}B \vert T^{-1}ATT^{-1}AT T^{-1}B \vert \dots \vert T^{-1}A^{n-1}TT^{-1}AT T^{-1}B \right] \\ &=& \left[ T^{-1}B \vert T^{-1}AB \vert T^{-1}A^2B \vert \dots \vert T^{-1}A^{n-1}B \right] = T^{-1}P \end{eqnarray}

il rango $\rho(\tilde{P}) = \rho(T^{-1}P)$ è pari a: $min \left\lbrace \rho(T^{-1}), \rho(P) \right\rbrace$. Ma $T^{-1}$ è una matrice invertibile per definizione, quindi ha rango massimo. Quindi $\rho(\tilde{P}) = \rho(P)$.
Cambiando base non si modifica il rango della matrice di Kalmann, e quindi non viene modificata la raggiungibilità del sistema.

Si definisce un sottospazio $X_{NR}$ come il complemento ortogonale dello spazio $X_R$. In altre parole, dati $X_1 \in X_R$ e $X_1 \in X_{NR}$ allora $X_1 \circ X_2 = X_1^T X_2 = X_1 X_2^T = 0$.

Il prodotto scalare $(\circ)$ è definito in questo modo: dati due vettori $a$ e $b$, allora

(47)
\begin{align} a \circ b = a^T b = \sum_{n=1}^{dim(A)} a_i b_i \end{align}

se uno dei due vettoi è nullo, allora sicuramente sarà nullo anche il suo prodotto.

La dimensione dello spazio di non raggiungibilità è la seguente:

(48)
\begin{align} dim\:X_{NR} = n - n_R \end{align}

Si possono costruire due matrici, chiamate $T_R$ e $T_{NR}$ in questo modo: $T_R$ è la matrice ottenuta affiancando le $n_R$ colonne linearmente indipendenti di $X_R$. Quindi

(49)
\begin{align} T_R \in M_{n x nr} \end{align}

la matrice $T_{NR}$ è ottenuta affiancando le colonne linearmente indipendenti di $X_{NR}$. La matrice

(50)
\begin{align} T = \left[ T_R \vert T_{NR} \right] \in M_{nx(nr + n - nr)} \end{align}

ha le prime $n_R$ colonne linearmente indipendenti tra loro, e le ultime $n - n_R$ indipendenti tra loro. La matrice ha rango pieno perché è unione di due gruppi di vettori linearmente indipendenti.

Effettuando il cambiamento di base $x = Tz$, impiegando la amtrice $T$ come matrice per il cambiamento di base, si ottiene:

(51)
\begin{equation} z' = T^{-1} A T z + T^{-1} N u \end{equation}

si dimostra che le matrici $\tilde{A}$ e $\tilde{B}$ tali che, spezzando il vettore z in $Z_R$ (detta parte raggiungibile dello stato) e $Z_{NR}$ (detta parte non raggiungibile dello stato) si ottiene

(52)
\begin{align} z' = \left[ \begin{array}{c} z'_R \\ z'_{NR} \end{array} \right] = \left[ \begin{array}{cc} \tilde{A}_11 & \tilde{A}_12 \\ 0 & \tilde{A}_22 \end{array} \right] \left[ \begin{array}{c} z_R \\ z_{NR} \end{array} \right] + \left[ \begin{array}{c} \tilde{B}_1 \\ 0 \end{array} \right] u \end{align}

dove $\tilde{A}_{11} \in M_{nr x nr}$, $\tilde{A}_{22} \in M_{n-nr x n-nr}$.

Costruendo la matrice T in questo modo si possono notare alcune particolarità:

  • $z'_{NR}$ non è influenzata dal controllo a causa del termine nullo nella matrice $A$ e non è influenzato da $z_R$ a causa del termine nullo nella matrice $B$.
  • $Z_{NR}$ ha una dinamica autonoma, essendo influenzata solo da se stessa: $z'_{NR} = \tilde{A}_{22} z_{NR}$

quindi il sistema può essere scomposto nella parte raggiungibile (e controllabile) e nella sua parte non raggiungibile (e non controllabile)

scomposizione.pdf

Fig 5.2 Scomposizione di un sistema

le equazioni sono:

(53)
\begin{align} \begin{array}{ccc} z'_{NR} &=& \tilde{A}_{22} z_{NR} \\ z'_R &=& \tilde{A}_{11} z_R + \tilde{A}_{12} z_{NR} + \tilde{B}_1 u \end{align}

Questo cambiamento di base, che determina la suddivisione del vettore di stato in componenti raggiungibili e non raggiungibili è detta decomposizione di Kalman di raggiungibilità (o controllabilità).
Si deve notare che $X_R$ è un sottospazio costituito da tutti e soli i punti raggiungibili, ovvero i valori raggiungibili dallo stato in quelche tempo (purché il sistema sia a tempo continuo). L'origine fa sempre parte di un sottospazio.

Esempio

Se $n=2$ e $dim X_R = 1$, allora graficamente, solo i punti della retta passante per l'origine sono raggiungibili. Tutti i punti non appartenenti alla retta sono NON raggiungibili, ovvero l'insieme dei punti $R^2 \ X_R$. Quest'ultimo non è un sottospazio perché non è compresa l'origine e non è sotto forma di retta o piano.

Il sottospazio $X_{NR}$ è ortogonale a $X_R$ e ha dimensione $n - n_R = 1$, ovvero una retta. $X_{NR}$ non è l'insieme di tutti i soli i punti di non raggiungibilità, anche se viene detto sottospazio di non raggiungibilità.

Esempio

Si considera il sistema seguente:

(54)
\begin{align} x' = \left[ \begin{array}{cc} -1 & 0 \\ 0 & -1 \end{array} \right] x + \left[ \begin{array}{c} 1 \\ 1 \end{array} \right] U \end{align}

La matrice di Kalman è

(55)
\begin{align} P = \left[ \begin{array}{cc} 1 & -1 \\ 1 & -1 \end{array} \right] \end{align}

si ha: $\rho(P) = 1$, $n_R = 1$. Il sottospazio $X_R$ è generato da una qualunque colonna di P: ad esempio

(56)
\begin{align} X_R = \alpha \left[ \begin{array}{c} 1 \\ 1 \end{array} \right] \end{align}

un generico vettore apparenente a $X_R$ è $\left[ \alpha \alpha \right]^T$. Il sottospazio $X_{NR}$ è costruito calcolando il prodotto scalare con un generico vettore di $X_R$, imponendo il risultato nullo. Un generico vettore è: $\left[ k_1 k_2 \right]^T$. Il prodotto scalare tra il generico vettore e un vettore di $X_R$ è:

(57)
\begin{align} \left[ \alpha \alpha \right]^T \circ \left[ k_1 k_2 \right]^T = \alpha k_1 + \alpha k_2 = 0 \end{align}

quindi si ha $k_1 = - k_2$, quindi un generico vettore di $X_{NR}$ è $\left[ k_1 -k_1 \right]^T$
La matrice $T$ è la seguente:

(58)
\begin{align} T = \left[ \begin{array}{cc} 1 & 1 \\ 1 & -1 \end{array} \right] \end{align}

svolgendo i calcoli si ha:

(59)
\begin{align} \tilde{A} = \left[ \begin{array}{cc} -1 & 0 \\ 0 & -1 \end{array} \right] \end{align}
(60)
\begin{align} \tilde{B} = \left[ \begin{array}{c} 1 \\ 0 \end{array} \right] \end{align}

la scomposizione da Kalman del sistema è la seguente:

(61)
\begin{align} z' = T^{-1}AT z + T^{-1}B = \left[ \begin{array}{cc} -1 & 0 \\ 0 & -1 \end{array} \right]z + \left[ \begin{array}{c} 1 \\ 0 \end{array} \right] u \end{align}

Il vettore dello stato $z$ è:

(62)
\begin{align} z = \left[ \begin{array}{c} z_R \\ z_{NR} \end{array} \right] = T^{-1}x = \left[ \begin{array}{c} 1/2 (x_1 + x_2) \\ 1/2 (x_1 - x_2) \end{array} \right] \end{align}

che si può interpretare nel modo seguente: è controllabile la somma delle due variabili di stato ma non la loro differenza.

Cambiamento di base e polinomio caratteristico

Si può dimostrare che il polinomio caratteristico del sistema è invariante rispetto al cambiamento di base. Il polinomio caratteristico è stato definito come:

(63)
\begin{align} \varphi(s) = det(sI - A)^{-1} \end{align}

e il polinomio caratteristico di controllabilità come:

(64)
\begin{align} \varphi_C (s) = det(sI - A)^{-1}B \end{align}

si ha: $x(0^-) = 0$ e $z(0^-) = 0$. Allora, effettuando il cambiamento di base si ha:

(65)
\begin{align} z = (sI - \tilde{A})^{-1} z(0^-) + (sI - \tilde{A})^{-1} \tilde{B}u = (sI - \tilde{A})^{-1} \tilde{B}u \end{align}

Si considera la matrice $(sI - A)^{-1} B$ e si effettua la decomposizione di Kalman di controllabilità. Effettuando il cambiamento di base si ottiene:

(66)
\begin{align} z' = \tilde{A}z + \tilde{B}u \end{align}

si effettua la trasformata di Laplcae

(67)
\begin{align} Z(s) = (sI - \tilde{A})^{-1} \tilde{B} U(s) \end{align}

dove

(68)
\begin{align} (sI - \tilde{A})^{-1} \tilde{B} = (sI - T^{-1}AT)^{-1} T^{-1}B = (sT^{-1}IT - T^{-1}AT)^{-1} T^{-1}B = (T^{-1}(sI)T - T^{-1}AT)^{-1} T^{-1}B \end{align}

essendo $s$ una quantità scalare, valgono le proprietà associative, quindi l'espressione diventa:

(69)
\begin{align} \left[ T^{-1}(sI - A) T \right] t^{-1}B \end{align}

l'inverso del prodotto è il prodotto delle matrici inverse, con l'ordine scambiato: $(ABC)^{-1} = C^{-1}B^{-1}A^{-1}$, quindi

(70)
\begin{align} \left[ T^{-1} (sI-A)^{-1} T \right] T^{-1} B = T^{-1} (sI - A)^{-1} T T^{-1} B = T^{-1} (sI - A)^{-1} B \end{align}

La matrice di partenza viene premoltiplicata per una matrice a rango pieno, e possiede lo stesso polinomio caratteristico. La matrice può essere scritta come:

(71)
\begin{align} (sI - \tilde{A})^{-1} \tilde{B} = \left[ \begin{array}{cc} sI_{11} - \tilde{A}_{11} & -\tilde{A}_{12} \\ 0 & sI_{22}-\tilde{A}_{22} \end{array} \right] \left[ \begin{array}{c} \tilde{b}_1 \\ 0 \end[array} \right] \end{align}

Le matrici $I_{11}$ e $I_{22}$ sono matrici identità con dimensione opportuna. Essendo una matrice triangolare a blocchi, il calcolo dell'inversa viene effettuato in questo modo:

(72)
\begin{align} left[ \begin{array}{cc} M_1 & M_2 \\ 0 & M_3 \end{array} \right]^{-1} = \left[ \begin{array}{cc} M_1^{-1} & \bar{M_2} \\ 0 & M_3^{-1} \end{array} \right] \end{align}

applicandola alla matrice $(sI - A)^{-1} B $ si ottiene:

(73)
\begin{align} left[ \begin{array}{cc} (sI_{11} - \tilde{A}_{11})^{-1} & M_{12} \\ 0 & (sI_{22} - \tilde{A}_{22})^{-1} \end{array} \right] \left[ \begin{array}{c} \tilde{B}_1 \\ 0 \end{array} \right] = \left[ \begin{array}{c} (sI_{11} - \tilde{A}_{11})^{-1} \tilde{B}_1 \\ 0 \end{array} \right] \end{align}

quindi sono rilevanti solo le matrici $\tilde{A}_{11}$ e $\tilde{B}_1$, mentre non lo sono le matrici $\tilde{A}_{22}$ e $\tilde{A}_{12}$. Il polinomio caratteristico relativo alla matrice $(sI - \tilde{A})^{-1} \tilde{B}$, ovvero $\tilde{\varphi}_C (s)$ dipende solo da $\tilde{A}_{11}$ e $\tilde{B}_1$.

Il polinomio caratteristico del sistema $\tilde{\varphi}(s)$ è il seguente:

(74)
\begin{align} \tilde{\varphi}(s) = det(sI - \tilde{A})^{-1} = det(sI_{11} - A_{11})det(sI_{22} - A_{22}) \end{align}

Il primo termine ha come radici gli $n_R$ autovalori, ovvero tutti e soli gli autovalori del polinomio della matrice

(75)
\begin{align} (sI - \tilde{A})^{-1}\tilde{B} = \left[ \begin{array}{c} (sI_{11} - \tilde{A}{11})^{-1} \tilde{B}_1 \\ 0 \end{array} \right] \end{align}

ed è chiamato $\tilde{\varphi_C}(s)$. Per calcolare tutti e soli gli autovalori della parte controllabile del sistema si può quindi utilizzare $\tilde{\varphi_C}(s)$. Il cambiamento di base fa sparire gli autovalori della parte non controllabile del sistema.
Il polinomio caratteristico di controllabilità $\varphi_C(s)$ relativo a $(sI-A)^{-1}B$ coincide con $\tilde{\varphi}_C (s)$. Non è dunque necessario effettuare il cambiamento di base per calcolare $\tilde{\varphi}_C(s)$ ma si può calcolare $\varphi_C(s)$, con grado pari a $n_R$: $deg(\varphi_C(s)) = n_R$.

La controllabilità definisce le proprietà di andamento forzato dello stato: un sistema situato nello stato zero può raggiungere un certo stato controllabile attraverso un determinato controllo. Si può pensare allo stato come ad una possibile uscita del sistema e la matrice $(sI-A)^{-1}B$ come una matrice di trasferimento controllo-stato.

(76)
\begin{align} deg \varphi_C(s) = dim X_R = n_R \end{align}

il grado del polinomio caratteristico di controllabilità è uguale alla dimensione del sottospazio di raggiungibilità e quindi è uguale al rango di P: $n_R = \rho(P)$.
L'analisi della raggiungibilità e della controllabilità può essere effettuata:

  • applicando il teorema di Kelman con la matrice $P = [B \vert AB \vert \dots \vert A^{n-1}B]$. Si ottiene $X_R$ scegliendo $n_R$ colonne linearmente indipendenti di P.
  • con il polinomio caratteristico di controllabilità $\varphi_C(s)$, calcolando il determinante della matrice $(sI - A)^{-1} B$ e ottenendo $n_R$. Non si ottiene $X_R$, ma si possono ricavare le radici di $\varphi_C(s)$. Queste radici sono detti poli controllabili o autovalori controllabili del sistema.
Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-ShareAlike 3.0 License