Sistemas de Control lineal óptimo con realimentación de estado

Capítulo 5 Sistemas de Control lineal óptimo con realimentación de estado La principal restricción de este sistema de control es suponer que se puede medir en todo instante de tiempo el estado completo del sistema para realimentarlo. 5.1. Mejorar la estabilidad de sistemas de control realimentando el estado 5.1.1. Control lineal con realimentación del estado Veamos como las propiedades de estabilidad de sistemas de control se pueden mejorar realimentando el estado. Consideremos el siguiente S.L.V.T: ẋ(t) = A(t) x(t) + B(t) u(t) (5.1) Si el estado se puede medir en todo instante, es posible construir una ley de control de la forma: u(t) = F (t) x(t) + u (t) (5.2) F (t): es una matriz de ganancia de realimentación variante en el tiempo. u (t): es una nueva entrada. Si esta ley de control se conecta al sistema (5.1), el sistema en lazo cerrado queda descrito por: ẋ(t) = [A(t) B(t) F (t)] x(t) + B(t) u (t) (5.3) La estabilidad de este sistema depende de A(t), B(t) y F (t). Introduzcamos la siguiente terminología: 49

Definición 5.1. La ley de control lineal: La denominaremos: Ley de control A.E para el sistema: Si el sistema en lazo cerrado: es asintóticamente estable. u(t) = F (t) x(t) + u (t) (5.4) ẋ(t) = A(t) x(t) + B(t) u(t) (5.5) ẋ(t) = [A(t) B(t) F (t)] x(t) + B(t) u (t) (5.6) Observación: Si el sistema (5.5) es I.T y se escoge una matriz F constante, la estabilidad del sistema (5.6) es determinada por los valores característicos de la matriz [A B F ]. 5.1.2. Condiciones para estabilización y asignación de polos En esta sección se establece: 1. Bajo que condiciones, los polos en el lazo cerrado de un S.L.I.T. se pueden ubicar en cualquier localización del plano complejo mediante realimentación lineal del estado. 2. Bajo que condiciones, el sistema se puede estabilizar. Teorema 5.1. Consideremos el S.L.I.T. ẋ(t) = A x(t) + B u(t) (5.7) con la ley de control I.T. u(t) = F x(t) + u (t) (5.8) Entonces los valores característicos del lazo cerrado, es decir, los valores característicos de [A B F ], se pueden colocar arbitrariamente en el plano complejo (con la restricción que los valores característicos complejos ocurran en pares complejos conjugados) escogiendo F adecuadamente si y sólo si el sistema (5.7) es completamente controlable. Observación: Este teorema no dice donde ubicar los polos en el semiplano izquierdo. 5.2. Regulador óptimo lineal determinístico Un S.L.I.T. se puede estabilizar con una ley lineal de realimentación cuando es C.C.. También se pueden escoger los polos del lazo cerrado para que la convergencia a cero del estado sea arbitrariamente rápida. Normalmente esto involucra entradas con grandes amplitudes, esto impone límite a la distancia en que se deben colocar los polos a la izquierda del eje imaginario. Luego hay que tomar en cuenta la velocidad de convergencia al estado cero y la magnitud de la entrada. Consideremos el S.L.I.T. ẋ(t) = A(t) x(t) + B(t) u(t) (5.9) 50

la idea es llevar el sistema desde un estado inicial arbitrario al estado cero tan rápido como sea posible. Un criterio útil es: x T (t) R 1 (t) x(t) dt (5.10) con R 1 (t) una matriz simétrica no-negativa definida. Este criterio ilustra la desviación acumulativa de x(t) desde el estado cero durante el intervalo [, t 1 ]. Usualmente disponemos de: z(t) = D(t) x(t) (5.11) luego el problema real es llevar z(t) a cero tan rápido como sea posible, luego (5.10) se reduce a: z T (t) R 3 (t) z(t) dt (5.12) con: R 1 (t) = D T (t) R 3 (t) D(t) (5.13) R 3 (t) matriz de ponderación simétrica positiva definida. Para prevenir grandes amplitudes en la entrada se incluye en el criterio a minimizar, quedando: [z T (t) R 3 (t) z(t) + u T (t) R 2 (t) u(t)] dt (5.14) con R 2 (t) una matriz de ponderación simétrica positiva definida. La importancia relativa de los dos términos, en el criterio, se determina por las matrices R 3 y R 2. También es muy importante que el estado terminal x(t 1 ) esté lo más cercano al estado cero, esto lleva a incluir un tercer término en el criterio. Luego resulta: [z T (t) R 3 (t) z(t) + u T (t) R 2 (t) u(t)] dt + x T (t 1 ) P 1 x(t 1 ) (5.15) donde P 1 es una matriz constante simétrica no-negativa definida. Definición 5.2. Considerar el S.L.V.T.: ẋ(t) = A(t) x(t) + B(t) u(t) (5.16) x( ) = x 0 (5.17) con la variable controlada: z(t) = D(t) x(t) (5.18) Considerar también el criterio: [z T (t) R 3 (t) z(t) + u T (t) R 2 (t) u(t)] dt + x T (t 1 ) P 1 x(t 1 ) (5.19) donde P 1 es una matriz simétrica no negativa definida, R 3 (t) y R 2 (t) son matrices simétricas positiva definidas para t t 1. Entonces el problema de determinar una entrada u o (t), t t 1, para que el criterio sea mínimo se llama: el problema del regulador óptimo lineal determinístico (P.R.O.L.D). 51

Definición 5.3. Si todas las matrices involucradas en la formulación del problema del regulador óptimo lineal determinístico son constantes, entonces nos referiremos al problema del regulador óptimo lineal determinístico invariante en el tiempo. 5.2.1. Solución del problema del regulador Es conveniente re-escribir el criterio (5.15) en la forma: [x T (t) R 1 (t) x(t) + u T (t) R 2 (t) u(t)] dt + x T (t 1 ) P 1 x(t 1 ) (5.20) donde R 1 (t) es una matriz simétrica no-negativa definida: R 1 (t) = D T (t) R 3 (t) D(t) (5.21) donde R 3 (t) y R 2 (t) son matrices simétricas positiva definidas. Supongamos que la entrada que minimiza este criterio existe y la denominaremos u o (t), t t 1. Sea x o (t) el estado óptimo para u o (t). Entonces el siguiente teorema nos define la solución: Teorema 5.2. Considerar el P.R.O.L.D.. Entonces la entrada óptima se puede generar desde una ley de control de la forma: u o (t) = F (t) x o (t) (5.22) La matriz P (t) está dada por: F (t) = R 1 2 (t) BT (t) P (t) (5.23) P (t) = [Φ 21 (t, t 1 ) + Φ 22 (t, t 1 ) P 1 ] [Φ 11 (t, t 1 ) + Φ 12 (t, t 1 ) P 1 ] 1 (5.24) donde Φ 11 (t, ), Φ 12 (t, ), Φ 21 (t, ) y Φ 22 (t, ) se obtienen particionando la matriz de transición Φ(t, ) de la ecuación diferencial de estado: ẋ(t) A(t) B(t) R 1 2 = (t) BT (t) x(t) (5.25) ṗ(t) R 1 (t) A T (t) p(t) R 1 (t) = D T (t) R 3 (t) D(t) (5.26) Se puede derivar la ecuación matricial diferencial que cumple la matriz P (t). Se consigue con el siguiente teorema: Teorema 5.3. La entrada óptima para el P.R.O.L.D. se genera con la ley de control lineal: u o (t) = F o (t) x o (t) (5.27) F o (t) = R 1 2 B T (t) P (t) (5.28) 52

en este caso, la matriz P (t) es simétrica y no-negativa definida que satisface la ecuación matricial de Riccati: P (t) = R 1 (t) P (t) B(t) R 1 2 (t) BT (t) P (t) + P (t) A(t) + A T (t) P (t) (5.29) con la condición terminal: y P (t 1 ) = P 1 (5.30) R 1 (t) = D T (t) R 3 (t) D(t) (5.31) Para la solución óptima tenemos: t [ ] x ot (τ) R 1 (τ) x o (τ) + u ot (τ) R 2 (τ) u o (τ) dτ + x ot (t 1 ) P 1 x o (t 1 ) = x ot (t) P (t) x o (t) (5.32) Vemos que la matriz P (t) no solamente da la ley de realimentación óptima sino que también permite evaluar el criterio para cualquier estado inicial y tiempo inicial. Del teorema 5.2 se puede extraer el siguiente resultado, que será útil cuando veamos el problema del observador óptimo: Lema 5.1. Considerar la ecuación diferencial matricial: P (t) = R1 (t) + F T (t) R 2 (t) F (t) + P (t)[a(t) B(t) F (t)] + [A(t) B(t) F (t)] T P (t) (5.33) con la condición terminal: P (t 1 ) = P 1 (5.34) donde R 1 (t), R 2 (t), A(t) y B(t) son matrices conocidas de dimensiones apropiadas, con R 1 (t) no-negativa definida y R 2 (t) positiva definida para t t 1, y P 1 no-negativa definida y constante. Tomando F (t) como una función matricial continua arbitraria para t t 1. Entonces para t t 1 : P (t) P (t) (5.35) donde P (t) es la solución de la ecuación de Riccati: P (t) = R 1 (t) P (t) B(t) R 1 2 (t) BT (t) P (t) + P (t) A(t) + A T (t) P (t) (5.36) P (t 1 ) = P 1 La desigualdad (5.35) se convierte en igualdad si: F (τ) = R 1 2 (τ) BT (τ) P (τ) t τ t 1 (5.37) 5.2.2. Solución en estado estacionario del P.R.O.L.D. Desde un punto de vista práctico, es natural considerar períodos largos de control. A continuación se indicarán las propiedades asintóticas del regulador óptimo. Para el caso variante en el tiempo, tenemos el siguiente teorema: 53

Teorema 5.4. Considerar la ecuación matricial de Riccati: P (t) = D T (t) R 3 (t) D(t) P (t) B(t) R 1 2 (t) BT (t) P (t) + A T (t) P (t) + P (t) A(t) (5.38) Supongamos que A(t) es continua y acotada, que B(t), D(t), R 3 (t) y R 2 (t) son continuas y acotadas por tramos en [, ), y además que: donde α y β son constantes positivas. i.) Entonces si el sistema: R 3 (t) α I, R 2 (t) β I t (5.39) ẋ(t) = A(t) x(t) + B(t) u(t) (5.40) z(t) = D(t) x(t) es: a.) Completamente controlable o b.) Exponencialmente estable la solución P (t) de la ecuación de Riccati (5.38) con la condición terminal P (t 1 ) = 0 converge a una función matricial no-negativa definida P (t) cuando t 1. P (t) es una solución de la ecuación (5.38). ii.) Más aún, si el sistema (5.40) es: c.) Uniformemente completamente controlable y uniformemente completamente reconstruible o d.) Exponencialmente estable la solución P (t) de la ecuación de Riccati (5.38) con la condición terminal P (t 1 ) = P 1 converge a P (t) cuando t 1 para cualquier P 1 0. Considerando la estabilidad de la ley de control en estado estacionario, tenemos el siguiente resultado: Teorema 5.5. Considerando el P.R.O.L.D. y suponiendo que se satisfacen las suposiciones del Teorema 5.4 con respecto a A, B, C, D, R 3 y R 2. Entonces si el sistema (5.40) es: a.) U.C.C y U.C.R o b.) Exponencialmente estable los siguientes factores se mantienen: i.) La ley de control óptimo en estado estacionario: u(t) = R 1 2 (t) BT (t) P (t) x(t) (5.41) 54

es exponencialmente estable. ii.) La ley de control (5.41) minimiza: { [ lím z T (t) R 3 (t) z(t) + u T (t) R 2 (t) u(t) ] } dt + x T (t 1 ) P 1 x(t 1 ) t 1 (5.42) para todo P 1 0. El valor mínimo de (5.42) está dado por: x T ( ) P ( ) x( ) (5.43) Para el caso del regulador óptimo invariante en el tiempo, las propiedades en estado estacionario, se resumen en el siguiente teorema: Teorema 5.6. Considerando el problema del regulador invariante en el tiempo para el sistema: ẋ(t) = A x(t) + B u(t) (5.44) z(t) = D x(t) y el criterio [ z T (t) R 3 z(t) + u T (t) R 2 u(t) ] dt + x T (t 1 ) P 1 x(t 1 ) (5.45) con R 3 > 0, R 2 > 0, P 1 > 0. La ecuación de Riccati asociada está dada por: P (t) = D T R 3 D P (t) B R 1 2 B T P (t) + A T P (t) + P (t) A (5.46) con la condición terminal: P (t 1 ) = P 1 (5.47) a.) Suponga que P 1 = 0. Entonces cuando t 1 la ecuación de Riccati aproxima a una constante, en estado estacionario, de valor P si y sólo si el sistema no posee polos que son al mismo tiempo inestables, incontrolables y reconstruibles. b.) Si el sistema (5.44) es completamente controlable y completamente reconstruible, la solución de la ecuación de Riccati (5.46) se aproxima a un valor único P cuando t 1 para todo P 1 0. c.) Si P existe, es una solución matriz simétrica no-negativa definida de la ecuación algebraica de Riccati: 0 = D T R 3 D P B R 1 2 B T P + A T P + P A (5.48) Si el sistema (5.44) es C.C. y C.R., P es la única solución matriz simétrica positiva definida de la ecuación (5.48). d.) Si P existe, la ley de control en estado estacionario: es A.E si y sólo si el sistema (5.44) es C.C. y C.R. u(t) = F (t) x(t) (5.49) F (t) = R 1 2 B T P (5.50) 55

e.) Si el sistema (5.44) es C.C. y C.R., la ley de control en estado estacionario minimiza: { [ lím z T (t) R 3 z(t) + u T (t) R 2 u(t) ] } dt + x T (t 1 ) P 1 x(t 1 ) (5.51) t 1 para todo P 1 0. Para la ley de control en estado estacionario el criterio (5.44) toma el valor: x T ( ) P x( ) (5.52) 5.2.3. Solución del problema del regulador invariante en el tiempo por diagonalización Se verá la solución en estado estacionario del problema del regulador invariante en el tiempo. Veremos como calcular computacionalmente la solución en estado estacionario, P, de la ecuación de Riccati, derivar información sobre los polos del regulador en lazo cerrado y su comportamiento. Teorema 5.7. Considerar el P.R.O.L.D.I.T. y suponer que el sistema: ẋ(t) = A x(t) + B u(t) (5.53) z(t) = D x(t) es C.C. y C.R.. Se define la matriz 2nx2n: A Z = D T R 3 D B R 1 2 B T A T (5.54) y se asume que Z tiene 2n valores característicos distintos. Entonces: a.) Si λ es un valor característico de Z, λ también es un valor característico. Z no tiene valores característicos con parte real cero. b.) Los valores característicos del regulador óptimo en lazo cerrado son aquellos valores característicos de Z que tiene parte real negativa. c.) Si Z es diagonalizable en la forma: Z = W [ Λ 0 0 Λ ] W 1 (5.55) donde la matriz diagonal Λ tiene como elementos de la diagonal los valores característicos de Z con parte real positiva, la solución en estado estacionario de la ecuación de Riccati: se puede escribir como: P (t) = D T R 3 D P (t) B R 1 2 B T P (t) + A T P (t) + P (t) A (5.56) P = W 22 W 1 12 = V 1 12 V 11 (5.57) donde el W ij y V ij con i, j = 1, 2, se obtienen particionando W y V = W 1, respectivamente. La matriz inversa en ambas expresiones existe. d.) La respuesta en estado estacionario del regulador óptimo en lazo cerrado se puede escribir como: x(t) = W 12 e Λ(t t0) W 1 12 x 0 (5.58) 56

5.3. Regulador y servo con referencia distinta de cero. Se supuso que el estado cero es el estado de equilibrio deseado del sistema. En la práctica no siempre es verdad. En este caso, se supone que el set-point es constante por largos periodos de tiempo pero que de tiempo en tiempo es modificado. Para el caso en que la entrada u(t) tiene la misma dimensión que la variable controlada z(t) se tiene el siguiente resultado: Teorema 5.8. Consideremos el S.L.I.T. : ẋ(t) = A x(t) + B u(t) (5.59) z(t) = D x(t) donde z y u tienen las mismas dimensiones. Consideremos alguna ley de control invariante en el tiempo A.E.: u(t) = F x(t) + u (t) (5.60) Tomemos H(s) la matriz de lazo abierto: y H c (s) como la matriz de lazo cerrado: H(s) = D [si A] 1 B (5.61) H c (s) = D [si A + B F ] 1 B (5.62) Entonces H c (0) es no singular y la variable controlada z(t) se puede, bajo condiciones de estado estacionario, mantener en algún valor constante z 0 escogiendo: u (t) = H 1 c (0) z 0 (5.63) si y sólo si H(s) tenga un polinomio numerador distinto de cero que no tenga ceros en el origen. 57