You are on page 1of 73

Electrnica Industrial

UTN Facultad Regional Paran

APUNTES DE CATEDRA DE LA ASIGNATURA ELECTRONICA INDUSTRIAL

ndice
Parte I
1. Introduccin.................................................................................................................. 3
1.1. Teora de control avanzado versus teora de control convencional....................... 4
1.2. Conceptos fundamentales ...................................................................................... 5
2. Representacin de sistemas en espacio de estado ........................................................ 9
2.1. Representacin en espacio de estado de sistemas lineales en tiempo continuo. ... 9
2.1.1. Representacin en espacio de estado de sistemas de ecuaciones diferenciales
lineales de orden n. ................................................................................................... 9
2.1.2. No unicidad del conjunto de variables de estado ......................................... 11
2.1.3. Solucin de la ecuacin de estado lineal invariante en el tiempo ................ 12
2.2. Representacin en espacio de estado de sistemas lineales en tiempo discreto.... 14
2.2.1. Formas cannicas para ecuaciones en el espacio de estado en tiempo
discreto. .................................................................................................................. 14
2.2.2. Controlabilidad y alcanzabilidad de sistemas lineales en tiempo discreto... 16
2.2.3. Observabilidad de sistemas lineales en tiempo discreto............................... 20
2.2.4. Observadores de estado ................................................................................ 23
2.2.5. No unicidad de la representacin en el espacio de estado............................ 27
2.2.6. Solucin de la ecuacin de espacio de estado en tiempo discreto e invariante
en el tiempo ............................................................................................................ 28
2.2.7. Discretizacin de una ecuacin de estado en tiempo continuo .................... 29
2.3. Representacin en espacio de estado de sistemas no lineales ............................. 30
2.3.1. Linealizacin de modelos no lineales........................................................... 31
2.4. Estados de equilibrio. Diagramas en el plano de fase ......................................... 31
2.5. Rutinas de Matlab relacionadas al captulo ......................................................... 36
2.6. Referencias bibliogrficas ................................................................................... 37
3. Concepto de estabilidad de Liapunov......................................................................... 39
3.1 Concepto de Estabilidad e Inestabilidad............................................................... 40
3.2. Teorema de estabilidad de Liapunov................................................................... 44
3.2.1. Anlisis de estabilidad de Liapunov para sistemas LTI autnomos en tiempo
continuo .................................................................................................................. 47
3.2.2. Anlisis de estabilidad de Liapunov para sistemas LTI autnomos en tiempo
discreto ................................................................................................................... 48
3.3. Rutinas de Matlab relacionadas al captulo ......................................................... 50
3.4. Referencias bibliogrficas ................................................................................... 51
4. Introduccin a la teora de optimizacin de funciones. Introduccin al control ptimo
(LQR) ............................................................................................................................. 53
4.1. Definiciones preliminares (Convexidad de conjuntos y funciones).................... 53

Alejandro H. Gonzlez

Electrnica Industrial

UTN Facultad Regional Paran

4.2. Optimizacin sin restricciones............................................................................. 62


4.3. Optimizacin con restricciones. .......................................................................... 65
4.3.1. Programacin convexa ................................................................................. 66
4.3.2. Condiciones geomtricas de optimalidad ..................................................... 67
4.3.4. Problemas con restricciones de igualdad y desigualdad............................... 71
4.3.5. Condiciones necesarias de Fritz John........................................................... 72
4.3.6. Condiciones necesarias de Karush-Kuhn-Tucker......................................... 76
4.3.7. Condiciones suficientes de Karush-Kuhn-Tucker........................................ 78
4.3.8. Programacin cuadrtica .............................................................................. 78
4.4. Dualidad Lagrangiana ......................................................................................... 79
4.4.1. Interpretacin geomtrica ............................................................................. 80
4.4.2. Dualidad fuerte y dualidad dbil .................................................................. 82
4.5. Conceptos bsicos de control ptimo. Regulador cuadrtico lineal (LQR) ........ 86
4.5.1. Regulador cuadrtico lineal en tiempo discreto ........................................... 92
4.5.2. Regulador cuadrtico lineal en tiempo discreto con horizonte infinito........ 99
Parte II
5. Control predictivo basado en modelos ..................................................................... 103
5.1. Ventajas y desventajas de MPC ........................................................................ 103
5.1.1. Importancia de las restricciones: ................................................................ 104
5.2. Formulacin bsica............................................................................................ 104
5.3. Modelos de prediccin ...................................................................................... 106
5.4. Problema de optimizacin on-line de MPC....................................................... 108
5.5. DMC (Acrnimo derivado del ingls Dynamic Matrix Control) ...................... 109
5.6. MPC con realimentacin de salida .................................................................... 111
5.7. Observador en estado estacionario .................................................................... 112
5.8. Eliminacin de offset en MPC .......................................................................... 113
5.9. Referencias bibliogrficas ................................................................................. 114
6. Estabilidad de los controladores predictivos ............................................................ 117
6.1. Definiciones preliminares.................................................................................. 117
6.2. Formulacin general MPC estable. Teorema de Mayne ................................... 121
6.3. Casos particulares. IHMPC y MPC Dual con LQR como control terminal...... 126
6.4. MPC con estabilidad garantizada, aplicable a procesos industriales (IHMPC) 133
6.5. Necesidad de restricciones terminales............................................................... 135
6.6. Extensin del dominio de atraccin. Estrategia de dos etapas de optimizacin 138
6.7. Referencias bibliogrficas ................................................................................. 141
7. Control predictivo robusto........................................................................................ 143

Alejandro H. Gonzlez

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

1.1. Teora de control avanzado versus teora de control conven-

Parte I

cional

1. Introduccin

En esta seccin se expondrn las diferencias entre el control clsico, basado en el uso
de funciones de transferencias, y el control avanzado, basado en el uso de espacio de

En apenas cincuenta aos el control automtico ha irrumpido como una disciplina pujante y de gran inters no slo cientfico y tecnolgico, sino tambin econmico. Los
sistemas de control automtico, que tienen sus orgenes en la ms remota antigedad,
han sustentado su desarrollo en las matemticas aplicadas y se estn convirtiendo, de
manera cada vez ms acentuada, en componentes esenciales y crticos de cualquier sistema dinmico, incluso en campos diferentes de los tradicionales en ingeniera.

estado. Una diferencia entre la teora de control moderna (o control avanzado) y la teora de control convencional es que la primera es aplicable a sistemas de mltiples entradas y mltiples salidas (MIMO), que pueden a su vez ser lineales o no-lineales, variantes o invariantes en el tiempo, mientras que la ltima es aplicable slo a sistemas lineales, invariantes en el tiempo, y con una sola entrada y una sola salida (SISO). Adems,
la teora de control avanzado es esencialmente un abordaje en el dominio temporal,
mientras que la teora convencional lo es en el poco intuitivo dominio de las frecuen-

Dentro del control automtico, se puede hablar de control clsico y control moderno o
avanzado. La teora de control clsico basa sus desarrollos en modelos de en el dominio
frecuancial, mientras que la teora de control avanzado lo hace en representaciones de
espacio de estado (dominio temporal), que son modelos matemticos de sistemas fsicos

cias.
Para contrastar de un modo claro los campos de accin de cada uno de estos abordajes, considrese la Tabla 1.1:

que relaciona conjuntos de variables de entrada, salida y estados del sistema por medio

Teora de control conven-

Teora de control avan-

de ecuaciones diferenciales de primer orden. Para dar cuenta de sistemas con mltiples

cional

zado

entradas y salidas, las variables se expresan en forma vectorial, de modo que las ecuaciones diferenciales toman una forma matricial-vectorial.
Dentro de las representaciones en espacio de estado, existen dos clasificaciones im-

Lineales, invariantes en el

rados

tiempo y SISO

Dominio de trabajo

Dominio de las frecuencias

Dominio temporal

Slo funciones especficas

Permite el uso de una serie

portantes, de acuerdo con los tipos de sistemas que se quieren modelar, y de acuerdo a
la naturaleza de la variable tiempo1. Por un lado se tienen sistemas lineales y no linea-

Lineales o No-lineales,

Tipos de sistema conside-

variantes o invariantes en
el tiempo, MIMO

les; por otro, sistemas en tiempo continuo o en tiempo discreto. Dada su importancia
terica y conceptual, la primera parte de este curso estar destinada a presentar y anali-

de entrada: funciones im-

de entradas arbitrarias en

tinuo como de tiempo discreto. No obstante, el inters principal estar puesto siempre

pulso, escaln, sinusoida-

lugar de funciones espec-

en los sistemas lineales de tiempo discreto (a la cual estar dedicada la segunda parte

les, etc.

ficas

No permite tener en cuenta

Permite tener en cuenta las

las condiciones iniciales

condiciones iniciales

Basados en mtodos de

Permiten el diseo de sis-

zar conceptos relacionados con sistemas tanto lineales como no lineales, de tiempo con-

Entradas

del curso con exclusividad), dado que es ste el enfoque de ms utilidad para el control
industrial.

Condiciones iniciales

Diseo de sistemas de

Tambin se podra incluir aqu la clasificacin de acuerdo a la variabilidad de los parmetros del modelo
respecto del tiempo. As, se tienen sistemas variantes e invariantes en el tiempo.

Alejandro H. Gonzlez

Alejandro H. Gonzlez

Electrnica Industrial

control

UTN Facultad Regional Paran


temas de control ptimo,

libre albedro no exista, ya que todo estaba determinado. Se podra decir, sin temor a

permiten sistemas de con-

respecto de determinados

exagerar, que las ideas que subyacen a la teora de espacio de estado son la materializa-

trol ptimo

ndices de desempeo

cin de las ideas de Laplace, aplicadas no ya al vasto y esquivo universo, sino a modes-

de primer orden, para sis-

Descripcin del sistema

UTN Facultad Regional Paran

prueba y error, que no

n-ecuaciones diferenciales

Morfologa

Electrnica Industrial

Relacin polinmica entrada-salida

temas descriptos por ecuaciones diferenciales de

tas porciones de ste, como lo son los sistemas dinmicos.


Algunos conceptos fundamentales con los que se trabajar en los sucesivos captulos
son los siguientes:
Estado. Es el conjunto mnimo de variables (llamadas variables de estado) tales que

orden n (ordenacin matri-

su conocimiento en un instante t = t0 , junto con el conocimiento de la entrada para t t0 ,

cial)

determina completamente el comportamiento del sistema para todo tiempo t t0 . De

Descripcin externa del

Descripcin interna del

este modo, el estado de un sistema dinmico en el tiempo t queda unvocamente deter-

sistema

sistema

minado por el estado al tiempo t0 y la entrada para t t0 , y es independiente de los esta-

Tabla 1.1. Comparacin entre la teora de control convencional y la teora de control

dos y entradas anteriores al tiempo t0.


El concepto de estado no est limitado a sistemas fsicos; tambin es aplicable a sis-

avanzado.

temas biolgicos, sistemas econmicos, sistemas sociales y otros.

1.2. Conceptos fundamentales

Variable

El matemtico francs Pierre Simn de Laplace (1749-1827) afirmaba, categrico,

( x1 ( t ) , x2 ( t ) ,

de

Estado.

Es

el

conjunto

ms

pequeo

de

variables

, xn ( t ) ) que determinan el estado del sistema dinmico. Ntese que las

que si se conociera la velocidad y la posicin de todas las partculas del Universo en un

variables de estado no necesitan ser cantidades fsicamente medibles u observables, si

instante dado, entonces se podra predecir su pasado y futuro para el resto de los siglos.

bien es deseable que lo sean, segn ciertas condiciones de diseo de controladores.


Vector de Estado. Si x1 ( t ) , x2 ( t ) ,

Lo deca con estas elocuentes palabras:


Podemos mirar el estado presente del universo como el efecto del pasado y la
causa de su futuro. Se podra condensar un intelecto que en cualquier momento dado

, xn ( t ) son las n variables de estado que descri-

ben completamente el comportamiento dinmico del sistema, entonces dichas n variables de estado son las n componentes del vector de estado x ( t ) .

sabra todas las fuerzas que animan la naturaleza y las posiciones de los seres que la
componen, si este intelecto fuera lo suficientemente vasto para someter los datos al
anlisis, podra condensar en una simple frmula de movimiento de los grandes cuer-

Estas variables de estado se representan en un vector denominado vector de estado,


por lo tanto un vector de estado es aquel que determina de manera unvoca el estado del

pos del universo y del tomo ms ligero; para tal intelecto nada podra ser incierto y

sistema x ( t ) para cualquier tiempo t t0 , una vez que se obtiene el estado en t = t0 y se

el futuro as como el pasado estaran frente sus ojos.

especifica la entrada u ( t ) para t t0 .

Existen, claro est, dificultades obvias para satisfacer la propuesta de Laplace, pero

Espacio de Estado. Es el espacio de n dimensiones, cuyos ejes estn formados por

por ms de cien aos su afirmacin pareci correcta y, ms an, la aplicacin literal de

los n ejes que forman las n variables de estado necesarias para describir completamente

esos conceptos al comportamiento humano condujo a la conclusin filosfica de que el

Alejandro H. Gonzlez

el comportamiento dinmico del sistema.

Alejandro H. Gonzlez

Electrnica Industrial

UTN Facultad Regional Paran

Ntese que en el anlisis en el espacio de estado se habla de tres tipos de variables,


variables de entrada, de salida y de estado.

Alejandro H. Gonzlez

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

x1 = y
x2 = y

2. Representacin de sistemas en espacio de estado

n 1

2.1. Representacin en espacio de estado de sistemas lineales en


tiempo continuo.

xn = y .
Luego, la Ec.(2.1) puede ser escrita como
x1 = x2

Un sistema dinmico formado por un nmero finito de elementos puede ser descrito
por una ecuacin diferencial ordinaria en la cual el tiempo es la variable independiente.
Por medio del uso de una notacin vectorial-matricial, una ecuacin diferencial de or-

x2 = x3
xn = an x1

a1 xn + u,

den n puede ser representada por una nica ecuacin vectorial-matricial de primer or-

den. Si los n elementos de un vector representan un conjunto de variables de estado,

x = Ax + Bu ,

entonces la ecuacin diferencial vectorial-matricial se llama ecuacin de estado. Se presentarn a continuacin algunos mtodos para obtener representaciones en espacio de
estado de sistemas en tiempo continuo.

2.1.1. Representacin en espacio de estado de sistemas de ecuaciones diferenciales lineales de orden n.

(2.2)

donde
x1
x
2

x=

x
n 1
xn

0
0

=
,
vector
de
estado
A
(
)

0
an

1
0

0
1

0
an 1

0
an 2

0
0

1
a1

0
0

n n
, B =

0
1

n1

Considrese un sistema lineal SISO descrito por la siguiente ecuacin diferencial de

La ecuacin de salida queda finalmente

orden n:
( n)

( n 1)

y + a1 y +

y = Cx ,
+ an 1 y + an y = u

Tomando en cuenta que el conocimiento de y ( 0 ) , y ( 0 ) ,

donde
( n 1)

, y ( 0 ) , junto con el co-

nocimiento de la entrada para t t0 , determina completamente el comportamiento del


sistema en el futuro, se pueden tomar las variables y ( t ) , y ( t ) ,

( n 1)

, y ( t ) como un con-

junto de n variables de estado.

y es la salida del sistema, y C = [1 0

0]

1 n

Una representacin en diagrama de bloques de las ecuaciones mostradas puede verse


en la Figura 2.1. Para dar generalidad a la representacin se ha agregado un trmino a la
ecuacin de salida, esto es, y = Cx + Du . La matriz D vincula la salida instantnea con
la entrada

Defnase

Alejandro H. Gonzlez

(2.3)

(2.1)

Alejandro H. Gonzlez

10

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

2.1.3. Solucin de la ecuacin de estado lineal invariante en el tiempo


D
Solucin de la ecuacin de estado homognea. Considrese la ecuacin diferencial

vectorial-matricial
B

x = Ax

donde x

(2.4)
n

n n

, A

Se supondr ahora una solucin x ( t ) de la forma

x ( t ) = b0 + b1t + b2t 2 +

Figura 2.1. Representacin en diagrama de bloques de las Ec. (2.2) y (2.3)

+ bk t k +

(2.5)

donde tanto x ( t ) como los coeficientes bi , i = 1, 2,

Ejemplo:

son vectores. Sustituyendo la

supuesta solucin (2.5) en la Ec. (2.4) se obtiene

A partir del sistema definido por: y + 6 y + 11 y + 6 y = 6u , obtngase una representacin en espacio de estado.

b1 + 2b2t + 3b3t 2 +

+ kbk t k 1 +

= A ( b0 + b1t + b2t 2 +

+ bk t k +

).

(2.6)

Ahora bien, si esta solucin supuesta es la verdadera solucin, entonces la Ec (2.6) debe

2.1.2. No unicidad del conjunto de variables de estado

cumplirse para cualquier t. De este modo, igualando coeficientes de igual potencia en t,

El conjunto de variables de estado que representa a un dado sistema no es nico. Supngase que x1 , x2 ,

, xn es un conjunto de variables de estado. Entonces, puede consi-

, xn )

x2 = X 2 ( x1 , x2 ,

, xn )

xn 1 = X n ( x1 , x2 ,

1
1
Ab1 = A2b0
2
2
1
1 3
b3 = Ab2 =
A b0
3
23

valores x1 , x2 ,

bk =

, xn ) ,

siempre que, a cada conjunto de valores x1 , x2 ,

, xn corresponda un nico conjunto de

, xn , y viceversa. De este modo, si x es un vector de estado, entonces x ,

con x = Px , es tambin un vector de estado, siempre que la matriz P sea no singular.


Vectores de estado diferentes llevan consigo la misma informacin relacionada al comportamiento del sistema.

Alejandro H. Gonzlez

b1 = Ab0
b2 =

derarse otro conjunto de variables de estado a cualquier conjunto de funciones,


x1 = X 1 ( x1 , x2 ,

se obtiene

11

1 k
A b0 .
k!

El valor de b0 se determina al sustituir t = 0 en la Ec (2.5), esto es, x ( 0 ) = b0 . De este


modo, la solucin x ( t ) se puede escribir como
1

x ( t ) = I + At + A2t 2 +
2!

= e At x ( 0 ) .

Alejandro H. Gonzlez

1 k k
At +
k!

x ( 0)

12

Electrnica Industrial

UTN Facultad Regional Paran

Ntese que la expresin entre parntesis es precisamente la definicin de la matriz


nn

exponencial e At

. Dado que la matriz exponencial es de uso frecuente en el anli-

sis de sistemas lineales en el espacio de estado, se examinarn a continuacin sus propiedades.


Solucin de la ecuacin de estado no homognea. Considrese ahora la ecuacin

diferencial vectorial-matricial no homognea


x = Ax + Bu

donde x

(2.7)
n

, u

nu

, A

n n

n nu

, B

Electrnica Industrial

UTN Facultad Regional Paran

La Ec. (2.8) es la solucin de la Ec (2.7), y en ella puede verse la suma de un trmino


que representa la transicin del estado inicial y un trmino que da cuenta de la accin de
la entrada.

2.2. Representacin en espacio de estado de sistemas lineales en


tiempo discreto
Una forma general de representar en espacio de estado un sistema lineal en tiempo
discreto, variante en el tiempo (LTV), es la siguiente:

Reescribiendo (2.7) como

x ( k + 1) = A ( k ) x ( k ) + B ( k ) u ( k )

x ( t ) Ax ( t ) = Bu ( t ) ,

y (k ) = C (k ) x (k ) + D (k )u (k ) ,

y pre-multiplicando por e At

n n

donde x ( k )

ambos lados de la ecuacin, se obtiene

u (k )

d At
e x ( t ) = e At Bu ( t ) . 2
dt

e At x ( t ) Ax ( t ) =

C (k )

Integrando ahora la ecuacin anterior entre 0 y t, se obtiene


e

At

x (t ) = x ( 0) + e
t

nu

ny n

(2.9)

es el vector de estado, y ( k )

es

el

, D (k )

vector
ny nu

de

entrada,

ny

es el vector de salida del sistema,


y

A(k )

n n

, B (k )

son matrices variantes en el tiempo (que no deben con-

lineales invariantes en el tiempo (LTI), estas matrices son constantes, lo que quedar

Bu ( ) d ,

evidenciado escribiendo
x ( k + 1) = Ax ( k ) + Bu ( k )

x (t ) = e x ( 0) + e
t

A( t )

fundirse con las utilizadas para los sistemas en tiempo continuo). En el caso de sistemas

o
At

n nu

Bu ( ) d ,

(2.10)

y ( k ) = Cx ( k ) + Du ( k ) .

que puede ser reescrita como

En la Figura 2.2 se muestra la representacin en diagrama de bloques de las Ec. (2.9).

x ( t ) = ( t ) x ( 0 ) + ( t ) Bu ( ) d ,
t

(2.8)

con ( t ) = e At ( ( t ) es la Matriz de transicin de estado o avance).

2.2.1. Formas cannicas para ecuaciones en el espacio de estado en


tiempo discreto.
Considrese un sistema SISO en tiempo discreto descrito por
y ( k ) + a1 y ( k 1) +

En general es f ( t ) = f ( 0 ) +

f ( ) d , con

f ( t ) = e At x ( t ) y e0 = I ).

donde algunos de los coeficientes ai , i = 1, 2,

Alejandro H. Gonzlez

+ an y ( k n ) = b0u ( k ) + b1u ( k 1) +

+ bn u ( k n ) ,

, n y bi , i = 1, 2,

, n pueden ser nulos.

Esta ecuacin puede ser escrita en la forma de una funcin de transferencia, como sigue:

13

Alejandro H. Gonzlez

14

Electrnica Industrial

UTN Facultad Regional Paran

Y ( z ) b0 + b1 z 1 + + bn z n
=
.
U ( z ) 1 + a1 z 1 + + an z n

(2.11)

Electrnica Industrial

UTN Facultad Regional Paran

Forma cannica de Jordan:


Si la funcin transferencia dada por la Ec (2.11) incluye un polo mltiple de orden m

Existen numerosas representaciones en espacio de estado particulares que se conocen


como formas cannicas. Alguna de ellas son: Forma cannica controlable, Forma cannica observable, Forma cannica diagonal, Forma cannica de Jordan. A continuacin
se mostrarn la primera y la ltima.

D(k)

B(k)

C(k)

en z = p1 , y todos los dems polos son distintos, entonces la ecuacin de estado y de


salida puede ser escrita como sigue

x1 ( k + 1) p1


x2 ( k + 1) 0


x
k
+
1
(
)
m
=0
x ( k + 1) 0
m +1


x ( k + 1) 0
n

p1 1

0
0

0
0

p1
0

0
pm +1

x ( k +1)

y ( k ) = [ c1 c2

A(k)

0 x1 ( k ) 0

0 x2 ( k ) 0

0 xm ( k ) + 1 u ( k )
0 xm +1 ( k ) 1

pn xn ( k ) 1

Figura 2.2. Representacin en diagrama de bloques de la Ec. (2.10).

x( k )

x1 ( k )

x2 ( k )
+ b0 u ( k ) ,
cn ]

D
xn 1 ( k )
x (k )
n

x( k )

Forma cannica controlable:


x1 ( k + 1) 0


x2 ( k + 1) 0


x
k
+
1
(
)
n 1
0
x ( k + 1) a
n
n

0
an 1

0
an 2

x ( k +1)

y ( k ) = ( bn an b0 )

( bn1 an1b0 )
C

donde ci , i = 1, 2,

0 x1 ( k ) 0

0 x2 ( k ) 0

+ u (k )

1 xn 1 ( k ) 0
a1 xn ( k ) 1
x( k )

, n son coeficientes provenientes de la expansin en fracciones par-

ciales de la transferencia original. Para ver las deducciones de stas y otras representaciones cannicas, se remite al lector a Ogata K., 1996.

2.2.2. Controlabilidad y alcanzabilidad de sistemas lineales en tiempo


discreto

x1 ( k )

x2 ( k )
+ b0 u ( k ) .
( b1 a1b0 )

D
xn 1 ( k )
x (k )
n

En esta seccin dar respuesta a la siguiente pregunta: es siempre posible llevar un


sistema de un dado estado inicial a otro cualquiera?
Considrese un sistema LTI discreto, de orden n, bajo la representacin de estados
x ( k + 1) = Ax ( k ) + Bu ( k )

x( k )

La denominacin controlable, refiere a una propiedad de los sistemas representados

(2.12)

y ( k ) = Cx ( k ) + Du ( k ) ,

en espacio de estado que se estudiar en prximas secciones.

Alejandro H. Gonzlez

15

Alejandro H. Gonzlez

16

Electrnica Industrial

UTN Facultad Regional Paran

y supngase un estado inicial x ( 0 ) dado.

Electrnica Industrial

Ejemplos:

Definicin de controlabilidad. El sistema discreto (2.12) es de estado completamen-

te controlable, si existe una secuencia de controles, u ( k ) , tal que el origen ( x = 0 ) puede ser alcanzado a partir de cualquier estado inicial en un tiempo finito.
Definicin de alcanzabilidad. El sistema discreto (2.12) es alcanzable, si existe una

secuencia de controles, u ( k ) , tal que un estado arbitrario puede ser alcanzado a partir

1)

Ntese que controlabilidad no implica alcanzabilidad, lo que puede inferirse de


(2.12). Si An x ( 0 ) = 0 , entonces el origen ser alcanzable con la entrada nula, u ( k ) = 0 ,
pero el sistema no es necesariamente alcanzable. Los conceptos de controlabilidad y
alcanzabilidad son equivalentes cuando la matriz A es invertible.

tema es de orden 2. Los estados alcanzables a partir del origen son aquellos que se pueden obtener de la combinacin lineal de columnas de Wc.
2)

1
1
1
2
Sea el sistema x ( k + 1) =
x ( k ) + 0.5 u ( k ) , y x ( 0 ) = 2 . Es po0.25
0

0.5
sible encontrar una secuencia de controles tales que x ( 2 ) =
?
1

De (2.12) se tiene que


x ( 2 ) = A2 x ( 0 ) + ABu ( 0 ) + Bu (1) , esto es

A partir de las definiciones anteriores resulta sencillo probar el siguiente teorema.


Teorema 1.1. El sistema de discreto (2.12) es alcanzable si y slo si rango (Wc ) = n ,

An 1 B es la matriz de controlabilidad de estados del siste-

AB

1 0
1
Sea el sistema x ( k + 1) =
x ( k ) + u ( k ) . Este sistema no es alcanzable,

0 1
1

1 1
dado que la matriz de conrtolabilidad Wc =
, tiene rango=1, mientras que el sis1 1

de cualquier estado inicial en un tiempo finito.

donde Wc = B

UTN Facultad Regional Paran

ma.

4 0.5u ( 0 ) + u (1)
2 = 0.25u 0 0.5u 1 .
( )
( )

Las dos ecuaciones que propone la igualdad anterior, son linealmente dependientes.
Por lo tanto, no existe una nica solucin. Una posible secuencia de controles que lleva

Prueba. El estado en el instante n (orden del sistema) vendr dado por:

x ( n ) = An x ( 0 ) + An 1 Bu ( 0 ) +

+ ABu ( n 2 ) + Bu ( n 1)

= An x ( 0 ) + WcU ,

(2.13)

0.5
Sin embargo, si ahora se desea llevar el sistema a x = , se tiene
1

donde
Wc = B

AB

An 1 B ,

U = u T ( n 1) u T ( n 2 )

3 0.5u ( 0 ) + u (1)
2 = 0.25u 0 0.5u 1 ,
( )
( )

u T ( 0 ) .

Por lo tanto si el rango de la matriz es n, entonces, para un estado final arbitrario,


x ( n ) , existir una secuencia controles no acotadas, U, capaz de llevar el sistema desde

el estado inicial, x ( 0 ) , hasta el estado final. Ntese que esta solucin puede no ser nica.

Alejandro H. Gonzlez

2
0.5
el sistema de x = a x =
en dos pasos es la dada por: u ( 0 ) = 2 , u (1) = 3 .
2

1

que no tiene solucin. La razn de esto es que el sistema no es alcanzable, como se puede comprobar al calcular el rango de su matriz de controlabilidad,
0.5
1
rango (Wc ) = rango
= 1.
0.5
0.25

Dicho rango es menor al orden del sistema, que es 2.

17

Alejandro H. Gonzlez

18

Electrnica Industrial

3)

UTN Facultad Regional Paran

Electrnica Industrial

0
0.5 0
0.8
Sea el sistema x ( k + 1) =
x ( k ) + 1 u ( k ) , y x ( 0 ) = 0 . Es posi
0 0.7

UTN Facultad Regional Paran

12

x (1)

10

1
ble encontrar una secuencia de controles tales que x ( 2 ) = ? De ser posible hacerlo,
1

x2

es posible permanecer en dicho estado un instante de tiempo ms (esto es,

x ( 3) = x ( 2 ) )?
4

Al ser

x ( 2)

x (0)

0.8 0.4
rango (Wc ) = rango
= 2 = n,
1 0.7

0
-2

el sistema es alcanzable. Por tanto, utilizando la secuencia de controles u ( 0 ) = 11.2500 ,

4
x1

10

Figura 2.3. Diagrama de fases del Ejemplo 3).

u (1) = -6.8750 es posible alcanzar el estado deseado en dos pasos: el primero lleva el

Considrese ahora el caso de un cambio de variables del tipo x = Px , donde P es una

9
1
sistema a x (1) =
; el segundo, a x ( 2 ) = 1 . En la Figura 2.3 se puede ver un
11.25

matriz no singular. En las nuevas coordenadas se tiene la siguiente matriz de controlabi-

diagrama de fase de la evolucin del sistema. Ahora bien, una vez all, si se quiere dejar

Wc = B

el sistema en el mismo estado, implementando un nuevo control, u ( 3) , se tiene

lidad:

AB

A n 1 B ,

donde las matrices A y B son las matrices del espacio de estado transformado (segn

0.5 0
0.8
x ( 3) = x ( 2 ) =
x ( 2 ) + 1 u ( 2 ) , o bien
0
0.7

se ver oportunamente, estas matrices son A = PAP 1 y B = PB ). La matriz Wc puede


ser escrita en trminos de las matrices originales como sigue:

0.5 0
0.8
0 0.3 x ( 2 ) = 1 u ( 2 ) ,

Wc = PB PAP 1 PB

y no existe ningn control u ( 2 ) que satisfaga esa condicin. Esto se debe a que el sistema tiene una determinada dinmica, que hace imposible dejarlo, en un paso, en el es-

PAn 1 P 1 PB = PWc .

Por lo tanto, Wc y Wc tendrn el mismo rango, lo que significa que la alcanzabilidad


es una propiedad inherente al sistema, y no depende de las coordenadas.

1
tado deseado. Ntese que es posible llevar el sistema desde el origen a x = en tres
1

2.2.3. Observabilidad de sistemas lineales en tiempo discreto

pasos; una forma trivial de lograr esto, es aplicar el control nulo u = 0 en el primer pa-

En esta seccin dar respuesta a la siguiente pregunta: cmo determinar el estado de

so, y despus repetir la secuencia calculada en la primera parte del ejercicio.

un sistema a partir de la observacin de las entradas y salidas? Ms concretamente, la


observabilidad de un sistema indica si es posible obtener el vector de variables de estado (no medibles en forma directa) a partir de las mediciones de la salida. Esto ltimo es
de suma utilidad para implementar controles con realimentacin de estados.

Alejandro H. Gonzlez

19

Alejandro H. Gonzlez

20

Electrnica Industrial

el

UTN Facultad Regional Paran

Electrnica Industrial

Considrese un sistema LTI discreto, de orden n, como el dado por (2.12).

Ejemplo:

Observabilidad. El sistema dado por (2.12) es observable si existe un k finito tal que

1)

conocimiento

y ( 0 ) , y (1) ,

de

las

u ( 0 ) , u (1) ,

entradas

, u ( k 1) ,

las

salidas

, y ( k 1) , es suficiente para determinar el estado inicial del sistema.

Teorema 1.2. El sistema de tiempo discreto (2.12) es observable si y slo si

UTN Facultad Regional Paran

Sea el sistema autnomo (sin entradas)

1.1 0.3
x ( k + 1) =
x (k )
0
.
1
y ( k ) = [1 0.5] x ( k )

es la matriz de observabi

C 1 0.5
La matriz de observabilidad es Wo = =
, y su rango es 1 mientras que
CA 0.6 0.3

lidad del sistema. De no cumplirse esa condicin, se dice que los estados x ( 0 ) tales que

el sistema es de orden 2. De este modo, los estados no observables pertenecen al espacio

x ( 0 ) null (Wo ) 3, son estados no observables.

nulo de Wo, esto es, [ 0.5 1] . En la Figura 2.4 se muestran las salidas correspondientes

T
rango (Wo ) = n , donde Wo = ( C )

( CA)

( CA )

n 1 T

Prueba. Para simplificar la explicacin, se supondr que u ( k ) = 0 , para todo k, y que


y ( 0 ) , y (1) ,

, y ( n 1) , con n=orden del sistema, son conocidos. As, se puede escribir

los

siguientes

estados

x ( 0 ) = [ 0.5 1] ,

x ( 0 ) = [1.5 0.5] ,

iniciales:

x ( 0 ) = [ 2.5 0] y x ( 0 ) = [1 0.5] .
T

1.5

y ( 0 ) = Cx ( 0 )

1.4

1.2

y (1) = Cx (1) = CAx ( 0 )

x ( 0 ) = [ 0.5 1]

x ( 0 ) = [1.5 0.5]

0.8

y ( n 1) = CAn 1 x ( 0 ) ,

0.6

0.5

o,

0.4

Wo x ( 0 ) = Y ,

0.2

0
0

10

12

14

donde
2.5

y ( 0)
C

CA
y 1
, Y = ( ) .
Wo =

n 1
y
n
1

CA
(
)

10

12

14

12

14

1.4

1.2
2
1

x ( 0 ) = [ 2.5 0]

y
0.6

Por lo tanto, el estado x ( 0 ) quedar determinado s y slo si rango (Wo ) = n .

x ( 0 ) = [1 0.5]

0.8

1.5

0.4
0.5
0.2

Al igual que ocurre con la alcanzabilidad, la observabilidad es una propiedad del sis0

tema, y por lo tanto es independiente del sistemas de coordenadas utilizado.

8
k

10

12

14

10

Figura 2.4. Salidas del sistema correspondientes a diferentes estados iniciales


3

null (Wo ) refiere al espacio nulo de la matriz Wo.

Alejandro H. Gonzlez

21

Alejandro H. Gonzlez

22

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

La ecuacin de estado del Observador es

2.2.4. Observadores de estado


En los sistemas no siempre es posible medir directamente los estados. Normalmente
se dispone slo de un modelo matemtico del sistema y de las entradas y salidas. Existen diferentes formar de lograr una estimacin de los estados a partir de las variables
conocidas, utilizando lo que se conoce como observadores de estado. A continuacin, se
expondrn algunas de ellas.

x ( k + 1) = Ax ( k ) + Bu ( k ) + L y ( k ) y ( k )

(2.14)

y ( k ) = Cx ( k )

Ntese que si x ( 0 ) = x ( 0 ) , y dado que las matrices A, B, y C del observador son


exactamente las de la planta real, entonces se tiene: x ( k ) = x ( k ) , y entonces las ecuaciones (2.12) y (2.14) son idnticas (no hay discrepancia entre el estado observado y el

Observador clsico o de prediccin

real). De aqu se deduce el hecho, no siempre obvio, de que cuando la planta es igual al
Considrese nuevamente un sistema LTI discreto, de orden n, como el dado por
(2.12).
x ( k + 1) = Ax ( k ) + Bu ( k )

Si se arma un nuevo vector de estados que sea la diferencia (error) entre el estado es-

(2.12)

timado y el estado real, se tiene

y ( k ) = Cx ( k ) + Du ( k ) ,

e ( k + 1) = ( A LC ) x ( k ) ( A LC ) x ( k )

Como se desea estimar el estado x ( k ) a partir de la secuencia de las entradas


u ( k ) , u ( k 1) ,

modelo, el problema de necesitar un observador reside en que se desconoce x ( 0 ) .

y salidas y ( k ) , y ( k 1) ,

= ( A LC ) e ( k )

(2.15)

, el sistema debe ser completamente ob-

De este modo, eligiendo adecuadamente los autovalores de (A-LC) se puede conse-

servable. La ecuacin del observador es una copia del modelo con realimentacin de la

guir la convergencia de x ( k ) a x ( k ) con una velocidad arbitrariamente grande. Ntese

diferencia entre la salida medida proveniente de la planta real y la salida estimada segn

que si L=0, entonces x ( k ) tiende a x ( k ) con la misma velocidad del sistema. Esto es,

el modelo. La Figura 2.5 muestra el esquema general del observador.

en el equilibrio (cuando x ( k + 1) = x ( k ) ) ambos estados, el real y el estimado, coincidi-

u(k)

z-1

x(k)

rn; pero fuera del equilibrio el estado estimado sigue al real sin alcanzarlo. Por otro

y(k)
C

lado, el tomar L 0 ayuda a corregir discrepancias entre las matrices A y B reales y las
respectivas matrices estimadas en el observador (notar que se considera planta igual a

modelo). Resumiendo, dependiendo de la matriz L de realimentacin del error de salida,

Planta

se conseguir un estimador de x(k) ms o menos aceptable.


+
-

L
x ( k + 1)
B

-1

Observador actualizado

x ( k )
C

Hasta aqu se ha considerado lo que se llama observador de prediccin, pues el estado

y ( k ) = Cx ( k )

estimado al tiempo k usa la informacin de salida al tiempo k-1. Ntese que en (2.14) el
A

estado estimado al tiempo k no depende de y(k) sino de y(k-1). La idea ahora es aproveObservador

char y(k), que es conocida al tiempo k, para obtener el estimador del estado al tiempo k.

Figura 2.5. Esquema general del observador de prediccin.

Alejandro H. Gonzlez

Para ello se divide la ecuacin del observador en dos partes:

23

Alejandro H. Gonzlez

24

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

Actualizacin de la medicin o correccin


innovacion

x ( k ) = x ( k ) + Laux y ( k ) y ( k )

Cx ( k )

(2.16)

Actualizacin temporal o prediccin 4


x ( k + 1) = Ax ( k ) + Bu ( k )

(2.17)

Adems de las anteriores actualizaciones, se tiene la ecuacin de salida


y ( k ) = Cx ( k )

(2.18)

Figura 2.6. Esquema general del observador actualizado.

En las ecuaciones anteriores, x ( k ) es una estimacin (o pseudo estimacin) basada


en la prediccin hecha en el tiempo anterior, mientras que x ( k ) es la estimacin basada

Ahora bien, la ecuacin (2.16) desplazada un instante hacia delante es


x ( k + 1) = x ( k + 1) + Laux Cx ( k + 1) Cx ( k + 1) .

en la medicin de la salida ms reciente. Se presenta ahora un esquema (Figura 2.6) del

Y, segn la actualizacin temporal (), x ( k + 1) = Ax ( k ) + Bu ( k ) , queda 5

observador actualizado, en donde aparece explcito x ( k ) , es decir, el estado estimado

x ( k + 1) = Ax ( k ) + Bu ( k ) + Laux Cx ( k + 1) C { Ax ( k ) + Bu ( k )} ,

que proporciona el observador al eventual controlador.


Es importante notar que la salida del observador es x ( k ) , pues esa es la mejor

que es una expresin slo de x .

estimacin del estado actual, y es lo que precisa MPC para hacer la prediccin.

Ahora, si se resta (2.20) de la primera ecuacin de (2.12) se tiene

Para analizar la convergencia del error de estimacin en el observador actualizado


(caso A, B y C conocidas), se define el error como
e ( k ) = x ( k ) x ( k )

(2.20)

(2.19)

o, lo que es igual,

e ( k + 1) = Ae ( k ) Laux CAe ( k ) ,

o,
e ( k + 1) = ( A Laux CA ) e ( k )

donde se recuerda una vez ms el detalle de que se supone que A, B y C son perfecta-

e ( k + 1) = x ( k + 1) x ( k + 1) .

mente conocidas por el observador. En este caso, vemos que la velocidad de convergencia del error de estimacin a cero vendr dada por la matriz ( A Laux CA ) .

4
Observaciones:
1 - x ( k ) , que es la estimacin de x(k) al tiempo k, depende de y(k).

2 - x ( k ) es la pseudo estimacin de x(k), utilizando y(k-1). Para ver esto, escrbase la actualizacin temporal o prediccin en k: x ( k ) = Ax ( k 1) + Bu ( k 1) ; donde a su vez, x ( k 1) proviene de la actualizacin de la medicin x ( k 1) = x ( k 1) + Laux y ( k 1) y ( k 1) .

Alejandro H. Gonzlez

25

Esta ecuacin es importante en el anlisis de eliminacin de offset de los controladores.

Alejandro H. Gonzlez

26

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

2.2.5. No unicidad de la representacin en el espacio de estado

UTN Facultad Regional Paran

2.2.6. Solucin de la ecuacin de espacio de estado en tiempo discreto e

Como se puede intuir de lo visto hasta ahora, una dada funcin de transferencia admi-

invariante en el tiempo

te ms de una representacin en espacio de estado. Sin embargo, todas las ecuaciones de


estado correspondientes a un mismo sistema estn relacionadas entre s por medio de
una transformacin de similaridad.

Considrense nuevamente las Ec. (2.12). La solucin a esta ecuacin puede obtenerse
recursivamente como
x (1) = Ax ( 0 ) + Bu ( 0 )

Considrese el sistema definido por las Ec. (2.12). Si se define ahora un nuevo vector
n n

de estado dado por x = Px , o, suponiendo que P

es no singular, x = P 1 x , enton-

x ( 2 ) = Ax (1) + Bu (1) = A2 x ( 0 ) + ABu ( 0 ) + Bu (1)


x ( 3) = Ax ( 2 ) + Bu ( 2 ) = A3 x ( 0 ) + A2 Bu ( 0 ) + ABu (1) + Bu ( 2 )

ces las Ec.(2.2) pueden ser escritas en trminos del nuevo vector de estado como sigue:
P 1 x ( k + 1) = AP 1 x ( k ) + Bu ( k )

Mediante la simple repeticin de este procedimiento se obtiene


k 1

y ( k ) = CP 1 x ( k ) + Du ( k ) .

x ( k ) = Ak x ( 0 ) + Ak j 1 Bu ( j ) ,

k = 1, 2,

(2.21)

j =0

Pre-multiplicando ahora ambos lados de esta ecuacin por P, y definiendo

A = PAP 1 , B = PB , C = CP y D = D se tiene finalmente

Ntese que x ( k ) est formada por dos partes, una que representa la transicin o
avance del estado inicial y otra que da cuenta de la accin de la entrada. La salida y ( k )

( k ) + Bu
(k )
x ( k + 1) = Ax

est dada por

( k ) + Du
(k ) ,
y ( k ) = Cx

k 1

que son ecuaciones de estado y salida equivalentes a las originales. (Ntese que si bien

y ( k ) = CAk x ( 0 ) + C Ak j 1 Bu ( j ) + Du ( k ) .

los estados han cambiado, la entrada y la salida son los originales). La matriz P recibe el
nombre de matriz de transformacin, y es la que permite pasar de una representacin a

(2.22)

j =0

De esta ltima ecuacin se puede inferir que la matriz de transicin de estado esta dada por ( k ) = Ak .

otra.
La

matriz

P,

A = PAP 1 = diag ( p1

por

ejemplo,

podra

escogerse

pn ) , donde pi , i = 1, 2,

de

modo

tal

que

, n son los autovalores de la ma-

Esta matriz es nica y satisface


( k + 1) = A ( k ) , ( 0 ) = I .

En trminos de la matriz de transicin de estado, las Ec. (2.21) y (2.22) pueden res-

triz A original (polos del sistema), si es que stos fueran distintos entre s. Si no lo fueran, P podra escogerse de modo que A = PAP 1 = matriz diagonal de Jordan, que es una

cribirse como

generalizacin del primer caso. Una importante propiedad de la transformacin lineal es

x ( k ) = ( k ) x ( 0 ) + ( k j 1) Bu ( j )

que cualquiera sea P, los elementos de la diagonal principal de la matriz PAP 1 son

k 1
j =0

k 1

= ( k ) x ( 0 ) + ( j ) Bu ( k j 1)

idnticos a los valores caractersticos de la matriz A original. Esto es, se mantiene la

j =0

invariancia de los valores caractersticos bajo una transformacin lineal de este tipo.
y

Alejandro H. Gonzlez

27

Alejandro H. Gonzlez

28

Electrnica Industrial

UTN Facultad Regional Paran

k 1

Electrnica Industrial

B (T ) =

y ( k ) = C ( k ) x ( 0 ) + C ( k j 1) Bu ( j ) + Du ( k )
j =0

k 1

= C ( k ) x ( 0 ) + C ( j ) Bu ( k j 1) + Du ( k ) .

UTN Facultad Regional Paran

( e dt ) B ,
T

Ac t

entonces la Ec. (2.25) se puede escribir como

j =0

x ( ( k + 1) T ) = A (T ) x ( kT ) + B (T ) u ( kT ) ,

2.2.7. Discretizacin de una ecuacin de estado en tiempo continuo

que no es otra que la forma buscada.

Supngase que el vector de entrada cambia slo en los instantes de muestreo T, 2T,
, es decir u ( t ) = u ( kT ) , kT t kT + T . La ecuacin de estado en tiempo continuo
est dada por

2.3. Representacin en espacio de estado de sistemas no lineales


Los sistemas fsicos son inherentemente no lineales. En el caso en que las no lineali-

x = Ac x + Bcu .

(2.23)

dades son suaves y el rango de operacin es pequeo, los sistemas no lineales pueden
ser razonablemente aproximados por modelos lineales. Sin embargo, no siempre es po-

La representacin en tiempo discreto de (2.23), por otro lado, tomar la forma


x ( ( k + 1) T ) = A (T ) x ( kT ) + B (T ) u ( kT ) ,

sible suponer estas condiciones, por lo que se torna imprescindible trabajar con modelos
(2.24)

ms precisos y complejos, que representen en todo el rango de operacin al sistema que


se pretende describir. En esta seccin se presentar brevemente la forma de modelar

donde queda evidenciada la dependencia de las matrices A y B del intervalo de muestreo


T. Para determinar estas matrices se recurrir a la Ec. (2.8), que es la solucin de (2.24).
Tomando en cuenta que
x ( ( k + 1) T ) = e

Ac ( k +1)T

sistemas no lineales con la representacin de espacio de estado. Para tal fin, se considerarn sistemas dinmicos modelados por un nmero finito de ecuaciones diferenciales
ordinarias de primer orden acopladas entre s, que sern representadas por

x ( 0) + e

Ac ( k +1)T

( k +1)T

Ac

Bc u ( ) d

x (t ) = f ( x (t ) , u (t )) ,

(2.26)

en su versin en tiempo continuo, y por


x ( k + 1) = f ( x ( k ) , u ( k ) ) ,

x ( kT ) = e Ac kT x ( 0 ) + e Ac kT e Ac Bc u ( ) d ;
kT

en su versin en tiempo discreto. Por simplicidad se suponen sistemas invariantes en el

y multiplicando la ltima ecuacin por e Act y sustrayndola de la primera, se obtiene


x ( ( k + 1) T ) = e

AcT

x ( kT ) + e

Ac ( k +1)T

( k +1)T

kT

tiempo. Las ecuaciones (2.26) y (2.27) estn escritas, al igual que en el caso lineal, en
e

Ac

Bc u ( ) d .

(2.25)

=e

x ( kT ) + e
0

Ac

nu

es el vector de entradas y f :

nu

es el vector de estados,

es una funcin que va del espacio

compuesto por entradas y estados al espacio de los estados.

x ( ( k + 1) T ) = e AcT x ( kT ) + e AcT e Ac Bc u ( kT ) dt
T

forma matricial vectorial. De este modo, se tiene que x


u

Como u es constante en el intervalo de integracin, se puede escribir

AcT

(2.27)

Por otro lado, la ecuacin de salida, tanto para sistemas en tiempo continuo como en

Bc u ( kT ) d

tiempo discreto, estar dado por


y = h ( x, u ) ,

con = T t . Si se define

(2.28)

A (T ) = e AcT

Alejandro H. Gonzlez

29

Alejandro H. Gonzlez

30

Electrnica Industrial

con y

ny

UTN Facultad Regional Paran

. La Figura 2.7 muestra un diagrama de bloques de las Ec. (2.26) y (2.28).

Como puede intuirse de las ecuaciones presentadas, los modelos lineales presentados
en secciones anteriores constituyen un caso particular de modelo no lineal. As, las propiedades que se expondrn en lo que sigue de esta primera parte estarn por lo general
referidas a sistemas de la forma (2.26) o (2.27), para dar generalidad a los conceptos.

Electrnica Industrial

UTN Facultad Regional Paran

x (t ) = f ( x (t ) , t ) ,

con x

(2.29)

, y condiciones iniciales dadas por x ( t0 ) = x0 . La Ec. (2.29) representa un

sistema fsico en tiempo continuo, y tiene solucin nica. Para el caso de sistemas en
tiempo discreto, el sistema autnomo estar dado por
x ( k + 1) = f ( x ( k ) , k ) ,

con x

(2.30)

, y condiciones iniciales dadas por x ( k0 ) = x0 .

Sistema no autnomo. Se llamar sistema no autnomo al sistema (en general no li-

neal) dado por


x (t ) = f ( x (t ) , u (t ) , t ) ,

Figura 2.7. Representacin en diagrama de bloques de las Ec. (2.26) y (2.28).

con x

2.3.1. Linealizacin de modelos no lineales

, u

nu

(2.31)

y condiciones iniciales x ( t0 ) = x0 , u ( t0 ) = u0 . La Ec. (2.31) repre-

senta un sistema fsico en tiempo continuo, y tiene ms de una solucin. Para el caso de
Una aproximacin lineal al modelo no lineal presentado antes, en cercanas de un dado punto de operacin, ( xss , uss ) , puede obtenerse segn

sistemas en tiempo discreto, el sistema no autnomo estar dado por


x ( k + 1) = f ( x ( k ) , u ( k ) , k ) ,

x = Alin x + Blinu ,

con x

, u

nu

(2.32)

y condiciones iniciales x ( k0 ) = x0 , u ( k0 ) = u0 .

para el caso de tiempo continuo, y segn


Ntese que un sistema no autnomo con realimentacin de estado, esto es, un sistema

x ( k + 1) = Alin x ( k ) + Blin u ( k ) ,

en el que la entrada est expresada en funcin del estado, u = g ( x ) , puede ser conside-

para el caso de tiempo discreto, donde

x = x xss , u = u uss , Alin =

rado un sistema autnomo, puesto que

x = f ( x, u , t ) = f ( x, g ( x ) , t ) = f ( x, t )

f
f
, Blin =
.
( x, u )
( x, u )
x

u
x
,
u
( ss ss )
( xss ,uss )

para un sistema en tiempo continuo, o

2.4. Estados de equilibrio. Diagramas en el plano de fase

x ( k + 1) = f ( x ( k ) , u ( k ) , k ) = f x ( k ) , g ( u ( k ) ) , k = f ( x ( k ) , k )

Primeramente se introducirn, siempre referidos al caso general de sistemas no linea-

para uno en tiempo discreto.

les, los siguientes conceptos:

Estado o punto de equilibrio. Sea un sistema autnomo en tiempo continuo como el

Sistema autnomo. Se llamar sistema autnomo al sistema (en general no lineal)

dado por

Alejandro H. Gonzlez

descrito por (2.29). Un estado xe que cumple con


f ( xe , t ) = 0

31

t t0 ,

Alejandro H. Gonzlez

32

Electrnica Industrial

UTN Facultad Regional Paran

UTN Facultad Regional Paran

3) Para los sistemas LTI autnomos, f ( x, k ) = Ax , si A es no singular, entonces el

se denomina estado o punto de equilibrio (PE) del sistema en tiempo continuo.


Sea ahora un sistema autnomo en tiempo discreto como el descrito por (2.30). Un

sistema tiene un nico estado de equilibrio, x = 0 , mientras que si A es singular entonces existirn infinitos estados de equilibrio.

estado xe que cumple con


f ( xe , k ) = xe

Electrnica Industrial

4) Para los sistemas LTI no autnomos, f ( x, u , k ) = Ax + Bu , si A es no singular, en-

k k0 ,

tonces existen infinitos estados de equilibrios que cumplen xe = Axe + Bue , o

se denomina estado o punto de equilibrio (PE) del sistema en tiempo discreto.

xe = ( I A ) Bue . Estos estados de equilibrio, que se asocian con entradas de equili1

Observaciones (Caso tiempo continuo):

brio, no necesariamente cubren todo el espacio de estado.

1) En el estado de equilibrio, si x ( t0 ) = xe , entonces x ( t ) = xe , t t0 .

5) Los sistemas no lineales en tiempo discreto pueden tener ms de un estado de equi2) Para el caso de sistemas no-autnomos, se habla de un estado xe y una entrada ue
de equilibrio, que cumplen con
f ( xe , ue , t ) = 0

librio.
Diagramas en el plano de fase

t t0 .

Los planos de fase fueron usados al principio por los ingenieros para estudiar estabi-

3) Para los sistemas LTI autnomos, f ( x, t ) = Ax , si A es no singular, entonces el


sistema tiene un nico estado de equilibrio, x = 0 , mientras que si A es singular entonces existirn infinitos estados de equilibrio.

lidad de sistemas no lineales. Tienen sentido usarlos cuando se estudia sistemas de segundo orden ya que consiste en una representacin grfica de x2 vs. x1. Tambin, es posible una extensin a sistemas de tercer orden donde se puede graficar las trayectorias
en el espacio.

4) Para los sistemas LTI no autnomos, f ( x, u , t ) = Ax + Bu , si A es no singular, en1

Trayectoria de estado. Dado un sistema como el descrito por (2.29) o (2.30), y una

tonces existen infinitos estados de equilibrios xe = A Bue . Estos estados de equilibrio,

condicin inicial x ( t0 ) = x0 , o x ( k0 ) = x0 , se define como trayectoria de estado a la

que se asocian con entradas de equilibrio, no necesariamente cubren todo el espacio de

grfica (en el espacio de estado) de la solucin de la ecuacin de estado.

estado.

Plano de Fase. Se define plano de fase al sistema de coordenadas cuyos ejes son las

5) Los sistemas no lineales en tiempo continuo pueden tener ms de un estado de


equilibrio.

variables de estado.
Diagrama o retrato de Fase. Se define como diagrama o retrato de fase a la

Observaciones (Caso tiempo discreto):

representacin grfica paramtrica de las distintas trayectorias de estado.

1) En el estado de equilibrio, si x ( k0 ) = xe , entonces x ( k ) = xe , k k0 .

Ejemplo:

2) Para el caso de sistemas no-autnomos, se habla de un estado xe y una entrada ue

1)

de equilibrio, que cumplen con


f ( xe , ue , k ) = xe

Alejandro H. Gonzlez

Considere el sistema mecnico lineal de segundo orden dado por

x ( t ) + 2kx ( t ) + n 2 x ( t ) = 0 . A partir de este sistema se obtiene la siguiente representax


x 0
cin de estado 1 = A 1 = 2
x2
x2 n

k k0 .

33

Alejandro H. Gonzlez

1 x1
.
2k x2

34

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

Dependiendo de los valores adoptados para n y k, se tienen los valores de la matriz A


mostrados en la Tabla 2.1.

Matriz A

Autovalores de A

Caso (1)

0 1
A=

4 0

1 = j 2 , 2 = j 2

Caso (2)

0 1
A=

4 2

1 = 1 + j 3 , 1 = 1 j 3

Caso (3)

2.5

0 1
A=

4 5

a)

b)

Figura 2.9.a) Respuesta temporal de los estados, y b) Diagrama de fase para el caso (2).

1 = 1 , 1 = 4

Tabla 2.1. Diferentes casos segn se varen los parmetros n y k.


Las Figuras 2.8 a 2.10 muestran las respuestas temporales de cada estado cuando

3
x0 = , y el diagrama de fase correspondiente a las trayectorias de estado originadas
3
3
4
2
5
para las condiciones iniciales x0 = , x0 = , x0 = y x0 = .
3
4
2
5

a)

b)

Figura 2.10.a) Respuesta temporal de los estados, y b) Diagrama de fase para el caso
(3).

2.5. Rutinas de Matlab relacionadas al captulo

[ A,B,C,D] =tf2ss ( num,den ) , transforma

a)

[ num,den ] =ss2tf ([ A,B,C,D,nu ]) ,

b)

Figura 2.8.a) Respuesta temporal de los estados, y b) diagrama de fase para el caso (1).

Alejandro H. Gonzlez

35

H (s) =

H (s) =

transforma

num ( s )
x = Ax + Bu
en
.
den ( s )
y = Cx
x = Ax + Bu
,

y = Cx

con

nu

en

num ( s )
.
den ( s )

Alejandro H. Gonzlez

36

Electrnica Industrial

UTN Facultad Regional Paran

sysd=c2d(sysc,T) , transforma el sistema continuo sysc, en el sistema discreto sysd,


con tiempo de muestreo T. El sistema sysc puede estar expresado en cualquiera de las
formas aceptadas por Matlab, esto es, funcin de transferencia en sus diferentes formas,
espacio de estado, etc.

2.6. Referencias bibliogrficas


Gonzlez A. H., Control Predictivo de Procesos Industriales con Restricciones. Anlisis
de Estabilidad y Robustez. Tesis Doctoral, Facultad de Ingeniera en recursos Hdricos Universidad Nacional del Litoral, 2006.
Ogata, K., Sistemas de control en tiempo discreto, Prentice Hall, 1996.

Alejandro H. Gonzlez

37

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

Funcin escalar definida negativa. Una funcin escalar V ( x ) es definida negativa

si V ( x ) es definida positiva.

3. Concepto de estabilidad de Liapunov.

Funcin escalar semidefinida positiva. Una funcin escalar V ( x ) es semidefinida

El anlisis de estabilidad de Liapunov juega un papel importante en el anlisis de estabilidad de los sistemas descritos por ecuaciones en espacio de estado. En general, y a

positiva si es positiva para todo x , excepto en el origen y en determinados estados


no nulos, donde V ( x ) = 0 .
Funcin escalar semidefinida negativa. Una funcin escalar V ( x ) es semidefinida

diferencia de lo que ocurre con los mtodos clsicos (ubicacin de polos en el dominio
de frecuencias, etc), el mtodo de Liapunov no requiere de las soluciones explcitas de

negativa si V ( x ) es semidefinida positiva.

las ecuaciones diferenciales o en diferencias, por lo que resulta de mucha utilidad en la

Funcin indefinida. Una funcin escalar V ( x ) es indefinida en si para algunos

prctica. De la teora de la mecnica clsica se sabe que un sistema vibratorio es estable


si su energa total se reduce continuamente, hasta alcanzar un estado de equilibrio. El

estados de adopta valores positivos, y para otros, valores negativos.

mtodo de Liapunov se basa en una generalizacin de lo anterior: si un sistema cual-

3.1 Concepto de Estabilidad e Inestabilidad

quiera tiene un estado de equilibrio asintticamente estable, entonces existe una funcin
escalar (una funcin ficticia de energa que se conoce como funcin de Liapunov) que
se decrementa al aumentar el tiempo, hasta que por ltimo adopta un valor mnimo en el
estado de equilibrio.
Un punto de equilibrio se dice estable si todas las soluciones de la ecuacin de estado
que se inicien en las cercanas del punto de equilibrio permanecen en las cercanas del
punto de equilibrio; de otro modo el punto de equilibrio es inestable. Un punto de equilibrio se dice asintticamente estable si todas las soluciones que se inicien en las cerca-

Las definiciones que siguen, estarn referidas al sistema autnomo dado por
x (t ) = f ( x (t )) ,

(3.1)

y el sistema no autnomo dado por


x (t ) = f ( x (t ) , u (t )) ,

(3.2)

ambos en tiempo continuo. La solucin general a las Ec. (3.1) y (3.2) se nombrar

nas del punto de equilibrio no slo permanecen en las cercanas del punto de equilibrio,

( t ; x0 ) , y ( t ; x0 ; u ( ) ) respectivamente. Ntese que las soluciones dependen de los

sino que adems tienden hacia el equilibrio a medida que el tiempo se aproxima a infini-

estados iniciales x0, y en el segundo caso, tambin de la entrada.

to. Los teoremas de estabilidad de Liapunov dan condiciones suficientes para estabilidad de puntos de equilibrio. Existen teoremas conversos que establecen que, al menos
conceptualmente, en los teoremas de Liapunov muchas de estas condiciones son tambin necesarias.
A continuacin se darn algunas definiciones, para luego pasar al anlisis de estabili-

Estabilidad en el sentido de Liapunov. Sea R > 0 el radio de una regin esfrica


S ( xe , R ) formada por el conjunto de puntos alrededor de un estado de equilibrio xe tal

que x ( t ) xe R 6 para todo t t0 , y sea r, con 0 < r < R , el radio de una regin esfrica S ( xe , r ) , formada por el conjunto de estados iniciales x0 alrededor de xe tales que

dad propiamente dicho.


Funcin escalar definida positiva. Una funcin escalar V ( x ) :

x0 xe r . Luego, se dice que el estado de equilibrio xe del sistema (3.1) es estable en


n

es definida

positiva en una regin (que incluye al origen del espacio de estado) si V ( x ) > 0 para
todo estado x 0 de la regin , y adems V ( 0 ) = 0 .

el sentido de Liapunov si para cada S ( xe , R ) existe un S ( xe , r ) tal que las trayectorias


que se inician en S ( xe , r ) no salen de S ( xe , R ) .
6

Alejandro H. Gonzlez

39

i refiere a la norma euclideana, es decir, x xe = ( x1 x1e )2 + ( x2 x2e )2 +

Alejandro H. Gonzlez

+ ( xn xne )

40

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

Estabilidad asinttica. Se dice que el estado de equilibrio xe del sistema (3.1) es

asintticamente estable si es estable en el sentido de Liapunov y si cada trayectoria que


se inicia en el interior de S ( xe , r ) converge a xe, sin salir de S ( xe , R ) , conforme t se
incrementa indefinidamente. Esto es, lim x0 xe = 0 .
t

Representaciones grficas de estados de equilibrio estables (en el sentido de Liapunov) y asintticamente estables, se muestran en la Figura 3.1.

Figura 3.2. Representacin grfica del dominio de atraccin de un estado de equilibrio.


Inestabilidad. Se dice que un estado de equilibrio xe es inestable si no es estable. En

la Figura 3.3 se muestra una representacin grfica de un estado de equilibrio inestable.

b)

a)

Figura 3.1. a) Estado de equilibrio estable, b) Estado de equilibrio asintticamente estable.


Dominio de atraccin. Dado un estado de equilibrio xe del sistema (3.1), se denomi-

na dominio de atraccin de xe, S ( xe , ) , a la mayor regin de estabilidad asinttica.


Esto es, el dominio de atraccin del equilibrio xe es el conjunto de todos los puntos x
Figura 3.3. Representacin grfica de un estado de equilibrio inestable.

tales que lim ( t ; x ) = xe , donde ( t ; x ) es la solucin de Ec. (3.1) que se inicia en el


t

Para el caso de la Figura 3.3, no es posible decir que las trayectoria se ir a infinito,

punto x (ver Figura 3.2).

ya que podra acercarse a un ciclo lmite fuera de la regin S ( xe , R ) . Si un sistema LTI


es inestable, entonces las trayectorias que se inician cerca del estado de equilibrio inestable van a infinito. Sin embargo, esto no necesariamente es cierto con los sistemas no
lineales.
Conjunto invariante: Un conjunto M es un conjunto invariante con respecto a (3.1)

si x ( 0 ) M x ( t ) M ,

Alejandro H. Gonzlez

41

Alejandro H. Gonzlez

42

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

Conjunto invariante positivo: Un conjunto M es un conjunto invariante positivo si


x ( 0) M x (t ) M ,

(3.3)

t 0 .

donde m es la masa de la bola, l es la longitud del brazo, es el ngulo entre la vertical

Ejemplos:

1)

Considrese el sistema no lineal descrito por x ( t ) = x ( t ) + x 2 ( t ) , con la condi-

y el brazo, g es la aceleracin de la gravedad, y k es el coeficiente de friccin. Tomando


como variables de estado x1 = , x2 = se pueden escribir las ecuaciones de estado

cin inicial x ( 0 ) = 0 . La solucin de dicha ecuacin diferencial est dada por


( t ; x0 ) =

x0
.
x0 + et (1 x0 )

(3.4)

De la condicin f ( x ( t ) ) = x ( t ) + x 2 ( t ) = 0 se obtienen dos estados de equilibrio:

Los PE, que salen de hacer x1 = x2 = 0 , son ( n , 0), n = 0, 1, 2,

. Obviamente,

xe1 = 0 y xe 2 = 1 . El estado xe1 = 0 es un punto de equilibrio asintticamente estable,

slo los PE (0, 0) y (, 0) son no triviales ya que el resto son repeticiones de los mis-

que cumple lim x ( t ) = 0 , para todo estado inicial < x0 < 1 . El estado xe 2 = 1 es un

mos 7.

punto de equilibrio inestable, dado que para x0 = 1 el sistema permanece en xe2 = 1,

Los tres tipos de estabilidad se pueden ver en la ecuacin (3.4). Considerando que no

( x0 1) , lo

hay friccin, o sea tomando k = 0, las trayectorias en el entorno del PE (0, 0) son rbitas

mientras que, para todo x0 > 1 y entonces existe un tiempo t1 tal que ln x0

cerradas. Empezando suficientemente cerca del PE se puede garantizar que las trayecto-

que implica que x ( t1 ) = .


2)

rias van a permanecer en cualquier bola pre-especificada alrededor del PE. Por lo tanto,

Pndulo. Uno de los problemas ms simples en robtica es el de controlar la po-

el PE es estable. No es asintticamente estable, sin embargo, porque las trayectorias que

sicin de una junta de robot usando un motor ubicado en el punto de giro. Matemtica-

comienzan fuera del PE nunca tienden a l. Si consideramos friccin (k > 0), el PE en el

mente esto no es ms que un pndulo, representado en la Figura 3.4.

origen es un foco estable. La inspeccin del retrato de fase de un foco estable muestra
que el requisito para estabilidad se satisface; ms an, las trayectorias que comienzan
cerca del PE tienden a l cuando t tiende a . El segundo PE en (, 0) es un punto de
ensilladura. Es obvio que el requisito para estabilidad no se satisface porque, para cualquier R> 0, siempre hay una trayectoria que deja la bola S ( xe , R ) , an cuando x ( 0 ) sea
arbitrariamente cercano al PE. El diagrama de fase, para el caso de considerar friccin
no nula, se muestra en la Figura 3.4.

3.2. Teorema de estabilidad de Liapunov


Funcin de Liapunov. Se denominar funcin de Liapunov V ( x ) :

Figura 3.3. Pndulo


Usando la segunda ley de Newton se puede escribir la ecuacin de movimiento en la
direccin tangencial:

Alejandro H. Gonzlez

es una regin de
7

43

, donde

alrededor del origen, a cualquier funcin escalar definida posi-

Fsicamente se puede intuir que el PE en (0, 0) es estable mientras que el PE en (, 0) es inestable.

Alejandro H. Gonzlez

44

Electrnica Industrial

UTN Facultad Regional Paran

tiva (y continuamente diferenciable), cuya derivada temporal V ( x ) =

dV ( x )
a lo largo
dt

de las trayectorias solucin de (3.1) sea definida negativa (o semidefinida negativa).

Electrnica Industrial

UTN Facultad Regional Paran

Teorema 1 (Estabilidad Asinttica). Sea el sistema dinmico descrito por (3.1),

donde 8 f ( 0 ) = 0 para todo t t0 . Si existe una funcin escalar V ( x ) con derivadas


parciales de primer orden continuas que cumple con
V ( x ) es definida positiva, y
V ( x ) es definida negativa,

entonces, el estado de equilibrio en el origen es uniforme y asintticamente estable.


Debe notarse que el teorema de estabilidad anterior proporciona slo una condicin
suficiente de estabilidad asinttica.
Teorema 2. Si se cumple el Teorema 1 y V ( x ) conforme x entonces el

estado de equilibrio en el origen es uniforme y asintticamente estable global.


Teorema 3. Sea el sistema dinmico descrito por (3.1), donde f ( 0 ) = 0 para todo
t t0 . Si existe una funcin escalar V ( x ) con derivadas parciales de primer orden con-

Figura 3.4. Diagrama de fase del pndulo

tinuas que cumple con

Ntese que,
1) La derivada temporal de V ( x ( t ) ) a lo largo de las trayectorias solucin de (3.1)
est dada por

V ( x (t )) =
i =1

n
V
V
V
xi =
fi ( x ) =
xi

x
i =1
i
x1

V
x2

V ( x ) es definida positiva, y
V ( x ) es semidefinida negativa,

entonces, el estado de equilibrio en el origen es uniformemente estable.

f1 ( x )

V f 2 ( x ) V
=
f ( x)

x
xn

f n ( x )

Teorema 4. (Inestabilidad). Sea el sistema dinmico descrito por (3.1), donde


f ( 0 ) = 0 para todo t t0 . Si existe una funcin escalar W ( x ) con derivadas parciales

de primer orden continuas que cumple con

2) Si V ( x ) < 0 entonces V ( x ) se va decrementando con respecto a t. Por tanto,


V ( x ) y V ( x ) dan informacin sobre la estabilidad de un estado de equilibrio sin tener

la solucin ( t ; x ) .
3) La funcin de Liapunov puede no ser nica. Una funcin definida positiva sencilla

W ( x ) es definida positiva en alguna regin alrededor del origen, y


W ( x ) es semidefinida positiva,

entonces, el estado de equilibrio en el origen es inestable.


Ntese que,

es la forma cuadrtica, donde P es una matriz definida positiva.

8
Se supone que si el estado de equilibrio no est en el origen, siempre es posible hacer un cambio de
variables tal que x ( t ) = x ( t ) xe y de este modo es xe = 0 .

Alejandro H. Gonzlez

45

Alejandro H. Gonzlez

46

Electrnica Industrial

UTN Facultad Regional Paran

1. Las condiciones de los teoremas de estabilidad de Liapunov requeridas para la estabilidad de un sistema no lineal son condiciones suficientes pero no necesarias.

Electrnica Industrial

UTN Facultad Regional Paran

V ( x ) = xT Px + xT Px
= ( Ax ) Px + xT P ( Ax )
T

2. La funcin de Liapunov no es nica y no encontrar una funcin de Liapunov adecuada para mostrar la estabilidad o inestabilidad de un punto de equilibrio implica simplemente no tener informacin respecto a la estabilidad y no permite aventurar condicin alguna sobre el punto de equilibrio considerado.
3. Para un estado de equilibrio estable o asintticamente estable, siempre existe una

= xT AT Px + xT PAx
= xT ( AT P + PA ) x

Dado que V ( x ) se escogi definida positiva, se requiere para la estabilidad asinttica


que V ( x ) sea definida negativa. Por tanto, debe ser,
V ( x ) = xT Qx ,

funcin de Liapunov con las propiedades requeridas.


4. Probar que un estado de equilibrio es estable en la regin que incluye al estado
de equilibrio, no significa que trayectorias fuera de puedan llevar a inestabilidad.

Para alguna matriz Q definida positivas. De ah, se define


Q = ( AT P + PA ) ,

(ecuacin de Liapunov)

3.2.1. Anlisis de estabilidad de Liapunov para sistemas LTI autnomos


donde se exige que AT P + PA sea definida positiva.

en tiempo continuo

Lo que usualmente se hace en la prctica es que, en lugar de especificar P, se especiConsidere el siguiente sistema LTI autnomo,
x ( t ) = Ax ( t ) ,

donde x

, A

fica Q y a partir de ello se calcula P. En trminos prcticos se puede escoger Q = I (ma(3.5)

n n

. En este caso, el nico punto de equilibrio est en xe =0, y ese

equilibrio es estable si y slo si todos los autovalores de A tienen parte real no positiva y
cada autovalor con parte real nula tiene un bloque de Jordan asociado de orden 1. El
punto de equilibrio x = 0 es asintticamente estable global si y slo si todos los autovalores de A tienen parte real negativa. Cuando todos los autovalores de A tienen parte real
negativa, se dice que A es una matriz Hurwitz. La estabilidad del origen puede tambin
estudiarse utilizando el mtodo de Liapunov. Considrese para ello la siguiente funcin
de Liapunov

triz identidad) como primer intento para calcular P.


Teorema 5. Considrese el sistema autnomo descrito por (3.5). El punto de equili-

brio xe = 0 ser asintticamente estable global si y slo si dada una matriz Q simtrica
real, definida positiva, existe una nica matriz P simtrica real, definida positiva, que es
solucin de AT P + PA = Q .

3.2.2. Anlisis de estabilidad de Liapunov para sistemas LTI autnomos


en tiempo discreto
Considrese el siguiente sistema autnomo en tiempo discreto

V ( x ) = xT Px ,

x ( k + 1) = Ax ( k )

donde P es una matriz simtrica real, definida positiva. Su derivada a lo largo de cual-

donde x

quier trayectoria, est dada por

, A

(3.6)
n n

. Otra vez, el nico punto de equilibrio de este sistema est en xe

=0, y ese equilibrio es estable si y slo si todos los autovalores de A tienen parte real
menor o igual a 1. A su vez, el punto de equilibrio x = 0 es asintticamente estable global si y slo si todos los autovalores de A tienen parte real menor a 1. La estabilidad del

Alejandro H. Gonzlez

47

Alejandro H. Gonzlez

48

Electrnica Industrial

UTN Facultad Regional Paran

origen puede tambin estudiarse utilizando el mtodo de Liapunov. Considrese para

Electrnica Industrial

UTN Facultad Regional Paran

ello la siguiente funcin de Liapunov

1
0
x ( k + 1) =
x (k )
0.5 1

V ( x ) = xT Px ,

mediante el mtodo de Lyapunov. Para ello primeramente se debe calcular la matriz P y

donde P es una matriz simtrica real, definida positiva. La funcin diferencia de esta
funcin (el equivalente discreto de la derivada) a lo largo de cualquier trayectoria, est
dada por

encontrar la funcin V ( x ( k ) ) de Lyapunov. Para ello se adopta Q = I, de modo que


AT PA P = I

V ( x ( k ) ) = V ( x ( k + 1) ) V ( x ( k ) )

1 p11
0
0.5 1 p

21

= x ( k + 1) Px ( k + 1) x ( k ) Px ( k )
T

= ( Ax ( k ) ) PAx ( k ) x ( k ) Px ( k )
T

Esta ecuacin conduce a

4 2
P=
,
2 3

( A PA P ) x ( k )

p12
1 0
=

p22
0 1

= x ( k ) AT PAx ( k ) x ( k ) Px ( k )
= x (k )

p12 0
1 p11

p22 0.5 1 p21

Dado que V ( x ) se escogi definida positiva, se requiere para la estabilidad asinttica


que V ( x ( k ) ) sea definida negativa. Por tanto, debe ser

que es una matriz real simtrica positiva. Por tanto, segn el Teorema 6, el punto de
equilibrio xe = 0 es asintticamente estable. La funcin de Lyapunov resulta
V ( x ) = xT Px = 4 x12 2 x1 x2 + 3 x22 .

V ( x ( k ) ) = x ( k ) Qx ( k ) ,
T

para alguna matriz Q definida positivas. De ah, se define

Dado que se escogi Q = I, la funcin diferencia de V est dada por

Q = ( AT PA P ) ,

V ( x ( k ) ) = x ( k ) Qx ( k ) = x12 x22 ,

(ecuacin de Liapunov en tiempo discreto)

que es una funcin definida negativa.

donde se exige que AT PA P sea definida positiva.


Al igual que para los sistemas LTI en tiempo continuo, es conveniente especificar Q y

3.3. Rutinas de Matlab relacionadas al captulo

luego calcular P.
Teorema 6. Considere el sistema autnomo descrito por (3.6). El punto de equilibrio

P=lyap(A,Q) , resuelve la ecuacin de Liapunov en tiempo continuo: AP + PAT = Q .

xe = 0 ser asintticamente estable global si y slo si dada una matriz Q simtrica real,

P=lyap(A,B,Q) , resuelve la ecuacin de Liapunov general en tiempo continuo (tam-

definida positiva, existe una nica matriz P simtrica real, definida positiva, que es solucin de Q = ( A PA P ) .

bin llamada ecuacin de Sylvester): AP + PB = Q .

P=dlyap(A,Q) ,

resuelve

la

ecuacin

de

Liapunov

en

tiempo

discreto:

APAT P + Q = 0 .

Ejemplo.

Se desea investigar la estabilidad del sistema autnomo en tiempo discreto dado por

Alejandro H. Gonzlez

49

Alejandro H. Gonzlez

50

Electrnica Industrial

UTN Facultad Regional Paran

3.4. Referencias bibliogrficas


Ogata, K., Sistemas de control en tiempo discreto, Prentice Hall, 1996.

Alejandro H. Gonzlez

51

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

un conjunto puedo no ser abierto ni cerrado, y los nicos conjuntos de

4. Introduccin a la teora de optimizacin de funcio-

vez abiertos y cerrados son el conjunto vaco y el mismo

que son a la

Un conjunto es acotado si est contenido en una vecindad de radio suficientemente

nes. Introduccin al control ptimo (LQR)

grande, pero acotado. Un conjunto que es cerrado y acotado, se dice compacto.


Como se ver oportunamente en este apunte, el corazn de la teora de control avan-

Funcin diferenciable. Sea S un conjunto en

zada, o ms concretamente, de la teora de control ptimo, es la teora de optimizacin.

f :S

Si bien la teora de optimizacin es un rea de inmenso potencial, tanto terico como de

f ( x )

aplicacin, que va mucho ms all de la aplicacin al control avanzado, este capitulo


presentar un resumen de sus conceptos fundamentales que permitir una comprensin
ms acabada de los sucesivos captulos.

con interior no vaco, y sea

. Luego, se dice que f es diferenciable en x int S si existe un vector

, llamado vector gradiente, y una funcin :

f ( x ) = f ( x ) + f ( x )

(x x)+

, tales que

x x ( x , x x ) para todo x S ,

con lim ( x , x x ) = 0 . La funcin f se dice diferenciable en el conjunto abierto


x x

4.1. Definiciones preliminares (Convexidad de conjuntos y fun-

S ' S si es diferenciable en cada punto de S ' . La representacin anterior se conoce

como la expansin de primer orden (serie de Taylor) de f en x .

ciones)

Ntese que si f es diferenciable en x , entonces existe un nico vector gradiente, que


Primeramente se revisarn algunos conceptos bsicos referidos a topologa de conjuntos.
Dado un punto x
N ( x ) = { x

, la vecindad alrededor de x se define como el conjunto

: x x < } , para todo > 0 , donde refiere a la norma Eucldea.

Sea S un conjunto arbitrario en

. Un punto x est en la cerradura de S, nombrada

consiste en las derivadas parciales, esto es,


f ( x ) f ( x )
f ( x ) =
,
,
x2
x1

sea f : S

de puntos arbitrariamente cercanos a S. Si S = cl S , entonces S se dice cerrado. Un pun-

Hessiana, y una funcin :

Un punto x est en la frontera de S, nombrado como S , si N ( x ) contiene al menos

con interior no vaco, y

. Luego, se dice que f es dos veces diferenciable en x int S si existe un

vector f ( x )

S = int S , entonces S se dice abierto.

f ( x )
.
xn

Funcin dos veces diferenciable. Sea S un conjunto en

como cl S, si S N ( x ) para todo > 0 . Es decir, la cerradura de S es el conjunto

to x est en el interior de S, nombrado como int S, si N ( x ) S para algn > 0 . Si

, una matriz simtrica de n n elementos, H ( x ) , llamada matriz

f ( x ) = f ( x ) + f ( x )

1
2

, tales que

(x x)+ (x x)

H ( x )( x x ) + x x ( x , x x ) para todo
2

xS ,

un punto en S y un punto fuera de S para cada > 0 9. De este modo, un conjunto S es

con lim ( x , x x ) = 0 . La funcin f se dice dos veces diferenciable en el conjunto

cerrado si y slo si contiene todos los puntos de su frontera. Ms an, se cumple que

abierto S ' S si es dos veces diferenciable en cada punto de S ' . La representacin

cl S S S es el conjunto cerrado ms pequeo que contiene a S. Anlogamente, un

anterior se conoce como la expansin de segundo orden (serie de Taylor) de f en x .

conjunto S es abierto si y slo si no contiene ningn punto de su frontera. Claramente,

x x

Para funciones dos veces diferenciables, la matriz Hessiana contiene las derivadas
parciales de segundo orden, esto es

Ntese que S no necesariamente contiene los puntos de su frontera.

Alejandro H. Gonzlez

53

Alejandro H. Gonzlez

54

Electrnica Industrial
2 f ( x )

x1x1
2 f ( x )

H ( x ) = x2 x1

2 f ( x )

xn x1

2 f ( x )
x1x2
2 f ( x )
x2 x2
f (x)
xn x2
2

UTN Facultad Regional Paran


2 f ( x )

x1xn
2 f ( x )

x2 x1

2
f (x )

xn xn

Electrnica Industrial

UTN Facultad Regional Paran

Luego, pT xT = pT x1 pT x2 = = 0 , y el producto escalar de vectores es nulo si y


solos si stos son normales (el coseno del ngulo entre ellos es nulo). Una representacin grfica de hiperplanos normales a un dado vector p puede verse en la Figura 4.2.a.
Semiplano. S = { x : pT x } , donde p es un vector no nulo de

, y es un escalar.

Semiplano abierto. S = { x : pT x < } , donde p es un vector no nulo de

Mnimo de una funcin. El mnimo de una funcin f en S, que se denominar

, y es un

escalar.

min { f ( x ) : x S } , existe si existe un x S tal que f ( x ) f ( x ) para todo x S . Se

Conjunto polidrico. S = { x : Ax b} , donde A es una matriz m n y b es un vector

puede probar que si S es no vaco, cerrado y acotado, y si f es continua en S, entonces

m 1 . La desigualdad anterior es elemento a elemento. Ver Figura 4.2.b.

existe un mnimo de f en S.

Cono polidrico. S = { x : Ax 0} , donde A es una matriz m n . Ver Figura 4.2.c.

nfimo de una funcin. El nfimo = inf { f ( x ) : x S } es la mayor cota inferior a f


Cono

en S.

creado

por

un

nmero

finito

de

vectores.

S = {x : x = j a j ,
j =1

Conjunto convexo: Un conjunto S

es convexo si el segmento que une cual-

j 0, para j = 1,

, m} , donde a1 ,

quier par de puntos del conjunto pertenece tambin al conjunto. Esto es, si x1 , x2 S

y 4.2.e.

entonces x1 + (1 ) x2 debe pertenecer tambin a S para cada [ 0,1] .

Vecindad de un punto. N ( x ) = { x

, am son vectores dados de

. Ver Figura 4.2.d.

: x x < } , donde x es un vector fijo de

y > 0.

La Figura 4.1 ilustra las nociones de conjunto convexo y no convexo.

x1

x1-x2
x2

p
S1

a)

b)

Figura 4.1. Conjunto a) convexo y b) no convexo

S =0

A continuacin se listan algunos ejemplos de conjuntos convexos:


Hiperplano. S = { x : pT x = } , donde p es un vector no nulo de

S 2
n

llamado vector

normal al hiperplano, y es un escalar. Para ver que p es el vector normal al hiperplano, considrese un vector tangencial al plano, dado por xT = x1 x2 , con x1 , x2 S .

Alejandro H. Gonzlez

55

Figura 4.2.a. Representacin grfica de hiperplanos definidos por el vector normal p.


Algunas condiciones de optimalidad geomtrica que se vern ms adelante hacen uso
de conos convexos.

Alejandro H. Gonzlez

56

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

Una propiedad geomtrica bien conocida es que, dado un conjunto cerrado y convexo
S y un punto y S , existe un nico punto x S que presenta la mnima distancia hasta

y, y un hiperplano que separa al punto y de S.


S

Teorema del punto ms cercano. Sea S un conjunto cerrado y convexo, no vaco, de


n

y sea y S . Luego, existe un nico punto x S con distancia mnima a y. Ms

aun, x es el punto de mnima distancia, o punto ms cercano a y, si y slo si


Figura 4.2.b. Conjunto polidrico.

T
( y x ) ( x x ) 0 para todo x S .

Figura 4.2.c. Cono polidrico

Definicin de separacin de conjuntos. Sean S1 y S2 conjuntos no vacos de

x1

. Un

hiperplano H = { x : p x = } separa a S1 de S2 si p x para todo x S1 y p x


T

x1

para todo x S2 .

x2

x2

Teorema de separacin. Sea S un conjunto cerrado y convexo, no vaco, de

sea y S . Luego, existe un vector p no nulo y un escalar tales que p y > y


T

pT x para todo x S .
x3

Definicin de hiperplano soporte en un punto de frontera. Sea S un conjunto no

Figura 4.2.e. y 4.2.e Conos creados por vectores

Cono convexo. Un conjunto no vaco, C, de

vaco de

se llama cono con vrtice en cero si

x C implica que x C para todo 0 . Si, adems, C es convexo, entonces se de-

nominar cono convexo. La Figura 4.3 muestra una representacin grfica de conos

y sea x S (la frontera de S). Un hiperplano H = { z : pT ( z x ) = 0} se

llama hiperplano soporte de S en x si pT ( x x ) 0 para todo x S o bien


pT ( x x ) 0 para todo x S .

Ntese que en el caso de ser S el conjunto de nivel de una funcin f,

convexos y no convexos.

S = { x S : f ( x ) } , con

, entonces el vector normal p del hiperplano soporte

de S en x S , est dado por p = f ( x ) .

a)

Figura 4.3. Cono a) convexo y b) no convexo

b)

a)

b)

Figura 4.4. a) Caso convexo y b) caso no convexo

Alejandro H. Gonzlez

57

Alejandro H. Gonzlez

58

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

Un conjunto convexo tiene un hiperplano soporte en cada punto de frontera.

Teorema del hiperplano soporte. Sea S un conjunto convexo, no vaco, de

y sea

x S . Luego existe un hiperplano soporte de S en x ; esto es, existe un vector no nulo

p tal que pT ( x x ) 0 para todo x cl S .

a)

b)

Figura 4.6. a) Funcin convexa y b) funcin no convexa y no cncava


A continuacin se darn algunas propiedades tiles de las funciones convexas.
(i) Sean f1 , f 2 ,

fk :

funciones convexas. Entonces,

f ( x ) = i f i ( x ) , donde i > 0 para i = 1, 2,

A continuacin se presentarn algunas propiedades de las funciones convexas, empezando por su definicin.

Funcin convexa. Sea f : S

f ( x ) = max { f1 ( x ) , f 2 ( x ) ,

(ii) Supngase que g ( x ) :


, donde S es un conjunto no vaci convexo de

, k es una funcin convexa.

i =1

Figura 4.5.

La funcin f es convexa en S si
f ( x1 + (1 ) x2 ) f ( x1 ) + (1 ) f ( x2 )

La funcin f es estrictamente convexa en S si la desigualdad anterior es una desigualdad

es una funcin cncava. Sea S = { x : g ( x ) > 0} , y


1
. Luego, f es convexa en S.
g ( x)

defnase f ( x ) : S

como f ( x ) =

(iii) Sea g ( x ) :

una funcin no decreciente, de una variable, y convexa, y sea

h ( x) :

para cada x1 , x2 S y para cada ( 0,1) .

f k ( x )} es una funcin convexa

una funcin convexa. Luego, la funcin f :

definida como la

composicin f ( x ) = g ( h ( x ) ) , es una funcin convexa.

estricta para cada par de puntos distintos x1 , x2 S , y para cada ( 0,1) .

(iv) Sea g ( x ) :

La funcin f es (estrictamente) cncava en S si -f es (estrictamente) convexa.

de la forma h ( x ) = Ax + b , donde A es una matriz de m n y b es un vector de m 1 .

La interpretacin geomtrica de la definicin anterior es como sigue: el valor de f en


el punto x1 + (1 ) x2 debe ser menor que la altura de la cuerda que une los puntos
x1 , f ( x1 ) y x2 , f ( x2 ) . Vase la Figura 4.6.

una funcin convexa, y sea h ( x ) :

Luego, la funcin f :

una funcin afn

definida como la composicin f ( x ) = g ( h ( x ) ) , es una

funcin convexa.
Asociado a una funcin f convexa est el conjunto de nivel S , definido como: S = { x S : f ( x ) } , con

Alejandro H. Gonzlez

59

Alejandro H. Gonzlez

60

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

Lema (convexidad de los conjuntos de nivel). Sea S un conjunto convexo no vaco

en

, y sea

f :S

una funcin convexa. Luego, el conjunto de nivel

S = { x S : f ( x ) } , con

, es un conjunto convexo.

En muchos problemas de optimizacin, el requerimiento de convexidad puede ser


muy exigente e innecesario. En esos casos se habla de convexidad en un punto. Se
muestran a continuacin diversos tipos de convexidad puntual, que son extensiones (relajaciones) de la idea primaria. Sea S un conjunto convexo no vaco de
f :S

, y sea

Convexidad en un punto. La funcin f se dice convexa en

a)

b)

Figura 4.7. (a) La funcin f es quasi-convexa, pero no estrictamente quasi-convexa en


x1; y f es quasi-convexa, y estrictamente quasi-convexa, en x2. (b) La funcin f es pseu-

do-convexa, y estrictamente pseudo-convexa, en x1; y es pseudo-convexa, pero no esx S

trictamente pseudo-convexa en x2.

si

f ( x + (1 ) x ) f ( x ) + (1 ) f ( x ) para cada ( 0,1) y cada x S .

4.2. Optimizacin sin restricciones

Convexidad estricta en un punto. La funcin f es estrictamente convexa en x S si


f ( x + (1 ) x ) < f ( x ) + (1 ) f ( x ) para cada ( 0,1) y cada x S , con x x .

Quasi-convexidad en un punto. La funcin f se dice quasi-convexa en x S si


f ( x + (1 ) x ) max { f ( x ) , f ( x )} para cada ( 0,1) y cada x S .

Un problema de optimizacin sin restricciones es un problema de la forma:


min f ( x )

sin ninguna restriccin en el vector x.

Quasi-convexidad estricta en un punto. La funcin f es estrictamente quasi-

Definicin de mnimo local y global. Considrese el problema de minimizar f ( x )

convexa en x S si f ( x + (1 ) x ) < max { f ( x ) , f ( x )} para cada ( 0,1) y cada

en

x S tal que f ( x ) f ( x ) .

Si f ( x ) f ( x ) para todo x

Pseudo-convexidad en un punto. Supngase que f es diferenciable en x int S ,

luego f es pseudo-convexa en x si f ( x )( x x ) 0 para x S implica que


f ( x) f ( x ) .

, y sea x

.
n

, entonces x es un mnimo global.

Si existe una vecindad , N ( x ) , alrededor de x tal que f ( x ) f ( x ) para todo


x N ( x ) , entonces x es un mnimo local.

Si f ( x ) f ( x ) para todo x N ( x ) , con x x , entonces x se denomina mnimo

Pseudo-convexidad estricta en un punto. Supngase que f es diferenciable en


x int S , luego f es estrictamente pseudo-convexa en x si f ( x )( x x ) 0 para
x S , x x , implica que f ( x ) > f ( x ) .

local estricto.

La Figura 4.8 muestra mnimos locales y globales de una funcin real.

Ejemplos ilustrativos de estas definiciones pueden verse en la Figura 4.7.

Alejandro H. Gonzlez

61

Alejandro H. Gonzlez

62

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

De este modo se arriba a una condicin necesaria de primer orden para mnimos.
Corolario (condicin necesaria de primer orden para mnimos). Supngase que
f:
Mnimo local estricto

Mnimo local

es diferenciable en x . Si x es un mnimo local entonces

f ( x ) = 0 .

Prueba. Supngase que x es un mnimo local y f ( x ) 0 . Luego, tomando


Mnimo global

d = f ( x ) se tiene que f ( x ) d = f ( x ) < 0 , y por el teorema de la direccin

Figura 4.8. mnimos locales y globales de una funcin real.


Dado un punto x

de decrecimiento existe un > 0 tal que f ( x + d ) < f ( x ) para cada ( 0, ) , con-

, se desea determinar si es o no un mnimo global o local de f.

Para el caso de funciones diferenciables, existen condiciones que permiten averiguarlo,

tradiciendo la suposicin de que x es un mnimo local. Luego, f ( x ) = 0 .


Una condicin necesaria de segundo orden para mnimos puede establecerse en tr-

como se ver a continuacin.


En primer lugar se caracterizar lo que se conoce como direccin de decrecimiento.
Teorema de la direccin de decrecimiento. Sea f :

una funcin diferen-

ciable en x . Si existe un vector d tal que

minos de la matriz Hessiana.


Teorema (condicin necesaria de segundo orden para mnimos). Supngase que
f:

es dos veces diferenciable en x . Si x es un mnimo local entonces

f ( x ) = 0

f ( x ) d < 0 ,

entonces existe un > 0 tal que

H ( x ) es semidefinida positiva.

f ( x + d ) < f ( x ) para cada ( 0, ) ,

Prueba. Supngase que x es un mnimo local y considrese una direccin d arbitra-

de modo que d es una direccin de decrecimiento de f en x .

ria. Como se supuso que f es dos veces diferenciable, se tiene que

Prueba. De la diferenciabilidad de f en x se tiene que

1
T
2
f ( x + d ) = f ( x ) + f ( x ) d + 2 d T H ( x ) d + 2 d ( x , d ) ,
2

f ( x + d ) = f ( x ) + f ( x ) d + d ( x , d ) ,
T

donde ( x , d ) 0 cuando 0 . Reordenando y dividiendo por 0 se tiene que


f ( x + d ) f ( x )

(4.1)

donde ( x , d ) 0 cuando 0 . Como x es un mnimo local, del Corolario de la


condicin necesaria de primer orden para mnimos se tiene que f ( x ) = 0 . Reordenan-

= f ( x ) d + d ( x , d ) .
T

do (4.1) y dividiendo por 2 > 0 se tiene que

Como f ( x ) d < 0 y ( x , d ) 0 cuando 0 , entonces existe un > 0 tal que


T

el lado derecho de la igualdad anterior es negativo para todo ( 0, ) . Luego,

f ( x + d ) f ( x )

1 T
2
d H ( x ) d + d ( x , d ) .
2

4.2

f ( x + d ) < f ( x ) .

Alejandro H. Gonzlez

63

Alejandro H. Gonzlez

64

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

Como x es un mnimo local, f ( x + d ) f ( x ) para un suficientemente pequeo. De (4.2), se tiene que

1 T
2
d H ( x ) d + d ( x , d ) 0 para ese suficientemente
2

pequeo. Tomando ahora el lmite para 0 , se tiene que d T H ( x ) d 0 ; y, por tanto, H ( x ) es semidefinida positiva.

UTN Facultad Regional Paran

Definicin de solucin factible y solucin ptima. Sea f :

, y considrese

un problema de optimizacin como el (4.3), donde S es un conjunto no vaco de

Un punto x S es una solucin factible del problema (4.3).

Si x S y f ( x ) f ( x ) para cada x S , entonces x es una solucin ptima o

solucin ptima global del problema (4.3).

Ahora se mostrar, sin prueba, una condicin suficiente para mnimo local.
Teorema (condicin suficiente para mnimo local). Supngase que f :

*
n

es

dos veces diferenciable en x . Si f ( x ) = 0 y H ( x ) es definida positiva, entonces x

f ( x ) f ( x ) para cada x S N ( x ) , entonces x es una solucin ptima local del

problema (4.3).

es un mnimo local estricto.


Como ocurre en general en los problemas de optimizacin, se tienen resultados ms
generales bajo condiciones de convexidad (generalizadas). El resultado que sigue muestra que si f es pseudoconvexa en x , entonces la condicin necesaria f ( x ) = 0 es tam-

Si x S y si existe una vecindad , N ( x ) , alrededor de x tal que

Si x S y f ( x ) f ( x ) para cada x S N ( x ) , con x x , para algn

> 0 , entonces x es una solucin ptima local estricta del problema (4.3)
La Figura 4.9 muestra ejemplos de mnimos locales y globales en un problema de optimizacin con restricciones.

bin suficiente para que x sea un mnimo global.


Teorema (condicin necesaria y suficiente para funciones pseudoconvexas). Su-

pngase que f :

es pseudoconvexa en x . Luego, x es un mnimo global si y

slo si f ( x ) = 0 .

4.3. Optimizacin con restricciones.

Mnimo local

Mnimo global

En esta seccin se derivarn condiciones de optimalidad para un problema como el


que sigue:
min f ( x )

Figura 4.9. Mnimos locales y globales en un problema de optimizacin con restricciones

(4.3)

Los puntos de S correspondientes a A, B y E son tambin mnimos locales estrictos,

sujeto a:

mientras que aquellos correspondientes al segmento plano del grfico entre C y D son

xS .

mnimos locales, pero no estrictos.

En primer lugar se considerar una restriccin general de conjunto, S, para luego pasar al caso ms concreto de restricciones de igualdad y de desigualdad. Considrense
ahora las siguientes definiciones:

4.3.1. Programacin convexa


Un problema de programacin convexa es un problema de la forma
min f ( x )

Alejandro H. Gonzlez

65

Alejandro H. Gonzlez

(4.4)

66

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

sujeto a:

junto S. La Figura 4.11, por su parte, muestra distintos ejemplos de conos de direcciones

xS ,

de mejora para una dada funcin f.

en el cual la funcin f y el conjunto S son convexos, respectivamente. A continuacin se


mostrar una propiedad importante de los problemas de programacin convexa.
Teorema (los mnimo locales de un problema de programacin convexa son mnimos globales). Considrese el problema (4.4), donde S es un conjunto no vaco con-

vexo de

y f :S

es una funcin convexa en S. Si x S es una solucin ptima

local del problema, entonces x es una solucin ptima global. Ms aun, si x es un mnimo local estricto, o si f es estrictamente convexa, entonces x es la nica solucin ptima global.

4.3.2. Condiciones geomtricas de optimalidad


En esta seccin se mostrarn condiciones de optimalidad del problema (4.3), esto es,
sin suponer convexidad. Dado que no se hace ninguna suposicin en cuanto a la con-

Figura 4.10. Conos de direcciones factibles para un dado conjunto S. Las lneas de trazo
significan que la frontera no pertenece al conjunto.

vexidad, se derivarn en principio slo condiciones necesarias. En secciones posteriores


se impondrn condiciones de convexidad que permiten derivar condiciones suficientes.
Considrense las siguientes definiciones
Cono de direcciones factibles. Sea S un conjunto no vaco de

y sea x cl S . El

cono de direcciones factibles de S en x , D, est dado por


D = {d 0 : x + d S para todo ( 0, ) para algun > 0} .

La Figura 4.11. Conos de direcciones de decrecimiento para una dada funcin f. Las
lneas de trazo significan que la frontera no pertenece al conjunto.

Cada vector no nulo d D se llama direccin factible.


Cono de direcciones de decrecimiento. Sea f :

. El cono de direcciones de

Ahora se considerar una funcin f diferenciable en x , y los siguientes conjuntos:

mejora o decrecimiento en x , F, est dado por

F0 = {d : f ( x ) d < 0}

F = {d : f ( x + d ) < f ( x ) para todo ( 0, ) para algun > 0} .

F0' = {d 0 : f ( x ) d 0} .

Cada vector no nulo d F d se llama direccin de mejora o direccin de decrecimiento

(para interpretar estos conjuntos, conviene recordar que el gradiente f ( x ) es un vec-

en x .

tor normal a la curva de nivel de f en x y el producto escalar de dos vectores es nulo,


. La Fi-

mayor a cero o menor a cero, segn los vectores sean normales, formen un ngulo agu-

gura 4.10 Muestras distintos ejemplos de conos de direcciones factibles de un dado con-

do o formen un ngulo obtuso, respectivamente). Del Teorema de la direccin de decre-

Alejandro H. Gonzlez

Alejandro H. Gonzlez

Ntese que para un punto interior de S, el cono de direcciones factibles es

67

68

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

cimiento se tiene que si f ( x ) d < 0 , entonces d es una direccin de decrecimiento. De

F0 D = ,

ah, se tiene que

donde F0 = {d : f ( x ) d < 0} y D es el cono de direcciones factibles de S en x , esto es

F0 F .

(4.5)

D = {d 0 : x + d S para todo ( 0, ) para algun > 0} .

Tambin, si d F , se tiene que f ( x ) d 0 , o sino, anlogamente al Teorema de la


direccin de decrecimiento, f ( x ) d > 0 implicara que d es una direccin de crecimiento. De ah, se tiene que

Prueba. Supngase, por contradiccin, que existe un vector d F0 D . Dado que

d F0 , entonces, por el Teorema de la direccin de decrecimiento existe un 1 > 0 tal


que

F F0' .

(4.6)

f ( x + d ) < f ( x ) , para cada ( 0, 1 ) .

Finalmente, de (4.5) y (4.6) se tiene que

(4.7)

Adems, como d D , por la definicin de Cono de direcciones factibles existe un

F0 F F ,

2 > 0 tal que

de modo que se ha acotado por dentro y por fuera el cono de direccin de decrecimiento

x + d S para cada ( 0, 2 ) .

'
0

(4.8)

(que es un concepto ms bien abstracto) con dos conjuntos que dan una descripcin algebraica en trminos del vector gradiente. En la Figura 4.12 se comparan estos tres con-

La suposicin de que x es una solucin ptima local no es compatible con las condi-

juntos para los casos mostrados en la Figura 4.11.

ciones (4.7) y (4.8). Luego, F0 D = .


Intuitivamente, se ve que si x S no est en la frontera de S (lo que implica que
D

), entonces la condicin geomtrica de ptimo es que el gradiente sea nulo, y de

este modo F0 D = , por ser F0 = . En la Figura 4.13 se muestra una representaf ( x )

f ( x )

cin grfica de la condicin establecida en el teorema anterior.

f ( x )

contornos
de f

Figura 4.12. Comparacin de F0 , F y F0' para los casos mostrados en la Figura 4.11.
El teorema que sigue establece que una condicin necesaria para la optimalidad local
es que toda direccin de mejora en F0 no sea una direccin factible.
Teorema (condicin geomtrica necesaria de optimalidad local). Considrese el

problema de minimizar f ( x ) sujeto a x S , donde f :

y S es un conjunto no

Figura 4.13. Representacin grfica de la condicin geomtrica necesaria de optimalidad, F0 D = .

vaco, supngase que f es diferenciable en x S . Si x es una solucin ptima local,


entonces
Alejandro H. Gonzlez

69

Alejandro H. Gonzlez

70

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

4.3.4. Problemas con restricciones de igualdad y desigualdad


Se considerar a continuacin el caso especfico en que la regin de factibilidad S est dada por
S = { x X : gi ( x ) 0, i = 1,

donde gi ( x ) :

para i=1, , m, y hi ( x ) :

, l} ,

, m, hi ( x ) = 0, i = 1,

conjunto abierto, no vaco, en

para i=1, , l, y X es un

Figura 4.14 muestra la comparacin entre los con juntos G0 , D y G0' para diferentes

Esta regin de factibilidad da origen al siguiente problema de programacin no lineal:


min f ( x )

(4.9)

casos
Teorema (condiciones geomtricas necesarias para problemas con restricciones

sujeto a:

de desigualdad e igualdad). Sea X un conjunto abierto no vaco de

gi ( x ) 0, i = 1,

, m,

hi ( x ) = 0, i = 1,

, l,

f ( x) :

, gi ( x ) :

para i=1, , m, y hi ( x ) :

, y sea

para i=1, , l.

Considrese el problema definido por (4.9). Supngase que x es una solucin ptima

x X.
Para una descripcin algebraica del cono de direcciones factibles para el caso ante-

local, y sea I = {i : gi ( x ) = 0} el conjunto de ndices de restricciones activas. Adems

es una solucin factible del problema (4.9), y sea

supngase que cada gi es continua en x para i I , que f y gi, con i I , son diferencia-

I = {i : gi ( x ) = 0} el conjunto de ndices de restricciones activas. Supngase que no hay

bles en x y que hi es continuamente diferenciable en x para i=1, , l. Si los gradien-

rior, supngase que x

tes hi ( x ) , con i=1, , l, son linealmente independientes, entonces


T

restricciones de igualdad.
Adems supngase que cada gi es continua en x para i I y que f y gi, con i I , son
diferenciables en x . Sean

F0 G0 H 0 = ,
donde

G0 = {d : gi ( x ) d < 0 para i I }

F0 = {d : f ( x ) d < 0}

G = {d 0 : gi ( x ) d 0 para i I } ,
'
0

G0 = {d : gi ( x ) d < 0 para i I }

entonces, G0 D G ,
'
0

H 0 = {d : hi ( x ) d = 0 para i = 1,

donde D es el cono de direcciones factibles.

, l} .

Prueba. (Ver Goodwin et al. 2005).


'
0

La Figura 4.14 muestra la comparacin entre los con juntos G0 , D y G para diferen-

4.3.5. Condiciones necesarias de Fritz John

tes casos.

A continuacin se expresar la condicin geomtrica F0 G0 H 0 = de forma algebraica, lo que se conoce como condiciones de Fritz John (FJ).

Alejandro H. Gonzlez

71

Alejandro H. Gonzlez

72

Electrnica Industrial

UTN Facultad Regional Paran

Teorema (condiciones necesarias de Fritz John). Sea X un conjunto abierto no va-

co de

, y sea f ( x ) :

, gi ( x ) :

para i=1, , m, y hi ( x ) :

para i=1, , l. Sea x es una solucin factible de (4.9) y sea I = {i : gi ( x ) = 0} . Supngase que cada gi es continua en x para i I , que f y gi, con i I , son diferenciables en
x y que hi es continuamente diferenciable en . x para i=1, , l. Si x es una solucin
ptima local de (4.9), entonces existen escalares u0 y ui para i I y vi para i=1, , l,
tales que
l

u0f ( x ) + ui gi ( x ) + vi hi ( x ) = 0 ,
T

iI

Electrnica Industrial

UTN Facultad Regional Paran

Las condiciones FJ pueden ser escritas en forma vectorial como sigue

f ( x ) u 0 + g ( x ) u + h ( x ) v = 0 ,
T

(4.12)

uT g ( x ) = 0 ,

( u0 , u ) ( 0, 0 ) ,
( u0 , u, v ) ( 0, 0, 0 ) ,
donde g ( x ) es la matriz Jacobiana de m n cuya i-sima columna es gi ( x ) ,

(4.10)

h ( x ) es la matriz Jacobiana de l n cuya i-sima columna es hi ( x ) , g ( x ) , u y v

i =1

u0 , ui 0 para i I ,

son vectores de dimensin apropiadas. Cualquier punto x para el cual existan multipli-

{u0 , ui , i I , v1 ,

cadores de Lagrange que hagan cumplir las condiciones FJ se dice que es un punto FJ.

, vl } no todos nulos.

Ms aun, si gi, con i I , es tambin diferenciable en x ,entonces la condicin anterior


puede ser escrita como
m

u0f ( x ) + ui gi ( x ) + vi hi ( x ) = 0 ,
T

i =1

Considrese el siguiente conjunto S de restricciones

S = {x

(4.11)

i =1

ui gi ( x ) = 0 para i = 1,

u0 , ui 0 para i = 1,

Interpretacin grfica de las condiciones FJ.

: g1 ( x ) 0, g 2 ( x ) 0, g3 ( x ) 0} ,

donde los contornos de las distintas gi pueden verse en la Figura 4.15 a), y considrese
un punto factible x como el que se muestra en la misma figura. Considrense tambin

,m ,

los gradientes de las restricciones activas en x , g1 ( x ) y g 2 ( x ) , como se muestra

,m ,

en la Figura 4.15 b).

( u0 , u, v ) ( 0, 0, 0 ) ,

punto factible

donde u y v son vectores cuyas componentes son ui, con i=1, , m, y vi, con i=1, , l,
respectivamente.

Prueba. (Ver Goodwin et al. 2005).


Los escalares u0, ui para i=1, , m, y vi, con i=1, , l, son los multiplicadores de

Lagrange asociados con la funcin objetivo, las restricciones de desigualdad y las restricciones de igualdad, respectivamente. La condicin de que x sea un punto factible se
llama condicin de factibilidad primal (PF). La condicin (4.10) se llama condicin de

factibilidad dual (DF). La condicin ui gi ( x ) = 0 para i = 1,

a)

, m , se llama condicin de

b)

Figura 4.15.

relajacin complementaria (CS), y exige que ui=0 si la correspondiente desigualdad no


esta activa ( gi ( x ) < 0 ) y permite que ui>0 slo para las restricciones activas.
Alejandro H. Gonzlez

73

Alejandro H. Gonzlez

74

Electrnica Industrial

UTN Facultad Regional Paran

Para los contornos de la funcin objetivo dados en la Figura 4.16, se tiene que
u0 ( g ( x ) ) est en el cono formado por g1 ( x ) y g 2 ( x ) , con u0 > 0 .

Electrnica Industrial

UTN Facultad Regional Paran

De entre las diversas formas de lograr la calificacin para las restricciones, se elegir
aqu la tpica que exige que el gradiente de la restriccin de desigualdad para i I y el
gradiente de la restriccin de igualdad en x sean linealmente independientes.

a)

Figura 4.16.

b)

Figura 4.17.

Las condiciones FJ para este caso son:

f ( x ) u 0 + g ( x ) u = 0 ,
T

4.3.6. Condiciones necesarias de Karush-Kuhn-Tucker


(4.12)

Teorema (condiciones necesarias de Karush-Kuhn-Tucker). Sea X un conjunto

uT g ( x ) = 0 ,

abierto no vaco de

( u0 , u ) ( 0, 0 ) ,

hi ( x ) :

( u0 , u, v ) ( 0, 0, 0 ) ,

I = {i : gi ( x ) = 0} . Supngase que cada gi es continua en x para i I , que f y gi,

, y sea f ( x ) :

, gi ( x ) :

para i=1, , m, y

para i=1, , l. Sea x es una solucin factible de (4.9) y sea

con i I , son diferenciables en x y que hi es continuamente diferenciable en x para

por lo que x es un punto FJ con u0>0. Adems, x es un mnimo local.

i=1, , l. Ms aun, supngase que gi ( x ) , para i I , y hi ( x ) , para i=1, , l,


T

Para los contornos de la funcin objetivo dados en la Figura 4.17 a), se tiene que
u0 ( g ( x ) ) est en el cono formado por g1 ( x ) y g 2 ( x ) , slo si u0 = 0 . x es en

son linealmente independientes. Luego, si x es una solucin ptima local de (4.9), entonces existen escalares ui para i I y vi para i=1, , l, nicos, tales que

este caso un punto FJ con u0=0, y es tambin un mnimo local. Sin embargo, para los
contornos de la funcin objetivo dados en la Figura 4.17 b), se tiene que x es un punto

iI

FJ con u0=0, pero constituye un mximo local.


Bajo condiciones apropiadas de regularidad, que se denominan calificacin de res-

f ( x ) + ui gi ( x ) + vi hi ( x ) = 0 ,
T

(4.13)

i =1

ui 0 para i I ,

tricciones, se asegura que u0 sea positiva y las condiciones FJ se convierten en las con-

Ms aun, si gi, con i I , es tambin diferenciable en x , entonces la condicin anterior

diciones de Karush-Kuhn-Tucker. Estas nuevas condiciones sern presentadas a conti-

puede ser escrita como

nuacin.

i =1

Alejandro H. Gonzlez

f ( x ) + ui gi ( x ) + vi hi ( x ) = 0 ,

75

Alejandro H. Gonzlez

(4.14)

i =1

76

Electrnica Industrial
ui gi ( x ) = 0 para i = 1,

ui 0 para i = 1,

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

Existe aun un caso particular importante: cuando las restricciones son lineales, las

,m ,

condiciones KKT son tambin condiciones necesarias de optimalidad, independiente-

,m .

mente de la naturaleza de la funcin objetivo.

Prueba. (Ver Goodwin et al. 2005).

Resta an determinar, entre todos los puntos que cumplen las condiciones KKT cu-

Al igual que en las condiciones FJ, los escalares ui y vi se llaman multiplicadores de

les constituyen soluciones ptimas locales. Los resultados que siguen, muestran que,

Lagrange. La condicin de que x sea factible se denomina factibilidad primal (PF). El

bajo suposiciones moderadas de convexidad, las condiciones KKT son tambin sufi-

requerimiento (4.14), con ui 0 para i = 1,

cientes para la optimalidad local.

, m , junto con la independencia lineal de

los gradientes, se llama factibilidad dual (DF). Por ltimo, la condicin ui g i ( x ) = 0


para i = 1,

4.3.7. Condiciones suficientes de Karush-Kuhn-Tucker

, m , se llama condicin de relajacin complementaria (CS).


Teorema (condiciones suficiente de Karush-Kuhn-Tucker). Sea X un conjunto

Las condiciones KKT pueden ser escritas tambin en forma vectorial, como sigue:

f ( x ) + g ( x ) u + h ( x ) v = 0 ,
T

abierto no vaco de

(4.15)

hi ( x ) :

, y sea f ( x ) :

, gi ( x ) :

para i=1, , m, y

para i=1, , l. Sea x es una solucin factible de (4.9) y sea

uT g ( x ) = 0 ,

I = {i : gi ( x ) = 0} . Supngase que las condiciones KKT se cumplen para x , esto es,

u =0.

existen escalares ui 0 para i I , y vi para i=1, , l, tales que

La Figura 4.18 muestra algunos ejemplos grficos de puntos KKT, referidos a las Figuras 4.15 a 4.17. En los casos mostrados en 4.18 a) y 4.18 c), los puntos considerados

f ( x ) + ui gi ( x ) + vi hi ( x ) = 0 .
T

iI

(4.16)

i =1

Sea J = {i : vi > 0} y K = {i : vi < 0} . Ms aun, supngase que f es pseudo-convexa en

son puntos KKT, mientras que en 4.18 b) el punto considerado no lo es.

x , gi es quasi-convexa en x para i I , hi es quasi-convexa en x para i J y que hi es


quasi-cncava en x (esto es, -hi es quasi-convexa en x ) para i K . Entonces, x es
una solucin ptima global de (4.9).

Prueba. (Ver Goodwin et al. 2005).

4.3.8. Programacin cuadrtica


a)

b)

c)

La programacin cuadrtica es una clase particular de programacin no-lineal en la

Figura 4.18.
La calificacin de restricciones de independencia lineal es una condicin suficiente en
el comportamiento de las restricciones que asegura que un punto FJ (y por tanto cual-

cual la funcin objetivo es cuadrtica y las restricciones son lineales. Un problema de


programacin cuadrtica (QP) puede ser escrito como

nes de restricciones es garantizar que, mediante el anlisis de slo los puntos KKT, no

min xT Hx + xT c
2

se pierde ninguna solucin ptima.

sujeto a:

quier mnimo local) es un punto KKT. De este modo, la importancia de las calificacio-

Alejandro H. Gonzlez

77

Alejandro H. Gonzlez

(4.17)

78

Electrnica Industrial

UTN Facultad Regional Paran

UTN Facultad Regional Paran

Bajo ciertas condiciones de convexidad y apropiadas calificaciones de restricciones,

AIT x bI
A x = bE

los problemas primal y dual tienen idnticos valores ptimos de funcin objetivo.

T
E

donde H

Electrnica Industrial

nxn

, c

, AI

nxmI

, bI

mI

, AE

nxmE

, bE

mE

Considrese nuevamente el problema de programacin no-lineal dado por (4.9):

Problema Primal P

Como las restricciones son lineales, se tiene que

x es un mnimo local

min f ( x )

x es un punto KKT.

el conjunto restriccin S = { x : AIT x bI , AET x = bE } es un conjunto (polidrico) convexo.


Por tanto,
el problema QP es convexo

, m,

hi ( x ) = 0, i = 1,

, l,

Problema Lagrangiano Dual D


max ( u , v )

x es un mnimo local x es un mnimo global x es un punto KKT.

(4.18)

sujeto a:

Ms aun, si H > 0 ,entonces x es el nico mnimo global

u0,
m
l

donde ( u, v ) = inf f ( x ) + ui gi ( x ) + vi hi ( x ) : x X , es la funcin Lagrangiana


i =1
i =1

Las condiciones KKT (4.15) para el problema QP definido por (4.17) son:
AIT x bI

dual.

AET x = bE

4.4.1. Interpretacin geomtrica

Hx + c + AI u + AE v = 0

Condicin de relaj. compl. (CS):

gi ( x ) 0, i = 1,

Entonces, el problema Lagrangiano dual se define como sigue:

H es simtrica y definida positiva.

En ese caso,

Factibilidad dual (DF):

sujeto a:

x X.

la funcin objetivo es convexa

Factibilidad primal (PF):

(4.9)

u0

Considrese el siguiente problema primal P:

u T ( AIT x bI ) = 0 ,

min f ( x )

Donde u es el vector de multiplicadores de Lagrange correspondientes a la restriccin

sujeto a:

de desigualdad y v es el vector de multiplicadores de Lagrange correspondientes a la

g ( x ) 0,

restriccin de igualdad.

x X,
donde f :

4.4. Dualidad Lagrangiana

y g:

, y defnase el siguiente conjunto en

G = {( y, z ) : y = g ( x ) , z = f ( x ) para algun x X } ,

La idea de lo que se expondr en esta seccin se puede resumir como sigue:

esto es, G es la imagen de X segn el mapeo (g,f). La Figura 4.19 muestra un ejemplo

Dado un problema de programacin no-lineal, conocido como problema primal, exis-

para el conjunto G.

te otro problema de programacin no-lineal, estrechamente relacionado a l, que recibe


el nombre de problema Lagrangiano dual.
Alejandro H. Gonzlez

79

Alejandro H. Gonzlez

80

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

Finalmente, para resolver el problema Lagrangiano dual D, es necesario encontrar la


lnea con pendiente u ( u 0 ) tal que la ltima intercepcin con el eje z, ( u ) , sea
mxima segn u. Tal lnea tiene pendiente u y soporta a G (en el sentido de la definicin dada en la seccin 4.1) en el punto ( y , z ) , y se muestra en la Figura 4.22. Por tanto, la solucin del problema dual es u y el valor ptimo de la funcin objetivo dual es
z . Esto es, los problemas primal y dual tienen idnticos objetivos ptimos. En ese caso
se dice que no hay gap de dualidad (dualidad fuerte).
Figura 4.19
De este modo, el problema primal consiste en encontrar un punto en G que tenga mnima ordenada z y cumpla con y 0 . En la Figura 4.19, este punto viene dado por

( y, z ) .
Ahora, considrese el siguiente problema Lagrangiano dual D:
max ( u )

sujeto a:

Figura 4.20.

u0.

Figura 4.21.

La solucin al problema Lagrangiano dual requiere primero la resolucin del siguiente sub-problema Lagrangiano dual: ( u ) = inf { f ( x ) + ug ( x ) : x X } .
Dado un u 0 , el sub-problema Lagrangiano dual es equivalente a minimizar z+uy
en los puntos (y,z) de G. Ntese que z + uy = es la ecuacin de una lnea recta con
pendiente u que intercepta el eje z en (la Figura 4.20 muestra la lnea recta dada por
z + uy = - en lnea de trazos rojos - para un valor de u arbitrario). Por tanto, para mi-

nimizar z+uy en G es necesario mover la lnea z + uy = paralela a s misma tan lejos


como sea posible, siempre que permanezca en contacto con G (debe ser un hiperplano
Figura 4.22.

soporte, segn la definicin dada en la seccin 4.1). La ltima intercepcin con el eje z
as obtenida es el valor de ( u ) correspondiente al dado u 0 . La Figura 4.21 muestra

4.4.2. Dualidad fuerte y dualidad dbil

la lnea recta de la Figura 4.20 desplazada hacia abajo (para minimizar ) pero en conEl teorema que sigue muestra que la funcin objetivo correspondiente a cualquier so-

tacto con G, con la que se obtiene ( u ) 10.

lucin factible del problema dual constituye una cota inferior para la funcin objetivo
correspondiente a una solucin factible del problema primal.

10

En pocas palabras, se busca una recta tangente a G por debajo (soportante) que cruce el eje z en el punto ms bajo posible.

Alejandro H. Gonzlez

81

Alejandro H. Gonzlez

82

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

Teorema (dualidad dbil): Considrese el problema primal P dado por (4.9) y su


problema Lagrangiano dual correspondiente D (dado por (4.18)). Sea x una solucin
factible de P; esto es x X , g ( x ) 0 y h ( x ) = 0 . Adems, sea ( u , v ) una solucin
factible de D; esto es u 0 . Luego,

Figura 4.23.
Antes de esbozar el teorema en s, se enunciar el siguiente lema:

Lema: Sea X un conjunto convexo no vaco de


g:

f ( x ) ( u, v ) .

convexo por componentes, y sea h :

h ( x ) = Ax b ). Adems, sea u0 un escalar, u

Prueba. De la definicin de ( u , v ) , y del hecho de que x X , u 0 , g ( x ) 0 y

y v

. Sea :

, sea

afn (esto es, de la forma


l

. Considrense ahora los

siguientes sistemas:

h ( x ) = 0 , se tiene que

Sistema 1: ( x ) < 0 , g ( x ) 0 , h ( x ) = 0 para algn x X .

( u, v ) = inf { f ( x ) + u T g ( x ) + vT h ( x ) : x X } f ( x ) + uT g ( x ) + vT h ( x ) f ( x ) ,

Sistema 2: u0 ( x ) + u T g ( x ) + vT h ( x ) 0 para algn ( u0 , u , v ) ( 0, 0, 0 ) , ( u0 , u ) ( 0, 0 )


y para todo x X .

con lo que queda probado el teorema.


Del Teorema anterior se desprende el siguiente corolario:

Si el Sistema 1 no tiene solucin x, entonces el Sistema 2 tiene una solucin ( u0 , u , v ) .

Corolario:

Contrariamente, si el Sistema 2 tiene una solucin ( u0 , u , v ) con u0 0 , entonces el


Sistema 1 no tiene solucin.

inf { f ( x ) : x X , g ( x ) 0, y h ( x ) = 0} sup { ( u, v ) : u 0} .

Prueba. (Ver Goodwin et al. 2005).


Es decir, el valor ptimo de la funcin objetivo del problema primal es mayor o igual
que el valor ptimo de la funcin objetivo del problema dual. Si la desigualdad es estricta, entonces se dice que existe un gap de dualidad.

El resultado que sigue es el Teorema de dualidad fuerte:

Teorema (dualidad fuerte): Sea X un conjunto convexo no vaco de

La Figura 4.23 muestra un ejemplo de la interpretacin geomtrica de los problemas


dual y primal. Ntese que en el caso de esta figura existe un gap de dualidad debido a la
no-convexidad del conjunto G. Se ver a continuacin, en el Teorema de dualidad fuerte, que para condiciones apropiadas de convexidad se puede garantizar la no existencia
de gaps de dualidad entre los problemas primal y dual.

f:

y g:

convexas, y sea h :

. Sea

afn (esto es, de la forma

h ( x ) = Ax b ). Supngase que se cumplen las siguientes calificaciones de restriccio-

nes: existe un

x X

tal que

g ( x ) < 0 y h ( x ) = 0

y 0 int h ( X ) , donde

h ( X ) = {h ( x ) : x X } . Entonces,
inf { f ( x ) : x X , g ( x ) 0, y h ( x ) = 0} = sup { ( u , v ) : u 0} ,

donde ( u, v ) = inf { f ( x ) + u T g ( x ) + vT h ( x ) : x X } . Ms aun, si el nfimo es finito,


entonces el sup { ( u, v ) : u 0} es alcanzado en ( u , v ) con u 0 . Si el nfimo es alcanzado en x , entonces u T g ( x ) = 0 .

Prueba. (Ver Goodwin et al. 2005).


Para terminar la seccin se desarrollar el siguiente ejemplo ilustrativo:

Alejandro H. Gonzlez

83

Alejandro H. Gonzlez

84

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

Ejemplo: Considrese el siguiente problema de optimizacin:


Problema Primal P
min ( x 1)

sujeto a:
2x 1 = 0
x X = {x

: x 2} .
2

1 1
El valor ptimo de la funcin objetivo es 1 = , dado que el conjunto factible
4
2

Objetivo dual y primal ptimos

1
est dado slo por el punto .
2

Figura 4.24.

4.5. Conceptos bsicos de control ptimo. Regulador cuadrtico

Problema Lagrangiano Dual D

lineal (LQR)

max ( v )

donde ( v ) = inf

{( x 1)

+ v ( 2 x 1) : x 2 , es la funcin Lagrangiana dual.

En esta seccin se busca aplicar los conceptos de teora de la optimizacin al caso del
control de un sistema dinmico. El objetivo general es hallar una secuencia de controles

Derivando con respecto a x e igualando a cero se tiene que el valor de la variable que

(eventualmente, una ley de control) que minimice una cierta funcin objetivo. Esta fun-

optimiza la funcin objetivo del sub-problema Lagrangiano dual es x* = v + 1 (si

cin es por lo general un ndice que busca describir el desempeo del control, esto es, la

1 v 3 ). De este modo, ( v ) = ( v + 1 1) + v ( 2v + 2 1) = v + v .

rapidez con que se logran los objetivos deseados, el uso o gasto de las variables de

Derivando ahora con respecto a v e igualando a cero, se tiene que el valor de la varia1
ble que optimiza la funcin objetivo del problema Lagrangiano dual es v = y el valor
2
*

ptimo de la funcin objetivo del mismo problema es ( v* ) + v* =


2

1
. Esto es, no existe
4

gap de dualidad. La grfica de este ejemplo se muestra en la Figura 4.24.

control para lograr los objetivos deseados, etc. Se comenzar con el anlisis para sistemas no lineales, para luego pasar a sistemas lineales, ya que es all donde las condiciones generales asumen formas concretas, y por tanto, ms fciles de intuir y ms tiles.
Considrese el siguiente sistema no-lineal
x ( k + 1) = f ( x ( k ) , u ( k ) )
n

donde f :
y u

nu

nu

k 0,

x ( 0 ) = x0

es una funcin no lineal dada, x

(4.19)
n

es el estado del sistema

es la entrada de control.

Se puede pensar el sistema de ecuaciones (4.19) como un juego de restricciones de


igualdad que deben cumplirse en todo tiempo k de un dado intervalo. Adems, podran
incluirse restricciones adicionales en los estados y las entradas, que pueden ser escritas
como sigue:
u ( k ) U
Alejandro H. Gonzlez

85

k = 0,

Alejandro H. Gonzlez

, N 1,
86

Electrnica Industrial
x (k ) X

k = 0,

UTN Facultad Regional Paran

Electrnica Industrial

Defnase en primer lugar una nueva variable que agrupa estados y entradas,

, N,

x(N ) X f X ,

donde U

nu

, X

,y Xf

son ciertos conjuntos, y N es el horizonte de op-

timizacin.

Por el momento, sin embargo, el problema de control ptimo de horizonte fijo que interesa tiene la siguiente forma (control sin restricciones de entrada y estado) 11:
PN ( x ) :

VNopt ( x0 )

min VN

x ( k + 1) = f ( x ( k ) , u ( k ) )

, x ( N )} , {u ( k )}

para k = 0,1,

estados y de controles. VN
VN

{ x ( k )} , {u ( k )}

donde F :

{u ( 0 ) ,

, N 1

({x ( k )} ,{u ( k )}) es la funcin objetivo, que estar dada por


N 1

(4.21)

k =0

nu

son funciones diferenciables.

Las secuencias de estados y de controles que minimizan la funcin objetivo se denominan secuencias ptimas o minimizadoras. El valor ptimo de la funcin objetivo correspondiente a las secuencias ptimas es VN ( x0 ) . La funcin VN ( ) se denomina fun-

A continuacin se determinarn condiciones necesarias para que las secuencias

, x ( N )} , {u ( 0 ) ,

(4.22)

h1


hn

hn +1



h ( x ) =
h2 n

h
+
1
Nn

h
( N +1)n

Funcin vectorial

( N +1)n + Nnu

N +1 n
( )

x0 x ( 0 )

f
x
u

x
0
,
0
1
(
)
(
)
(
)
(
)

= 0,

f
x
N

u
N

x
N
1
,
1
) (
) ) ( )
( (

n ecuaciones

(4.23)

N +1 n + Nnu
N +1 n
( ) es una funcin vectorial.
donde h : ( )

Ntese que cada estado y entrada, en un dado tiempo k, est dado a su vez por

cin valor, y es funcin slo del estado inicial.

{x ( 0) ,

igualdad para la variable x:

(4.20)

, u ( N 1)} son las secuencias de

F ( x ( N )) + L ( x ( k ) , u ( k )) ,

, L:

( N +1) n + Nnu

De este modo, es posible escribir las ecuaciones (4.19) como ( N + 1) n restricciones de

x ( 0 ) = x0

{x ( 0) ,

x ( 0)

x(N )

u ( 0)

u ( N 1)

Estas variables son las variables respecto de las cuales se realizar la optimizacin.

({x ( k )} ,{u ( k )})

s.a :

donde { x ( k )}

UTN Facultad Regional Paran

, u ( N 1)} sean secuencias ptimas del problema PN ,

segn las condiciones KKT. Ntese que el problema PN tiene restricciones de igualdad
pero no de desigualdad. Para poder aplicar las condiciones de optimalidad de KKT es
necesario primero verificar la calificacin de las restricciones, esto es, que los gradien-

x (k )

x1 ( k )

xn ( k )

u (k )

u1 ( k )

unu ( k )

para k = 0,

nu

para k = 0,

,N

(4.24)

, N 1,

(4.25)

y la funcin f del sistema, por

f ( x ( k ) , u ( k ))

f1 ( x ( k ) , u ( k ) )

f n ( x ( k ) , u ( k ) )
T

(4.26)

tes de las restricciones de igualdad sean linealmente independientes en las secuencias


ptimas.
11

Estas restricciones adicionales sern analizadas en detalle en captulos posteriores, en el marco general
del control predictivo basado en modelos

Alejandro H. Gonzlez

87

Alejandro H. Gonzlez

88

Electrnica Industrial

UTN Facultad Regional Paran

Las derivadas parciales de f (matrices Jacobianas), respecto a los estados en el tiempo


k, primero, y a las entradas en el tiempo k, despus, estn dadas por

f
x ( k )

f1
x ( k )
1

f n
x1 ( k )

f1
xn ( k )

f n
xn ( k )

f
u ( k )
gradiente de fi

12

f1
u ( k )
1

f n
u1 ( k )

Electrnica Industrial

(que son las restricciones en PN). Con estos valores se forma la siguiente funcin Lagrangiana (que toma valores reales)

f1

unu ( k )

f n
unu ( k )

funcion objetivo

( x, )

h
x

In
f

x ( 0 )

N 1

+ (k )
k =0

In

f
x (1)

In

f
x ( N 1)

In

0
f
u ( 0 )

donde

u ( N 1)

0
f
u (1)
0

En la expresin anterior se puede ver que

h
tiene rango completo (sus filas son l.i.),
x

por lo que los gradientes de las restricciones de igualdad del problema PN son linealmente independientes en

( N +1) n + N nu

. De este modo, la calificacin de restricciones re-

querida por las condiciones KKT se cumple para todo x

( N +1) n + N nu

A continuacin se presentarn los multiplicadores de Lagrange (tambin conocidos


como variables adjuntas o co-estados) asociados al problema PN. ( 1) es el multipliLagrange

{ ( k )} { ( 0 ) ,
12

asociado

, ( N 1)} , ( k )

al
n

estado

inicial,

mientras

que

, sern los asociados a la ecuacin de estado

f
En el caso de sistemas lineales, estas derivadas toman la forma
x ( k )

Alejandro H. Gonzlez

( 1)

(0) .

( N 1)

x ( 0 )

x (N)

u ( 0)

u ( N 1)

( N +1) n + Nnu

el vector formado por las secuencias de estado y entrada ptimos. Entonces la condicin

identidad de n n .

de

(4.27)

f ( x ( k ) , u ( k ) ) x ( k + 1)

Sea ahora,

donde 0 representa matrices nulas de dimensiones apropiadas e I n representa la matriz

cador

restricciones h

gradiente de hi

primera restriccion

N 1

F ( x ( N ) ) + L ( x ( k ) , u ( k ) ) + ( 1) ( x0 x ( 0 ) )
k =0

Por otro lado, la matriz Jacobiana (de dimensin ( N + 1) n ( N + 1) n + N nu ) de la


funcin vectorial h ( x ) , estar dada por

UTN Facultad Regional Paran

f
A,
u ( k )

de factibilidad dual de KKT requiere que exista un vector

( 1)

( 0)

( N 1)

tal que la derivada parcial de la funcin Lagrangiana,


modo, se debe cumplir lo siguiente:

( x , )
x ( k )

( x , )
u ( k )

B.

89

, se anule en ( x , ) . De este
x

=0

para k = 0,

,N

(4.28)

=0

para k = 0,

, N 1 .

(4.29)

Alejandro H. Gonzlez

90

Electrnica Industrial

UTN Facultad Regional Paran

y
refieren a los vectores fila de derivadas
x ( k )
u ( k )

Ntese que en (4.28) y (4.29),

parciales (gradientes) que siguen

Electrnica Industrial

Por tanto, de (4.30) - (4.32) y de la ecuacin de estado (4.19), se tiene que una condicin necesaria para que las secuencias { x ( 0 ) ,

x1 ( k )


,
xn ( k )

u ( k )

u1 ( k )


.
unu ( k )

{ ( 1) , ( 0 ) ,

nu

Ecuacin de estado

x ( k + 1) =

x ( k ) , u ( k ) , ( k )
( k )

) = f ( x ( k ) , u ( k ))

k = 0,

, N 1,

x ( 0 ) = x0 .

, como sigue:

II)

costo de etpa

( x ( k ) , u ( k ) , ( k ))

, u ( N 1)} sean

, ( N 1)} tales que se cumplan las siguientes ecuaciones:

I)

Antes de calcular las derivadas (4.28) y (4.29), se definir la funcin Hamiltoniana o


n

, x ( N )} , {u ( 0 ) ,

secuencias ptimas del problema PN , es que exista una secuencia de vectores

x ( k )

Hamiltoniano, :

UTN Facultad Regional Paran

Ecuacin adjunta (o Ecuacin de co-estados)

sistema

L ( x ( k ) , u ( k )) + ( k ) f ( x ( k ) , u ( k )) ,
T

para k = 0,

, N 1

( k 1) =

donde L es el costo de etapa de la funcin objetivo. Ntese que la funcin Hamiltoniana


cumple con:

III)

x ( k ) , u ( k ) , ( k )

x ( k )

para k = 0,

,N - 1 .

Condiciones de borde

L
f
T
=
+ (k )
,
x ( k ) x ( k )
x ( k )

con

L
L
=
x ( k ) x1 ( k )

L
,
xn ( k )

( ( N 1) )

L
f
T
,
=
+ (k )
u ( k ) u ( k )
u ( k )

con

L
L
=
u ( k ) u1 ( k )

L
,
unu ( k )

IV)

F ( x ( N ) )
x ( N )

Condicin Hamiltoniana (o Estacionaria)

( x ( k ) , u ( k ) , ( k ) )
u ( k )

= f ( x ( k ) , u ( k )) .
( k )

=0

para k = 0,

,N - 1 .

Ntese que, en particular, esto significa que el control minimizador u ( k ) es un pun

Ahora s, se establecern las condiciones KKT, usando para ello la definicin de funcin Hamiltoniana vista.
( x , )
x ( k )

( x , )
x ( N )

( x , )
u ( k )

( x ( k ) , u ( k ) , ( k ) )
x ( k )

F ( x ( N ) )
x ( N )

( ( k 1) ) = 0

u ( k )

x (k ) ,u (k ), (k )

para k = 0, ,N - 1 , (4.30)

( ( N 1) ) = 0

( x ( k ) , u ( k ) , ( k ) )

to estacionario 13 de la funcin Hamiltaniana definida como

L x ( k ) , u ( k ) + ( k ) f ( x ( k ) , u ( k ) ) ,

(4.31)

para k = 0,

, N 1

4.5.1. Regulador cuadrtico lineal en tiempo discreto


Las ecuaciones I) IV) establecen condiciones para el problema general del control

=0

para k = 0,

,N - 1 .

(4.32)

ptimo de sistemas no-lineales, considerando una funcin objetivo tambin muy gene13

Alejandro H. Gonzlez

91

Estacionario significa, en general, que una derivad es nula.

Alejandro H. Gonzlez

92

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

ral. De ah que no sea fcil deducir de ellas expresiones explcitas que determinen la

( x ( k ) , u ( k ) , ( k )) =

secuencia de controles ptimos. En esta seccin se considerar el caso, muy importante


para los objetivos del curso, de sistemas lineales sin restricciones, cuando la funcin

x ( k + 1) =

como una funcin del tiempo.

( k )

estado final fijo, que deriva en una estrategia de control de lazo abierto, y la solucin

k = 0,

, N 1 , (4.35)

= Qx ( k ) + AT ( k ) k = 0,

,N - 1 , (4.36)

y la condicin Hamiltoniana o estacionaria (IV), por

para el caso de estado final libre, que deriva en una estrategia de control de lazo cerrado.
0=

A continuacin demostrar como arribar a la ltima.

) = Ax ( k ) + Bu ( k )

x ( k ) , u ( k ) , ( k )
( k 1) =

x ( k )

En general, se pueden obtener dos soluciones importantes: la solucin para el caso de

x ( k ) , u ( k ) , ( k )

dos y entradas, respectivamente. El sistema lineal, a su vez, puede ser considerado como
un hiperplano que intersecta la superficie cuadrtica y se mueve a travs del espacio

1
T
T
T
x ( k ) Qx ( k ) + u ( k ) Ru ( k ) + ( k ) ( Ax ( k ) + Bu ( k ) ) ,
2

de modo que las Ecuaciones de estado (I) y co-estados (II) vendrn dadas por

objetivo es de tipo cuadrtica. Esta funcin objetivo puede ser considerada como una
superficie cuadrtica de dimensin n+nu, donde n y nu son las dimensiones de los esta-

UTN Facultad Regional Paran

( x ( k ) , u ( k ) , ( k ) )
u ( k )

= Ru ( k ) + BT ( k )

para k = 0,

,N - 1 . (4.37)

Caso estado terminal libre


De acuerdo con esta ltima ecuacin, el control ptimo en k se puede obtener como

El sistema que se quiere controlar est dado por


x ( k + 1) = Ax ( k ) + Bu ( k )

u ( k ) = R 1 BT ( k )

(4.33)

,N - 1 .

un vector de co-estados que cumpla con las condiciones anteriores. Utilizando (4.38)
n

es el estado del sistema y u

nu

es la entrada de control. La funcin

objetivo estar dada por

1
1
T
T
T
VN = x ( N ) P ( N ) x ( N ) + x ( k ) Qx ( k ) + u ( k ) Ru ( k ) ,
2
2 k =0
que est definida en el intervalo de inters
P ( k ) , k = 0,

para eliminar el control u ( k ) de la ecuacin de estado (4.35), se tiene

x ( k + 1) = Ax ( k ) BR 1BT ( k )
N 1

[0, N ] .

(4.34)

k = 0,

(4.39)

ma autnomo con la siguiente forma:


Las matrices Q, R y

, N , son simtricas y semi-definidas positivas, y adems R 0 . El

El objetivo es entonces encontrar la secuencia de controles

x ( k + 1) A BR 1BT x ( k )

=
.

AT
( k 1) Q
( k )

(4.40)

La matriz de este sistema Hamiltoniano discreto se denomina Matriz Hamiltoniana.


14

{u ( 0 ) ,

, u ( N 1)}

que minimiza la funcin objetivo VN. La funcin Hamiltoniana estar dada en este caso

Este sistema, no obstante, es difcil de resolver ya que parte de l evoluciona hacia delante y parte hacia atrs. Si la Matriz A es invertible (que es el caso ms comn en sistemas discretos), entonces la ecuacin de estados puede ser escrita en reversa

por

x ( k ) = A1 x ( k + 1) + A1BR 1BT ( k )

k = 0,

, N 1 ,

y de este modo, el sistema autnomo (4.40) toma la forma

Una vez obtenida la secuencia de controles, es trivial obtener la secuencia de estados.

Alejandro H. Gonzlez

, N 1 .

El sistema acoplado de estado y co-estado puede entonces ser escrito como un siste-

estado terminal x ( N ) pude asumir cualquier valor.

14

(4.38)

De este modo, la secuencia recontroles ptima puede ser determinada si se encuentra

x ( 0 ) = x0 ,

donde x

para k = 0,

93

Alejandro H. Gonzlez

94

Electrnica Industrial
x ( k ) A1

=
( k 1) QA1

UTN Facultad Regional Paran

x ( k + 1)
.

A + QA BR B ( k )
1

x (k ) ,

1 T

Esta recursin evoluciona enteramente hacia atrs (o en reversa), de modo que si se conocen los valores finales x ( N ) y

UTN Facultad Regional Paran

Luego, de (4.44) y (4.45) se obtiene una ecuacin que involucra slo al estado ptimo

A1BR 1BT

Electrnica Industrial

( N 1) , entonces se pueden determinar

x (k ) y

( k ) , y por tanto la secuencia de controles ptima. Desafortunadamente, slo se co-

P ( k ) x ( k ) = Qx ( k ) + AT P ( k + 1) I + BR 1BT P ( k + 1)

Ax ( k )

k = 0,

, N 1 .

Como esta ecuacin se cumple para todo x ( k ) para un dado x0 , entonces se puede
escribir

noce x0 .
Las condiciones iniciales estn dadas por x0 = x0 , mientras que el estado terminal,
x ( N ) est libre. De la condicin de borde (III) se tiene entonces que
F ( x ( N ) )
= P ( N ) x ( N ) .
( N 1) =
x ( N )

A+Q.

Usando ahora el lema de inversin de matrices (Lewis, 1986), se puede escribir

P ( k ) = AT P ( k + 1) I + BR 1BT P ( k + 1)

(4.41)

P ( k ) = AT P ( k + 1) P ( k + 1) B BT P ( k + 1) B + R

BT P ( k + 1) A + Q ,

(4.46)

que es una recursin en reversa para la P ( k ) propuesta, que la determina completamen-

Esta relacin entre el estado y el co-estado finales es la relacin que particulariza el


hecho de tener libre el estado final.
Para resolver este problema con dos condiciones de borde (estado inicial y co-estado

te a partir de P ( k + 1) y las matrices conocidas del sistema y de los pesos de la funcin


objetivo. Justamente, la matriz P ( N ) (penalizacin terminal) es conocida, por lo que a

final), se puede utilizar el mtodo del intercambio (Bryson and Ho 1975). Segn ese

partir de ella se puede obtener toda la secuencia P ( k ) , k = 0,

mtodo se supone que la relacin lineal (4.41) se cumple para todo tiempo

la secuencia P ( k ) se puede obtener, a partir de (4.44), y conociendo el estado inicial

( k ) = P ( k + 1) x ( k + 1)

k = 0,

la secuencia de matrices
P cobra importancia

, N 1 .

(4.42)

k = 0,

y resolviendo (4.43) para x ( k + 1) , se tiene

x ( k + 1) = I + BR B P ( k + 1)

1 T

Ax ( k )

, N 1,

(4.43)

k = 0,

, N 1,

(4.44)

A+Q .

(4.47)

Ahora slo resta determinar la secuencia de controles ptimos, a partir de los estados
ptimos y de la secuencia P ( k ) . De (4.38), que vincula el control con el co-estado, se

gunda relacin entre x ( k + 1) y x ( k ) :


P ( k ) x ( k ) = Qx ( k ) + A P ( k + 1) x ( k + 1) k = 0,
T

P ( k ) = AT P ( k + 1) + BR 1BT

Ahora, reemplazando (4.42) en la ecuacin de co-estados (4.36), se obtiene una se-

invertible para todo k, se puede escribir de un modo ms compacto (usando nuevamente el lema de inversin de matrices), como sigue:

slo estados

que es una recursin hacia delante de los estados ptimos.

,N .

La ecuacin (4.46) es la conocida ecuacin de Riccati que, suponiendo que P ( k ) es

As, reemplazando (4.42) en (4.39) se tiene

x ( k + 1) = Ax ( k ) BR 1BT P ( k + 1) x ( k + 1)

x0 , la secuencia de estados ptimos, x ( k ) , k = 1,

, N 1 . A su vez, con

tiene
u ( k ) = R 1 BT ( k )

,N - 1 .

para k = 0,

,N - 1 ,

(4.48)

(4.45)

slo estados
Alejandro H. Gonzlez

95

Alejandro H. Gonzlez

96

Electrnica Industrial

UTN Facultad Regional Paran

y de (4.42), que vincula el co-estado ( k ) con P ( k + 1) y con el estado x ( k + 1) se

Electrnica Industrial
VN =

tiene

u ( k ) = R 1 BT P ( k + 1) x ( k + 1)

= R B P ( k + 1) ( Ax ( k ) + Bu ( k ) )
1

para k = 0,

1 T
1 N 1
T
x0 P ( 0 ) x0 + x ( k + 1) P ( k + 1) x ( k + 1)
2
2 k =0

+ x ( k ) ( Q P ( k ) ) x ( k ) + u ( k ) Ru ( k ) .
T

para k = 0,

,N - 1 .

(4.49)

De este modo, se ha llegado a una realimentacin de estado variante en el tiempo (llamada la secuencia de ganancias de Kalman), de la forma

que
VN =

1 T
1 N 1
T
x0 P ( 0 ) x0 + x ( k ) ( AT P ( k + 1) A + Q P ( k ) ) x ( k )
2
2 k =0

+ x ( k ) AT P ( k + 1) Bu ( k ) + u ( k ) BT P ( k + 1) Ax ( k ) + u ( k )
T

u ( k ) = K ( k ) x ( k ) ,

(4.50)

( B P ( k + 1) B + R ) u ( k )}.
T

Segn la ecuacin de Riccati (4.46), el primer trmino de la sumatoria anterior se

con

puede escribir como

K ( k ) = ( BT P ( k + 1) B + R ) BT P ( k + 1) A .
1

(4.51)

VN =

El sistema a lazo cerrado, utilizando (4.50), queda

x ( k + 1) = ( A BK ( k ) ) x ( k )

k = 0,

+ x ( k ) A P ( k + 1) Bu ( k ) + u ( k ) B P ( k + 1) Ax ( k ) + u ( k )

, N 1 ;

( B P ( k + 1) B + R ) u ( k )}.

(4.52)

La sumatoria en (4.52) puede ser escrita a su vez como (McReynolds 1966):

timos. Al ser la ley recontrol variante en el tiempo, el sistema autnomo que se ob-

VN =

control de est tipo, esto es, ptimo, no se puede obtener por mtodos clsicos del
dominio frecuencial.

T
1
1 T
1 N 1
x0 P ( 0 ) x0 + ( BT P ( k + 1) B + R ) BT P ( k + 1) Ax ( k ) + u ( k )

2
2 k =0

( B P ( k + 1) B + R ) ( B P ( k + 1) B + R )

tiene del lazo cerrado es tambin variante en el tiempo, lo que evidencia que un

cin objetivo, cuando se implementa la ley de control ptima. Ntese primero que

BT P ( k + 1) Ax ( k ) + u ( k ) .

Si se usa ahora la ley de control ptima

Para completar el desarrollo se determinar a continuacin el valor ptimo de la fun-

1
1 T
1 N 1
T
x0 P ( 0 ) x0 + x ( k ) AT P ( k + 1) B ( BT P ( k + 1) B + R ) BT P ( k + 1) A x ( k )
2
2 k =0
T

ecuacin sta que provee una alternativa para el clculo de la secuencia de estados p-

N 1

Teniendo en cuenta ahora la ecuacin de estado x ( k + 1) = Ax ( k ) + Bu ( k ) , se tiene

u ( k ) = ( B P ( k + 1) B + R ) B P ( k + 1) Ax ( k )
1

1
1 N 1
T
T
T
x ( N ) P ( N ) x ( N ) + x ( k ) Qx ( k ) + u ( k ) Ru ( k )
2
2 k =0

,N - 1,

UTN Facultad Regional Paran

u ( k ) = ( BT P ( k + 1) B + R )

BT P ( k + 1) Ax ( k ) , se tiene la sumatoria anterior es nula. De este modo, slo permane-

ce el trmino inicial, lo que permite escribir

1
T
T
x ( k + 1) P ( k + 1) x ( k + 1) x ( k ) P ( k ) x ( k )
2 k =0
.
1
1
T
= x ( N ) P ( N ) x ( N ) x0T P ( 0 ) x0
2
2

VN* =

cin objetivo (4.34), sin alterarla

N 1

1
1
T
T
x ( N ) P ( N ) x ( N ) + x ( k ) ( Q + K kT RK k ) x ( k )
2
2 k =0
1
= x0T P ( 0 ) x0 .
2
=

Por tanto, se puede agregar la resta del lado izquierdo menos el lado derecho a la fun-

1
1 N 1
T
T
T
x ( N ) P ( N ) x ( N ) + x ( k ) Qx ( k ) + u ( k ) Ru ( k )
2
2 k =0

)
(4.53)

Este resultado, algo asombroso por su simpleza y contundencia, merece an una breve discusin. La secuencia P ( k ) se calcula completamente antes de implementar el
Alejandro H. Gonzlez

97

Alejandro H. Gonzlez

98

Electrnica Industrial

UTN Facultad Regional Paran

control ptimo (off-line), de modo que P ( 0 ) se conoce a priori. Luego, dado cualquier
estado inicial x0 , se puede usar (4.53) para determinar el costo completo de aplicar el
control ptimo, antes incluso de haberlo aplicado. En general, se puede considerar cualquier tiempo k en [ 0, N ] como el tiempo inicial de un sub-intervalo, de modo que
Vk*, N =

Electrnica Industrial

UTN Facultad Regional Paran

K = ( BT P B + R ) BT P A .
1

(4.55)

Esto es, se ha llegado a una ley de realimentacin de estado invariante en el tiempo de


la forma
u ( k ) = K x ( k ) .

1
T
x (k ) P (k ) x (k ) ,
2

Cabe ahora la pregunta de cmo queda la funcin objetivo o costo, en el caso de que

donde el subndice k,N significa que el sub-intervalo considerado va de k hasta N. Este


importante resultado significa que dado el estado actual de un sistema, x ( k ) , se puede

k . Este costo toma la forma

V =

conocer el costo para ir hasta (esto es el, el costo que queda para llegar hasta N) de

1
1
T
T
T
x ( ) P x ( ) + x ( k ) Qx ( k ) + u ( k ) Ru ( k ) ,
2
2 k =0

(4.56)

y dado que se supone que el sistema de lazo cerrado es estable, el estado converge a

aplicar el control ptimo desde el tiempo k hasta N.

cero para un tiempo infinito. De este modo la ecuacin (4.56) se puede escribir como

4.5.2. Regulador cuadrtico lineal en tiempo discreto con horizonte infiV =

nito
La ecuacin de Riccati (4.46), como se dijo, se debe resolver en reversa para as obtener la secuencia de matrices P ( k ) , k = 0,

, N 1 a partir de P ( N ) . A medida que

k , la secuencia P ( k ) tiene diferentes tipos de comportamiento: puede converger

converge,

entonces

para

un

grande

se

cumplir

Por ltimo, las tablas 4.1 y 4.2 muestran un resumen de lo expuesto en relacin al re-

P ( k ) = P ( k + 1) . Por tanto, en el lmite, la ecuacin de Riccati (4.46) se convertir

gulador cuadrtico lineal (LQR) de horizonte finito y horizonte infinito, respectivamen-

negativo

1
T
T
x ( k ) Qx ( k ) + u ( k ) Ru ( k )
2 k =0
1
T
= x ( k ) ( Q + K T RK ) x ( k )
2 k =0
1
= x0T P x0 .
2

V* =

va o definida positiva; o bien puede no converger a una matriz finita.


P (k )

El costo ptimo, finalmente, vendr dado por

a una matriz de estado estacionario P ( ) , la cual puede ser nula, semi-definida positi-

Si

1
T
T
x ( k ) Qx ( k ) + u ( k ) Ru ( k )
2 k =0

te.

en

P = AT P PB BT PB + R

BT P A + Q ,

(4.54)

x ( k + 1) = Ax ( k ) + Bu ( k )

Sistema

x ( 0 ) = x0

que es lo que se conoce como ecuacin algebraica de Riccati (ARE) y es una ecuacin
que no depende del tiempo. De este modo, la solucin lmite de la ecuacin de Riccati

Funcin objetivo

(4.46), esto es, la solucin que se obtiene resolviendo en reversa (4.46) hasta infinito,
ser siempre solucin de (4.54) (la inversa no es cierta). En caso de que dicha matriz

Parmetros de la fun-

lmite exista, se denominar P , y la correspondiente ganancia de Kalman estacionaria

cin objetivo

VN =

1
1 N 1
T
T
T
x ( N ) P ( N ) x ( N ) + x ( k ) Qx ( k ) + u ( k ) Ru ( k )
2
2 k =0

P ( N ) 0 , Q 0 , R > 0 y simtricas

ser
Alejandro H. Gonzlez

99

Alejandro H. Gonzlez

100

Electrnica Industrial
Secuencia de penalizacin terminal.

Ecuacin de Riccati

UTN Facultad Regional Paran

en el tiempo

UTN Facultad Regional Paran

V* =

Costo ptimo

1 T
x0 P x0 .
2

No considera restricciones en la variable de control ni en los


Inconvenientes para

u ( k ) = K ( k ) x ( k )

Realimentacin de
estado ptima variante

1
P ( k ) = AT P ( k + 1) P ( k + 1) B BT P ( k + 1) B + R BT P ( k + 1) A + Q

k = 1, , N 1 y P ( N ) dado

Electrnica Industrial

estados.

su aplicacin
No considera posibles perturbaciones (control off-line)

K ( k ) = ( BT P ( k + 1) B + R ) BT P ( k + 1) A
1

Tabla 4.2. Resultados referentes al regulador cuadrtico lineal (LQR) de horizonte in1 T
x0 P ( N ) x0 .
2

VN* =

Costo ptimo

finito.

No considera restricciones en la variable de control ni en los


Inconvenientes para

estados.

su aplicacin

Referencias bibliogrficas
No considera posibles perturbaciones (control off-line)

Goodgwin G.C., Seron, M.M. and De Don J.A. Constrained control and estimation.

Tabla 4.1. Resultados referentes al regulador cuadrtico lineal (LQR) de horizonte finito.

Parmetros de la funcin objetivo

F. Lewis. Optimal control. John Wiley & Sons 1986.

x ( k + 1) = Ax ( k ) + Bu ( k )

Sistema

Funcin objetivo

An optimization approach. Springer 2005.

x ( 0 ) = x0
V =

1
T
T
x ( k ) Qx ( k ) + u ( k ) Ru ( k )
2 k =0

Q 0 , R > 0 y simtricas

Penalizacin terminal.

Ecuacin algebraica

P = AT P PB BT PB + R

BT P A + Q

de Riccati (ARE)

Realimentacin de
estado ptima invariante en el tiempo

Alejandro H. Gonzlez

u ( k ) = K x ( k )

K ( k ) = ( BT P B + R ) BT PP A
1

con P solucin de la ARE

101

Alejandro H. Gonzlez

102

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

5.1.1. Importancia de las restricciones:

Parte II

Ms all de que los problemas reales presentan de hecho limitaciones en las entradas

5. Control predictivo basado en modelos

y salidas, la contemplacin explcita de restricciones en la estrategia de control, permite


usar las variables manipuladas en todo su rango, saturndolas cuando es necesario.

5.1. Ventajas y desventajas de MPC

Ntese que en muchos procesos es deseable que las entradas se mantengan en uno de
sus lmites para optimizar gastos energticos (por ej. vlvulas que regulan el suministro

La tcnica MPC es la nica tcnica avanzada de control que ha tenido un impacto


significativo en el control de procesos industriales. Su creciente xito se debe, esencialmente, a las siguientes virtudes (Maciejowsky, 2000, Camacho y Bordons 1999,
Mayne et al. 2000):

de un fluido costoso). Un control que slo se aparta de los lmites no es til en este
caso.
La presencia de lmites en las entradas cambia la naturaleza del sistema. Por ejemplo,
un sistema lineal inestable con restricciones en la entrada presenta un conjunto de per-

1. Posee una formulacin en el dominio del tiempo, flexible, abierta e intuitiva.

turbaciones bien definido, fuera del cual no es posible estabilizar el lazo con entradas

2. Trata problemas de control tanto lineales como no lineales, monovariados como

factibles.

multivariados e interactivos, utilizando la misma formulacin del controlador.

5.2. Formulacin bsica

3. Tiene en cuenta en su formulacin las limitaciones de los actuadores.


4. Permite operaciones en las proximidades de las restricciones (a diferencia de los
controles convencionales), lo que frecuentemente lleva a operaciones ms redituables.

El control predictivo basado en modelos, o MPC, es una variante de la teora general


de control basado en modelos que se enmarca dentro de los controladores ptimos, es
decir, aquellos en los que las actuaciones responden a la optimizacin de un cierto crite-

Entre las desventajas de esta tcnica de control, se pueden anotar las siguientes:

rio. Supngase que un proceso est representado por el siguiente modelo en variables de

1. En algunos casos se requiere el conocimiento de un modelo dinmico del sistema


suficientemente preciso.

estado
x ( k + 1) = Ax ( k ) + Bu ( k )

(5.1)

y ( k ) = Cx ( k )

(5.2)

2. El controlador requiere un algoritmo de optimizacin, por lo que slo puede implementarse por computadora.
3. Se requiere un alto costo computacional, lo que hace difcil su aplicacin a sistemas rpidos.

donde x

nx

, u

nu

e y

ny

Obsrvese que en el modelo (5.1)-(5.2), se presupone que el proceso opera en torno a

4. Resulta compleja la inclusin de incertidumbre en la formulacin.

un estado estacionario representado por ( u ss , y ss ) . De este modo, los vectores de entrada y salida representados en (5.1)-(5.2) son en rigor diferencias respecto de los valores
estacionarios. Esto es,
y ( k ) = y ( k ) y ss ,

Alejandro H. Gonzlez

103

Alejandro H. Gonzlez

u ( k ) = u ( k ) u ss ,

104

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

donde y y u representan los valores reales (esto es, los valores aplicados al proceso) de
pasado

la salida y la entrada respectivamente.

futuro

sp

Considrese ahora un controlador genrico, que para un dado instante k y un dado estado

actual

u ( k / k ) , u ( k + 1/ k ) ,

x (k ) ,

calcula

la

secuencia

de

controles

Y
control implementado al
tiempo k

salida predicha

, u ( k + m 1/ k ) que minimiza la siguiente funcin objetivo:


entrada manipulada

Jk

m 1

( y ( k + j / k ) y ) Q ( y ( k + j / k ) y ) + u ( k + j / k )
p

j =0

sp T

sp

Ru ( k + j / k ) ,

(5.3)

j =0

k+m-1

k+1

k+p

horizonte de control m

sujeta a una serie de restricciones, tanto de entrada como de salida, y donde p es el horisp

zonte de prediccin, m es el horizonte de control, y es la referencia o set point de la

horizonte de prediccin p

salida controlada, u ( k ) = u ( k ) u ( k 1) son los incrementos de entrada, Q y R son


matrices positivas definidas, y el argumento ( k + j / k ) , frecuente en la literatura de
MPC, denota la prediccin de la variable en cuestin en k+j, hecha en base a los datos

Figura 5.1: Entrada y salida a lazo abierto que conforman el costo que minimiza MPC a

conocidos en el tiempo k. Naturalmente, las predicciones de salida dependen del estado

cada instante.

actual x ( k ) , y del modelo definido en (5.1)-(5.2).

5.3. Modelos de prediccin

Ahora bien, de la secuencia de controles obtenida mediante la minimizacin de (5.3),


el controlador MPC slo implementa el primer valor, es decir, u ( k / k ) , y una vez
transcurrido el tiempo de muestreo, repite el clculo partiendo de k+1. Esto es lo que se
conoce como estrategia de horizonte deslizante (receding horizon), y busca en parte

Tomando en cuenta el modelo (5.1)-(5.2), interesa ahora saber cmo se conformarn


las predicciones del costo (5.3). De (5.1)-(5.2) se tiene que

y ( k + j / k ) = CA j x ( k ) + CA j 1 Bu ( k / k ) + CA j 2 Bu ( k + 1 / k ) +
+ CA j m Bu ( k + m 1 / k )

contemplar la posible entrada de perturbaciones al sistema. Ntese, adems, que en las

= CA j x ( k ) + C A j 1

predicciones dadas por (5.3) no se consideran las acciones de control que van desde el
tiempo k+m hacia delante, lo que dio origen a que estas predicciones se conozcan como

donde

predicciones de lazo abierto. De este modo, las predicciones no coinciden, en general,

u (k / k )

u ( k + 1/ k )
uk =

u ( k + m 1/ k )

con el comportamiento real de la salida del sistema, ni siquiera en el caso nominal en


que la planta es igual al modelo y no se consideran perturbaciones. Una representacin
grfica de los componentes que forman el costo (1.3) se muestra en la Figura 5.1.

A j 2

A j m Buk ,

m.nu

Para una representacin ms sencilla del costo (5.3), es posible expresar las predicciones en una forma matricial-vectorial, como sigue:

Alejandro H. Gonzlez

105

Alejandro H. Gonzlez

106

Electrnica Industrial

UTN Facultad Regional Paran

yk = Cd Apas x ( k ) + Cd Afut uk ,
pasado

(5.4)

futuro

donde

y (k + 1 / k )

y (k + m / k )
yk =

y ( k + m + 1 / k )

y ( k + p / k )
C
Cd =
0

p .ny

Apas

m
A
= m +1 ,
A

p
A

Afut

Am 1 B
= m
A B

p 1
A B

B
,
AB

p m +1
A
B
0

0
.

Electrnica Industrial
0
1

I M = I M , M = 0

0 0
0 0
0 0

1 0

0
0
1
0

1
0
m.nu m.nu
, I =


0

Utilizando (5.6) y definiendo R = diag ( R

m m.nu

R ) , el segundo trmino del costo (5.3)

puede ser escrito como:


m 1

u ( k + j / k )

j =0

Ru ( k + j / k ) = ( I M uk Iu ( k 1) ) R ( I M uk Iu ( k 1) ) .
T

(5.7)

Finalmente, de (5.5) y (5.7) se tiene que el costo (5.3) puede ser escrito como:
J k = ( Cd Apas x ( k ) + Cd Afut uk y sp ) Q ( Cd Apas x ( k ) + Cd Afut uk y sp )
T

y sp

sp
Utilizando (5.4) y definiendo y = , Q = diag ( Q
y sp

+ ( I M uk Iu ( k 1) ) R ( I M uk Iu ( k 1) )
T

Q ) , el primer trmino del

J k = ukT

{(C A

) Q (C
T

fut

Afut ) + I MT RI M uk + 2 ( Cd Apas x ( k ) y sp ) QCd A fut Iu ( k 1)


T

( y (k + j / k ) y ) Q( y (k + j / k ) y )
sp T

RI M } uk + ( Cd Apas x ( k ) y sp ) Q ( Cd Apas x ( k ) y sp ) + u ( k 1) I T RIu ( k 1)

costo (5.3) puede ser escrito como:


p

UTN Facultad Regional Paran

sp

j =0

= ( Cd Apas x ( k ) + Cd Afut uk y sp ) Q ( Cd Apas x ( k ) + Cd Afut uk y sp )

(5.5)

J k = ukT Huk + 2cTf uk + c .

(5.8)

Ntese que la funcin objetivo del problema de control ser cuadrtica en uk.

Otro tanto puede ser hecho con las entradas. En este caso, la secuencia de incrementos

5.4. Problema de optimizacin on-line de MPC

de entrada pude ser expresada segn:


Segn (5.8), el problema de optimizacin que resuelve MPC instante a instante es

u ( k / k )

u ( k + 1/ k )
uk =
= I u Iu ( k 1) ,

M k

u ( k + m 1/ k )

como sigue:
P1:
(5.6)

min ukT Huk + 2cTf uk


uk

sujeto a:

donde

umin u ( k + j / k ) umax

0 j<m

umin u ( k + j / k ) umax

Alejandro H. Gonzlez

107

Alejandro H. Gonzlez

0 j<m

108

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

donde ahora aparecen incorporadas en forma explcita las restricciones tanto de entrada

yk = NAx ( k ) + DM uk

(5.10)

cmo de incrementos de entrada. Luego, la ley de control de MPC (que no siempre puede ser explicitada), saldr de aplicar la primera accin de control de la secuencia ptima
obtenida en P1.

5.5. DMC (Acrnimo derivado del ingls Dynamic Matrix Control)


Los controladores conocidos como DMC constituyen las primeras versiones de los
controladores MPC. Utilizan un modelo en variable de estado que tiene la siguiente
forma (se supone que el sistema es estable):
x ( k + 1) = Ax ( k ) + Bu ( k ) ,

(5.9)

donde
T
x (k ) = y (k / k )

y ( k + 1/ k )

y (k + n / k )

0
I ny
0
0

0
0

I ny
I ny

ny .( n +1)ny .( n +1)

s1
s
, B = 2


sn +1

y (k + 1 / k )

y (k + m / k )
yk =

y ( k + m + 1 / k )

+
/
y
k
p
k
)
(
s1
s
2

DM =
sm

s p

0
s1
sm 1
s p 1

u ( k / k )

u ( k + 1/ k )
p .ny
, uk =

u ( k + m 1/ k )

, N = I p

0 ,

0
0

(Matriz Dinmica, que da origen el nombre DMC).


s1

s p m +1

ne:
ny .( n +1)nu

J k = ( NAx ( k ) + DM uk y sp ) Q ( NAx ( k ) + DM uk y sp ) + ukT R uk


T

J k = ukT ( DMT QDM + R ) uk + 2 ( NAx ( k ) y sp ) QDM uk


T

+ ( NAx ( k ) y sp ) Q ( NAx ( k ) y sp )

sj: coeficientes de la respuesta al escaln en el instante j.

Observaciones:

As, redefiniendo H = ( DMT QDM + R ) y cTf = ( NAx ( k ) y sp ) QDM , el control


T

* En la representacin dada por (5.9) los estados corresponden a la trayectoria de salida si no se aplica ninguna accin de control. De este modo, la representacin de estado

QDMC (quadratic dynamic matrix control) se obtiene de la solucin on-line del siguiente problema de optimizacin:

es no-mnima.
* La representacin dada por (5.9) esta escrita en trminos de los incrementos de en-

P2:
min ukT H uk + 2cTf uk

trada.

uk

El controlador DMC tiene la misma funcin objetivo definida en (5.3). Sin embargo,
teniendo en cuanta el modelo (5.9), las predicciones de salida son ahora:

Alejandro H. Gonzlez

m.nu

y sp

Entonces, definiendo como antes y sp = , y substituyendo (5.10) en (5.3), se tie y sp

n: horizonte de estabilizacin del sistema (truncamiento),


0 I ny
0 0

A=

0 0
0 0

donde

109

sujeto a:

Alejandro H. Gonzlez

110

Electrnica Industrial
umin u ( k + j / k ) umax

UTN Facultad Regional Paran

UTN Facultad Regional Paran

donde x representa el estado estimado, y representa la salida medida y L es la ganancia

0 j<m

umin u ( k + j / k ) umax

Electrnica Industrial

del observador.

0 j < m.

La ecuacin (5.11) puede ser escrita como:

Ntese que la variable de decisin est ahora dada por u , dado que el modelo de
partida esta escrito en la forma incremental.
Para incluir una perturbacin medida en el esquema QDMC, la ecuacin (5.9) puede

x ( k + 1) = ( I LC ) Ax ( k ) + ( I CB ) u ( k ) + Ly ( k + 1) ,

donde aparece explicitada la evolucin del estado estimado respecto de s mismo. De


all se puede intuir que para que el observador sea estable, la matriz (I-LC)A debe ser

ser modificada segn:

Hourwitz, es decir, debe tener todos sus autovalores negativos 16.

sd ,1
s
d ,2
x ( k + 1) = Ax ( k ) + Bu ( k ) + Bd d ( k ) , donde Bd = .


sd ,n

Comentario:
Los controladores DMC originales utilizan un esquema de realimentacin que, traducido en trminos de observadores, hace que la matriz (I-LC)A no sea Hourwitz para sis-

Observaciones:

temas no estables. De all su incapacidad para trabajar con este tipo de sistemas.

* Los controladores DMC o QDMC son las versiones tempranas de MPC, y presen-

5.7. Observador en estado estacionario

tan una formulacin simple y transparente, que basa su desarrollo en modelos de simple
construccin (respuesta al escaln). Es por eso que la mayora de los controladores

Para un tiempo k = k suficientemente grande, y suponiendo al lazo en estado esta-

MPC que se utilizan actualmente en la industria son de este tipo.


* Como contrapartida de su simpleza, se debe mencionar que esta estrategia fue formulada tan slo para el caso de sistemas estables.

cionario, la ecuacin (3.1) se convierte en

xk = Axk + Buk + L yk C ( Axk + Buk )


,

(5.12)

* Adems, este tipo de controladores no garantiza la estabilidad del lazo cerrado.

pues en estado estacionario debe ser x ( k + 1) = x ( k ) , ya que el segundo es slo el pri-

5.6. MPC con realimentacin de salida

mero retrasado un instante de tiempo.


Ntese que si bien se asume un observador estable, nada hay en la ecuacin (5.12)

La forma en que se incorpora la realimentacin de salida en el esquema de MPC basado en modelos de espacio de estado, es actualizando el estado presente (del que depende la funcin costo) segn la ltima lectura de la salida de la planta. Esto se consigue por medio del siguiente observador 15:

x ( k + 1) = Ax ( k ) + Bu ( k ) + L y ( k + 1) C Ax ( k ) + Bu ( k ) ,

que obligue a que la salida predicha segn el estado estimado y el modelo (esto es
C ( Axk + Buk ) ) sea igual a la salida medida en el estado estacionario. La condicin de

estado estacionario slo implica que xk +1 = xk , lo que no significa que xk = Axk + Buk ,
porque el estado estimado no tiene porqu evolucionar segn A, B y C que son slo un

(5.11)

modelo. Esto significa que, en general, ser

L yk C ( Axk + Buk ) 0 ,

(5.13)

15

La ecuacin que se presenta corresponde a un observador actualizado, es decir, un observador que


estima el estado al tiempo k+1, utilizando la salida medida el tiempo k+1.

16

Alejandro H. Gonzlez

Alejandro H. Gonzlez

111

Ntese que dicha estabilidad no implica que la salida estimada sea igual a la salida medida.

112

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

lo que implica que las predicciones de salida en estado estacionario hechas en base a

De este modo se ha mostrado que la forma en que MPC elimina el offset es por medio

C ( Axk + Buk ) no sern precisas. sta es la razn por la cual los controladores MPC no

de la inclusin de modos integradores en el observador, y no por el mero hecho de que

garantizan en principio (ni aun usando modelos incrementales) la eliminacin de offset

los modos integradores aparezcan en el modelo de prediccin. Esto es as, porque las
predicciones en MPC estn basadas en el estado actual estimado, y si este estado no es

de salida.

preciso en cuanto a su capacidad de predecir salidas precisas, entonces aparecer nece-

5.8. Eliminacin de offset en MPC

sariamente offset.

Existe un caso particular en el que el mero hecho de que el observador se estabilice

5.9. Referencias bibliogrficas

provoca que la ecuacin (5.13) sea nula. Este es el caso en el que el modelo utilizado
Camacho, E and Bordons. Model Predictive Control (2nd ed.), Berlin: Springer

por el observador contiene modos integradores, esto es, estados que cumplen

(2004).

xi ( k + 1) = x i ( k ) + 0.u ( k ) .

Cano R. A. R. and D. Odloak. Robust model predictive control of integrating process.

Supngase ahora un modelo ampliado A , B , C que agrega estados integradores a los


ya existentes. De este modo, el observador tendr una ganancia ampliada dada por
Li
L = o , donde Li corresponde a la parte integradora agregada y Lo corresponde a la
L

parte original. La ecuacin (5.12) para los estados integradores es

Carrapio O. L. and D. Odloak. A stable model predictive control for integrating


process. Computers & Chemical Engineering, 29, 1089-1099 (2005).
De Don J. A, M. M. Seron, D. Q. Mayne and G. C. Goodwin. Enlarged terminal sets
guaranteeing stability of receding horizon control. System & Control Letters, 47,
57-63 (2002).

+ Bu
,
xki = xki + Li yk C Ax
k
k

Kerrigan, E. C. Robust Constraint Satisfaction: Invariant Sets and Predictive Control.

donde se remarca que el estado que no lleva el superndice, es el vector de estado completo, es decir, los estados originales ms los integradores. Ahora bien, esta ltima condicin implica que si Li es de rango completo, entonces

Journal of Process Conrol, 13, 101-104 (2003).

PhD thesis, University of Cambridge (2000).


Kerrigan, E. C. and J. M. Maciejowski. Invariant sets for constrained discrete-time
systems with application to feasibility in model predictive control. Proceedings of

+ Bu
=0,
y C Ax
k
k
k

the CDC (2000).

con lo que se logra la deseada igualdad entre salida predicha y salida medida. Ms aun,
cuando el trmino entre corchetes se anule, se tendr (segn la misma ecuacin (5.12),

Limn D. Control predictivo de sistemas no lineales con restricciones: estabilidad y


robustez. Tesis Doctoral, Universidad de Sevilla, Espaa, (2002).
Maciejowski J.M. Predictive Control with Constraints. New Jersey: Prentice Hall,

+ Bu
+ Bu
+ L y C Ax
,
xk = Ax
k
k
k
k
k

(2002).

=0

Mayne D. Q, J. B. Rawlings, C. V. Rao and P. O. M. Scokaert. Constrained model

lo que permite utilizar el modelo ampliado A , B , C para conocer los estados estimados

predictive control: Stability and optimality. Automatica, 36, 789814 (2000).

completos en su estado estacionario.

Alejandro H. Gonzlez

113

Alejandro H. Gonzlez

114

Electrnica Industrial

UTN Facultad Regional Paran

Michalska, H. & Mayne, D. Q. Robust receding horizon control of constrained


nonlinear systems. IEEE Transactions on Automatic Control, 38(11), 1623-1633
(1993).
Odloak D. Extended robust model predictive control. AIChE Journal, 50 (8) 18241836 (2004).
Rawlings J.B. and K.R. Muske. The stability of Constrained Receding Horizon
Control. IEEE Transaction on Automatic Control, 38, 1512 (1993).
Rodrigues M.A. and D. Odloak. MPC for Stable Linear Systems with Model
Uncertainty. Automatica, 39, 569-583 (2003).
Rodrigues M.A. and D. Odloak. An infinite horizon model predictive control for
stable and integrating process. Computer and chemical Engineering, 27, 11131128 (2003b).
Rossiter J.A. Model-Based Predictive Control. CRC Press (2003).
Scokaert P. O. M. and D. Q. Mayne. Min-Max feedback model predictive control for
constrained linear systems. IEEE Transactions on Automatic Control, 43(8),
1136-1142 (1998).

Alejandro H. Gonzlez

115

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

Dicho en pocas palabras, si un sistema (autnomo o a lazo cerrado) alcanza un con-

6. Estabilidad de los controladores predictivos

junto invariante positivo, entonces la evolucin del mismo ya no podr abandonarlo.

Definicin 2 (Mximo conjunto invariante positivo): El mximo conjunto invarianEl tema de la estabilidad es acaso uno de los ms caros a MPC, y gran parte de la literatura especializada de los aos 80s y 90s estuvo destinada a tratarlo. Recientemente,

te positivo para el sistema a lazo cerrado x ( k + 1) = f x ( k ) , ( x ( k ) )

se nombrar

la utilizacin de la teora de Liapunov conjuntamente con la teora de conjuntos inva-

, y viene dado por el mximo invariante positivo contenido en X , donde

riantes ha permitido arribar a una formulacin general que permite, si se atienden ciertas

condiciones, garantizar la estabilidad de los controladores predictivos. Si bien este pro-

{x ( k ) X : ( x ( k ) ) U }

cedimiento es puramente terico, y algo apartado de los objetivos prcticos del control,

es el subconjunto admisible de entrada de X ; es decir, X es el subconjunto en el cual

dos causas principales justifican su estudio: en primer trmino, su exposicin general

la ley de control satisface las restricciones de entrada.

conforma una parte sustancial del desarrollo histrico reciente de MPC, en tanto que,
asombrosamente, contiene como casos particulares a la mayora de las estrategias de
estabilidad restantes. En segundo lugar, su comprensin detallada facilita los desarrollos
referentes a la estrategia conocida como MPC de horizonte infinito, que son la base de
los controladores con estabilidad garantizada que se estn comenzando a utilizar en la

{x : A

x X , f Aj f x U ,

j = 0,1,

Definicin 3 (Conjunto invariante de control): Un conjunto

6.1. Definiciones preliminares

se dice inva-

riante de control para el sistema no autnomo x ( k + 1) = f ( x ( k ) , u ( k ) ) , si existe algu-

Las definiciones que siguen estn asociadas a un dado sistema, no autnomo, dado
n

. Adems, se considera que di-

cho sistema est restringido por el siguiente juego de restricciones de entrada y de esta-

na ley de control u ( k ) = ( x ) tal que sea un invariante positivo para el lazo cerrado
x ( k + 1) = f ( x ( k ) , ( x ) ) .

Ntese que a diferencia de la definicin de conjunto invariante positivo, en la que se

do:

considera un sistema lazo cerrado particular, en esta definicin slo se exige que exista

u ( k ) U

alguna ley de control tal que el conjunto en cuestin sea un invariante positivo. Si un

x (k ) X .

conjunto es un invariante positivo para x ( k + 1) = f x ( k ) , ( x ( k ) ) ; entonces ser un

Definicin 1 (Conjunto invariante positivo): Un conjunto

se dice invarian-

te positivo para el sistema a lazo cerrado x ( k + 1) = f x ( k ) , ( x ( k ) ) , si para todo


x ( 0 ) la evolucin del sistema es tal que x ( k ) para todo k 0 , y adems
u ( k ) = ( x ) U para todo k 0 .

Alejandro H. Gonzlez

control lineal dada por u = f x , el mximo conjunto invariante positivo est dado por:

donde A f = A B f .

industria.

por la forma general x ( k + 1) = f ( x ( k ) , u ( k ) ) , x

En el caso de sistemas lineales dados por x ( k + 1) = Ax ( k ) + Bu ( k ) , y una ley de

invariante de control para x ( k + 1) = f ( x ( k ) , u ( k ) ) .

Definicin 4 (Funcin de Lyapunov de control): Una funcin V :

se dice

que es una funcin de Lyapunov de control asociada al sistema (no autnomo)


x ( k + 1) = f ( x ( k ) , u ( k ) ) , si es definida positiva y satisface que

117

Alejandro H. Gonzlez

118

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

V ( x ) = min V ( f ( x, u ) V ( x ) ) 0
uU

* El clculo de la secuencia de conjuntos controlables puede obtenerse mediante:


Coi +1 ( X , ) = Q ( Coi ( X , ) ) X , con

para todo x de un dado entorno del origen.

es el conjunto de estados x para los cuales existe una actuacin admisible u U (que

caso

en

que

el

conjunto

sea

un

invariante

de

control.

As,

si

x ( 0 ) Coi ( X , )\ Coi +1 ( X , ) , entonces el sistema puede llevarse a en i pasos,


17

depender del estado x) tal que el sistema alcanza el conjunto en un solo paso:

{x ( k )

Co0 ( X , ) = .

* El conjunto Coi ( X , ) no tiene porqu estar incluido en Coi +1 ( X , ) , salvo en el

Definicin 5 (Conjunto a un paso): El conjunto a un paso del conjunto , Q ( ) ,

Q ()

UTN Facultad Regional Paran

pero no en i+1.

: u ( k ) U tal que f ( x ( k ) , u ( k ) ) .

La definicin de conjunto controlable puede ser extendida a sistemas en lazo cerrado


Esta definicin puede ser extendida a un sistema controlado por una ley de control
u ( k ) = ( x ) de la siguiente manera:
Q

()

{x ( k )

controlados por una ley de control u ( k ) = ( x ) de la siguiente manera:

Coi ( X , )

: ( x ( k ) ) U y f x ( k ) , ( x ( k ) ) .

siendo X

Teorema (Condicin geomtrica de invariante): Un conjunto es un invariante

{x ( 0) X

: x ( k ) X , para todo k = 0,

, i 1 y x ( i ) } ,

{x ( k ) X : ( x ( k ) ) U } .

En este caso, la primera de las propiedades enunciadas se transforma en:

de control si y slo si

CoI +1 ( X , ) = Q ( CoI ( X , ) ) X .

Q () .

Ntese que esta condicin tiene una interpretacin geomtrica. Una vez obtenido el con-

Definicin 7 (Conjunto admisible en i pasos): El conjunto admisible en i pasos,

junto Q ( ) (que puede calcularse por procedimientos geomtricos), basta con compro-

Ci ( X ) , es el conjunto de estados para los cuales existe una secuencia de actuaciones

bar si contiene al conjunto , para ver si este ltimo es un invariante de control.

admisibles tal que la evolucin del sistema permanece en el conjunto X durante los i

Definicin 6 (Conjunto controlable en i pasos): El conjunto controlable en i pasos,


Coi ( X , ) , es el conjunto de estados para los cuales existe una secuencia de actuacio-

instantes siguientes:
Ci ( X )

nes admisibles tal que conduce el sistema hasta el conjunto X en i pasos, con una
trayectoria admisible:

Coi ( X , )

{ x ( 0 ) X : para todo k = 0,1,

{ x ( 0 ) X : para todo k = 0,

, i 1, u ( k ) U tal que x ( k + 1) X } .

Definicin 8 (Conjunto estabilizable en i pasos): El conjunto estabilizable en i pasos al conjunto invariante (de control, o positivo segn una dada ley de control) X ,
es el conjunto de estados Si ( X , ) para los cuales existe una secuencia de actuaciones

, i 1, u ( k ) U
tal que x ( k ) X y x ( i ) }.

El conjunto controlable en i pasos indica los estados que pueden alcanzar un determi-

admisibles tal que conduce el sistema hasta el conjunto en i pasos, con una trayectoria admisible 18:

nado conjunto en i pasos con una evolucin admisible mediante una secuencia de actuaciones admisibles. Este conjunto depende naturalmente del nmero de pasos i, y da origen a una secuencia de conjuntos que poseen una serie de propiedades. A continuacin
se enuncian algunas que resultan de inters:

Alejandro H. Gonzlez

17

La notacin x X 1\ X 2 significa que el elemento x pertenece a X1 pero no a X2.


En rigor, el conjunto debe ser un invariante de control. Sin embargo, en la definicin de conjunto
estabilizable dada (asociada al sistema x ( k + 1) = f ( x ( k ) , u ( k ) ) ) se incluye tambin la posibilidad de

18

que sea un invariante positivo. Que sea un invariante positivo significa que lo ser respecto de una

119

Alejandro H. Gonzlez

120

Electrnica Industrial
Si ( X , )

UTN Facultad Regional Paran

{ x ( 0 ) X : para todo k = 0,

, i 1, u ( k ) U

N 1

VN ( x ( k ) , uk ) =

tal que x ( k ) X y x ( i ) }

i =0

Como se puede observar, la nica diferencia entre el conjunto estabilizable Si ( X , ) y


el conjunto controlable Coi ( X , ) es la condicin de que el conjunto debe ser un
conjunto invariante. A continuacin se enuncian algunas propiedades de los conjuntos
estabilizables que resultan de inters:

con

siendo X

{x ( 0) X

funcin de costo terminal destinada a penalizar el ltimo estado dentro del horizonte 19.
El costo propuesto depende tanto del estado inicial x ( k / k ) = x ( k ) como de la secuen-

u ( k + 1/ k )

T
u ( k + N 1/ k ) ;

(6.2)

VN* ( x ( k ) ) .

controlados por una ley de control u ( k ) = ( x ) de la siguiente manera:

( X , )

Q > 0 y R 0 , es el costo de etapa, N es el horizon-

y una vez alcanzado el ptimo, el costo pasa a depender slo del estado inicial,

La definicin de conjunto estabilizable puede ser extendida a sistemas en lazo cerrado

(6.1)

te de control (en este caso coincidente con el horizonte de prediccin) y F ( x ) es una

* Todo conjunto Si ( X , ) es un invariante de control.

( x ( k + i / k ) , u ( k + i / k )) + F ( x ( k + N / k )) ,

( x, u ) = xT Qx + uT Ru , con

uk = u ( k / k )

S0 ( X , ) = .

* Si ( X , ) Si +1 ( X , ) .

donde

UTN Facultad Regional Paran

cia de entradas futuras

* El clculo de la secuencia de conjuntos controlables puede obtenerse mediante:


Si +1 ( X , ) = Q ( Si ( X , ) ) X ,

Electrnica Industrial

: x ( k ) X , para todo k = 0,

El modelo de espacio de estado a partir del cual se hacen las predicciones vendr dado por la forma general x ( k + 1) = f ( x ( k ) , u ( k ) ) , aunque los modelos de inters sern
lineales e invariantes en el tiempo, es decir, la funcin f tomar la forma

, i 1 y x ( i ) } ,

f ( x ( k ) , u ( k ) ) = Ax ( k ) + Bu ( k ) .

{x ( k ) X : ( x ( k ) ) U } .

A continuacin se expondr una formulacin general de MPC que cuenta con todas
las condiciones para garantizar la estabilidad del lazo cerrado. Este resultado fue presen-

En este caso, la primera de las propiedades se transforma en:

tado por Mayne et al., 2000, y representa un punto de inflexin en la materia, en tanto

Si+1 ( X , ) = Q ( Si ( X , ) ) X .

que contiene como casos particulares a casi todas las formulaciones precedentes de
MPC estables. El problema general de MPC, en el que se incluyen todos los ingredien-

Adems, todo conjunto Si ( X , ) es un invariante positivo del sistema.

tes necesarios para abordar la demostracin de factibilidad recursiva y estabilidad asinttica, es el descrito por las siguientes ecuaciones:

6.2. Formulacin general MPC estable. Teorema de Mayne

19

El anlisis riguroso de la estabilidad de MPC se basa en la teora de control ptimo.


Por lo tanto en esta seccin se utilizar una formulacin ligeramente diferente de la que
se ha venido utilizando. Se partir de un costo general dado por

El costo general dado por (6.1) presenta, por provenir de la teora de control ptimo, algunas diferencias respectos de los costos definidos antes. En primer lugar, se considera aqu un nico horizonte, es
decir, el horizonte de control coincide con el de prediccin (m = p = N). En segundo lugar, se trabaja con
un costo de etapa asociado al caso de regulacin que es equivalente al caso de seguimiento de una referencia ysp si se considera la matriz de peso C T QC en lugar de Q, y se trabaja con variables desviacin
tanto para los estados como para las entradas. En el caso de seguimiento, el costo de etapa viene dado por

( x, u ) = ( x xs )

dada ley de control ( x ) . Si un conjunto es un invariante positivo para x ( k + 1) = f x ( k ) , ( x ( k ) ) ;


entonces ser un invariante de control para x ( k + 1) = f ( x ( k ) , u ( k ) ) .

Alejandro H. Gonzlez

121

C T QC ( x xs ) + ( u us ) R ( u us ) , donde xs y us son los targets estacionarios, y


T

adems y = Cxs . En tercer lugar, se considera un costo terminal F aplicado al ltimo estado dentro del
horizonte, lo que permite dar ms generalidad al tratamiento. En cuarto lugar, el subndice N del costo VN
refiere en este caso al (nico) horizonte de las predicciones.
sp

Alejandro H. Gonzlez

122

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

PrN ( x ) :

instante (k + j), solucin en x ( k ) , puede ser distinta a la actuacin ptima para ese

min VN ( x ( k ) , uk )

mismo instante en x ( k + 1) ; es decir, u * ( k + j / k ) u * ( k + j / k + 1) . Por tanto, las tra-

s.a

yectorias ptimas predichas en cada instante son distintas y, en consecuencia, la evolu-

uk

u ( k + j / k ) U

j = 0,1,

, N 1

x (k + j / k ) X

j = 0,1,

, N 1

(6.3)

cin del sistema en bucle cerrado difiere de la evolucin predicha en la resolucin del
sistema 21. Tan slo en el caso de horizonte infinito se verifica que la evolucin real co-

x (k + N / k ) X f

incide con la predicha, pues en ese caso se puede considerar que el horizonte no retro-

Los parmetros del controlador vienen dados por: un controlador local 20 f ( x ) que
gua el sistema de N hacia delante (en las predicciones), una regin terminal X f donde
opera el control local, un costo terminal F ( x ) , un costo de etapa

( x, u ) y un horizonte

N.

cede, y se puede aplicar el principio de optimalidad de Bellman.


En lo que sigue, se utilizar la siguiente notacin: sea una funcin ( x ) :
entonces se define: ( x, u ) ( f ( x, u ) ) ( x ) y [ +

u * ( k + 1/ k )

Sea una funcin costo terminal F : X f


control local f : X f

de

estados

ptimos,

nu

, un conjunto terminal X f y una ley de

que satisfacen:

T
u * ( k + N 1/ k ) , desechndose el resto de la

A1: X f es cerrado y 0 X f ,

secuencia. A su vez, la secuencia de actuaciones ptima se corresponde con una secuencia

( x, u ) .

Teorema 6.1 (Mayne et al. 2000)

problema parametrizado en x ( k ) . Haciendo uso de la estrategia de horizonte deslizante,

uk* = u * ( k / k )

( x, u ) +

Se establecen ahora las condiciones generales de estabilidad:

Este problema depende del estado del sistema en cada instante, siendo por tanto un

en cada instante k se aplica slo la primera actuacin ( u * ( k / k ) ) de la secuencia ptima

] ( x, u )

{ x ( k / k ) x ( k + 1/ k )
*

x* ( k + N / k )} ,

A2: f ( x ) U , x X f (se satisface la restriccin en las actuaciones en X f ),

donde

A3: X f es un invariante positivo para el sistema x ( k + 1) = f x ( k ) , f ( x ( k ) ) ,

x* ( k / k ) = x ( k ) . Dado que la solucin u * ( k / k ) depende del estado de la planta, la ley

de control del MPC viene dada implcitamente por

A4: [ F +

MPC ( x ( k ) ) = u * ( k / k ) .

] ( x, f ( x ) ) 0,

x X f ( F ( ) es una funcin local de Liapunov).

Entonces

Ahora bien, debido a que se supone que el modelo de prediccin es exacto, el estado
al que evoluciona el sistema es exactamente el predicho, esto es, x ( k + 1) = x ( k + 1/ k ) .
*

VN* + ( x, MPC ( x ) ) 0 ;

(6.4)

Pero, dado que el problema a resolver depende del estado, la actuacin ptima en el
21

controlador en un tiempo determinado, sino que, por el contrario, este cambio opera slo en las predicciones (Rossiter, 2003).

Esto significa que aun siendo los modelos exactos existir una discrepancia entre prediccin y comportamiento real. Este detalle, trivial a priori, tiene la siguiente consecuencia: no todo lo que le ocurre a las
predicciones (que comnmente se llaman lazo abierto), debe ocurrirle al sistema real. Por ejemplo, que
las predicciones en un dado instante k alcancen un conjunto en N pasos, no implicar que los estados del
sistema lo alcancen en esa cantidad de pasos, ya que al tiempo k+1 se habrn descartado muchas de las
actuaciones que lo lograban. En general, se puede decir que cuanto ms se aparten prediccin y comportamiento real, ms pobre ser el desempeo del controlador, ya que se estar optimizando sobre la base a
una prediccin deficiente.

Alejandro H. Gonzlez

Alejandro H. Gonzlez

20

La idea de utilizar un controlador local, es decir, un controlador que opere ms all del horizonte N en
las predicciones, proviene de lo que se conoce como control MPC de modo dual (Michalska y Mayne,
1993). En la Ecuacin (6.1), el costo terminal F es el que computa el costo de guiar el sistema con el
control local f ( x ) . Un detalle a tener en cuenta, es que el MPC dual no refiere a un cambio real de

123

124

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

es decir, el sistema controlado por la ley u ( k ) = MPC ( x ( k ) ) = u * ( k / k ) es asinttica-

ltima condicin implica a su vez que f ( x* ( k + N / k ) ) est definido y es admisible y

mente estable con un dominio de atraccin X N dado por todos los estados para los cua-

adems satisface que f x* ( k + N / k ) , f ( x* ( k + N / k ) ) X f , por ser X f un inva-

les existe una secuencia de N actuaciones admisibles tales que el sistema evoluciona
dentro de X hasta alcanzar el conjunto terminal X f . X N es, a su vez, un invariante po-

sitivo para el lazo cerrado x ( k + 1) = f x ( k ) , MPC ( x ( k ) ) .

riante positivo segn f (condicin A3). De todo lo anterior se deduce que uk +1 es una
secuencia factible para el problema en el tiempo k+1.
Ahora bien, el costo correspondiente a la secuencia factible que se acaba de describir,

Demostracin

VN ( x ( k + 1) ) , cumplir con

Factibilidad recursiva:

VN ( x ( k + 1) ) VN* ( x ( k ) ) =

( x ( k ) , u ( k / k )) + { ( x ( k + N / k ) , ( x ( k + N / k )))
*

( (

La factibilidad recursiva se fundamenta en el hecho de que X N es un invariante posi-

))

+ F f x* ( k + N / k ) , f ( x* ( k + N / k ) ) F ( x* ( k + N / k ) ) ,

tivo del sistema en lazo cerrado. Como el conjunto Xf es un conjunto invariante positivo
segn la ley de control local, entonces X N es el conjunto estabilizable en N pasos,

luego, de A4 se tiene

S N ( X , X f ) . Sea x ( k ) S N ( X , X f ) , entonces el estado siguiente puede alcanzar X f

VN ( x ( k + 1) ) VN* ( x ( k ) ) = ( x ( k ) , u * ( k / k ) ) + [ F +
( x ( k ) , u* ( k / k ) )

en N-1 pasos, por lo que x ( k + 1) = x ( k + 1/ k ) S N 1 ( X , X f ) S N ( X , X f ) . Por tanto,

] ( x* ( k + 1/ k ) , f ( x* ( k + 1/ k ) ) )

se verifica la condicin de conjunto invariante y el conjunto X N es un invariante positi-

por tanto, al ser siempre la solucin ptima al tiempo k+1 menor que una solucin facti-

vo del sistema en lazo cerrado.

ble, entonces
VN* ( x ( k + 1) ) VN* ( x ( k ) ) VN ( x ( k + 1) ) VN* ( x ( k ) )

Convergencia:
Sea uk* = u * ( k / k )

u * ( k + 1/ k )

T
u * ( k + N 1/ k )

el tiempo k, x* ( k + j / k ) , j = 1,

la solucin ptima en

, N la secuencia de estados predichos ptima y

VN* ( x ( k ) ) el costo ptimo correspondiente. Considrese ahora la secuencia uk +1 dada

por

( x ( k ) , u ( k / k )) .
*

De este modo se concluye que VN* ( x ) es una funcin de Liapunov, y el sistema es asintticamente estable.

6.3. Casos particulares. IHMPC y MPC Dual con LQR como


control terminal

uk +1 = u ( k + 1/ k )

u ( k + N 1/ k )
*

f ( x ( k + N / k ) ) ,
*

(6.5)

Resulta ahora interesante hacer algunos comentarios respecto a la formulacin prece-

es decir, una secuencia compuesta a partir de k+1 por los controles ptimos pasados, y

dente. Atendiendo fines didcticos, nos detenemos a analizar el caso sencillo de un sis-

completada con la actuacin que surge de aplicar el control local al estado terminal p-

tema

timo predicho al tiempo k. Al ser el problema de optimizacin factible al tiempo k, entonces tanto las actuaciones como los estados predichos satisfacen las restricciones, es
decir, u * ( k + j / k ) U , x* ( k + j / k ) X , j = 1,

Alejandro H. Gonzlez

, N 1 y x* ( k + N / k ) X f . Esta

125

lineal

( x, u ) = x

x ( k + 1) = Ax ( k ) + Bu ( k ) ,

un

costo

de

etapa

cuadrtico

Qx + u Ru . Un procedimiento a seguir para disear un controlador MPC es


T

el siguiente. En primer lugar se elige una ley de control local, u = f x , que sea esta-

Alejandro H. Gonzlez

126

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

Por otro lado, como el sistema estar controlado por la ley f a partir de N, entonces

bilizante. Esta ley de control determinar, junto con las restricciones de entrada U y de
estados X, una regin terminal X f , que vendr dada por el mximo conjunto invariante
positivo:

{x : A

x X , f Aj f x U ,

j = 0,1,

},

UTN Facultad Regional Paran

evolucionar

x ( k + j ) = Aj f x ( k ) ,

segn

A f = A B f

donde

adems

u ( k + j ) = f x ( k + j ) = f Aj f x ( k ) . De este modo el costo dado por (4.7) se convier(6.6)

donde A f = A B f .

te en

F ( x ( k )) = x ( k )

j =0

Esta regin ser en general tanto mayor cuanto ms conservador sea el control local.

QAj f x ( k ) + x ( k ) f Aj f

( ) (Q +

drtico lineal sin restricciones (LQR), f = K LQR , que se obtiene a partir de la ecuacin

T
f

R f Aj f x ( k )

R f ) Aj f x ( k )

= x ( k ) Qx ( k ) .
T

algebraica de Ricatti. En el primer caso, que es el que se utilizar concretamente en los

Para obtener esta matriz de ponderacin se utiliza la ecuacin de Liapunov. Esto es,

controladores propuestos en prximas secciones, y siempre que el sistema sea estable a


ser el mximo invariante positivo contenido en X del sistema con controles nulos; en el

T
= x ( k ) Aj f
j =0

Como casos extremos se puede considerar el control nulo, f 0 , y el regulador cua-

lazo abierto (o se cancelen oportunamente los modos no estables), la regin terminal

(A )

( ) (Q +

como la serie Q = Aj f
j =0

T
f

segundo, dicha regin vendr determinada por f , X y U, de suerte que cuanto ms

bilizante, entonces se cumple que 22

agresivo sea el control (ms grande sea Q en relacin a R) ms pequeo ser X f . Una

ATf QA f = Aj f

j =1

vez determinada la regin terminal, se puede componer el dominio de atraccin que

( ) (Q +
T

T
f

R f ) Aj f es convergente al ser el control local esta-

R f ) Aj f = Q ( Q + Tf R f ) .

(6.8)

depender naturalmente del horizonte N. Se puede demostrar que, como indica el senti-

Ntese que con esta eleccin para el costo terminal, la condicin A4 se satisface con

do comn, a mayor regin terminal mayor ser el dominio de atraccin.

igualdad. Esto es,

Volvamos ahora al caso de una ley de control (local) general. A partir de dicha ley se
debe calcular un costo terminal F ( x ) que satisfaga A4. Una alternativa para calcular

[ F + ] ( x, f ( x ) ) = F ( A
= xT Aj f+1

j =0

este costo es suponer un horizonte (cola, a partir de N) infinito sobre el que actuar el

) (Q +
T

( x,

x)

T
f

( ) (Q +

R f ) Aj f+1 x xT Aj f

j =0

T
f

R f ) Aj f x

= x ( Q + Tf R f ) x + xT ( Q + Tf R f ) x = 0, x X f ,
T

acotada. Adoptando esta alternativa, el costo terminal que penaliza los estados de N en

es decir, al tener una ley de control fija y un horizonte infinito, la trayectoria de estados

F ( x ( k ) ) = x ( k + j ) Qx ( k + j ) + u ( k + j ) Ru ( k + j ) .
T

x F ( x) +

( x , f x )

estados convergern asintticamente al origen y la suma de los trminos que restan ser

+ xT ( Q + Tf R f ) x

control local elegido. Al ser este control estabilizante y factible en X f , entonces los

delante vendr dado por:

se conserva de un instante al otro, de suerte que la diferencia entre ambas sumas infini(6.7)

j =0

tas es el primer elemento de la serie. Como este elemento coincide con el costo de etapa

22

No siempre es sencillo obtener una solucin a esta ecuacin cuando A f no es diagonal. En general, la

rutina de Matlab (dlyap) no da una solucin aceptable en estos casos.

Alejandro H. Gonzlez

127

Alejandro H. Gonzlez

128

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

de la formulacin general, entonces se cumple la condicin A4 con igualdad. Es intere-

demoran algunos pasos ms. Esto se debe a que se implementa la estrategia de horizonte

sante resaltar que lo anterior se cumple para cualquier control estabilizante, siempre y

deslizante, y lo que se predijo se lograra en el comienzo de la simulacin

cuando exista una matriz Q que satisfaga la ecuacin (6.8). Como se mencion, un caso

( x ( 0 ) = [8.2 0.28] ), no se alcanza luego en la implementacin real, pues en cada

de inters es el control nulo f 0 , que cumple con todo lo anterior siempre y cuando

instante k se van descartando los controles de k+1 hacia delante. Esto no invalida, sin

el sistema a controlar sea estable. Otro caso singular es el regulador cuadrtico lineal,

embargo, la demostracin de estabilidad de Mayne et al., 2000, pues lo nico que se

que vendr determinado por los pesos Q y R. En este caso, la penalizacin terminal

requiere all es la factibilidad en las predicciones, esto es, la factibilidad en el lazo abier-

viene dada por Q = P , siendo P la solucin de la ecuacin algebraica de Ricatti (ARE).

to.

Para visualizar todos los detalles enunciados en esta seccin, se realizar a continuacin
1.5

un ejemplo de simulacin.

Ejemplo de simulacin

Co1
Co2

Sea el siguiente sistema lineal (Kerrigan, 2000): A=[1 1; 0 1]; B=[0.5; 1], y los si-

( x, u ) = xT Qx + uT Ru , don-

x2

guientes parmetros del controlador MPC: costo de etapa:

Xf

0.5

Co3

de Q=[0.01 0; 0 0.01] y R=1; restricciones de entrada y de estado: 0.3 u ( k ) 0.3 ,


0.5} y horizonte N=2. Se utilizar

-0.5

como control local el regulador cuadrtico lineal obtenido a partir de las matrices de

-1

1 x2 ( k ) 1 ; regin terminal: X f = { x

: x

ponderacin Q y R dadas, y el costo terminal F ( x ) = xT Px (donde P es la matriz obte-

-1.5
-10

nida de la ecuacin algebraica de Ricatti). Una vez hecho esto, se calcula la regin ter-

-5

0
x1

10

minal, X f , que vendr dada por el mximo conjunto invariante positivo dado por (6.6).

Figura 6.1: Conjuntos controlables y evolucin de los estados a lazo cerrado para un

A partir de este conjunto, y tomando un horizonte N=3, se determinan los conjuntos

control MPC estable cuando el control local es un LQR.

establizables a 1, 2, y 3 pasos que conducen a esta regin terminal. Ntese que se habla
de conjuntos estabilizables porque ahora la regin terminal es un invariante positivo
para la ley de control local dada. Estos conjuntos, como se defini ms arriba, denotan
los estados que pueden ser llevados en 1, 2 y 3 pasos, respectivamente, por medio de
controles admisibles y a travs de trayectorias admisibles hasta X f . Pero que puedan
ser llevados en N pasos por algn control no implica que el control MPC lo har de esa
manera, pues como se dijo, no todo lo que ocurre en las predicciones ocurrir en el lazo
cerrado. Ms aun, puede ocurrir que lo ptimo para llegar al equilibrio no sea llegar
rpido a la regin terminal. En la Figura 6.1 se puede ver que algunas trayectorias de

Si se utilizase un regulador cuadrtico lineal (sin restricciones) fuera de la regin


terminal, entonces las restricciones, ya sean las de entrada o las de estado, se violaran 23.
De este modo, como el control MPC busca optimizar la trayectoria que lleva el estado
hasta X f , entonces, en su afn de asemejarse al ptimo, saturar alguna restriccin,
pero siempre respetndola. Y esta es una diferencia entre MPC y control ptimo; el control ptimo, para un par de matrices Q y R dadas, no puede guiar el sistema desde un
punto que est por fuera de X f , mientras que MPC s puede hacerlo porque contempla
las restricciones. Una vez dentro de la regin terminal, y dado que el control local utili-

estado alcanzan efectivamente la regin terminal en N=3 pasos, mientras que otras se

23

Alejandro H. Gonzlez

Alejandro H. Gonzlez

129

Eso dice precisamente la definicin de mximo invariante dada por (4.6).

130

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

zado por MPC es precisamente el control ptimo, ambos controladores tendrn idnti-

control LQR.

cas trayectorias. En resumen se puede decir que mientras las restricciones le impidan
asumir la ley de control ptima sin restricciones, K LQR , el control MPC har lo mejor

6.2 se muestra la evolucin del control ptimo tomando como estados iniciales los puntos [8.2 0.28] y [ 8.2 0.28] . All se puede ver como es violada la restriccin en el
segundo estado. El hecho, tan interesante, de que las trayectorias de ambos controles,
ptimo sin restricciones y MPC, coincidan dentro de X f se puede comprobar fcilmente en las simulaciones. Sin embargo, por razones de espacio sus grficas son omitidas.
En la Figura 6.3 se muestran las evoluciones de la entrada y los estados del sistema. En
lneas llenas aparecen las grficas correspondientes a MPC, y en lneas punteadas las
correspondientes al regulador cuadrtico lineal, cuando el estado inicial es
x ( 0 ) = [8.2 0.28] . Ntese cmo el control MPC satisface en todo momento las res-

tricciones. Por ltimo, en la Figura 6.4 se muestra la evolucin del costo en MPC que,

entrada

0
-0.5
0
10

x1

sistema est dentro de X f , aplicar la ley ptima sin restricciones K LQR . En la Figura

10

15

20

25

30

35

40

10

15

20

25

30

35

40

10

15
20
25
tiempo (seg)

30

35

40

0
-10
0
2

x2

posible para llegar a X f , saturando cuando sea necesario las restricciones; cuando el

0.5

0
-2
0

Figura 6.3: Evolucin de la entrada y los estados a lazo cerrado para un control MPC y

segn lo indica el Teorema 4.1, es estrictamente no creciente.

un control LQR.

1.5

Co1

2.5

Co2

Xf

0.5

Co3

costo

x2

2
0

1.5

-0.5

1
-1

0.5
-1.5
-10

-5

0
x1

10

0
0

Figura 6.2: Conjuntos controlables y evolucin de los estados a lazo cerrado para un

Alejandro H. Gonzlez

131

Alejandro H. Gonzlez

10

15
20
25
tiempo (seg)

30

35

40

132

Electrnica Industrial

UTN Facultad Regional Paran

Figura 6.4: Costo ptimo del lazo cerrado MPC.

Electrnica Industrial
0
d1,1

D =
0
dny ,1

i
d1,1
d1,0nu
, Di =

i
dny0 ,nu
dny ,1

6.4. MPC con estabilidad garantizada, aplicable a procesos industriales (IHMPC)

F = diag ( r1,1,1

En esta seccin se estudiar una serie de formulaciones basadas en la estrategia de

r 1,1,na

d
Dd = diag d1,1,1

costo terminal y horizonte infinito (IHMPC) desarrollada en Rawlings y Muske, 1993.

d
d1,1,
na

Estas formulaciones, sucesivamente presentadas en Rodrigues y Odloak, 2003, y Odloak, 2004, son extensiones que buscan desarrollar controles aplicables a sistemas reales. Dos caractersticas principales se destacan en ellas: trabajan en la forma seguimiento de MPC, es decir, se apartan del caso de regulacin originalmente presentado

J1
J
N = 2

Jny

nd nu

por Rawlings y Muske (debido a esto, se propone un modelo en su forma velocidad,


adaptado para su uso en predicciones de horizonte infinito); y trabajan sobre el caso
general de sistemas que contienen tanto modos estables como modos integradores.
El modelo que se utilizar en esta seccin viene dado por
x ( k + 1) = Ax ( k ) + Bu ( k )

=
0

UTN Facultad Regional Paran

r1,nu ,1

r1,nu ,na

d1,dnu ,1
1

Ji =
0

d1,i nu
, D 0 , Di

i
dny ,nu
rny ,1,1

d1,dnu ,na
0
0
0
0

0
ny nd , = 1
[

rny ,1,na

dnyd ,1,1

rny ,nu ,1

dnyd ,1,na

nu na nu

ny nu

rny ,nu ,na )

dnyd ,nu ,1

nd nd

dnyd ,nu ,na

nd nd

i = 1, , ny ,

1] nu na .

Este modelo es del tipo velocidad, y bien puede ser calculado a partir de la respuesta

y ( k ) = Cx ( k ) ,

al escaln del sistema, bien mediante una apropiada transformacin de similaridad de un

donde

presente en las aplicaciones reales, en que el sistema tiene modos estables e integrado-

xs
x = xd
i
x

modelo general de espacio de estado. Adems, considera el caso general, muchas veces
res.

nx

, nx = 2ny + nd , nd = ny.nu.na , x
s

0 t Iny
F
0

0
Iny

C = I ny

0ny ,

x =

d
x1,1,1

, x

ny .nu .na

, x
i

ny

La forma incremental de la entrada aporta nuevos modos integradores que se agregan


a los (modos integradores) originales del sistema. Es preciso, entonces, distinguir entre

Iny
A= 0

ny

d
x1,1,na

D + tD
, B = Dd F N
i
D
0

nx nx

s
s
x = x1
d
x1,2,1

s
xny ,

los modos integradores aportados por la forma velocidad del modelo, x s , y los modos
nx nu

, y = y1

yny ,

integradores originales del sistema, xi . Los estados restantes que conforman el modelo
se denominan x d , y representan los modos estables del sistema, es decir, aquellos que

i
i
x = x1

se anulan en el estado estacionario. Este desacople entre estados estables e integradores,

i
xny ,

y mejor aun, entre estados que corresponden al rgimen transitorio y estados que co-

d
x1,2,na
d
x2,1,1

rresponden al rgimen estacionario, proporciona ciertas condiciones favorables para la


d
x2,1,na

d
xny ,1,na

implementacin de MPC. Concretamente, el desacople entre estados (sumado al hecho

T
d
xny ,nu ,na

de que en general la matriz F es diagonal) hace que la ecuacin de Liapunov, necesaria


para computar el costo terminal del controlador, sea sencilla de resolver. Esto permite

Alejandro H. Gonzlez

133

Alejandro H. Gonzlez

134

Electrnica Industrial

UTN Facultad Regional Paran

calcular la matriz de peso terminal con una demanda computacional despreciable, facilitando cualquier cambio en la configuracin del controlador 24. Otra ventaja, ms obvia,

Electrnica Industrial

UTN Facultad Regional Paran

de salida, y m es el horizonte de control. Ntese que se supone que u ( k + j / k ) = 0


para j m .

es que al trabajar con un modelo en forma velocidad se torna innecesario conocer la


ganancia de estado estacionario para calcular la entrada que corresponde a una cierta

Adems, se consideran restricciones de entrada del tipo

referencia de salida. Esto es, no hay que calcular el valor de entrada us que cumpla

u ( k + j / k ) U ,

ysp = C ( I A ) Bus ,

umax u ( k + j / k ) umax

j
U = u ( k + j / k )
.
1
/
u
u
k
u
k
i
k
u

(
)
(
)

min
max

i =0

para luego restarlo a la ponderacin de entrada. Los incrementos de entrada, en este


caso, son siempre nulos en el estado estacionario.

j = 0, 1,

, m 1

(6.10)

(6.11)

Este problema corresponde a la estrategia de costo terminal y horizonte infinito des-

6.5. Necesidad de restricciones terminales

arrollada en Rawlings y Muske, pero adaptado al caso de seguimiento de referencias de


salida, es decir, la funcin objetivo penaliza los errores de salida y los incrementos de

Hasta aqu se describieron las virtudes que hacen al modelo apropiado para componer
las predicciones de un control MPC; ahora se pasar a enumerar algunos inconvenientes, y las soluciones propuestas para cada uno de ellos. La funcin objetivo que se busca
minimizar en el problema de optimizacin est dada por

m 1

j =0

donde

(6.9)

j =0

ny ny

es definida positiva,

nu nu

control nulo. Esto significa que los controles (para el caso estudiado los controles son
los incrementos de entrada) ms all del horizonte m sern cero, de suerte que los modos integradores que no hayan sido anulados para entonces, permanecern constantes en

V ( k ) = e ( k + j / k ) Q e ( k + j / k ) + u ( k + j / k ) R u ( k + j / k ) ,
T

entrada. El control local implementado por estos autores consiste, como se dijo, en el

es semi-definida positiva,

e ( k + j / k ) = y ( k + j / k ) y sp = Cx ( k + j / k ) y sp , x ( k / k ) = x ( k ) , es el error predi-

cho incluyendo el efecto de los movimientos de control futuros 25, y sp es la referencia

24

Por ejemplo, es posible alterar las variables que representan las salidas y las entradas.
Ntese que dada la forma del modelo utilizado, el error de salida puede ser escrito como
xsps ysp

e = Cx ysp = C ( x xsp ) , donde xsp = xspd = 0 . Esto se debe a que los estados xs representan preci xspi 0

las predicciones, es decir, no convergern a cero como lo requiere el cmputo del costo
terminal. De este modo, si los modos integradores nos son anulados oportunamente, el
costo ser no acotado, pues se recordar que a partir de m se computa un horizonte de
salida infinito. Esta dificultad del modelo y de la naturaleza integradora de la planta, si
ese fuera el caso, obligan a la inclusin de restricciones que anulen los estados integradores al final del horizonte m:
e s ( k ) + ( Dm0 D2i m ) uk = 0

( e ( k + m) = 0)

(6.12)

xi ( k ) + D1im uk = 0 ,

( x ( k + m) = 0)

(6.13)

25

samente la salida en estado estacionario, una vez que los modos xi se han anulado. De este modo, si se
x s ysp e s


utiliza el vector de estado x = ( x xsp ) = x d = x d en lugar del vector de estado original, el costo
xi xi

dado por (6.9) ser: V ( k ) = x ( k + j / k ) C QC x ( k + j / k ) +


j =0

Alejandro H. Gonzlez

m 1

u ( k + j / k )

R u ( k + j / k ) .

donde
e s ( k ) = x s ( k ) ysp

Dm0 = D 0

D 0

D2i m = 0 tD i

nym.nu

, D1im = D i

( m 1) tDi

D i

nym.nu

nym.nu

j =0

135

Alejandro H. Gonzlez

136

Electrnica Industrial
uk = u ( k / k )

UTN Facultad Regional Paran


T

T
u ( k + m 1/ k )

m.nu

Electrnica Industrial

UTN Facultad Regional Paran

6.6. Extensin del dominio de atraccin. Estrategia de dos eta-

Ntese que desde el punto de vista de la formulacin general de MPC, las ecuaciones
(6.12) y (6.13) representan restricciones terminales. Se pude decir, entonces, que la re-

pas de optimizacin
Para el caso que se estudia en esta seccin, la regin terminal viene dada por

gin terminal en este tipo de problemas viene dada por X f = { x : e = 0, x = 0} . Ahora

X f = { x : e s = 0, xi = 0} ; y debido al desacople existente entre los estados integradores

bien, con la inclusin explcita de las restricciones (6.12) y (6.13), el problema de opti-

y los estados estables, se puede afirmar que la regin terminal (y por tanto, el dominio

mizacin se puede escribir como:

de atraccin) resultante para cada tipo de estado ser independiente. Es decir, los esta-

Problema P1

dos integradores tendrn una regin terminal pequea, mientras que los estados estables

m 1

tendrn una regin terminal ilimitada.

min V1 ( k ) = e ( k + j / k ) Q e ( k + j / k ) + u ( k + j / k ) R u ( k + j / k )
uk

j =0

Ahora bien, el horizonte m es el parmetro que afecta ms directamente al costo com-

+ x d ( k + m / k ) Qx d ( k + m / k )
T

putacional de resolver el problema de optimizacin de MPC. Por esta razn, cuando se

(6.14)

busca controlar plantas cuyo tiempo de respuesta es moderado, este horizonte debe ser
pequeo. Por otro lado, cuando se requiere una operacin suave del sistema, los incre-

sujeto a:

mentos de entrada mximos se escogen pequeos para evitar saltos bruscos en las varia-

(6.10), (6.12) y (6.13),

bles manipuladas que, por lo dems, suelen tener lmites fsicos de funcionamiento. Es-

donde Q es la matriz de ponderacin terminal que se obtiene de la ecuacin de Liapu-

tas dos caractersticas hacen que la restricciones terminales sean difciles de cumplir.

nov

Por tanto, el dominio de atraccin de los modos integradores se ve reducido drsticamente, de modo que perturbaciones o cambios de referencia de magnitud moderada,

Q F T QF = F T T QF .

provocan conflictos entre las restricciones (6.10), (6.12) y (6.13). Rodrigues y Odloak,

Ntese que al estar anulados los modos integradores, el costo infinito que comienza

2003b, y Carrapio y Odloak, 2005, propusieron la inclusin de variables de relajacin

en k+m depender exclusivamente de los modos estables, por lo que ser acotado. Por

(en ingls, slack variables) en el problema de optimizacin, con el objeto de ampliar

esa razn, la ecuacin de Liapunov utiliza la matriz F, que es una matriz diagonal

26

de

el dominio de atraccin del controlador formulado por (6.9)-(6.13).

autovalores menores a 1, en lugar de la matriz completa A. Esta forma diagonal de la

Rodrigues y Odloak, 2003b, y Odloak, 2005, propusieron la inclusin de variables de

matriz F, como se dijo, hace mucho ms sencillo el cmputo de la matriz de pondera-

relajacin (en ingls, slack variables) en el problema de optimizacin, con el objeto

cin Q .

de ampliar el dominio de atraccin del controlador.

Mientras el problema de optimizacin permanezca factible, esta formulacin hereda


la garanta de estabilidad del controlador propuesto por Rawlings y Muske. Sin embargo, el problema principal de este controlador reside en el reducido dominio de atraccin

Problema P2

min V2 ( k ) = ( e ( k + j / k ) + ks + jt ki ) Q ( e ( k + j / k ) + ks + jt ki )

uk , ks , ki

j =1

que presenta, como se ver a continuacin.

m 1

+ u ( k + j / k ) Ru ( k + j / k ) + ksT S1 ks + kiT S2 ki
T

j =0

26

Esto es rigurosamente cierto slo si los polos del sistema son diferentes entre s.

Alejandro H. Gonzlez

137

Alejandro H. Gonzlez

138

Electrnica Industrial

UTN Facultad Regional Paran


(6.15)

Electrnica Industrial

Sea ki * , ua*,k

UTN Facultad Regional Paran

) la solucin ptima al Problema P4a, y considrese el incremento total

sujeto a:
u ( k + j / k ) U ,

m 1

j = 0, 1,

de entrada correspondiente a esta solucin:

, m 1 ,

ua* (k + j / k ) .
j =0

Este incremento total ptimo es pasado al segundo problema, que se resuelve en el

xi ( k + m ) + ki = 0 ,

mismo instante de muestreo que el anterior:

e s ( k + m ) + ks = 0 ,

Problema P3b

donde S1 y S2 son definidas positiva y ks

ny

y ki

nu

son variables slack. Ntese

que cuando el Problema P1 es factible, la solucin ptima a dicho problema es la solu-

min V4b ( k ) = e ( k + j / k ) + ks

ub , k ,ks

j =0

) Q (e (k + j / k ) + )
T

s
k

m 1

cin ptima del Problema P2 con ks = ki = 0 .

+ ub ( k + j / k ) Rub ( k + j / k ) + ks T S1ks
T

j =0

Es importante resaltar que, aunque la regin terminal relajada vara (disminuye) con
el tiempo, la formulacin garantiza la factibilidad recursiva. Ntese que si el problema

sujeto a:

es factible en un dado instante, entonces se puede elegir como secuencia de control la

ub (k + j / k ) U, j 0

secuencia anterior ms una accin de control nula, y de este modo asegurar que el problema permanecer factible.

e s ( k + m ) + ks = 0

Sin embargo, el problema P2, as formulado, no garantiza la convergencia de la salida

m 1

m 1

del sistema a su referencia. Una forma de lograr la deseada convergencia es dividiendo

j =0

j =0

el problema de optimizacin en dos:

min V4 a ( k ) = ki T S2 ki

(6.16)

ki ,ua , k

ub (k + m 1/ k )T .

La implementacin prctica de este controlador es como sigue. Primero se verifica si


el Problema P2 es factible, lo que se hace comprobando si existe una solucin a la ecuacin (6.13) que satisfaga (6.10). Si tal solucin existe, se implementa el control resultan-

sujeto a:

te del Problema P2; si, por el contrario, no se encuentra solucin, entonces se resuelve

ua (k + j / k ) U, j 0

el Problema P3a, y luego el P3b.

xi ( k + m ) + ki = 0

(6.17)

El controlador resultante del Problema P3 garantiza que la variable de relajacin ki


converge a cero en tiempo finito. De este modo, para una matriz S1 que satisfaga

donde

Alejandro H. Gonzlez

donde ub,k = ub (k / k )T

Problema 3a

ua ,k = ua (k / k )T

ub (k + j / k ) = ua* (k + j / k )

((

ua (k + m 1/ k )T .

S1 > tD i

139

) (( tD ) )

1 T

Alejandro H. Gonzlez

T
i 1

(
(

)
)

tD i 1
T

G QG + R
1
i

tD

140

Electrnica Industrial

UTN Facultad Regional Paran

se garantiza tanto la estabilidad del lazo cerrado como la propiedad de la factibilidad


recursiva. Una demostracin rigurosa de estas caractersticas puede verse en Odloak

Electrnica Industrial

UTN Facultad Regional Paran

Maciejowski J.M. Predictive Control with Constraints. New Jersey: Prentice Hall,
(2002).

2005. Podra decirse que en este caso se han aprovechado las caractersticas del contro-

Mayne D. Q, J. B. Rawlings, C. V. Rao and P. O. M. Scokaert. Constrained model

lador propuesto por Rawlings y Muske, 1993, para implementar una extensin eficiente

predictive control: Stability and optimality. Automatica, 36, 789814 (2000).

a casos aplicables en la prctica. El hecho de tener desacoplados los modos integradores


puros de los modos estables, y el hecho de que el control local sea el control nulo, hacen
que la restriccin terminal, en general excesivamente conservadora, se pueda ampliar
(relajar) de un modo sencillo. Ntese que ante al ausencia de cualquiera de estas propiedades, cualquier extensin de ese tipo deriva en un excesivo incremento de la complejidad del controlador (incremento de las variables de decisin en la optimizacin), y en
un aumento prohibitivo del costo computacional.

Michalska, H. & Mayne, D. Q. Robust receding horizon control of constrained


nonlinear systems. IEEE Transactions on Automatic Control, 38(11), 1623-1633
(1993).
Odloak D. Extended robust model predictive control. AIChE Journal, 50 (8) 18241836 (2004).
Rawlings J.B. and K.R. Muske. The stability of Constrained Receding Horizon
Control. IEEE Transaction on Automatic Control, 38, 1512 (1993).

6.7. Referencias bibliogrficas

Rodrigues M.A. and D. Odloak. MPC for Stable Linear Systems with Model
Camacho, E and Bordons. Model Predictive Control (2nd ed.), Berlin: Springer
(2004).

Uncertainty. Automatica, 39, 569-583 (2003).


Rodrigues M.A. and D. Odloak. An infinite horizon model predictive control for

Cano R. A. R. and D. Odloak. Robust model predictive control of integrating process.

stable and integrating process. Computer and chemical Engineering, 27, 11131128 (2003b).

Journal of Process Conrol, 13, 101-104 (2003).

Carrapio O. L. and D. Odloak. A stable model predictive control for integrating


process. Computers & Chemical Engineering, 29, 1089-1099 (2005).

Rossiter J.A. Model-Based Predictive Control. CRC Press (2003).


Scokaert P. O. M. and D. Q. Mayne. Min-Max feedback model predictive control for

De Don J. A, M. M. Seron, D. Q. Mayne and G. C. Goodwin. Enlarged terminal sets


guaranteeing stability of receding horizon control. System & Control Letters, 47,

constrained linear systems. IEEE Transactions on Automatic Control, 43(8),


1136-1142 (1998).

57-63 (2002).
Kerrigan, E. C. Robust Constraint Satisfaction: Invariant Sets and Predictive Control.
PhD thesis, University of Cambridge (2000).
Kerrigan, E. C. and J. M. Maciejowski. Invariant sets for constrained discrete-time
systems with application to feasibility in model predictive control. Proceedings of
the CDC (2000).

Limn D. Control predictivo de sistemas no lineales con restricciones: estabilidad y


robustez. Tesis Doctoral, Universidad de Sevilla, Espaa, (2002).

Alejandro H. Gonzlez

141

Alejandro H. Gonzlez

142

Electrnica Industrial

UTN Facultad Regional Paran

Electrnica Industrial

UTN Facultad Regional Paran

Referencias bibliogrficas

7. Control predictivo robusto

Camacho, E and Bordons. Model Predictive Control (2nd ed.), Berlin: Springer
7.1. Control predictivo robusto basado en desigualdades matriciales lineales (LMI)

(2004).
Cano R. A. R. and D. Odloak. Robust model predictive control of integrating process.
Journal of Process Conrol, 13, 101-104 (2003).

Carrapio O. L. and D. Odloak. A stable model predictive control for integrating


process. Computers & Chemical Engineering, 29, 1089-1099 (2005).
De Don J. A, M. M. Seron, D. Q. Mayne and G. C. Goodwin. Enlarged terminal sets
guaranteeing stability of receding horizon control. System & Control Letters, 47,
57-63 (2002).
Kerrigan, E. C. Robust Constraint Satisfaction: Invariant Sets and Predictive Control.
PhD thesis, University of Cambridge (2000).
Kerrigan, E. C. and J. M. Maciejowski. Invariant sets for constrained discrete-time
systems with application to feasibility in model predictive control. Proceedings of
the CDC (2000).

Limn D. Control predictivo de sistemas no lineales con restricciones: estabilidad y


robustez. Tesis Doctoral, Universidad de Sevilla, Espaa, (2002).
Maciejowski J.M. Predictive Control with Constraints. New Jersey: Prentice Hall,
(2002).
Mayne D. Q, J. B. Rawlings, C. V. Rao and P. O. M. Scokaert. Constrained model
predictive control: Stability and optimality. Automatica, 36, 789814 (2000).
Michalska, H. & Mayne, D. Q. Robust receding horizon control of constrained
nonlinear systems. IEEE Transactions on Automatic Control, 38(11), 1623-1633
(1993).
Odloak D. Extended robust model predictive control. AIChE Journal, 50 (8) 18241836 (2004).
Rawlings J.B. and K.R. Muske. The stability of Constrained Receding Horizon
Control. IEEE Transaction on Automatic Control, 38, 1512 (1993).

Alejandro H. Gonzlez

143

Alejandro H. Gonzlez

144

Electrnica Industrial

UTN Facultad Regional Paran

Rodrigues M.A. and D. Odloak. MPC for Stable Linear Systems with Model
Uncertainty. Automatica, 39, 569-583 (2003).
Rodrigues M.A. and D. Odloak. An infinite horizon model predictive control for
stable and integrating process. Computer and chemical Engineering, 27, 11131128 (2003b).
Rossiter J.A. Model-Based Predictive Control. CRC Press (2003).
Scokaert P. O. M. and D. Q. Mayne. Min-Max feedback model predictive control for
constrained linear systems. IEEE Transactions on Automatic Control, 43(8),
1136-1142 (1998).

Alejandro H. Gonzlez

145

You might also like