Apunte de La Catedra Eletronica Industrial Apaisado

Electrnica Industrial
UTN Facultad Regional Paran
APUNTES DE CATEDRA DE LA ASIGNATURA ELECTRONICA INDUSTRIAL
ndice
Parte I
1. Introduccin.................................................................................................................. 3
1.1. Teora de control avanzado versus teora de control convencional....................... 4
1.2. Conceptos fundamentales ...................................................................................... 5
2. Representacin de sistemas en espacio de estado ........................................................ 9
2.1. Representacin en espacio de estado de sistemas lineales en tiempo continuo. ... 9
2.1.1. Representacin en espacio de estado de sistemas de ecuaciones diferenciales
lineales de orden n. ................................................................................................... 9
2.1.2. No unicidad del conjunto de variables de estado ......................................... 11
2.1.3. Solucin de la ecuacin de estado lineal invariante en el tiempo ................ 12
2.2. Representacin en espacio de estado de sistemas lineales en tiempo discreto.... 14
2.2.1. Formas cannicas para ecuaciones en el espacio de estado en tiempo
discreto. .................................................................................................................. 14
2.2.2. Controlabilidad y alcanzabilidad de sistemas lineales en tiempo discreto... 16
2.2.3. Observabilidad de sistemas lineales en tiempo discreto............................... 20
2.2.4. Observadores de estado ................................................................................ 23
2.2.5. No unicidad de la representacin en el espacio de estado............................ 27
2.2.6. Solucin de la ecuacin de espacio de estado en tiempo discreto e invariante
en el tiempo ............................................................................................................ 28
2.2.7. Discretizacin de una ecuacin de estado en tiempo continuo .................... 29
2.3. Representacin en espacio de estado de sistemas no lineales ............................. 30
2.3.1. Linealizacin de modelos no lineales........................................................... 31
2.4. Estados de equilibrio. Diagramas en el plano de fase ......................................... 31
2.5. Rutinas de Matlab relacionadas al captulo ......................................................... 36
2.6. Referencias bibliogrficas ................................................................................... 37
3. Concepto de estabilidad de Liapunov......................................................................... 39
3.1 Concepto de Estabilidad e Inestabilidad............................................................... 40
3.2. Teorema de estabilidad de Liapunov................................................................... 44
3.2.1. Anlisis de estabilidad de Liapunov para sistemas LTI autnomos en tiempo
continuo .................................................................................................................. 47
3.2.2. Anlisis de estabilidad de Liapunov para sistemas LTI autnomos en tiempo
discreto ................................................................................................................... 48
3.3. Rutinas de Matlab relacionadas al captulo ......................................................... 50
3.4. Referencias bibliogrficas ................................................................................... 51
4. Introduccin a la teora de optimizacin de funciones. Introduccin al control ptimo
(LQR) ............................................................................................................................. 53
4.1. Definiciones preliminares (Convexidad de conjuntos y funciones).................... 53
Alejandro H. Gonzlez
4.2. Optimizacin sin restricciones............................................................................. 62

4.3. Optimizacin con restricciones. .......................................................................... 65
4.3.1. Programacin convexa ................................................................................. 66
4.3.2. Condiciones geomtricas de optimalidad ..................................................... 67
4.3.4. Problemas con restricciones de igualdad y desigualdad............................... 71
4.3.5. Condiciones necesarias de Fritz John........................................................... 72
4.3.6. Condiciones necesarias de Karush-Kuhn-Tucker......................................... 76
4.3.7. Condiciones suficientes de Karush-Kuhn-Tucker........................................ 78
4.3.8. Programacin cuadrtica .............................................................................. 78
4.4. Dualidad Lagrangiana ......................................................................................... 79
4.4.1. Interpretacin geomtrica ............................................................................. 80
4.4.2. Dualidad fuerte y dualidad dbil .................................................................. 82
4.5. Conceptos bsicos de control ptimo. Regulador cuadrtico lineal (LQR) ........ 86
4.5.1. Regulador cuadrtico lineal en tiempo discreto ........................................... 92
4.5.2. Regulador cuadrtico lineal en tiempo discreto con horizonte infinito........ 99
Parte II
5. Control predictivo basado en modelos ..................................................................... 103
5.1. Ventajas y desventajas de MPC ........................................................................ 103
5.1.1. Importancia de las restricciones: ................................................................ 104
5.2. Formulacin bsica............................................................................................ 104
5.3. Modelos de prediccin ...................................................................................... 106
5.4. Problema de optimizacin on-line de MPC....................................................... 108
5.5. DMC (Acrnimo derivado del ingls Dynamic Matrix Control) ...................... 109
5.6. MPC con realimentacin de salida .................................................................... 111
5.7. Observador en estado estacionario .................................................................... 112
5.8. Eliminacin de offset en MPC .......................................................................... 113
5.9. Referencias bibliogrficas ................................................................................. 114
6. Estabilidad de los controladores predictivos ............................................................ 117
6.1. Definiciones preliminares.................................................................................. 117
6.2. Formulacin general MPC estable. Teorema de Mayne ................................... 121
6.3. Casos particulares. IHMPC y MPC Dual con LQR como control terminal...... 126
6.4. MPC con estabilidad garantizada, aplicable a procesos industriales (IHMPC) 133
6.5. Necesidad de restricciones terminales............................................................... 135
6.6. Extensin del dominio de atraccin. Estrategia de dos etapas de optimizacin 138
6.7. Referencias bibliogrficas ................................................................................. 141
7. Control predictivo robusto........................................................................................ 143
1.1. Teora de control avanzado versus teora de control conven-
Parte I
cional
1. Introduccin
En esta seccin se expondrn las diferencias entre el control clsico, basado en el uso
de funciones de transferencias, y el control avanzado, basado en el uso de espacio de
En apenas cincuenta aos el control automtico ha irrumpido como una disciplina pujante y de gran inters no slo cientfico y tecnolgico, sino tambin econmico. Los
sistemas de control automtico, que tienen sus orgenes en la ms remota antigedad,
han sustentado su desarrollo en las matemticas aplicadas y se estn convirtiendo, de
manera cada vez ms acentuada, en componentes esenciales y crticos de cualquier sistema dinmico, incluso en campos diferentes de los tradicionales en ingeniera.
estado. Una diferencia entre la teora de control moderna (o control avanzado) y la teora de control convencional es que la primera es aplicable a sistemas de mltiples entradas y mltiples salidas (MIMO), que pueden a su vez ser lineales o no-lineales, variantes o invariantes en el tiempo, mientras que la ltima es aplicable slo a sistemas lineales, invariantes en el tiempo, y con una sola entrada y una sola salida (SISO). Adems,
la teora de control avanzado es esencialmente un abordaje en el dominio temporal,
mientras que la teora convencional lo es en el poco intuitivo dominio de las frecuen-
Dentro del control automtico, se puede hablar de control clsico y control moderno o
avanzado. La teora de control clsico basa sus desarrollos en modelos de en el dominio
frecuancial, mientras que la teora de control avanzado lo hace en representaciones de
espacio de estado (dominio temporal), que son modelos matemticos de sistemas fsicos
cias.
Para contrastar de un modo claro los campos de accin de cada uno de estos abordajes, considrese la Tabla 1.1:
que relaciona conjuntos de variables de entrada, salida y estados del sistema por medio
Teora de control conven-
Teora de control avan-
de ecuaciones diferenciales de primer orden. Para dar cuenta de sistemas con mltiples
cional
zado
entradas y salidas, las variables se expresan en forma vectorial, de modo que las ecuaciones diferenciales toman una forma matricial-vectorial.
Dentro de las representaciones en espacio de estado, existen dos clasificaciones im-
Lineales, invariantes en el
rados
tiempo y SISO
Dominio de trabajo
Dominio de las frecuencias
Dominio temporal
Slo funciones especficas
Permite el uso de una serie
portantes, de acuerdo con los tipos de sistemas que se quieren modelar, y de acuerdo a
la naturaleza de la variable tiempo1. Por un lado se tienen sistemas lineales y no linea-
Lineales o No-lineales,
Tipos de sistema conside-
variantes o invariantes en
el tiempo, MIMO
les; por otro, sistemas en tiempo continuo o en tiempo discreto. Dada su importancia
terica y conceptual, la primera parte de este curso estar destinada a presentar y anali-
de entrada: funciones im-
de entradas arbitrarias en
tinuo como de tiempo discreto. No obstante, el inters principal estar puesto siempre
pulso, escaln, sinusoida-
lugar de funciones espec-
en los sistemas lineales de tiempo discreto (a la cual estar dedicada la segunda parte
les, etc.
ficas
No permite tener en cuenta
Permite tener en cuenta las
las condiciones iniciales
condiciones iniciales
Basados en mtodos de
Permiten el diseo de sis-
zar conceptos relacionados con sistemas tanto lineales como no lineales, de tiempo con-
Entradas
del curso con exclusividad), dado que es ste el enfoque de ms utilidad para el control
industrial.
Condiciones iniciales
Diseo de sistemas de
Tambin se podra incluir aqu la clasificacin de acuerdo a la variabilidad de los parmetros del modelo
respecto del tiempo. As, se tienen sistemas variantes e invariantes en el tiempo.
control

temas de control ptimo,
libre albedro no exista, ya que todo estaba determinado. Se podra decir, sin temor a
permiten sistemas de con-
respecto de determinados
exagerar, que las ideas que subyacen a la teora de espacio de estado son la materializa-
trol ptimo
ndices de desempeo
cin de las ideas de Laplace, aplicadas no ya al vasto y esquivo universo, sino a modes-
de primer orden, para sis-
Descripcin del sistema
prueba y error, que no
n-ecuaciones diferenciales
Morfologa
Relacin polinmica entrada-salida
temas descriptos por ecuaciones diferenciales de
tas porciones de ste, como lo son los sistemas dinmicos.

Algunos conceptos fundamentales con los que se trabajar en los sucesivos captulos
son los siguientes:
Estado. Es el conjunto mnimo de variables (llamadas variables de estado) tales que
orden n (ordenacin matri-
su conocimiento en un instante t = t0 , junto con el conocimiento de la entrada para t t0 ,
cial)
determina completamente el comportamiento del sistema para todo tiempo t t0 . De
Descripcin externa del
Descripcin interna del
este modo, el estado de un sistema dinmico en el tiempo t queda unvocamente deter-
sistema
sistema
minado por el estado al tiempo t0 y la entrada para t t0 , y es independiente de los esta-
Tabla 1.1. Comparacin entre la teora de control convencional y la teora de control
dos y entradas anteriores al tiempo t0.

El concepto de estado no est limitado a sistemas fsicos; tambin es aplicable a sis-
avanzado.
temas biolgicos, sistemas econmicos, sistemas sociales y otros.
1.2. Conceptos fundamentales
Variable
El matemtico francs Pierre Simn de Laplace (1749-1827) afirmaba, categrico,
( x1 ( t ) , x2 ( t ) ,
de
Estado.
Es
el
conjunto
ms
pequeo
de
variables
, xn ( t ) ) que determinan el estado del sistema dinmico. Ntese que las
que si se conociera la velocidad y la posicin de todas las partculas del Universo en un
variables de estado no necesitan ser cantidades fsicamente medibles u observables, si
instante dado, entonces se podra predecir su pasado y futuro para el resto de los siglos.
bien es deseable que lo sean, segn ciertas condiciones de diseo de controladores.

Vector de Estado. Si x1 ( t ) , x2 ( t ) ,
Lo deca con estas elocuentes palabras:

Podemos mirar el estado presente del universo como el efecto del pasado y la
causa de su futuro. Se podra condensar un intelecto que en cualquier momento dado
, xn ( t ) son las n variables de estado que descri-
ben completamente el comportamiento dinmico del sistema, entonces dichas n variables de estado son las n componentes del vector de estado x ( t ) .
sabra todas las fuerzas que animan la naturaleza y las posiciones de los seres que la
componen, si este intelecto fuera lo suficientemente vasto para someter los datos al
anlisis, podra condensar en una simple frmula de movimiento de los grandes cuer-
Estas variables de estado se representan en un vector denominado vector de estado,

por lo tanto un vector de estado es aquel que determina de manera unvoca el estado del
pos del universo y del tomo ms ligero; para tal intelecto nada podra ser incierto y
sistema x ( t ) para cualquier tiempo t t0 , una vez que se obtiene el estado en t = t0 y se
el futuro as como el pasado estaran frente sus ojos.
especifica la entrada u ( t ) para t t0 .
Existen, claro est, dificultades obvias para satisfacer la propuesta de Laplace, pero
Espacio de Estado. Es el espacio de n dimensiones, cuyos ejes estn formados por
por ms de cien aos su afirmacin pareci correcta y, ms an, la aplicacin literal de
los n ejes que forman las n variables de estado necesarias para describir completamente
esos conceptos al comportamiento humano condujo a la conclusin filosfica de que el
el comportamiento dinmico del sistema.
Ntese que en el anlisis en el espacio de estado se habla de tres tipos de variables,

variables de entrada, de salida y de estado.
x1 = y
x2 = y
2. Representacin de sistemas en espacio de estado
n 1
2.1. Representacin en espacio de estado de sistemas lineales en

tiempo continuo.
xn = y .
Luego, la Ec.(2.1) puede ser escrita como
x1 = x2
Un sistema dinmico formado por un nmero finito de elementos puede ser descrito
por una ecuacin diferencial ordinaria en la cual el tiempo es la variable independiente.
Por medio del uso de una notacin vectorial-matricial, una ecuacin diferencial de or-
x2 = x3
xn = an x1
a1 xn + u,
den n puede ser representada por una nica ecuacin vectorial-matricial de primer or-
den. Si los n elementos de un vector representan un conjunto de variables de estado,
x = Ax + Bu ,
entonces la ecuacin diferencial vectorial-matricial se llama ecuacin de estado. Se presentarn a continuacin algunos mtodos para obtener representaciones en espacio de
estado de sistemas en tiempo continuo.
2.1.1. Representacin en espacio de estado de sistemas de ecuaciones diferenciales lineales de orden n.
(2.2)
donde
x1
x
2
x=
x
n 1
xn
0
0
=
,
vector
de
estado
A
(
)
0
an
1
0
0
1
0
an 1
0
an 2
0
0
1
a1
0
0

n n
, B =

0
1
n1
Considrese un sistema lineal SISO descrito por la siguiente ecuacin diferencial de
La ecuacin de salida queda finalmente
orden n:
( n)
( n 1)
y + a1 y +
y = Cx ,
+ an 1 y + an y = u
Tomando en cuenta que el conocimiento de y ( 0 ) , y ( 0 ) ,
donde
( n 1)
, y ( 0 ) , junto con el co-
nocimiento de la entrada para t t0 , determina completamente el comportamiento del

sistema en el futuro, se pueden tomar las variables y ( t ) , y ( t ) ,
( n 1)
, y ( t ) como un con-
junto de n variables de estado.
y es la salida del sistema, y C = [1 0
0]
1 n
Una representacin en diagrama de bloques de las ecuaciones mostradas puede verse

en la Figura 2.1. Para dar generalidad a la representacin se ha agregado un trmino a la
ecuacin de salida, esto es, y = Cx + Du . La matriz D vincula la salida instantnea con
la entrada
Defnase
(2.3)
(2.1)
10
2.1.3. Solucin de la ecuacin de estado lineal invariante en el tiempo

D
Solucin de la ecuacin de estado homognea. Considrese la ecuacin diferencial
vectorial-matricial
B
x = Ax
donde x
(2.4)
n
n n
, A
Se supondr ahora una solucin x ( t ) de la forma
x ( t ) = b0 + b1t + b2t 2 +
Figura 2.1. Representacin en diagrama de bloques de las Ec. (2.2) y (2.3)
+ bk t k +
(2.5)
donde tanto x ( t ) como los coeficientes bi , i = 1, 2,
Ejemplo:
son vectores. Sustituyendo la
supuesta solucin (2.5) en la Ec. (2.4) se obtiene
A partir del sistema definido por: y + 6 y + 11 y + 6 y = 6u , obtngase una representacin en espacio de estado.
b1 + 2b2t + 3b3t 2 +
+ kbk t k 1 +
= A ( b0 + b1t + b2t 2 +
+ bk t k +
).
(2.6)
Ahora bien, si esta solucin supuesta es la verdadera solucin, entonces la Ec (2.6) debe
2.1.2. No unicidad del conjunto de variables de estado
cumplirse para cualquier t. De este modo, igualando coeficientes de igual potencia en t,
El conjunto de variables de estado que representa a un dado sistema no es nico. Supngase que x1 , x2 ,
, xn es un conjunto de variables de estado. Entonces, puede consi-
, xn )
x2 = X 2 ( x1 , x2 ,
, xn )
xn 1 = X n ( x1 , x2 ,
1
1
Ab1 = A2b0
2
2
1
1 3
b3 = Ab2 =
A b0
3
23
valores x1 , x2 ,
bk =
, xn ) ,
siempre que, a cada conjunto de valores x1 , x2 ,
, xn corresponda un nico conjunto de
, xn , y viceversa. De este modo, si x es un vector de estado, entonces x ,
con x = Px , es tambin un vector de estado, siempre que la matriz P sea no singular.

Vectores de estado diferentes llevan consigo la misma informacin relacionada al comportamiento del sistema.
b1 = Ab0
b2 =
derarse otro conjunto de variables de estado a cualquier conjunto de funciones,

x1 = X 1 ( x1 , x2 ,
se obtiene
11
1 k
A b0 .
k!
El valor de b0 se determina al sustituir t = 0 en la Ec (2.5), esto es, x ( 0 ) = b0 . De este

modo, la solucin x ( t ) se puede escribir como
1
x ( t ) = I + At + A2t 2 +
2!
= e At x ( 0 ) .
1 k k
At +
k!
x ( 0)
12
Ntese que la expresin entre parntesis es precisamente la definicin de la matriz

nn
exponencial e At
. Dado que la matriz exponencial es de uso frecuente en el anli-
sis de sistemas lineales en el espacio de estado, se examinarn a continuacin sus propiedades.

Solucin de la ecuacin de estado no homognea. Considrese ahora la ecuacin
diferencial vectorial-matricial no homognea

x = Ax + Bu
donde x
(2.7)
n
, u
nu
, A
n n
n nu
, B
La Ec. (2.8) es la solucin de la Ec (2.7), y en ella puede verse la suma de un trmino

que representa la transicin del estado inicial y un trmino que da cuenta de la accin de
la entrada.
2.2. Representacin en espacio de estado de sistemas lineales en

tiempo discreto
Una forma general de representar en espacio de estado un sistema lineal en tiempo
discreto, variante en el tiempo (LTV), es la siguiente:
Reescribiendo (2.7) como
x ( k + 1) = A ( k ) x ( k ) + B ( k ) u ( k )
x ( t ) Ax ( t ) = Bu ( t ) ,
y (k ) = C (k ) x (k ) + D (k )u (k ) ,
y pre-multiplicando por e At
n n
donde x ( k )
ambos lados de la ecuacin, se obtiene
u (k )
d At
e x ( t ) = e At Bu ( t ) . 2
dt
e At x ( t ) Ax ( t ) =
C (k )
Integrando ahora la ecuacin anterior entre 0 y t, se obtiene

e
At
x (t ) = x ( 0) + e
t
nu
ny n
(2.9)
es el vector de estado, y ( k )
es
el
, D (k )
vector
ny nu
de
entrada,
ny
es el vector de salida del sistema,

y
A(k )
n n
, B (k )
son matrices variantes en el tiempo (que no deben con-
lineales invariantes en el tiempo (LTI), estas matrices son constantes, lo que quedar
Bu ( ) d ,
evidenciado escribiendo
x ( k + 1) = Ax ( k ) + Bu ( k )
x (t ) = e x ( 0) + e
t
A( t )
fundirse con las utilizadas para los sistemas en tiempo continuo). En el caso de sistemas
o
At
n nu
Bu ( ) d ,
(2.10)
y ( k ) = Cx ( k ) + Du ( k ) .
que puede ser reescrita como
En la Figura 2.2 se muestra la representacin en diagrama de bloques de las Ec. (2.9).
x ( t ) = ( t ) x ( 0 ) + ( t ) Bu ( ) d ,
t
(2.8)
con ( t ) = e At ( ( t ) es la Matriz de transicin de estado o avance).
2.2.1. Formas cannicas para ecuaciones en el espacio de estado en

tiempo discreto.
Considrese un sistema SISO en tiempo discreto descrito por
y ( k ) + a1 y ( k 1) +
En general es f ( t ) = f ( 0 ) +
f ( ) d , con
f ( t ) = e At x ( t ) y e0 = I ).
donde algunos de los coeficientes ai , i = 1, 2,
+ an y ( k n ) = b0u ( k ) + b1u ( k 1) +
+ bn u ( k n ) ,
, n y bi , i = 1, 2,
, n pueden ser nulos.
Esta ecuacin puede ser escrita en la forma de una funcin de transferencia, como sigue:
13
14
Y ( z ) b0 + b1 z 1 + + bn z n
=
.
U ( z ) 1 + a1 z 1 + + an z n
(2.11)
Forma cannica de Jordan:

Si la funcin transferencia dada por la Ec (2.11) incluye un polo mltiple de orden m
Existen numerosas representaciones en espacio de estado particulares que se conocen

como formas cannicas. Alguna de ellas son: Forma cannica controlable, Forma cannica observable, Forma cannica diagonal, Forma cannica de Jordan. A continuacin
se mostrarn la primera y la ltima.
D(k)
B(k)
C(k)
en z = p1 , y todos los dems polos son distintos, entonces la ecuacin de estado y de

salida puede ser escrita como sigue
x1 ( k + 1) p1

x2 ( k + 1) 0

x
k
+
1
(
)
m
=0
x ( k + 1) 0
m +1

x ( k + 1) 0
n

p1 1
0
0
0
0
p1
0
0
pm +1
x ( k +1)
y ( k ) = [ c1 c2
A(k)
0 x1 ( k ) 0
0 x2 ( k ) 0

0 xm ( k ) + 1 u ( k )
0 xm +1 ( k ) 1

pn xn ( k ) 1
Figura 2.2. Representacin en diagrama de bloques de la Ec. (2.10).
x( k )
x1 ( k )
x2 ( k )
+ b0 u ( k ) ,
cn ]
D
xn 1 ( k )
x (k )
n
x( k )
Forma cannica controlable:

x1 ( k + 1) 0

x2 ( k + 1) 0

x
k
+
1
(
)
n 1
0
x ( k + 1) a
n
n
0
an 1
0
an 2
x ( k +1)
y ( k ) = ( bn an b0 )
( bn1 an1b0 )
C
donde ci , i = 1, 2,
0 x1 ( k ) 0
0 x2 ( k ) 0

+ u (k )
1 xn 1 ( k ) 0
a1 xn ( k ) 1
x( k )
, n son coeficientes provenientes de la expansin en fracciones par-
ciales de la transferencia original. Para ver las deducciones de stas y otras representaciones cannicas, se remite al lector a Ogata K., 1996.
2.2.2. Controlabilidad y alcanzabilidad de sistemas lineales en tiempo

discreto
x1 ( k )
x2 ( k )
+ b0 u ( k ) .
( b1 a1b0 )
D
xn 1 ( k )
x (k )
n
En esta seccin dar respuesta a la siguiente pregunta: es siempre posible llevar un

sistema de un dado estado inicial a otro cualquiera?
Considrese un sistema LTI discreto, de orden n, bajo la representacin de estados
x ( k + 1) = Ax ( k ) + Bu ( k )
x( k )
La denominacin controlable, refiere a una propiedad de los sistemas representados
(2.12)
y ( k ) = Cx ( k ) + Du ( k ) ,
en espacio de estado que se estudiar en prximas secciones.
15
16
y supngase un estado inicial x ( 0 ) dado.
Ejemplos:
Definicin de controlabilidad. El sistema discreto (2.12) es de estado completamen-
te controlable, si existe una secuencia de controles, u ( k ) , tal que el origen ( x = 0 ) puede ser alcanzado a partir de cualquier estado inicial en un tiempo finito.
Definicin de alcanzabilidad. El sistema discreto (2.12) es alcanzable, si existe una
secuencia de controles, u ( k ) , tal que un estado arbitrario puede ser alcanzado a partir
1)
Ntese que controlabilidad no implica alcanzabilidad, lo que puede inferirse de

(2.12). Si An x ( 0 ) = 0 , entonces el origen ser alcanzable con la entrada nula, u ( k ) = 0 ,
pero el sistema no es necesariamente alcanzable. Los conceptos de controlabilidad y
alcanzabilidad son equivalentes cuando la matriz A es invertible.
tema es de orden 2. Los estados alcanzables a partir del origen son aquellos que se pueden obtener de la combinacin lineal de columnas de Wc.
2)
1
1
1
2
Sea el sistema x ( k + 1) =
x ( k ) + 0.5 u ( k ) , y x ( 0 ) = 2 . Es po0.25
0
0.5
sible encontrar una secuencia de controles tales que x ( 2 ) =
?
1
De (2.12) se tiene que

x ( 2 ) = A2 x ( 0 ) + ABu ( 0 ) + Bu (1) , esto es
A partir de las definiciones anteriores resulta sencillo probar el siguiente teorema.

Teorema 1.1. El sistema de discreto (2.12) es alcanzable si y slo si rango (Wc ) = n ,
An 1 B es la matriz de controlabilidad de estados del siste-
AB
1 0
1
x ( k ) + u ( k ) . Este sistema no es alcanzable,
0 1
1
1 1
dado que la matriz de conrtolabilidad Wc =
, tiene rango=1, mientras que el sis1 1
de cualquier estado inicial en un tiempo finito.
donde Wc = B
ma.
4 0.5u ( 0 ) + u (1)
2 = 0.25u 0 0.5u 1 .
( )
( )

Las dos ecuaciones que propone la igualdad anterior, son linealmente dependientes.
Por lo tanto, no existe una nica solucin. Una posible secuencia de controles que lleva
Prueba. El estado en el instante n (orden del sistema) vendr dado por:
x ( n ) = An x ( 0 ) + An 1 Bu ( 0 ) +
+ ABu ( n 2 ) + Bu ( n 1)
= An x ( 0 ) + WcU ,
(2.13)
0.5
Sin embargo, si ahora se desea llevar el sistema a x = , se tiene
1
donde
Wc = B
AB
An 1 B ,
U = u T ( n 1) u T ( n 2 )
3 0.5u ( 0 ) + u (1)
2 = 0.25u 0 0.5u 1 ,
( )
( )

u T ( 0 ) .
Por lo tanto si el rango de la matriz es n, entonces, para un estado final arbitrario,

x ( n ) , existir una secuencia controles no acotadas, U, capaz de llevar el sistema desde
el estado inicial, x ( 0 ) , hasta el estado final. Ntese que esta solucin puede no ser nica.
2
0.5
el sistema de x = a x =
en dos pasos es la dada por: u ( 0 ) = 2 , u (1) = 3 .
2

1
que no tiene solucin. La razn de esto es que el sistema no es alcanzable, como se puede comprobar al calcular el rango de su matriz de controlabilidad,
0.5
1
rango (Wc ) = rango
= 1.
0.5
0.25
Dicho rango es menor al orden del sistema, que es 2.
17
18
3)
0
0.5 0
0.8
x ( k ) + 1 u ( k ) , y x ( 0 ) = 0 . Es posi
0 0.7

12
x (1)
10
1
ble encontrar una secuencia de controles tales que x ( 2 ) = ? De ser posible hacerlo,
1
x2
es posible permanecer en dicho estado un instante de tiempo ms (esto es,
x ( 3) = x ( 2 ) )?
4
Al ser
x ( 2)
x (0)
0.8 0.4
rango (Wc ) = rango
= 2 = n,
1 0.7
0
-2
el sistema es alcanzable. Por tanto, utilizando la secuencia de controles u ( 0 ) = 11.2500 ,
4
x1
10
Figura 2.3. Diagrama de fases del Ejemplo 3).
u (1) = -6.8750 es posible alcanzar el estado deseado en dos pasos: el primero lleva el
Considrese ahora el caso de un cambio de variables del tipo x = Px , donde P es una
9
1
sistema a x (1) =
; el segundo, a x ( 2 ) = 1 . En la Figura 2.3 se puede ver un
11.25
matriz no singular. En las nuevas coordenadas se tiene la siguiente matriz de controlabi-
diagrama de fase de la evolucin del sistema. Ahora bien, una vez all, si se quiere dejar
Wc = B
el sistema en el mismo estado, implementando un nuevo control, u ( 3) , se tiene
lidad:
AB
A n 1 B ,
donde las matrices A y B son las matrices del espacio de estado transformado (segn
0.5 0
0.8
x ( 3) = x ( 2 ) =
x ( 2 ) + 1 u ( 2 ) , o bien
0
0.7
se ver oportunamente, estas matrices son A = PAP 1 y B = PB ). La matriz Wc puede

ser escrita en trminos de las matrices originales como sigue:
0.5 0
0.8
0 0.3 x ( 2 ) = 1 u ( 2 ) ,
Wc = PB PAP 1 PB
y no existe ningn control u ( 2 ) que satisfaga esa condicin. Esto se debe a que el sistema tiene una determinada dinmica, que hace imposible dejarlo, en un paso, en el es-
PAn 1 P 1 PB = PWc .
Por lo tanto, Wc y Wc tendrn el mismo rango, lo que significa que la alcanzabilidad

es una propiedad inherente al sistema, y no depende de las coordenadas.
1
tado deseado. Ntese que es posible llevar el sistema desde el origen a x = en tres
1
2.2.3. Observabilidad de sistemas lineales en tiempo discreto
pasos; una forma trivial de lograr esto, es aplicar el control nulo u = 0 en el primer pa-
En esta seccin dar respuesta a la siguiente pregunta: cmo determinar el estado de
so, y despus repetir la secuencia calculada en la primera parte del ejercicio.
un sistema a partir de la observacin de las entradas y salidas? Ms concretamente, la

observabilidad de un sistema indica si es posible obtener el vector de variables de estado (no medibles en forma directa) a partir de las mediciones de la salida. Esto ltimo es
de suma utilidad para implementar controles con realimentacin de estados.
19
20
el
Considrese un sistema LTI discreto, de orden n, como el dado por (2.12).
Ejemplo:
Observabilidad. El sistema dado por (2.12) es observable si existe un k finito tal que
1)
conocimiento
y ( 0 ) , y (1) ,
de
las
u ( 0 ) , u (1) ,
entradas
, u ( k 1) ,
las
salidas
, y ( k 1) , es suficiente para determinar el estado inicial del sistema.
Teorema 1.2. El sistema de tiempo discreto (2.12) es observable si y slo si
Sea el sistema autnomo (sin entradas)
1.1 0.3
x ( k + 1) =
x (k )
0
.
1
y ( k ) = [1 0.5] x ( k )
es la matriz de observabi
C 1 0.5
La matriz de observabilidad es Wo = =
, y su rango es 1 mientras que
CA 0.6 0.3
lidad del sistema. De no cumplirse esa condicin, se dice que los estados x ( 0 ) tales que
el sistema es de orden 2. De este modo, los estados no observables pertenecen al espacio
x ( 0 ) null (Wo ) 3, son estados no observables.
nulo de Wo, esto es, [ 0.5 1] . En la Figura 2.4 se muestran las salidas correspondientes
T
rango (Wo ) = n , donde Wo = ( C )
( CA)
( CA )
n 1 T
Prueba. Para simplificar la explicacin, se supondr que u ( k ) = 0 , para todo k, y que

y ( 0 ) , y (1) ,
, y ( n 1) , con n=orden del sistema, son conocidos. As, se puede escribir
los
siguientes
estados
x ( 0 ) = [ 0.5 1] ,
x ( 0 ) = [1.5 0.5] ,
iniciales:
x ( 0 ) = [ 2.5 0] y x ( 0 ) = [1 0.5] .
T
1.5
y ( 0 ) = Cx ( 0 )
1.4
1.2
y (1) = Cx (1) = CAx ( 0 )
x ( 0 ) = [ 0.5 1]
x ( 0 ) = [1.5 0.5]
0.8
y ( n 1) = CAn 1 x ( 0 ) ,
0.6
0.5
o,
0.4
Wo x ( 0 ) = Y ,
0.2
0
0
10
12
14
donde
2.5
y ( 0)
C
CA
y 1
, Y = ( ) .
Wo =
n 1
y
n
1
CA
(
)
10
12
14
12
14
1.4
1.2
2
1
x ( 0 ) = [ 2.5 0]
y
0.6
Por lo tanto, el estado x ( 0 ) quedar determinado s y slo si rango (Wo ) = n .
x ( 0 ) = [1 0.5]
0.8
1.5
0.4
0.5
0.2
Al igual que ocurre con la alcanzabilidad, la observabilidad es una propiedad del sis0
tema, y por lo tanto es independiente del sistemas de coordenadas utilizado.
8
k
10
12
14
10
Figura 2.4. Salidas del sistema correspondientes a diferentes estados iniciales

3
null (Wo ) refiere al espacio nulo de la matriz Wo.
21
22
La ecuacin de estado del Observador es
2.2.4. Observadores de estado

En los sistemas no siempre es posible medir directamente los estados. Normalmente
se dispone slo de un modelo matemtico del sistema y de las entradas y salidas. Existen diferentes formar de lograr una estimacin de los estados a partir de las variables
conocidas, utilizando lo que se conoce como observadores de estado. A continuacin, se
expondrn algunas de ellas.
x ( k + 1) = Ax ( k ) + Bu ( k ) + L y ( k ) y ( k )
(2.14)
y ( k ) = Cx ( k )
Ntese que si x ( 0 ) = x ( 0 ) , y dado que las matrices A, B, y C del observador son

exactamente las de la planta real, entonces se tiene: x ( k ) = x ( k ) , y entonces las ecuaciones (2.12) y (2.14) son idnticas (no hay discrepancia entre el estado observado y el
Observador clsico o de prediccin
real). De aqu se deduce el hecho, no siempre obvio, de que cuando la planta es igual al
Considrese nuevamente un sistema LTI discreto, de orden n, como el dado por
(2.12).
x ( k + 1) = Ax ( k ) + Bu ( k )
Si se arma un nuevo vector de estados que sea la diferencia (error) entre el estado es-
(2.12)
timado y el estado real, se tiene
y ( k ) = Cx ( k ) + Du ( k ) ,
e ( k + 1) = ( A LC ) x ( k ) ( A LC ) x ( k )
Como se desea estimar el estado x ( k ) a partir de la secuencia de las entradas

u ( k ) , u ( k 1) ,
modelo, el problema de necesitar un observador reside en que se desconoce x ( 0 ) .
y salidas y ( k ) , y ( k 1) ,
= ( A LC ) e ( k )
(2.15)
, el sistema debe ser completamente ob-
De este modo, eligiendo adecuadamente los autovalores de (A-LC) se puede conse-
servable. La ecuacin del observador es una copia del modelo con realimentacin de la
guir la convergencia de x ( k ) a x ( k ) con una velocidad arbitrariamente grande. Ntese
diferencia entre la salida medida proveniente de la planta real y la salida estimada segn
que si L=0, entonces x ( k ) tiende a x ( k ) con la misma velocidad del sistema. Esto es,
el modelo. La Figura 2.5 muestra el esquema general del observador.
en el equilibrio (cuando x ( k + 1) = x ( k ) ) ambos estados, el real y el estimado, coincidi-
u(k)
z-1
x(k)
rn; pero fuera del equilibrio el estado estimado sigue al real sin alcanzarlo. Por otro
y(k)
C
lado, el tomar L 0 ayuda a corregir discrepancias entre las matrices A y B reales y las
respectivas matrices estimadas en el observador (notar que se considera planta igual a
modelo). Resumiendo, dependiendo de la matriz L de realimentacin del error de salida,
Planta
se conseguir un estimador de x(k) ms o menos aceptable.

+
-
L
x ( k + 1)
B
-1
Observador actualizado
x ( k )
C
Hasta aqu se ha considerado lo que se llama observador de prediccin, pues el estado
y ( k ) = Cx ( k )
estimado al tiempo k usa la informacin de salida al tiempo k-1. Ntese que en (2.14) el
A
estado estimado al tiempo k no depende de y(k) sino de y(k-1). La idea ahora es aproveObservador
char y(k), que es conocida al tiempo k, para obtener el estimador del estado al tiempo k.
Figura 2.5. Esquema general del observador de prediccin.
Para ello se divide la ecuacin del observador en dos partes:
23
24
Actualizacin de la medicin o correccin

innovacion
x ( k ) = x ( k ) + Laux y ( k ) y ( k )
Cx ( k )
(2.16)
Actualizacin temporal o prediccin 4

x ( k + 1) = Ax ( k ) + Bu ( k )
(2.17)
Adems de las anteriores actualizaciones, se tiene la ecuacin de salida

y ( k ) = Cx ( k )
(2.18)
Figura 2.6. Esquema general del observador actualizado.
En las ecuaciones anteriores, x ( k ) es una estimacin (o pseudo estimacin) basada

en la prediccin hecha en el tiempo anterior, mientras que x ( k ) es la estimacin basada
Ahora bien, la ecuacin (2.16) desplazada un instante hacia delante es

x ( k + 1) = x ( k + 1) + Laux Cx ( k + 1) Cx ( k + 1) .
en la medicin de la salida ms reciente. Se presenta ahora un esquema (Figura 2.6) del
Y, segn la actualizacin temporal (), x ( k + 1) = Ax ( k ) + Bu ( k ) , queda 5
observador actualizado, en donde aparece explcito x ( k ) , es decir, el estado estimado
x ( k + 1) = Ax ( k ) + Bu ( k ) + Laux Cx ( k + 1) C { Ax ( k ) + Bu ( k )} ,
que proporciona el observador al eventual controlador.

Es importante notar que la salida del observador es x ( k ) , pues esa es la mejor
que es una expresin slo de x .
estimacin del estado actual, y es lo que precisa MPC para hacer la prediccin.
Ahora, si se resta (2.20) de la primera ecuacin de (2.12) se tiene
Para analizar la convergencia del error de estimacin en el observador actualizado

(caso A, B y C conocidas), se define el error como
e ( k ) = x ( k ) x ( k )
(2.20)
(2.19)
o, lo que es igual,
e ( k + 1) = Ae ( k ) Laux CAe ( k ) ,
o,
e ( k + 1) = ( A Laux CA ) e ( k )
donde se recuerda una vez ms el detalle de que se supone que A, B y C son perfecta-
e ( k + 1) = x ( k + 1) x ( k + 1) .
mente conocidas por el observador. En este caso, vemos que la velocidad de convergencia del error de estimacin a cero vendr dada por la matriz ( A Laux CA ) .
4
Observaciones:
1 - x ( k ) , que es la estimacin de x(k) al tiempo k, depende de y(k).
2 - x ( k ) es la pseudo estimacin de x(k), utilizando y(k-1). Para ver esto, escrbase la actualizacin temporal o prediccin en k: x ( k ) = Ax ( k 1) + Bu ( k 1) ; donde a su vez, x ( k 1) proviene de la actualizacin de la medicin x ( k 1) = x ( k 1) + Laux y ( k 1) y ( k 1) .
25
Esta ecuacin es importante en el anlisis de eliminacin de offset de los controladores.
26
2.2.5. No unicidad de la representacin en el espacio de estado
2.2.6. Solucin de la ecuacin de espacio de estado en tiempo discreto e
Como se puede intuir de lo visto hasta ahora, una dada funcin de transferencia admi-
invariante en el tiempo
te ms de una representacin en espacio de estado. Sin embargo, todas las ecuaciones de

estado correspondientes a un mismo sistema estn relacionadas entre s por medio de
una transformacin de similaridad.
Considrense nuevamente las Ec. (2.12). La solucin a esta ecuacin puede obtenerse
recursivamente como
x (1) = Ax ( 0 ) + Bu ( 0 )
Considrese el sistema definido por las Ec. (2.12). Si se define ahora un nuevo vector
n n
de estado dado por x = Px , o, suponiendo que P
es no singular, x = P 1 x , enton-
x ( 2 ) = Ax (1) + Bu (1) = A2 x ( 0 ) + ABu ( 0 ) + Bu (1)

x ( 3) = Ax ( 2 ) + Bu ( 2 ) = A3 x ( 0 ) + A2 Bu ( 0 ) + ABu (1) + Bu ( 2 )
ces las Ec.(2.2) pueden ser escritas en trminos del nuevo vector de estado como sigue:
P 1 x ( k + 1) = AP 1 x ( k ) + Bu ( k )
Mediante la simple repeticin de este procedimiento se obtiene

k 1
y ( k ) = CP 1 x ( k ) + Du ( k ) .
x ( k ) = Ak x ( 0 ) + Ak j 1 Bu ( j ) ,
k = 1, 2,
(2.21)
j =0
Pre-multiplicando ahora ambos lados de esta ecuacin por P, y definiendo
A = PAP 1 , B = PB , C = CP y D = D se tiene finalmente
Ntese que x ( k ) est formada por dos partes, una que representa la transicin o
avance del estado inicial y otra que da cuenta de la accin de la entrada. La salida y ( k )
( k ) + Bu
(k )
x ( k + 1) = Ax
est dada por
( k ) + Du
(k ) ,
y ( k ) = Cx
k 1
que son ecuaciones de estado y salida equivalentes a las originales. (Ntese que si bien
y ( k ) = CAk x ( 0 ) + C Ak j 1 Bu ( j ) + Du ( k ) .
los estados han cambiado, la entrada y la salida son los originales). La matriz P recibe el
nombre de matriz de transformacin, y es la que permite pasar de una representacin a
(2.22)
j =0
De esta ltima ecuacin se puede inferir que la matriz de transicin de estado esta dada por ( k ) = Ak .
otra.
La
matriz
P,
A = PAP 1 = diag ( p1
por
ejemplo,
podra
escogerse
pn ) , donde pi , i = 1, 2,
de
modo
tal
que
, n son los autovalores de la ma-
Esta matriz es nica y satisface

( k + 1) = A ( k ) , ( 0 ) = I .
En trminos de la matriz de transicin de estado, las Ec. (2.21) y (2.22) pueden res-
triz A original (polos del sistema), si es que stos fueran distintos entre s. Si no lo fueran, P podra escogerse de modo que A = PAP 1 = matriz diagonal de Jordan, que es una
cribirse como
generalizacin del primer caso. Una importante propiedad de la transformacin lineal es
x ( k ) = ( k ) x ( 0 ) + ( k j 1) Bu ( j )
que cualquiera sea P, los elementos de la diagonal principal de la matriz PAP 1 son
k 1
j =0
k 1
= ( k ) x ( 0 ) + ( j ) Bu ( k j 1)
idnticos a los valores caractersticos de la matriz A original. Esto es, se mantiene la
j =0
invariancia de los valores caractersticos bajo una transformacin lineal de este tipo.
y
27
28
k 1
B (T ) =
y ( k ) = C ( k ) x ( 0 ) + C ( k j 1) Bu ( j ) + Du ( k )
j =0
k 1
= C ( k ) x ( 0 ) + C ( j ) Bu ( k j 1) + Du ( k ) .
( e dt ) B ,
T
Ac t
entonces la Ec. (2.25) se puede escribir como
j =0
x ( ( k + 1) T ) = A (T ) x ( kT ) + B (T ) u ( kT ) ,
2.2.7. Discretizacin de una ecuacin de estado en tiempo continuo
que no es otra que la forma buscada.
Supngase que el vector de entrada cambia slo en los instantes de muestreo T, 2T,
, es decir u ( t ) = u ( kT ) , kT t kT + T . La ecuacin de estado en tiempo continuo
est dada por
2.3. Representacin en espacio de estado de sistemas no lineales

Los sistemas fsicos son inherentemente no lineales. En el caso en que las no lineali-
x = Ac x + Bcu .
(2.23)
dades son suaves y el rango de operacin es pequeo, los sistemas no lineales pueden
ser razonablemente aproximados por modelos lineales. Sin embargo, no siempre es po-
La representacin en tiempo discreto de (2.23), por otro lado, tomar la forma

x ( ( k + 1) T ) = A (T ) x ( kT ) + B (T ) u ( kT ) ,
sible suponer estas condiciones, por lo que se torna imprescindible trabajar con modelos
(2.24)
ms precisos y complejos, que representen en todo el rango de operacin al sistema que

se pretende describir. En esta seccin se presentar brevemente la forma de modelar
donde queda evidenciada la dependencia de las matrices A y B del intervalo de muestreo

T. Para determinar estas matrices se recurrir a la Ec. (2.8), que es la solucin de (2.24).
Tomando en cuenta que
x ( ( k + 1) T ) = e
Ac ( k +1)T
sistemas no lineales con la representacin de espacio de estado. Para tal fin, se considerarn sistemas dinmicos modelados por un nmero finito de ecuaciones diferenciales
ordinarias de primer orden acopladas entre s, que sern representadas por
x ( 0) + e
Ac ( k +1)T
( k +1)T
Ac
Bc u ( ) d
x (t ) = f ( x (t ) , u (t )) ,
(2.26)
en su versin en tiempo continuo, y por

x ( k + 1) = f ( x ( k ) , u ( k ) ) ,
x ( kT ) = e Ac kT x ( 0 ) + e Ac kT e Ac Bc u ( ) d ;
kT
en su versin en tiempo discreto. Por simplicidad se suponen sistemas invariantes en el
y multiplicando la ltima ecuacin por e Act y sustrayndola de la primera, se obtiene

x ( ( k + 1) T ) = e
AcT
x ( kT ) + e
Ac ( k +1)T
( k +1)T
kT
tiempo. Las ecuaciones (2.26) y (2.27) estn escritas, al igual que en el caso lineal, en
e
Ac
Bc u ( ) d .
(2.25)
=e
x ( kT ) + e
0
Ac
nu
es el vector de entradas y f :
nu
es el vector de estados,
es una funcin que va del espacio
compuesto por entradas y estados al espacio de los estados.
x ( ( k + 1) T ) = e AcT x ( kT ) + e AcT e Ac Bc u ( kT ) dt
T
forma matricial vectorial. De este modo, se tiene que x

u
Como u es constante en el intervalo de integracin, se puede escribir
AcT
(2.27)
Por otro lado, la ecuacin de salida, tanto para sistemas en tiempo continuo como en
Bc u ( kT ) d
tiempo discreto, estar dado por

y = h ( x, u ) ,
con = T t . Si se define
(2.28)
A (T ) = e AcT
29
30
con y
ny
. La Figura 2.7 muestra un diagrama de bloques de las Ec. (2.26) y (2.28).
Como puede intuirse de las ecuaciones presentadas, los modelos lineales presentados
en secciones anteriores constituyen un caso particular de modelo no lineal. As, las propiedades que se expondrn en lo que sigue de esta primera parte estarn por lo general
referidas a sistemas de la forma (2.26) o (2.27), para dar generalidad a los conceptos.
x (t ) = f ( x (t ) , t ) ,
con x
(2.29)
, y condiciones iniciales dadas por x ( t0 ) = x0 . La Ec. (2.29) representa un
sistema fsico en tiempo continuo, y tiene solucin nica. Para el caso de sistemas en
tiempo discreto, el sistema autnomo estar dado por
x ( k + 1) = f ( x ( k ) , k ) ,
con x
(2.30)
, y condiciones iniciales dadas por x ( k0 ) = x0 .
Sistema no autnomo. Se llamar sistema no autnomo al sistema (en general no li-
neal) dado por

x (t ) = f ( x (t ) , u (t ) , t ) ,
Figura 2.7. Representacin en diagrama de bloques de las Ec. (2.26) y (2.28).
con x
2.3.1. Linealizacin de modelos no lineales
, u
nu
(2.31)
y condiciones iniciales x ( t0 ) = x0 , u ( t0 ) = u0 . La Ec. (2.31) repre-
senta un sistema fsico en tiempo continuo, y tiene ms de una solucin. Para el caso de
Una aproximacin lineal al modelo no lineal presentado antes, en cercanas de un dado punto de operacin, ( xss , uss ) , puede obtenerse segn
sistemas en tiempo discreto, el sistema no autnomo estar dado por

x ( k + 1) = f ( x ( k ) , u ( k ) , k ) ,
x = Alin x + Blinu ,
con x
, u
nu
(2.32)
y condiciones iniciales x ( k0 ) = x0 , u ( k0 ) = u0 .
para el caso de tiempo continuo, y segn

Ntese que un sistema no autnomo con realimentacin de estado, esto es, un sistema
x ( k + 1) = Alin x ( k ) + Blin u ( k ) ,
en el que la entrada est expresada en funcin del estado, u = g ( x ) , puede ser conside-
para el caso de tiempo discreto, donde
x = x xss , u = u uss , Alin =
rado un sistema autnomo, puesto que
x = f ( x, u , t ) = f ( x, g ( x ) , t ) = f ( x, t )
f
f
, Blin =
.
( x, u )
( x, u )
x
u
x
,
u
( ss ss )
( xss ,uss )
para un sistema en tiempo continuo, o
2.4. Estados de equilibrio. Diagramas en el plano de fase
x ( k + 1) = f ( x ( k ) , u ( k ) , k ) = f x ( k ) , g ( u ( k ) ) , k = f ( x ( k ) , k )
Primeramente se introducirn, siempre referidos al caso general de sistemas no linea-
para uno en tiempo discreto.
les, los siguientes conceptos:
Estado o punto de equilibrio. Sea un sistema autnomo en tiempo continuo como el
Sistema autnomo. Se llamar sistema autnomo al sistema (en general no lineal)
dado por
descrito por (2.29). Un estado xe que cumple con

f ( xe , t ) = 0
31
t t0 ,
32
3) Para los sistemas LTI autnomos, f ( x, k ) = Ax , si A es no singular, entonces el
se denomina estado o punto de equilibrio (PE) del sistema en tiempo continuo.

Sea ahora un sistema autnomo en tiempo discreto como el descrito por (2.30). Un
sistema tiene un nico estado de equilibrio, x = 0 , mientras que si A es singular entonces existirn infinitos estados de equilibrio.
estado xe que cumple con

f ( xe , k ) = xe
4) Para los sistemas LTI no autnomos, f ( x, u , k ) = Ax + Bu , si A es no singular, en-
k k0 ,
tonces existen infinitos estados de equilibrios que cumplen xe = Axe + Bue , o
se denomina estado o punto de equilibrio (PE) del sistema en tiempo discreto.
xe = ( I A ) Bue . Estos estados de equilibrio, que se asocian con entradas de equili1
Observaciones (Caso tiempo continuo):
brio, no necesariamente cubren todo el espacio de estado.
1) En el estado de equilibrio, si x ( t0 ) = xe , entonces x ( t ) = xe , t t0 .
5) Los sistemas no lineales en tiempo discreto pueden tener ms de un estado de equi2) Para el caso de sistemas no-autnomos, se habla de un estado xe y una entrada ue
de equilibrio, que cumplen con
f ( xe , ue , t ) = 0
librio.
Diagramas en el plano de fase
t t0 .
Los planos de fase fueron usados al principio por los ingenieros para estudiar estabi-
3) Para los sistemas LTI autnomos, f ( x, t ) = Ax , si A es no singular, entonces el

sistema tiene un nico estado de equilibrio, x = 0 , mientras que si A es singular entonces existirn infinitos estados de equilibrio.
lidad de sistemas no lineales. Tienen sentido usarlos cuando se estudia sistemas de segundo orden ya que consiste en una representacin grfica de x2 vs. x1. Tambin, es posible una extensin a sistemas de tercer orden donde se puede graficar las trayectorias
en el espacio.
4) Para los sistemas LTI no autnomos, f ( x, u , t ) = Ax + Bu , si A es no singular, en1
Trayectoria de estado. Dado un sistema como el descrito por (2.29) o (2.30), y una
tonces existen infinitos estados de equilibrios xe = A Bue . Estos estados de equilibrio,
condicin inicial x ( t0 ) = x0 , o x ( k0 ) = x0 , se define como trayectoria de estado a la
que se asocian con entradas de equilibrio, no necesariamente cubren todo el espacio de
grfica (en el espacio de estado) de la solucin de la ecuacin de estado.
estado.
Plano de Fase. Se define plano de fase al sistema de coordenadas cuyos ejes son las
5) Los sistemas no lineales en tiempo continuo pueden tener ms de un estado de

equilibrio.
variables de estado.
Diagrama o retrato de Fase. Se define como diagrama o retrato de fase a la
Observaciones (Caso tiempo discreto):
representacin grfica paramtrica de las distintas trayectorias de estado.
1) En el estado de equilibrio, si x ( k0 ) = xe , entonces x ( k ) = xe , k k0 .
Ejemplo:
2) Para el caso de sistemas no-autnomos, se habla de un estado xe y una entrada ue
1)
de equilibrio, que cumplen con

f ( xe , ue , k ) = xe
Considere el sistema mecnico lineal de segundo orden dado por
x ( t ) + 2kx ( t ) + n 2 x ( t ) = 0 . A partir de este sistema se obtiene la siguiente representax

x 0
cin de estado 1 = A 1 = 2
x2
x2 n
k k0 .
33
1 x1
.
2k x2
34
Dependiendo de los valores adoptados para n y k, se tienen los valores de la matriz A

mostrados en la Tabla 2.1.
Matriz A
Autovalores de A
Caso (1)
0 1
A=
4 0
1 = j 2 , 2 = j 2
Caso (2)
0 1
A=
4 2
1 = 1 + j 3 , 1 = 1 j 3
Caso (3)
2.5
0 1
A=
4 5
a)
b)
Figura 2.9.a) Respuesta temporal de los estados, y b) Diagrama de fase para el caso (2).
1 = 1 , 1 = 4
Tabla 2.1. Diferentes casos segn se varen los parmetros n y k.

Las Figuras 2.8 a 2.10 muestran las respuestas temporales de cada estado cuando
3
x0 = , y el diagrama de fase correspondiente a las trayectorias de estado originadas
3
3
4
2
5
para las condiciones iniciales x0 = , x0 = , x0 = y x0 = .
3
4
2
5
a)
b)
Figura 2.10.a) Respuesta temporal de los estados, y b) Diagrama de fase para el caso
(3).
2.5. Rutinas de Matlab relacionadas al captulo
[ A,B,C,D] =tf2ss ( num,den ) , transforma
a)
[ num,den ] =ss2tf ([ A,B,C,D,nu ]) ,
b)
Figura 2.8.a) Respuesta temporal de los estados, y b) diagrama de fase para el caso (1).
35
H (s) =
H (s) =
transforma
num ( s )
x = Ax + Bu
en
.
den ( s )
y = Cx
x = Ax + Bu
,
y = Cx
con
nu
en
num ( s )
.
den ( s )
36
sysd=c2d(sysc,T) , transforma el sistema continuo sysc, en el sistema discreto sysd,

con tiempo de muestreo T. El sistema sysc puede estar expresado en cualquiera de las
formas aceptadas por Matlab, esto es, funcin de transferencia en sus diferentes formas,
espacio de estado, etc.
2.6. Referencias bibliogrficas

Gonzlez A. H., Control Predictivo de Procesos Industriales con Restricciones. Anlisis
de Estabilidad y Robustez. Tesis Doctoral, Facultad de Ingeniera en recursos Hdricos Universidad Nacional del Litoral, 2006.
Ogata, K., Sistemas de control en tiempo discreto, Prentice Hall, 1996.
37
Funcin escalar definida negativa. Una funcin escalar V ( x ) es definida negativa
si V ( x ) es definida positiva.
3. Concepto de estabilidad de Liapunov.
Funcin escalar semidefinida positiva. Una funcin escalar V ( x ) es semidefinida
El anlisis de estabilidad de Liapunov juega un papel importante en el anlisis de estabilidad de los sistemas descritos por ecuaciones en espacio de estado. En general, y a
positiva si es positiva para todo x , excepto en el origen y en determinados estados

no nulos, donde V ( x ) = 0 .
Funcin escalar semidefinida negativa. Una funcin escalar V ( x ) es semidefinida
diferencia de lo que ocurre con los mtodos clsicos (ubicacin de polos en el dominio
de frecuencias, etc), el mtodo de Liapunov no requiere de las soluciones explcitas de
negativa si V ( x ) es semidefinida positiva.
las ecuaciones diferenciales o en diferencias, por lo que resulta de mucha utilidad en la
Funcin indefinida. Una funcin escalar V ( x ) es indefinida en si para algunos
prctica. De la teora de la mecnica clsica se sabe que un sistema vibratorio es estable

si su energa total se reduce continuamente, hasta alcanzar un estado de equilibrio. El
estados de adopta valores positivos, y para otros, valores negativos.
mtodo de Liapunov se basa en una generalizacin de lo anterior: si un sistema cual-
3.1 Concepto de Estabilidad e Inestabilidad
quiera tiene un estado de equilibrio asintticamente estable, entonces existe una funcin
escalar (una funcin ficticia de energa que se conoce como funcin de Liapunov) que
se decrementa al aumentar el tiempo, hasta que por ltimo adopta un valor mnimo en el
estado de equilibrio.
Un punto de equilibrio se dice estable si todas las soluciones de la ecuacin de estado
que se inicien en las cercanas del punto de equilibrio permanecen en las cercanas del
punto de equilibrio; de otro modo el punto de equilibrio es inestable. Un punto de equilibrio se dice asintticamente estable si todas las soluciones que se inicien en las cerca-
Las definiciones que siguen, estarn referidas al sistema autnomo dado por
x (t ) = f ( x (t )) ,
(3.1)
y el sistema no autnomo dado por

x (t ) = f ( x (t ) , u (t )) ,
(3.2)
ambos en tiempo continuo. La solucin general a las Ec. (3.1) y (3.2) se nombrar
nas del punto de equilibrio no slo permanecen en las cercanas del punto de equilibrio,
( t ; x0 ) , y ( t ; x0 ; u ( ) ) respectivamente. Ntese que las soluciones dependen de los
sino que adems tienden hacia el equilibrio a medida que el tiempo se aproxima a infini-
estados iniciales x0, y en el segundo caso, tambin de la entrada.
to. Los teoremas de estabilidad de Liapunov dan condiciones suficientes para estabilidad de puntos de equilibrio. Existen teoremas conversos que establecen que, al menos
conceptualmente, en los teoremas de Liapunov muchas de estas condiciones son tambin necesarias.
A continuacin se darn algunas definiciones, para luego pasar al anlisis de estabili-
Estabilidad en el sentido de Liapunov. Sea R > 0 el radio de una regin esfrica

S ( xe , R ) formada por el conjunto de puntos alrededor de un estado de equilibrio xe tal
que x ( t ) xe R 6 para todo t t0 , y sea r, con 0 < r < R , el radio de una regin esfrica S ( xe , r ) , formada por el conjunto de estados iniciales x0 alrededor de xe tales que
dad propiamente dicho.

Funcin escalar definida positiva. Una funcin escalar V ( x ) :
x0 xe r . Luego, se dice que el estado de equilibrio xe del sistema (3.1) es estable en

n
es definida
positiva en una regin (que incluye al origen del espacio de estado) si V ( x ) > 0 para
todo estado x 0 de la regin , y adems V ( 0 ) = 0 .
el sentido de Liapunov si para cada S ( xe , R ) existe un S ( xe , r ) tal que las trayectorias

que se inician en S ( xe , r ) no salen de S ( xe , R ) .
6
39
i refiere a la norma euclideana, es decir, x xe = ( x1 x1e )2 + ( x2 x2e )2 +
+ ( xn xne )
40
Estabilidad asinttica. Se dice que el estado de equilibrio xe del sistema (3.1) es
asintticamente estable si es estable en el sentido de Liapunov y si cada trayectoria que

se inicia en el interior de S ( xe , r ) converge a xe, sin salir de S ( xe , R ) , conforme t se
incrementa indefinidamente. Esto es, lim x0 xe = 0 .
t
Representaciones grficas de estados de equilibrio estables (en el sentido de Liapunov) y asintticamente estables, se muestran en la Figura 3.1.
Figura 3.2. Representacin grfica del dominio de atraccin de un estado de equilibrio.

Inestabilidad. Se dice que un estado de equilibrio xe es inestable si no es estable. En
la Figura 3.3 se muestra una representacin grfica de un estado de equilibrio inestable.
b)
a)
Figura 3.1. a) Estado de equilibrio estable, b) Estado de equilibrio asintticamente estable.

Dominio de atraccin. Dado un estado de equilibrio xe del sistema (3.1), se denomi-
na dominio de atraccin de xe, S ( xe , ) , a la mayor regin de estabilidad asinttica.

Esto es, el dominio de atraccin del equilibrio xe es el conjunto de todos los puntos x
Figura 3.3. Representacin grfica de un estado de equilibrio inestable.
tales que lim ( t ; x ) = xe , donde ( t ; x ) es la solucin de Ec. (3.1) que se inicia en el

t
Para el caso de la Figura 3.3, no es posible decir que las trayectoria se ir a infinito,
punto x (ver Figura 3.2).
ya que podra acercarse a un ciclo lmite fuera de la regin S ( xe , R ) . Si un sistema LTI

es inestable, entonces las trayectorias que se inician cerca del estado de equilibrio inestable van a infinito. Sin embargo, esto no necesariamente es cierto con los sistemas no
lineales.
Conjunto invariante: Un conjunto M es un conjunto invariante con respecto a (3.1)
si x ( 0 ) M x ( t ) M ,
41
42
Conjunto invariante positivo: Un conjunto M es un conjunto invariante positivo si

x ( 0) M x (t ) M ,
(3.3)
t 0 .
donde m es la masa de la bola, l es la longitud del brazo, es el ngulo entre la vertical
Ejemplos:
1)
Considrese el sistema no lineal descrito por x ( t ) = x ( t ) + x 2 ( t ) , con la condi-
y el brazo, g es la aceleracin de la gravedad, y k es el coeficiente de friccin. Tomando

como variables de estado x1 = , x2 = se pueden escribir las ecuaciones de estado
cin inicial x ( 0 ) = 0 . La solucin de dicha ecuacin diferencial est dada por

( t ; x0 ) =
x0
.
x0 + et (1 x0 )
(3.4)
De la condicin f ( x ( t ) ) = x ( t ) + x 2 ( t ) = 0 se obtienen dos estados de equilibrio:
Los PE, que salen de hacer x1 = x2 = 0 , son ( n , 0), n = 0, 1, 2,
. Obviamente,
xe1 = 0 y xe 2 = 1 . El estado xe1 = 0 es un punto de equilibrio asintticamente estable,
slo los PE (0, 0) y (, 0) son no triviales ya que el resto son repeticiones de los mis-
que cumple lim x ( t ) = 0 , para todo estado inicial < x0 < 1 . El estado xe 2 = 1 es un
mos 7.
punto de equilibrio inestable, dado que para x0 = 1 el sistema permanece en xe2 = 1,
Los tres tipos de estabilidad se pueden ver en la ecuacin (3.4). Considerando que no
( x0 1) , lo
hay friccin, o sea tomando k = 0, las trayectorias en el entorno del PE (0, 0) son rbitas
mientras que, para todo x0 > 1 y entonces existe un tiempo t1 tal que ln x0
cerradas. Empezando suficientemente cerca del PE se puede garantizar que las trayecto-
que implica que x ( t1 ) = .

2)
rias van a permanecer en cualquier bola pre-especificada alrededor del PE. Por lo tanto,
Pndulo. Uno de los problemas ms simples en robtica es el de controlar la po-
el PE es estable. No es asintticamente estable, sin embargo, porque las trayectorias que
sicin de una junta de robot usando un motor ubicado en el punto de giro. Matemtica-
comienzan fuera del PE nunca tienden a l. Si consideramos friccin (k > 0), el PE en el
mente esto no es ms que un pndulo, representado en la Figura 3.4.
origen es un foco estable. La inspeccin del retrato de fase de un foco estable muestra
que el requisito para estabilidad se satisface; ms an, las trayectorias que comienzan
cerca del PE tienden a l cuando t tiende a . El segundo PE en (, 0) es un punto de
ensilladura. Es obvio que el requisito para estabilidad no se satisface porque, para cualquier R> 0, siempre hay una trayectoria que deja la bola S ( xe , R ) , an cuando x ( 0 ) sea
arbitrariamente cercano al PE. El diagrama de fase, para el caso de considerar friccin
no nula, se muestra en la Figura 3.4.
3.2. Teorema de estabilidad de Liapunov

Funcin de Liapunov. Se denominar funcin de Liapunov V ( x ) :
Figura 3.3. Pndulo

Usando la segunda ley de Newton se puede escribir la ecuacin de movimiento en la
direccin tangencial:
es una regin de
7
43
, donde
alrededor del origen, a cualquier funcin escalar definida posi-
Fsicamente se puede intuir que el PE en (0, 0) es estable mientras que el PE en (, 0) es inestable.
44
tiva (y continuamente diferenciable), cuya derivada temporal V ( x ) =
dV ( x )
a lo largo
dt
de las trayectorias solucin de (3.1) sea definida negativa (o semidefinida negativa).
Teorema 1 (Estabilidad Asinttica). Sea el sistema dinmico descrito por (3.1),
donde 8 f ( 0 ) = 0 para todo t t0 . Si existe una funcin escalar V ( x ) con derivadas

parciales de primer orden continuas que cumple con
V ( x ) es definida positiva, y
V ( x ) es definida negativa,
entonces, el estado de equilibrio en el origen es uniforme y asintticamente estable.

Debe notarse que el teorema de estabilidad anterior proporciona slo una condicin
suficiente de estabilidad asinttica.
Teorema 2. Si se cumple el Teorema 1 y V ( x ) conforme x entonces el
estado de equilibrio en el origen es uniforme y asintticamente estable global.

Teorema 3. Sea el sistema dinmico descrito por (3.1), donde f ( 0 ) = 0 para todo
t t0 . Si existe una funcin escalar V ( x ) con derivadas parciales de primer orden con-
Figura 3.4. Diagrama de fase del pndulo
tinuas que cumple con
Ntese que,
1) La derivada temporal de V ( x ( t ) ) a lo largo de las trayectorias solucin de (3.1)
est dada por
V ( x (t )) =
i =1
n
V
V
V
xi =
fi ( x ) =
xi
x
i =1
i
x1
V
x2
V ( x ) es definida positiva, y
V ( x ) es semidefinida negativa,
entonces, el estado de equilibrio en el origen es uniformemente estable.
f1 ( x )
V f 2 ( x ) V
=
f ( x)
x
xn
f n ( x )
Teorema 4. (Inestabilidad). Sea el sistema dinmico descrito por (3.1), donde

f ( 0 ) = 0 para todo t t0 . Si existe una funcin escalar W ( x ) con derivadas parciales
de primer orden continuas que cumple con
2) Si V ( x ) < 0 entonces V ( x ) se va decrementando con respecto a t. Por tanto,

V ( x ) y V ( x ) dan informacin sobre la estabilidad de un estado de equilibrio sin tener
la solucin ( t ; x ) .
3) La funcin de Liapunov puede no ser nica. Una funcin definida positiva sencilla
W ( x ) es definida positiva en alguna regin alrededor del origen, y

W ( x ) es semidefinida positiva,
entonces, el estado de equilibrio en el origen es inestable.

Ntese que,
es la forma cuadrtica, donde P es una matriz definida positiva.
8
Se supone que si el estado de equilibrio no est en el origen, siempre es posible hacer un cambio de
variables tal que x ( t ) = x ( t ) xe y de este modo es xe = 0 .
45
46
1. Las condiciones de los teoremas de estabilidad de Liapunov requeridas para la estabilidad de un sistema no lineal son condiciones suficientes pero no necesarias.
V ( x ) = xT Px + xT Px
= ( Ax ) Px + xT P ( Ax )
T
2. La funcin de Liapunov no es nica y no encontrar una funcin de Liapunov adecuada para mostrar la estabilidad o inestabilidad de un punto de equilibrio implica simplemente no tener informacin respecto a la estabilidad y no permite aventurar condicin alguna sobre el punto de equilibrio considerado.
3. Para un estado de equilibrio estable o asintticamente estable, siempre existe una
= xT AT Px + xT PAx
= xT ( AT P + PA ) x
Dado que V ( x ) se escogi definida positiva, se requiere para la estabilidad asinttica

que V ( x ) sea definida negativa. Por tanto, debe ser,
V ( x ) = xT Qx ,
funcin de Liapunov con las propiedades requeridas.

4. Probar que un estado de equilibrio es estable en la regin que incluye al estado
de equilibrio, no significa que trayectorias fuera de puedan llevar a inestabilidad.
Para alguna matriz Q definida positivas. De ah, se define

Q = ( AT P + PA ) ,
(ecuacin de Liapunov)
3.2.1. Anlisis de estabilidad de Liapunov para sistemas LTI autnomos

donde se exige que AT P + PA sea definida positiva.
en tiempo continuo
Lo que usualmente se hace en la prctica es que, en lugar de especificar P, se especiConsidere el siguiente sistema LTI autnomo,
x ( t ) = Ax ( t ) ,
donde x
, A
fica Q y a partir de ello se calcula P. En trminos prcticos se puede escoger Q = I (ma(3.5)
n n
. En este caso, el nico punto de equilibrio est en xe =0, y ese
equilibrio es estable si y slo si todos los autovalores de A tienen parte real no positiva y
cada autovalor con parte real nula tiene un bloque de Jordan asociado de orden 1. El
punto de equilibrio x = 0 es asintticamente estable global si y slo si todos los autovalores de A tienen parte real negativa. Cuando todos los autovalores de A tienen parte real
negativa, se dice que A es una matriz Hurwitz. La estabilidad del origen puede tambin
estudiarse utilizando el mtodo de Liapunov. Considrese para ello la siguiente funcin
de Liapunov
triz identidad) como primer intento para calcular P.

Teorema 5. Considrese el sistema autnomo descrito por (3.5). El punto de equili-
brio xe = 0 ser asintticamente estable global si y slo si dada una matriz Q simtrica
real, definida positiva, existe una nica matriz P simtrica real, definida positiva, que es
solucin de AT P + PA = Q .
3.2.2. Anlisis de estabilidad de Liapunov para sistemas LTI autnomos

en tiempo discreto
Considrese el siguiente sistema autnomo en tiempo discreto
V ( x ) = xT Px ,
x ( k + 1) = Ax ( k )
donde P es una matriz simtrica real, definida positiva. Su derivada a lo largo de cual-
donde x
quier trayectoria, est dada por
, A
(3.6)
n n
. Otra vez, el nico punto de equilibrio de este sistema est en xe
=0, y ese equilibrio es estable si y slo si todos los autovalores de A tienen parte real
menor o igual a 1. A su vez, el punto de equilibrio x = 0 es asintticamente estable global si y slo si todos los autovalores de A tienen parte real menor a 1. La estabilidad del
47
48
origen puede tambin estudiarse utilizando el mtodo de Liapunov. Considrese para
ello la siguiente funcin de Liapunov
1
0
x ( k + 1) =
x (k )
0.5 1
V ( x ) = xT Px ,
mediante el mtodo de Lyapunov. Para ello primeramente se debe calcular la matriz P y
donde P es una matriz simtrica real, definida positiva. La funcin diferencia de esta
funcin (el equivalente discreto de la derivada) a lo largo de cualquier trayectoria, est
dada por
encontrar la funcin V ( x ( k ) ) de Lyapunov. Para ello se adopta Q = I, de modo que

AT PA P = I
V ( x ( k ) ) = V ( x ( k + 1) ) V ( x ( k ) )
1 p11
0
0.5 1 p
21
= x ( k + 1) Px ( k + 1) x ( k ) Px ( k )
T
= ( Ax ( k ) ) PAx ( k ) x ( k ) Px ( k )
T
Esta ecuacin conduce a
4 2
P=
,
2 3
( A PA P ) x ( k )
p12
1 0
=
p22
0 1
= x ( k ) AT PAx ( k ) x ( k ) Px ( k )
= x (k )
p12 0
1 p11
p22 0.5 1 p21
Dado que V ( x ) se escogi definida positiva, se requiere para la estabilidad asinttica

que V ( x ( k ) ) sea definida negativa. Por tanto, debe ser
que es una matriz real simtrica positiva. Por tanto, segn el Teorema 6, el punto de
equilibrio xe = 0 es asintticamente estable. La funcin de Lyapunov resulta
V ( x ) = xT Px = 4 x12 2 x1 x2 + 3 x22 .
V ( x ( k ) ) = x ( k ) Qx ( k ) ,
T
para alguna matriz Q definida positivas. De ah, se define
Dado que se escogi Q = I, la funcin diferencia de V est dada por
Q = ( AT PA P ) ,
V ( x ( k ) ) = x ( k ) Qx ( k ) = x12 x22 ,
(ecuacin de Liapunov en tiempo discreto)
que es una funcin definida negativa.
donde se exige que AT PA P sea definida positiva.

Al igual que para los sistemas LTI en tiempo continuo, es conveniente especificar Q y
3.3. Rutinas de Matlab relacionadas al captulo
luego calcular P.
Teorema 6. Considere el sistema autnomo descrito por (3.6). El punto de equilibrio
P=lyap(A,Q) , resuelve la ecuacin de Liapunov en tiempo continuo: AP + PAT = Q .
xe = 0 ser asintticamente estable global si y slo si dada una matriz Q simtrica real,
P=lyap(A,B,Q) , resuelve la ecuacin de Liapunov general en tiempo continuo (tam-
definida positiva, existe una nica matriz P simtrica real, definida positiva, que es solucin de Q = ( A PA P ) .
bin llamada ecuacin de Sylvester): AP + PB = Q .
P=dlyap(A,Q) ,
resuelve
la
ecuacin
de
Liapunov
en
tiempo
discreto:
APAT P + Q = 0 .
Ejemplo.
Se desea investigar la estabilidad del sistema autnomo en tiempo discreto dado por
49
50

Ogata, K., Sistemas de control en tiempo discreto, Prentice Hall, 1996.
51
un conjunto puedo no ser abierto ni cerrado, y los nicos conjuntos de
4. Introduccin a la teora de optimizacin de funcio-
vez abiertos y cerrados son el conjunto vaco y el mismo
que son a la
Un conjunto es acotado si est contenido en una vecindad de radio suficientemente
nes. Introduccin al control ptimo (LQR)
grande, pero acotado. Un conjunto que es cerrado y acotado, se dice compacto.

Como se ver oportunamente en este apunte, el corazn de la teora de control avan-
Funcin diferenciable. Sea S un conjunto en
zada, o ms concretamente, de la teora de control ptimo, es la teora de optimizacin.
f :S
Si bien la teora de optimizacin es un rea de inmenso potencial, tanto terico como de
f ( x )
aplicacin, que va mucho ms all de la aplicacin al control avanzado, este capitulo

presentar un resumen de sus conceptos fundamentales que permitir una comprensin
ms acabada de los sucesivos captulos.
con interior no vaco, y sea
. Luego, se dice que f es diferenciable en x int S si existe un vector
, llamado vector gradiente, y una funcin :
f ( x ) = f ( x ) + f ( x )
(x x)+
, tales que
x x ( x , x x ) para todo x S ,
con lim ( x , x x ) = 0 . La funcin f se dice diferenciable en el conjunto abierto

x x
4.1. Definiciones preliminares (Convexidad de conjuntos y fun-
S ' S si es diferenciable en cada punto de S ' . La representacin anterior se conoce
como la expansin de primer orden (serie de Taylor) de f en x .
ciones)
Ntese que si f es diferenciable en x , entonces existe un nico vector gradiente, que

Primeramente se revisarn algunos conceptos bsicos referidos a topologa de conjuntos.
Dado un punto x
N ( x ) = { x
, la vecindad alrededor de x se define como el conjunto
: x x < } , para todo > 0 , donde refiere a la norma Eucldea.
Sea S un conjunto arbitrario en
. Un punto x est en la cerradura de S, nombrada
consiste en las derivadas parciales, esto es,

f ( x ) f ( x )
f ( x ) =
,
,
x2
x1
sea f : S
de puntos arbitrariamente cercanos a S. Si S = cl S , entonces S se dice cerrado. Un pun-
Hessiana, y una funcin :
Un punto x est en la frontera de S, nombrado como S , si N ( x ) contiene al menos
con interior no vaco, y
. Luego, se dice que f es dos veces diferenciable en x int S si existe un
vector f ( x )
S = int S , entonces S se dice abierto.
f ( x )
.
xn
Funcin dos veces diferenciable. Sea S un conjunto en
como cl S, si S N ( x ) para todo > 0 . Es decir, la cerradura de S es el conjunto
to x est en el interior de S, nombrado como int S, si N ( x ) S para algn > 0 . Si
, una matriz simtrica de n n elementos, H ( x ) , llamada matriz
f ( x ) = f ( x ) + f ( x )
1
2
, tales que
(x x)+ (x x)
H ( x )( x x ) + x x ( x , x x ) para todo
2
xS ,
un punto en S y un punto fuera de S para cada > 0 9. De este modo, un conjunto S es
con lim ( x , x x ) = 0 . La funcin f se dice dos veces diferenciable en el conjunto
cerrado si y slo si contiene todos los puntos de su frontera. Ms an, se cumple que
abierto S ' S si es dos veces diferenciable en cada punto de S ' . La representacin
cl S S S es el conjunto cerrado ms pequeo que contiene a S. Anlogamente, un
anterior se conoce como la expansin de segundo orden (serie de Taylor) de f en x .
conjunto S es abierto si y slo si no contiene ningn punto de su frontera. Claramente,
x x
Para funciones dos veces diferenciables, la matriz Hessiana contiene las derivadas
parciales de segundo orden, esto es
Ntese que S no necesariamente contiene los puntos de su frontera.
53
54
2 f ( x )
x1x1
2 f ( x )
H ( x ) = x2 x1
2 f ( x )
xn x1
2 f ( x )
x1x2
2 f ( x )
x2 x2
f (x)
xn x2
2

2 f ( x )
x1xn
2 f ( x )
x2 x1
2
f (x )
xn xn
Luego, pT xT = pT x1 pT x2 = = 0 , y el producto escalar de vectores es nulo si y

solos si stos son normales (el coseno del ngulo entre ellos es nulo). Una representacin grfica de hiperplanos normales a un dado vector p puede verse en la Figura 4.2.a.
Semiplano. S = { x : pT x } , donde p es un vector no nulo de
, y es un escalar.
Semiplano abierto. S = { x : pT x < } , donde p es un vector no nulo de
Mnimo de una funcin. El mnimo de una funcin f en S, que se denominar
, y es un
escalar.
min { f ( x ) : x S } , existe si existe un x S tal que f ( x ) f ( x ) para todo x S . Se
Conjunto polidrico. S = { x : Ax b} , donde A es una matriz m n y b es un vector
puede probar que si S es no vaco, cerrado y acotado, y si f es continua en S, entonces
m 1 . La desigualdad anterior es elemento a elemento. Ver Figura 4.2.b.
existe un mnimo de f en S.
Cono polidrico. S = { x : Ax 0} , donde A es una matriz m n . Ver Figura 4.2.c.
nfimo de una funcin. El nfimo = inf { f ( x ) : x S } es la mayor cota inferior a f

Cono
en S.
creado
por
un
nmero
finito
de
vectores.
S = {x : x = j a j ,
j =1
Conjunto convexo: Un conjunto S
es convexo si el segmento que une cual-
j 0, para j = 1,
, m} , donde a1 ,
quier par de puntos del conjunto pertenece tambin al conjunto. Esto es, si x1 , x2 S
y 4.2.e.
entonces x1 + (1 ) x2 debe pertenecer tambin a S para cada [ 0,1] .
Vecindad de un punto. N ( x ) = { x
, am son vectores dados de
. Ver Figura 4.2.d.
: x x < } , donde x es un vector fijo de
y > 0.
La Figura 4.1 ilustra las nociones de conjunto convexo y no convexo.
x1
x1-x2
x2
p
S1
a)
b)
Figura 4.1. Conjunto a) convexo y b) no convexo
S =0
A continuacin se listan algunos ejemplos de conjuntos convexos:

Hiperplano. S = { x : pT x = } , donde p es un vector no nulo de
S 2
n
llamado vector
normal al hiperplano, y es un escalar. Para ver que p es el vector normal al hiperplano, considrese un vector tangencial al plano, dado por xT = x1 x2 , con x1 , x2 S .
55
Figura 4.2.a. Representacin grfica de hiperplanos definidos por el vector normal p.

Algunas condiciones de optimalidad geomtrica que se vern ms adelante hacen uso
de conos convexos.
56
Una propiedad geomtrica bien conocida es que, dado un conjunto cerrado y convexo
S y un punto y S , existe un nico punto x S que presenta la mnima distancia hasta
y, y un hiperplano que separa al punto y de S.

S
Teorema del punto ms cercano. Sea S un conjunto cerrado y convexo, no vaco, de

n
y sea y S . Luego, existe un nico punto x S con distancia mnima a y. Ms
aun, x es el punto de mnima distancia, o punto ms cercano a y, si y slo si

Figura 4.2.b. Conjunto polidrico.
T
( y x ) ( x x ) 0 para todo x S .
Figura 4.2.c. Cono polidrico
Definicin de separacin de conjuntos. Sean S1 y S2 conjuntos no vacos de
x1
. Un
hiperplano H = { x : p x = } separa a S1 de S2 si p x para todo x S1 y p x

T
x1
para todo x S2 .
x2
x2
Teorema de separacin. Sea S un conjunto cerrado y convexo, no vaco, de
sea y S . Luego, existe un vector p no nulo y un escalar tales que p y > y

T
pT x para todo x S .
x3
Definicin de hiperplano soporte en un punto de frontera. Sea S un conjunto no
Figura 4.2.e. y 4.2.e Conos creados por vectores
Cono convexo. Un conjunto no vaco, C, de
vaco de
se llama cono con vrtice en cero si
x C implica que x C para todo 0 . Si, adems, C es convexo, entonces se de-
nominar cono convexo. La Figura 4.3 muestra una representacin grfica de conos
y sea x S (la frontera de S). Un hiperplano H = { z : pT ( z x ) = 0} se
llama hiperplano soporte de S en x si pT ( x x ) 0 para todo x S o bien

pT ( x x ) 0 para todo x S .
Ntese que en el caso de ser S el conjunto de nivel de una funcin f,
convexos y no convexos.
S = { x S : f ( x ) } , con
, entonces el vector normal p del hiperplano soporte
de S en x S , est dado por p = f ( x ) .
a)
Figura 4.3. Cono a) convexo y b) no convexo
b)
a)
b)
Figura 4.4. a) Caso convexo y b) caso no convexo
57
58
Un conjunto convexo tiene un hiperplano soporte en cada punto de frontera.
Teorema del hiperplano soporte. Sea S un conjunto convexo, no vaco, de
y sea
x S . Luego existe un hiperplano soporte de S en x ; esto es, existe un vector no nulo
p tal que pT ( x x ) 0 para todo x cl S .
a)
b)
Figura 4.6. a) Funcin convexa y b) funcin no convexa y no cncava

A continuacin se darn algunas propiedades tiles de las funciones convexas.
(i) Sean f1 , f 2 ,
fk :
funciones convexas. Entonces,
f ( x ) = i f i ( x ) , donde i > 0 para i = 1, 2,
A continuacin se presentarn algunas propiedades de las funciones convexas, empezando por su definicin.
Funcin convexa. Sea f : S
f ( x ) = max { f1 ( x ) , f 2 ( x ) ,
(ii) Supngase que g ( x ) :

, donde S es un conjunto no vaci convexo de
, k es una funcin convexa.
i =1
Figura 4.5.
La funcin f es convexa en S si
f ( x1 + (1 ) x2 ) f ( x1 ) + (1 ) f ( x2 )
La funcin f es estrictamente convexa en S si la desigualdad anterior es una desigualdad
es una funcin cncava. Sea S = { x : g ( x ) > 0} , y

1
. Luego, f es convexa en S.
g ( x)
defnase f ( x ) : S
como f ( x ) =
(iii) Sea g ( x ) :
una funcin no decreciente, de una variable, y convexa, y sea
h ( x) :
para cada x1 , x2 S y para cada ( 0,1) .
f k ( x )} es una funcin convexa
una funcin convexa. Luego, la funcin f :
definida como la
composicin f ( x ) = g ( h ( x ) ) , es una funcin convexa.
estricta para cada par de puntos distintos x1 , x2 S , y para cada ( 0,1) .
(iv) Sea g ( x ) :
La funcin f es (estrictamente) cncava en S si -f es (estrictamente) convexa.
de la forma h ( x ) = Ax + b , donde A es una matriz de m n y b es un vector de m 1 .
La interpretacin geomtrica de la definicin anterior es como sigue: el valor de f en

el punto x1 + (1 ) x2 debe ser menor que la altura de la cuerda que une los puntos
x1 , f ( x1 ) y x2 , f ( x2 ) . Vase la Figura 4.6.
una funcin convexa, y sea h ( x ) :
Luego, la funcin f :
una funcin afn
definida como la composicin f ( x ) = g ( h ( x ) ) , es una
funcin convexa.
Asociado a una funcin f convexa est el conjunto de nivel S , definido como: S = { x S : f ( x ) } , con
59
60
Lema (convexidad de los conjuntos de nivel). Sea S un conjunto convexo no vaco
en
, y sea
f :S
una funcin convexa. Luego, el conjunto de nivel
S = { x S : f ( x ) } , con
, es un conjunto convexo.
En muchos problemas de optimizacin, el requerimiento de convexidad puede ser

muy exigente e innecesario. En esos casos se habla de convexidad en un punto. Se
muestran a continuacin diversos tipos de convexidad puntual, que son extensiones (relajaciones) de la idea primaria. Sea S un conjunto convexo no vaco de
f :S
, y sea
Convexidad en un punto. La funcin f se dice convexa en
a)
b)
Figura 4.7. (a) La funcin f es quasi-convexa, pero no estrictamente quasi-convexa en

x1; y f es quasi-convexa, y estrictamente quasi-convexa, en x2. (b) La funcin f es pseu-
do-convexa, y estrictamente pseudo-convexa, en x1; y es pseudo-convexa, pero no esx S
trictamente pseudo-convexa en x2.
si
f ( x + (1 ) x ) f ( x ) + (1 ) f ( x ) para cada ( 0,1) y cada x S .
4.2. Optimizacin sin restricciones
Convexidad estricta en un punto. La funcin f es estrictamente convexa en x S si

f ( x + (1 ) x ) < f ( x ) + (1 ) f ( x ) para cada ( 0,1) y cada x S , con x x .
Quasi-convexidad en un punto. La funcin f se dice quasi-convexa en x S si

f ( x + (1 ) x ) max { f ( x ) , f ( x )} para cada ( 0,1) y cada x S .
Un problema de optimizacin sin restricciones es un problema de la forma:

min f ( x )
sin ninguna restriccin en el vector x.
Quasi-convexidad estricta en un punto. La funcin f es estrictamente quasi-
Definicin de mnimo local y global. Considrese el problema de minimizar f ( x )
convexa en x S si f ( x + (1 ) x ) < max { f ( x ) , f ( x )} para cada ( 0,1) y cada
en
x S tal que f ( x ) f ( x ) .
Si f ( x ) f ( x ) para todo x
Pseudo-convexidad en un punto. Supngase que f es diferenciable en x int S ,
luego f es pseudo-convexa en x si f ( x )( x x ) 0 para x S implica que

f ( x) f ( x ) .
, y sea x
.
n
, entonces x es un mnimo global.
Si existe una vecindad , N ( x ) , alrededor de x tal que f ( x ) f ( x ) para todo

x N ( x ) , entonces x es un mnimo local.
Si f ( x ) f ( x ) para todo x N ( x ) , con x x , entonces x se denomina mnimo
Pseudo-convexidad estricta en un punto. Supngase que f es diferenciable en

x int S , luego f es estrictamente pseudo-convexa en x si f ( x )( x x ) 0 para
x S , x x , implica que f ( x ) > f ( x ) .
local estricto.
La Figura 4.8 muestra mnimos locales y globales de una funcin real.
Ejemplos ilustrativos de estas definiciones pueden verse en la Figura 4.7.
61
62
De este modo se arriba a una condicin necesaria de primer orden para mnimos.
Corolario (condicin necesaria de primer orden para mnimos). Supngase que
f:
Mnimo local estricto
Mnimo local
es diferenciable en x . Si x es un mnimo local entonces
f ( x ) = 0 .
Prueba. Supngase que x es un mnimo local y f ( x ) 0 . Luego, tomando

Mnimo global
d = f ( x ) se tiene que f ( x ) d = f ( x ) < 0 , y por el teorema de la direccin
Figura 4.8. mnimos locales y globales de una funcin real.

Dado un punto x
de decrecimiento existe un > 0 tal que f ( x + d ) < f ( x ) para cada ( 0, ) , con-
, se desea determinar si es o no un mnimo global o local de f.
Para el caso de funciones diferenciables, existen condiciones que permiten averiguarlo,
tradiciendo la suposicin de que x es un mnimo local. Luego, f ( x ) = 0 .

Una condicin necesaria de segundo orden para mnimos puede establecerse en tr-
como se ver a continuacin.

En primer lugar se caracterizar lo que se conoce como direccin de decrecimiento.
Teorema de la direccin de decrecimiento. Sea f :
una funcin diferen-
ciable en x . Si existe un vector d tal que
minos de la matriz Hessiana.

Teorema (condicin necesaria de segundo orden para mnimos). Supngase que
f:
es dos veces diferenciable en x . Si x es un mnimo local entonces
f ( x ) = 0
f ( x ) d < 0 ,
entonces existe un > 0 tal que
H ( x ) es semidefinida positiva.
f ( x + d ) < f ( x ) para cada ( 0, ) ,
Prueba. Supngase que x es un mnimo local y considrese una direccin d arbitra-
de modo que d es una direccin de decrecimiento de f en x .
ria. Como se supuso que f es dos veces diferenciable, se tiene que
Prueba. De la diferenciabilidad de f en x se tiene que
1
T
2
f ( x + d ) = f ( x ) + f ( x ) d + 2 d T H ( x ) d + 2 d ( x , d ) ,
2
f ( x + d ) = f ( x ) + f ( x ) d + d ( x , d ) ,
T
donde ( x , d ) 0 cuando 0 . Reordenando y dividiendo por 0 se tiene que

f ( x + d ) f ( x )
(4.1)
donde ( x , d ) 0 cuando 0 . Como x es un mnimo local, del Corolario de la

condicin necesaria de primer orden para mnimos se tiene que f ( x ) = 0 . Reordenan-
= f ( x ) d + d ( x , d ) .
T
do (4.1) y dividiendo por 2 > 0 se tiene que
Como f ( x ) d < 0 y ( x , d ) 0 cuando 0 , entonces existe un > 0 tal que

T
el lado derecho de la igualdad anterior es negativo para todo ( 0, ) . Luego,
f ( x + d ) f ( x )
1 T
2
d H ( x ) d + d ( x , d ) .
2
4.2
f ( x + d ) < f ( x ) .
63
64
Como x es un mnimo local, f ( x + d ) f ( x ) para un suficientemente pequeo. De (4.2), se tiene que
1 T
2
d H ( x ) d + d ( x , d ) 0 para ese suficientemente
2
pequeo. Tomando ahora el lmite para 0 , se tiene que d T H ( x ) d 0 ; y, por tanto, H ( x ) es semidefinida positiva.
Definicin de solucin factible y solucin ptima. Sea f :
, y considrese
un problema de optimizacin como el (4.3), donde S es un conjunto no vaco de
Un punto x S es una solucin factible del problema (4.3).
Si x S y f ( x ) f ( x ) para cada x S , entonces x es una solucin ptima o
solucin ptima global del problema (4.3).
Ahora se mostrar, sin prueba, una condicin suficiente para mnimo local.
Teorema (condicin suficiente para mnimo local). Supngase que f :
*
n
es
dos veces diferenciable en x . Si f ( x ) = 0 y H ( x ) es definida positiva, entonces x
f ( x ) f ( x ) para cada x S N ( x ) , entonces x es una solucin ptima local del
problema (4.3).
es un mnimo local estricto.

Como ocurre en general en los problemas de optimizacin, se tienen resultados ms
generales bajo condiciones de convexidad (generalizadas). El resultado que sigue muestra que si f es pseudoconvexa en x , entonces la condicin necesaria f ( x ) = 0 es tam-
Si x S y si existe una vecindad , N ( x ) , alrededor de x tal que
Si x S y f ( x ) f ( x ) para cada x S N ( x ) , con x x , para algn
> 0 , entonces x es una solucin ptima local estricta del problema (4.3)
La Figura 4.9 muestra ejemplos de mnimos locales y globales en un problema de optimizacin con restricciones.
bin suficiente para que x sea un mnimo global.

Teorema (condicin necesaria y suficiente para funciones pseudoconvexas). Su-
pngase que f :
es pseudoconvexa en x . Luego, x es un mnimo global si y
slo si f ( x ) = 0 .
4.3. Optimizacin con restricciones.
Mnimo local
Mnimo global
En esta seccin se derivarn condiciones de optimalidad para un problema como el

que sigue:
min f ( x )
Figura 4.9. Mnimos locales y globales en un problema de optimizacin con restricciones
(4.3)
Los puntos de S correspondientes a A, B y E son tambin mnimos locales estrictos,
sujeto a:
mientras que aquellos correspondientes al segmento plano del grfico entre C y D son
xS .
mnimos locales, pero no estrictos.
En primer lugar se considerar una restriccin general de conjunto, S, para luego pasar al caso ms concreto de restricciones de igualdad y de desigualdad. Considrense
ahora las siguientes definiciones:
4.3.1. Programacin convexa

Un problema de programacin convexa es un problema de la forma
min f ( x )
65
(4.4)
66
sujeto a:
junto S. La Figura 4.11, por su parte, muestra distintos ejemplos de conos de direcciones
xS ,
de mejora para una dada funcin f.
en el cual la funcin f y el conjunto S son convexos, respectivamente. A continuacin se

mostrar una propiedad importante de los problemas de programacin convexa.
Teorema (los mnimo locales de un problema de programacin convexa son mnimos globales). Considrese el problema (4.4), donde S es un conjunto no vaco con-
vexo de
y f :S
es una funcin convexa en S. Si x S es una solucin ptima
local del problema, entonces x es una solucin ptima global. Ms aun, si x es un mnimo local estricto, o si f es estrictamente convexa, entonces x es la nica solucin ptima global.
4.3.2. Condiciones geomtricas de optimalidad

En esta seccin se mostrarn condiciones de optimalidad del problema (4.3), esto es,
sin suponer convexidad. Dado que no se hace ninguna suposicin en cuanto a la con-
Figura 4.10. Conos de direcciones factibles para un dado conjunto S. Las lneas de trazo
significan que la frontera no pertenece al conjunto.
vexidad, se derivarn en principio slo condiciones necesarias. En secciones posteriores

se impondrn condiciones de convexidad que permiten derivar condiciones suficientes.
Considrense las siguientes definiciones
Cono de direcciones factibles. Sea S un conjunto no vaco de
y sea x cl S . El
cono de direcciones factibles de S en x , D, est dado por

D = {d 0 : x + d S para todo ( 0, ) para algun > 0} .
La Figura 4.11. Conos de direcciones de decrecimiento para una dada funcin f. Las
lneas de trazo significan que la frontera no pertenece al conjunto.
Cada vector no nulo d D se llama direccin factible.

Cono de direcciones de decrecimiento. Sea f :
. El cono de direcciones de
Ahora se considerar una funcin f diferenciable en x , y los siguientes conjuntos:
mejora o decrecimiento en x , F, est dado por
F0 = {d : f ( x ) d < 0}
F = {d : f ( x + d ) < f ( x ) para todo ( 0, ) para algun > 0} .
F0' = {d 0 : f ( x ) d 0} .
Cada vector no nulo d F d se llama direccin de mejora o direccin de decrecimiento
(para interpretar estos conjuntos, conviene recordar que el gradiente f ( x ) es un vec-
en x .
tor normal a la curva de nivel de f en x y el producto escalar de dos vectores es nulo,

. La Fi-
mayor a cero o menor a cero, segn los vectores sean normales, formen un ngulo agu-
gura 4.10 Muestras distintos ejemplos de conos de direcciones factibles de un dado con-
do o formen un ngulo obtuso, respectivamente). Del Teorema de la direccin de decre-
Ntese que para un punto interior de S, el cono de direcciones factibles es
67
68
cimiento se tiene que si f ( x ) d < 0 , entonces d es una direccin de decrecimiento. De
F0 D = ,
ah, se tiene que
donde F0 = {d : f ( x ) d < 0} y D es el cono de direcciones factibles de S en x , esto es
F0 F .
(4.5)
D = {d 0 : x + d S para todo ( 0, ) para algun > 0} .
Tambin, si d F , se tiene que f ( x ) d 0 , o sino, anlogamente al Teorema de la

direccin de decrecimiento, f ( x ) d > 0 implicara que d es una direccin de crecimiento. De ah, se tiene que
Prueba. Supngase, por contradiccin, que existe un vector d F0 D . Dado que
d F0 , entonces, por el Teorema de la direccin de decrecimiento existe un 1 > 0 tal

que
F F0' .
(4.6)
f ( x + d ) < f ( x ) , para cada ( 0, 1 ) .
Finalmente, de (4.5) y (4.6) se tiene que
(4.7)
Adems, como d D , por la definicin de Cono de direcciones factibles existe un
F0 F F ,
2 > 0 tal que
de modo que se ha acotado por dentro y por fuera el cono de direccin de decrecimiento
x + d S para cada ( 0, 2 ) .
'
0
(4.8)
(que es un concepto ms bien abstracto) con dos conjuntos que dan una descripcin algebraica en trminos del vector gradiente. En la Figura 4.12 se comparan estos tres con-
La suposicin de que x es una solucin ptima local no es compatible con las condi-
juntos para los casos mostrados en la Figura 4.11.
ciones (4.7) y (4.8). Luego, F0 D = .

Intuitivamente, se ve que si x S no est en la frontera de S (lo que implica que
D
), entonces la condicin geomtrica de ptimo es que el gradiente sea nulo, y de
este modo F0 D = , por ser F0 = . En la Figura 4.13 se muestra una representaf ( x )
f ( x )
cin grfica de la condicin establecida en el teorema anterior.
f ( x )
contornos
de f
Figura 4.12. Comparacin de F0 , F y F0' para los casos mostrados en la Figura 4.11.
El teorema que sigue establece que una condicin necesaria para la optimalidad local
es que toda direccin de mejora en F0 no sea una direccin factible.
Teorema (condicin geomtrica necesaria de optimalidad local). Considrese el
problema de minimizar f ( x ) sujeto a x S , donde f :
y S es un conjunto no
Figura 4.13. Representacin grfica de la condicin geomtrica necesaria de optimalidad, F0 D = .
vaco, supngase que f es diferenciable en x S . Si x es una solucin ptima local,

entonces
69
70
4.3.4. Problemas con restricciones de igualdad y desigualdad

Se considerar a continuacin el caso especfico en que la regin de factibilidad S est dada por
S = { x X : gi ( x ) 0, i = 1,
donde gi ( x ) :
para i=1, , m, y hi ( x ) :
, l} ,
, m, hi ( x ) = 0, i = 1,
conjunto abierto, no vaco, en
para i=1, , l, y X es un
Figura 4.14 muestra la comparacin entre los con juntos G0 , D y G0' para diferentes
Esta regin de factibilidad da origen al siguiente problema de programacin no lineal:

min f ( x )
(4.9)
casos
Teorema (condiciones geomtricas necesarias para problemas con restricciones
sujeto a:
de desigualdad e igualdad). Sea X un conjunto abierto no vaco de
gi ( x ) 0, i = 1,
, m,
hi ( x ) = 0, i = 1,
, l,
f ( x) :
, gi ( x ) :
para i=1, , m, y hi ( x ) :
, y sea
para i=1, , l.
Considrese el problema definido por (4.9). Supngase que x es una solucin ptima
x X.
Para una descripcin algebraica del cono de direcciones factibles para el caso ante-
local, y sea I = {i : gi ( x ) = 0} el conjunto de ndices de restricciones activas. Adems
es una solucin factible del problema (4.9), y sea
supngase que cada gi es continua en x para i I , que f y gi, con i I , son diferencia-
I = {i : gi ( x ) = 0} el conjunto de ndices de restricciones activas. Supngase que no hay
bles en x y que hi es continuamente diferenciable en x para i=1, , l. Si los gradien-
rior, supngase que x
tes hi ( x ) , con i=1, , l, son linealmente independientes, entonces

T
restricciones de igualdad.
Adems supngase que cada gi es continua en x para i I y que f y gi, con i I , son
diferenciables en x . Sean
F0 G0 H 0 = ,
donde
G0 = {d : gi ( x ) d < 0 para i I }
F0 = {d : f ( x ) d < 0}
G = {d 0 : gi ( x ) d 0 para i I } ,
'
0
G0 = {d : gi ( x ) d < 0 para i I }
entonces, G0 D G ,
'
0
H 0 = {d : hi ( x ) d = 0 para i = 1,
donde D es el cono de direcciones factibles.
, l} .
Prueba. (Ver Goodwin et al. 2005).

'
0
La Figura 4.14 muestra la comparacin entre los con juntos G0 , D y G para diferen-
4.3.5. Condiciones necesarias de Fritz John
tes casos.
A continuacin se expresar la condicin geomtrica F0 G0 H 0 = de forma algebraica, lo que se conoce como condiciones de Fritz John (FJ).
71
72
Teorema (condiciones necesarias de Fritz John). Sea X un conjunto abierto no va-
co de
, y sea f ( x ) :
, gi ( x ) :
para i=1, , m, y hi ( x ) :
para i=1, , l. Sea x es una solucin factible de (4.9) y sea I = {i : gi ( x ) = 0} . Supngase que cada gi es continua en x para i I , que f y gi, con i I , son diferenciables en
x y que hi es continuamente diferenciable en . x para i=1, , l. Si x es una solucin
ptima local de (4.9), entonces existen escalares u0 y ui para i I y vi para i=1, , l,
tales que
l
u0f ( x ) + ui gi ( x ) + vi hi ( x ) = 0 ,
T
iI
Las condiciones FJ pueden ser escritas en forma vectorial como sigue
f ( x ) u 0 + g ( x ) u + h ( x ) v = 0 ,
T
(4.12)
uT g ( x ) = 0 ,
( u0 , u ) ( 0, 0 ) ,
( u0 , u, v ) ( 0, 0, 0 ) ,
donde g ( x ) es la matriz Jacobiana de m n cuya i-sima columna es gi ( x ) ,
(4.10)
h ( x ) es la matriz Jacobiana de l n cuya i-sima columna es hi ( x ) , g ( x ) , u y v
i =1
u0 , ui 0 para i I ,
son vectores de dimensin apropiadas. Cualquier punto x para el cual existan multipli-
{u0 , ui , i I , v1 ,
cadores de Lagrange que hagan cumplir las condiciones FJ se dice que es un punto FJ.
, vl } no todos nulos.
Ms aun, si gi, con i I , es tambin diferenciable en x ,entonces la condicin anterior

puede ser escrita como
m
u0f ( x ) + ui gi ( x ) + vi hi ( x ) = 0 ,
T
i =1
Considrese el siguiente conjunto S de restricciones
S = {x
(4.11)
i =1
ui gi ( x ) = 0 para i = 1,
u0 , ui 0 para i = 1,
Interpretacin grfica de las condiciones FJ.
: g1 ( x ) 0, g 2 ( x ) 0, g3 ( x ) 0} ,
donde los contornos de las distintas gi pueden verse en la Figura 4.15 a), y considrese
un punto factible x como el que se muestra en la misma figura. Considrense tambin
,m ,
los gradientes de las restricciones activas en x , g1 ( x ) y g 2 ( x ) , como se muestra
,m ,
en la Figura 4.15 b).
( u0 , u, v ) ( 0, 0, 0 ) ,
punto factible
donde u y v son vectores cuyas componentes son ui, con i=1, , m, y vi, con i=1, , l,
respectivamente.

Los escalares u0, ui para i=1, , m, y vi, con i=1, , l, son los multiplicadores de
Lagrange asociados con la funcin objetivo, las restricciones de desigualdad y las restricciones de igualdad, respectivamente. La condicin de que x sea un punto factible se
llama condicin de factibilidad primal (PF). La condicin (4.10) se llama condicin de
factibilidad dual (DF). La condicin ui gi ( x ) = 0 para i = 1,
a)
, m , se llama condicin de
b)
Figura 4.15.
relajacin complementaria (CS), y exige que ui=0 si la correspondiente desigualdad no

esta activa ( gi ( x ) < 0 ) y permite que ui>0 slo para las restricciones activas.
73
74
Para los contornos de la funcin objetivo dados en la Figura 4.16, se tiene que
u0 ( g ( x ) ) est en el cono formado por g1 ( x ) y g 2 ( x ) , con u0 > 0 .
De entre las diversas formas de lograr la calificacin para las restricciones, se elegir
aqu la tpica que exige que el gradiente de la restriccin de desigualdad para i I y el
gradiente de la restriccin de igualdad en x sean linealmente independientes.
a)
Figura 4.16.
b)
Figura 4.17.
Las condiciones FJ para este caso son:
f ( x ) u 0 + g ( x ) u = 0 ,
T
4.3.6. Condiciones necesarias de Karush-Kuhn-Tucker

(4.12)
Teorema (condiciones necesarias de Karush-Kuhn-Tucker). Sea X un conjunto
uT g ( x ) = 0 ,
abierto no vaco de
( u0 , u ) ( 0, 0 ) ,
hi ( x ) :
( u0 , u, v ) ( 0, 0, 0 ) ,
I = {i : gi ( x ) = 0} . Supngase que cada gi es continua en x para i I , que f y gi,
, y sea f ( x ) :
, gi ( x ) :
para i=1, , m, y
para i=1, , l. Sea x es una solucin factible de (4.9) y sea
con i I , son diferenciables en x y que hi es continuamente diferenciable en x para
por lo que x es un punto FJ con u0>0. Adems, x es un mnimo local.
i=1, , l. Ms aun, supngase que gi ( x ) , para i I , y hi ( x ) , para i=1, , l,

T
Para los contornos de la funcin objetivo dados en la Figura 4.17 a), se tiene que
u0 ( g ( x ) ) est en el cono formado por g1 ( x ) y g 2 ( x ) , slo si u0 = 0 . x es en
son linealmente independientes. Luego, si x es una solucin ptima local de (4.9), entonces existen escalares ui para i I y vi para i=1, , l, nicos, tales que
este caso un punto FJ con u0=0, y es tambin un mnimo local. Sin embargo, para los
contornos de la funcin objetivo dados en la Figura 4.17 b), se tiene que x es un punto
iI
FJ con u0=0, pero constituye un mximo local.

Bajo condiciones apropiadas de regularidad, que se denominan calificacin de res-
f ( x ) + ui gi ( x ) + vi hi ( x ) = 0 ,
T
(4.13)
i =1
ui 0 para i I ,
tricciones, se asegura que u0 sea positiva y las condiciones FJ se convierten en las con-
Ms aun, si gi, con i I , es tambin diferenciable en x , entonces la condicin anterior
diciones de Karush-Kuhn-Tucker. Estas nuevas condiciones sern presentadas a conti-
puede ser escrita como
nuacin.
i =1
f ( x ) + ui gi ( x ) + vi hi ( x ) = 0 ,
75
(4.14)
i =1
76
ui gi ( x ) = 0 para i = 1,
ui 0 para i = 1,
Existe aun un caso particular importante: cuando las restricciones son lineales, las
,m ,
condiciones KKT son tambin condiciones necesarias de optimalidad, independiente-
,m .
mente de la naturaleza de la funcin objetivo.
Resta an determinar, entre todos los puntos que cumplen las condiciones KKT cu-
Al igual que en las condiciones FJ, los escalares ui y vi se llaman multiplicadores de
les constituyen soluciones ptimas locales. Los resultados que siguen, muestran que,
Lagrange. La condicin de que x sea factible se denomina factibilidad primal (PF). El
bajo suposiciones moderadas de convexidad, las condiciones KKT son tambin sufi-
requerimiento (4.14), con ui 0 para i = 1,
cientes para la optimalidad local.
, m , junto con la independencia lineal de
los gradientes, se llama factibilidad dual (DF). Por ltimo, la condicin ui g i ( x ) = 0

para i = 1,
4.3.7. Condiciones suficientes de Karush-Kuhn-Tucker
, m , se llama condicin de relajacin complementaria (CS).

Teorema (condiciones suficiente de Karush-Kuhn-Tucker). Sea X un conjunto
Las condiciones KKT pueden ser escritas tambin en forma vectorial, como sigue:
f ( x ) + g ( x ) u + h ( x ) v = 0 ,
T
abierto no vaco de
(4.15)
hi ( x ) :
, y sea f ( x ) :
, gi ( x ) :
para i=1, , m, y
para i=1, , l. Sea x es una solucin factible de (4.9) y sea
uT g ( x ) = 0 ,
I = {i : gi ( x ) = 0} . Supngase que las condiciones KKT se cumplen para x , esto es,
u =0.
existen escalares ui 0 para i I , y vi para i=1, , l, tales que
La Figura 4.18 muestra algunos ejemplos grficos de puntos KKT, referidos a las Figuras 4.15 a 4.17. En los casos mostrados en 4.18 a) y 4.18 c), los puntos considerados
f ( x ) + ui gi ( x ) + vi hi ( x ) = 0 .
T
iI
(4.16)
i =1
Sea J = {i : vi > 0} y K = {i : vi < 0} . Ms aun, supngase que f es pseudo-convexa en
son puntos KKT, mientras que en 4.18 b) el punto considerado no lo es.
x , gi es quasi-convexa en x para i I , hi es quasi-convexa en x para i J y que hi es

quasi-cncava en x (esto es, -hi es quasi-convexa en x ) para i K . Entonces, x es
una solucin ptima global de (4.9).
4.3.8. Programacin cuadrtica

a)
b)
c)
La programacin cuadrtica es una clase particular de programacin no-lineal en la
Figura 4.18.
La calificacin de restricciones de independencia lineal es una condicin suficiente en
el comportamiento de las restricciones que asegura que un punto FJ (y por tanto cual-
cual la funcin objetivo es cuadrtica y las restricciones son lineales. Un problema de

programacin cuadrtica (QP) puede ser escrito como
nes de restricciones es garantizar que, mediante el anlisis de slo los puntos KKT, no
min xT Hx + xT c
2
se pierde ninguna solucin ptima.
sujeto a:
quier mnimo local) es un punto KKT. De este modo, la importancia de las calificacio-
77
(4.17)
78
Bajo ciertas condiciones de convexidad y apropiadas calificaciones de restricciones,
AIT x bI
A x = bE
los problemas primal y dual tienen idnticos valores ptimos de funcin objetivo.
T
E
donde H
nxn
, c
, AI
nxmI
, bI
mI
, AE
nxmE
, bE
mE
Considrese nuevamente el problema de programacin no-lineal dado por (4.9):
Problema Primal P
Como las restricciones son lineales, se tiene que
x es un mnimo local
min f ( x )
x es un punto KKT.
el conjunto restriccin S = { x : AIT x bI , AET x = bE } es un conjunto (polidrico) convexo.

Por tanto,
el problema QP es convexo
, m,
hi ( x ) = 0, i = 1,
, l,
Problema Lagrangiano Dual D

max ( u , v )
x es un mnimo local x es un mnimo global x es un punto KKT.
(4.18)
sujeto a:
Ms aun, si H > 0 ,entonces x es el nico mnimo global
u0,
m
l
donde ( u, v ) = inf f ( x ) + ui gi ( x ) + vi hi ( x ) : x X , es la funcin Lagrangiana

i =1
i =1
Las condiciones KKT (4.15) para el problema QP definido por (4.17) son:
AIT x bI
dual.
AET x = bE
4.4.1. Interpretacin geomtrica
Hx + c + AI u + AE v = 0
Condicin de relaj. compl. (CS):
gi ( x ) 0, i = 1,
Entonces, el problema Lagrangiano dual se define como sigue:
H es simtrica y definida positiva.
En ese caso,
Factibilidad dual (DF):
sujeto a:
x X.
la funcin objetivo es convexa
Factibilidad primal (PF):
(4.9)
u0
Considrese el siguiente problema primal P:
u T ( AIT x bI ) = 0 ,
min f ( x )
Donde u es el vector de multiplicadores de Lagrange correspondientes a la restriccin
sujeto a:
de desigualdad y v es el vector de multiplicadores de Lagrange correspondientes a la
g ( x ) 0,
restriccin de igualdad.
x X,
donde f :
4.4. Dualidad Lagrangiana
y g:
, y defnase el siguiente conjunto en
G = {( y, z ) : y = g ( x ) , z = f ( x ) para algun x X } ,
La idea de lo que se expondr en esta seccin se puede resumir como sigue:
esto es, G es la imagen de X segn el mapeo (g,f). La Figura 4.19 muestra un ejemplo
Dado un problema de programacin no-lineal, conocido como problema primal, exis-
para el conjunto G.
te otro problema de programacin no-lineal, estrechamente relacionado a l, que recibe

el nombre de problema Lagrangiano dual.
79
80
Finalmente, para resolver el problema Lagrangiano dual D, es necesario encontrar la

lnea con pendiente u ( u 0 ) tal que la ltima intercepcin con el eje z, ( u ) , sea
mxima segn u. Tal lnea tiene pendiente u y soporta a G (en el sentido de la definicin dada en la seccin 4.1) en el punto ( y , z ) , y se muestra en la Figura 4.22. Por tanto, la solucin del problema dual es u y el valor ptimo de la funcin objetivo dual es
z . Esto es, los problemas primal y dual tienen idnticos objetivos ptimos. En ese caso
se dice que no hay gap de dualidad (dualidad fuerte).
Figura 4.19
De este modo, el problema primal consiste en encontrar un punto en G que tenga mnima ordenada z y cumpla con y 0 . En la Figura 4.19, este punto viene dado por
( y, z ) .
Ahora, considrese el siguiente problema Lagrangiano dual D:
max ( u )
sujeto a:
Figura 4.20.
u0.
Figura 4.21.
La solucin al problema Lagrangiano dual requiere primero la resolucin del siguiente sub-problema Lagrangiano dual: ( u ) = inf { f ( x ) + ug ( x ) : x X } .
Dado un u 0 , el sub-problema Lagrangiano dual es equivalente a minimizar z+uy
en los puntos (y,z) de G. Ntese que z + uy = es la ecuacin de una lnea recta con
pendiente u que intercepta el eje z en (la Figura 4.20 muestra la lnea recta dada por
z + uy = - en lnea de trazos rojos - para un valor de u arbitrario). Por tanto, para mi-
nimizar z+uy en G es necesario mover la lnea z + uy = paralela a s misma tan lejos

como sea posible, siempre que permanezca en contacto con G (debe ser un hiperplano
Figura 4.22.
soporte, segn la definicin dada en la seccin 4.1). La ltima intercepcin con el eje z
as obtenida es el valor de ( u ) correspondiente al dado u 0 . La Figura 4.21 muestra
4.4.2. Dualidad fuerte y dualidad dbil
la lnea recta de la Figura 4.20 desplazada hacia abajo (para minimizar ) pero en conEl teorema que sigue muestra que la funcin objetivo correspondiente a cualquier so-
tacto con G, con la que se obtiene ( u ) 10.
lucin factible del problema dual constituye una cota inferior para la funcin objetivo
correspondiente a una solucin factible del problema primal.
10
En pocas palabras, se busca una recta tangente a G por debajo (soportante) que cruce el eje z en el punto ms bajo posible.
81
82
Teorema (dualidad dbil): Considrese el problema primal P dado por (4.9) y su

problema Lagrangiano dual correspondiente D (dado por (4.18)). Sea x una solucin
factible de P; esto es x X , g ( x ) 0 y h ( x ) = 0 . Adems, sea ( u , v ) una solucin
factible de D; esto es u 0 . Luego,
Figura 4.23.
Antes de esbozar el teorema en s, se enunciar el siguiente lema:
Lema: Sea X un conjunto convexo no vaco de

g:
f ( x ) ( u, v ) .
convexo por componentes, y sea h :
h ( x ) = Ax b ). Adems, sea u0 un escalar, u
Prueba. De la definicin de ( u , v ) , y del hecho de que x X , u 0 , g ( x ) 0 y
y v
. Sea :
, sea
afn (esto es, de la forma

l
. Considrense ahora los
siguientes sistemas:
h ( x ) = 0 , se tiene que
Sistema 1: ( x ) < 0 , g ( x ) 0 , h ( x ) = 0 para algn x X .
( u, v ) = inf { f ( x ) + u T g ( x ) + vT h ( x ) : x X } f ( x ) + uT g ( x ) + vT h ( x ) f ( x ) ,
Sistema 2: u0 ( x ) + u T g ( x ) + vT h ( x ) 0 para algn ( u0 , u , v ) ( 0, 0, 0 ) , ( u0 , u ) ( 0, 0 )

y para todo x X .
con lo que queda probado el teorema.

Del Teorema anterior se desprende el siguiente corolario:
Si el Sistema 1 no tiene solucin x, entonces el Sistema 2 tiene una solucin ( u0 , u , v ) .
Corolario:
Contrariamente, si el Sistema 2 tiene una solucin ( u0 , u , v ) con u0 0 , entonces el

Sistema 1 no tiene solucin.
inf { f ( x ) : x X , g ( x ) 0, y h ( x ) = 0} sup { ( u, v ) : u 0} .

Es decir, el valor ptimo de la funcin objetivo del problema primal es mayor o igual
que el valor ptimo de la funcin objetivo del problema dual. Si la desigualdad es estricta, entonces se dice que existe un gap de dualidad.
El resultado que sigue es el Teorema de dualidad fuerte:
Teorema (dualidad fuerte): Sea X un conjunto convexo no vaco de
La Figura 4.23 muestra un ejemplo de la interpretacin geomtrica de los problemas

dual y primal. Ntese que en el caso de esta figura existe un gap de dualidad debido a la
no-convexidad del conjunto G. Se ver a continuacin, en el Teorema de dualidad fuerte, que para condiciones apropiadas de convexidad se puede garantizar la no existencia
de gaps de dualidad entre los problemas primal y dual.
f:
y g:
convexas, y sea h :
. Sea
afn (esto es, de la forma
h ( x ) = Ax b ). Supngase que se cumplen las siguientes calificaciones de restriccio-
nes: existe un
x X
tal que
g ( x ) < 0 y h ( x ) = 0
y 0 int h ( X ) , donde
h ( X ) = {h ( x ) : x X } . Entonces,
inf { f ( x ) : x X , g ( x ) 0, y h ( x ) = 0} = sup { ( u , v ) : u 0} ,
donde ( u, v ) = inf { f ( x ) + u T g ( x ) + vT h ( x ) : x X } . Ms aun, si el nfimo es finito,

entonces el sup { ( u, v ) : u 0} es alcanzado en ( u , v ) con u 0 . Si el nfimo es alcanzado en x , entonces u T g ( x ) = 0 .

Para terminar la seccin se desarrollar el siguiente ejemplo ilustrativo:
83
84
Ejemplo: Considrese el siguiente problema de optimizacin:

Problema Primal P
min ( x 1)
sujeto a:
2x 1 = 0
x X = {x
: x 2} .
2
1 1
El valor ptimo de la funcin objetivo es 1 = , dado que el conjunto factible
4
2
Objetivo dual y primal ptimos
1
est dado slo por el punto .
2
Figura 4.24.
4.5. Conceptos bsicos de control ptimo. Regulador cuadrtico
Problema Lagrangiano Dual D
lineal (LQR)
max ( v )
donde ( v ) = inf
{( x 1)
+ v ( 2 x 1) : x 2 , es la funcin Lagrangiana dual.
En esta seccin se busca aplicar los conceptos de teora de la optimizacin al caso del
control de un sistema dinmico. El objetivo general es hallar una secuencia de controles
Derivando con respecto a x e igualando a cero se tiene que el valor de la variable que
(eventualmente, una ley de control) que minimice una cierta funcin objetivo. Esta fun-
optimiza la funcin objetivo del sub-problema Lagrangiano dual es x* = v + 1 (si
cin es por lo general un ndice que busca describir el desempeo del control, esto es, la
1 v 3 ). De este modo, ( v ) = ( v + 1 1) + v ( 2v + 2 1) = v + v .
rapidez con que se logran los objetivos deseados, el uso o gasto de las variables de
Derivando ahora con respecto a v e igualando a cero, se tiene que el valor de la varia1
ble que optimiza la funcin objetivo del problema Lagrangiano dual es v = y el valor
2
*
ptimo de la funcin objetivo del mismo problema es ( v* ) + v* =

2
1
. Esto es, no existe
4
gap de dualidad. La grfica de este ejemplo se muestra en la Figura 4.24.
control para lograr los objetivos deseados, etc. Se comenzar con el anlisis para sistemas no lineales, para luego pasar a sistemas lineales, ya que es all donde las condiciones generales asumen formas concretas, y por tanto, ms fciles de intuir y ms tiles.
Considrese el siguiente sistema no-lineal
x ( k + 1) = f ( x ( k ) , u ( k ) )
n
donde f :
y u
nu
nu
k 0,
x ( 0 ) = x0
es una funcin no lineal dada, x
(4.19)
n
es el estado del sistema
es la entrada de control.
Se puede pensar el sistema de ecuaciones (4.19) como un juego de restricciones de

igualdad que deben cumplirse en todo tiempo k de un dado intervalo. Adems, podran
incluirse restricciones adicionales en los estados y las entradas, que pueden ser escritas
como sigue:
u ( k ) U
85
k = 0,
, N 1,
86
x (k ) X
k = 0,
Defnase en primer lugar una nueva variable que agrupa estados y entradas,
, N,
x(N ) X f X ,
donde U
nu
, X
,y Xf
son ciertos conjuntos, y N es el horizonte de op-
timizacin.
Por el momento, sin embargo, el problema de control ptimo de horizonte fijo que interesa tiene la siguiente forma (control sin restricciones de entrada y estado) 11:
PN ( x ) :
VNopt ( x0 )
min VN
x ( k + 1) = f ( x ( k ) , u ( k ) )
, x ( N )} , {u ( k )}
para k = 0,1,
estados y de controles. VN
VN
{ x ( k )} , {u ( k )}
donde F :
{u ( 0 ) ,
, N 1
({x ( k )} ,{u ( k )}) es la funcin objetivo, que estar dada por

N 1
(4.21)
k =0
nu
son funciones diferenciables.
Las secuencias de estados y de controles que minimizan la funcin objetivo se denominan secuencias ptimas o minimizadoras. El valor ptimo de la funcin objetivo correspondiente a las secuencias ptimas es VN ( x0 ) . La funcin VN ( ) se denomina fun-
A continuacin se determinarn condiciones necesarias para que las secuencias
, x ( N )} , {u ( 0 ) ,
(4.22)
h1

hn
hn +1

h ( x ) =
h2 n
h
+
1
Nn
h
( N +1)n
Funcin vectorial
( N +1)n + Nnu
N +1 n
( )
x0 x ( 0 )
f
x
u
x
0
,
0
1
(
)
(
)
(
)
(
)
= 0,
f
x
N
u
N
x
N
1
,
1
) (
) ) ( )
( (
n ecuaciones
(4.23)
N +1 n + Nnu
N +1 n
( ) es una funcin vectorial.
donde h : ( )
Ntese que cada estado y entrada, en un dado tiempo k, est dado a su vez por
cin valor, y es funcin slo del estado inicial.
{x ( 0) ,
igualdad para la variable x:
(4.20)
, u ( N 1)} son las secuencias de
F ( x ( N )) + L ( x ( k ) , u ( k )) ,
, L:
( N +1) n + Nnu
De este modo, es posible escribir las ecuaciones (4.19) como ( N + 1) n restricciones de
x ( 0 ) = x0
{x ( 0) ,
x ( 0)
x(N )
u ( 0)
u ( N 1)
Estas variables son las variables respecto de las cuales se realizar la optimizacin.
({x ( k )} ,{u ( k )})
s.a :
donde { x ( k )}
, u ( N 1)} sean secuencias ptimas del problema PN ,
segn las condiciones KKT. Ntese que el problema PN tiene restricciones de igualdad
pero no de desigualdad. Para poder aplicar las condiciones de optimalidad de KKT es
necesario primero verificar la calificacin de las restricciones, esto es, que los gradien-
x (k )
x1 ( k )
xn ( k )
u (k )
u1 ( k )
unu ( k )
para k = 0,
nu
para k = 0,
,N
(4.24)
, N 1,
(4.25)
y la funcin f del sistema, por
f ( x ( k ) , u ( k ))
f1 ( x ( k ) , u ( k ) )
f n ( x ( k ) , u ( k ) )
T
(4.26)
tes de las restricciones de igualdad sean linealmente independientes en las secuencias

ptimas.
11
Estas restricciones adicionales sern analizadas en detalle en captulos posteriores, en el marco general
del control predictivo basado en modelos
87
88
Las derivadas parciales de f (matrices Jacobianas), respecto a los estados en el tiempo

k, primero, y a las entradas en el tiempo k, despus, estn dadas por
f
x ( k )
f1
x ( k )
1
f n
x1 ( k )
f1
xn ( k )
f n
xn ( k )
f
u ( k )
gradiente de fi
12
f1
u ( k )
1
f n
u1 ( k )
(que son las restricciones en PN). Con estos valores se forma la siguiente funcin Lagrangiana (que toma valores reales)
f1
unu ( k )
f n
unu ( k )
funcion objetivo
( x, )
h
x
In
f
x ( 0 )
N 1
+ (k )
k =0
In
f
x (1)
In
f
x ( N 1)
In
0
f
u ( 0 )
donde
u ( N 1)
0
f
u (1)
0
En la expresin anterior se puede ver que
h
tiene rango completo (sus filas son l.i.),
x
por lo que los gradientes de las restricciones de igualdad del problema PN son linealmente independientes en
( N +1) n + N nu
. De este modo, la calificacin de restricciones re-
querida por las condiciones KKT se cumple para todo x
( N +1) n + N nu
A continuacin se presentarn los multiplicadores de Lagrange (tambin conocidos

como variables adjuntas o co-estados) asociados al problema PN. ( 1) es el multipliLagrange
{ ( k )} { ( 0 ) ,
12
asociado
, ( N 1)} , ( k )
al
n
estado
inicial,
mientras
que
, sern los asociados a la ecuacin de estado
f
En el caso de sistemas lineales, estas derivadas toman la forma
x ( k )
( 1)
(0) .
( N 1)
x ( 0 )
x (N)

u ( 0)
u ( N 1)
( N +1) n + Nnu
el vector formado por las secuencias de estado y entrada ptimos. Entonces la condicin
identidad de n n .
de
(4.27)
f ( x ( k ) , u ( k ) ) x ( k + 1)
Sea ahora,
donde 0 representa matrices nulas de dimensiones apropiadas e I n representa la matriz
cador
restricciones h
gradiente de hi
primera restriccion
N 1
F ( x ( N ) ) + L ( x ( k ) , u ( k ) ) + ( 1) ( x0 x ( 0 ) )
k =0
Por otro lado, la matriz Jacobiana (de dimensin ( N + 1) n ( N + 1) n + N nu ) de la

funcin vectorial h ( x ) , estar dada por
f
A,
u ( k )
de factibilidad dual de KKT requiere que exista un vector
( 1)

( 0)
( N 1)
tal que la derivada parcial de la funcin Lagrangiana,

modo, se debe cumplir lo siguiente:
( x , )
x ( k )
( x , )
u ( k )
B.
89
, se anule en ( x , ) . De este
x
=0
para k = 0,
,N
(4.28)
=0
para k = 0,
, N 1 .
(4.29)
90
y
refieren a los vectores fila de derivadas
x ( k )
u ( k )
Ntese que en (4.28) y (4.29),
parciales (gradientes) que siguen
Por tanto, de (4.30) - (4.32) y de la ecuacin de estado (4.19), se tiene que una condicin necesaria para que las secuencias { x ( 0 ) ,
x1 ( k )

,
xn ( k )
u ( k )
u1 ( k )

.
unu ( k )
{ ( 1) , ( 0 ) ,
nu
Ecuacin de estado
x ( k + 1) =
x ( k ) , u ( k ) , ( k )
( k )
) = f ( x ( k ) , u ( k ))
k = 0,
, N 1,
x ( 0 ) = x0 .
, como sigue:
II)
costo de etpa
( x ( k ) , u ( k ) , ( k ))
, u ( N 1)} sean
, ( N 1)} tales que se cumplan las siguientes ecuaciones:
I)
Antes de calcular las derivadas (4.28) y (4.29), se definir la funcin Hamiltoniana o

n
, x ( N )} , {u ( 0 ) ,
secuencias ptimas del problema PN , es que exista una secuencia de vectores
x ( k )
Hamiltoniano, :
Ecuacin adjunta (o Ecuacin de co-estados)
sistema
L ( x ( k ) , u ( k )) + ( k ) f ( x ( k ) , u ( k )) ,
T
para k = 0,
, N 1
( k 1) =
donde L es el costo de etapa de la funcin objetivo. Ntese que la funcin Hamiltoniana

cumple con:
III)
x ( k ) , u ( k ) , ( k )
x ( k )
para k = 0,
,N - 1 .
Condiciones de borde
L
f
T
=
+ (k )
,
x ( k ) x ( k )
x ( k )
con
L
L
=
x ( k ) x1 ( k )
L
,
xn ( k )
( ( N 1) )
L
f
T
,
=
+ (k )
u ( k ) u ( k )
u ( k )
con
L
L
=
u ( k ) u1 ( k )
L
,
unu ( k )
IV)
F ( x ( N ) )
x ( N )
Condicin Hamiltoniana (o Estacionaria)
( x ( k ) , u ( k ) , ( k ) )
u ( k )
= f ( x ( k ) , u ( k )) .
( k )
=0
para k = 0,
,N - 1 .
Ntese que, en particular, esto significa que el control minimizador u ( k ) es un pun
Ahora s, se establecern las condiciones KKT, usando para ello la definicin de funcin Hamiltoniana vista.
( x , )
x ( k )
( x , )
x ( N )
( x , )
u ( k )
( x ( k ) , u ( k ) , ( k ) )
x ( k )
F ( x ( N ) )
x ( N )
( ( k 1) ) = 0
u ( k )
x (k ) ,u (k ), (k )
para k = 0, ,N - 1 , (4.30)
( ( N 1) ) = 0
( x ( k ) , u ( k ) , ( k ) )
to estacionario 13 de la funcin Hamiltaniana definida como
L x ( k ) , u ( k ) + ( k ) f ( x ( k ) , u ( k ) ) ,
(4.31)
para k = 0,
, N 1
4.5.1. Regulador cuadrtico lineal en tiempo discreto

Las ecuaciones I) IV) establecen condiciones para el problema general del control
=0
para k = 0,
,N - 1 .
(4.32)
ptimo de sistemas no-lineales, considerando una funcin objetivo tambin muy gene13
91
Estacionario significa, en general, que una derivad es nula.
92
ral. De ah que no sea fcil deducir de ellas expresiones explcitas que determinen la
( x ( k ) , u ( k ) , ( k )) =
secuencia de controles ptimos. En esta seccin se considerar el caso, muy importante

para los objetivos del curso, de sistemas lineales sin restricciones, cuando la funcin
x ( k + 1) =
como una funcin del tiempo.
( k )
estado final fijo, que deriva en una estrategia de control de lazo abierto, y la solucin
k = 0,
, N 1 , (4.35)
= Qx ( k ) + AT ( k ) k = 0,
,N - 1 , (4.36)
y la condicin Hamiltoniana o estacionaria (IV), por
para el caso de estado final libre, que deriva en una estrategia de control de lazo cerrado.
0=
A continuacin demostrar como arribar a la ltima.
) = Ax ( k ) + Bu ( k )
x ( k ) , u ( k ) , ( k )
( k 1) =
x ( k )
En general, se pueden obtener dos soluciones importantes: la solucin para el caso de
x ( k ) , u ( k ) , ( k )
dos y entradas, respectivamente. El sistema lineal, a su vez, puede ser considerado como
un hiperplano que intersecta la superficie cuadrtica y se mueve a travs del espacio
1
T
T
T
x ( k ) Qx ( k ) + u ( k ) Ru ( k ) + ( k ) ( Ax ( k ) + Bu ( k ) ) ,
2
de modo que las Ecuaciones de estado (I) y co-estados (II) vendrn dadas por
objetivo es de tipo cuadrtica. Esta funcin objetivo puede ser considerada como una
superficie cuadrtica de dimensin n+nu, donde n y nu son las dimensiones de los esta-
( x ( k ) , u ( k ) , ( k ) )
u ( k )
= Ru ( k ) + BT ( k )
para k = 0,
,N - 1 . (4.37)
Caso estado terminal libre

De acuerdo con esta ltima ecuacin, el control ptimo en k se puede obtener como
El sistema que se quiere controlar est dado por

x ( k + 1) = Ax ( k ) + Bu ( k )
u ( k ) = R 1 BT ( k )
(4.33)
,N - 1 .
un vector de co-estados que cumpla con las condiciones anteriores. Utilizando (4.38)
n
es el estado del sistema y u
nu
es la entrada de control. La funcin
objetivo estar dada por
1
1
T
T
T
VN = x ( N ) P ( N ) x ( N ) + x ( k ) Qx ( k ) + u ( k ) Ru ( k ) ,
2
2 k =0
que est definida en el intervalo de inters
P ( k ) , k = 0,
para eliminar el control u ( k ) de la ecuacin de estado (4.35), se tiene
x ( k + 1) = Ax ( k ) BR 1BT ( k )
N 1
[0, N ] .
(4.34)
k = 0,
(4.39)
ma autnomo con la siguiente forma:

Las matrices Q, R y
, N , son simtricas y semi-definidas positivas, y adems R 0 . El
El objetivo es entonces encontrar la secuencia de controles
x ( k + 1) A BR 1BT x ( k )

=
.

AT
( k 1) Q
( k )
(4.40)
La matriz de este sistema Hamiltoniano discreto se denomina Matriz Hamiltoniana.

14
{u ( 0 ) ,
, u ( N 1)}
que minimiza la funcin objetivo VN. La funcin Hamiltoniana estar dada en este caso
Este sistema, no obstante, es difcil de resolver ya que parte de l evoluciona hacia delante y parte hacia atrs. Si la Matriz A es invertible (que es el caso ms comn en sistemas discretos), entonces la ecuacin de estados puede ser escrita en reversa
por
x ( k ) = A1 x ( k + 1) + A1BR 1BT ( k )
k = 0,
, N 1 ,
y de este modo, el sistema autnomo (4.40) toma la forma
Una vez obtenida la secuencia de controles, es trivial obtener la secuencia de estados.
, N 1 .
El sistema acoplado de estado y co-estado puede entonces ser escrito como un siste-
estado terminal x ( N ) pude asumir cualquier valor.
14
(4.38)
De este modo, la secuencia recontroles ptima puede ser determinada si se encuentra
x ( 0 ) = x0 ,
donde x
para k = 0,
93
94
x ( k ) A1

=
( k 1) QA1
x ( k + 1)
.

A + QA BR B ( k )
1
x (k ) ,
1 T
Esta recursin evoluciona enteramente hacia atrs (o en reversa), de modo que si se conocen los valores finales x ( N ) y
Luego, de (4.44) y (4.45) se obtiene una ecuacin que involucra slo al estado ptimo
A1BR 1BT
( N 1) , entonces se pueden determinar
x (k ) y
( k ) , y por tanto la secuencia de controles ptima. Desafortunadamente, slo se co-
P ( k ) x ( k ) = Qx ( k ) + AT P ( k + 1) I + BR 1BT P ( k + 1)
Ax ( k )
k = 0,
, N 1 .
Como esta ecuacin se cumple para todo x ( k ) para un dado x0 , entonces se puede
escribir
noce x0 .
Las condiciones iniciales estn dadas por x0 = x0 , mientras que el estado terminal,
x ( N ) est libre. De la condicin de borde (III) se tiene entonces que
F ( x ( N ) )
= P ( N ) x ( N ) .
( N 1) =
x ( N )
A+Q.
Usando ahora el lema de inversin de matrices (Lewis, 1986), se puede escribir
P ( k ) = AT P ( k + 1) I + BR 1BT P ( k + 1)
(4.41)
P ( k ) = AT P ( k + 1) P ( k + 1) B BT P ( k + 1) B + R
BT P ( k + 1) A + Q ,
(4.46)
que es una recursin en reversa para la P ( k ) propuesta, que la determina completamen-
Esta relacin entre el estado y el co-estado finales es la relacin que particulariza el

hecho de tener libre el estado final.
Para resolver este problema con dos condiciones de borde (estado inicial y co-estado
te a partir de P ( k + 1) y las matrices conocidas del sistema y de los pesos de la funcin

objetivo. Justamente, la matriz P ( N ) (penalizacin terminal) es conocida, por lo que a
final), se puede utilizar el mtodo del intercambio (Bryson and Ho 1975). Segn ese
partir de ella se puede obtener toda la secuencia P ( k ) , k = 0,
mtodo se supone que la relacin lineal (4.41) se cumple para todo tiempo
la secuencia P ( k ) se puede obtener, a partir de (4.44), y conociendo el estado inicial
( k ) = P ( k + 1) x ( k + 1)
k = 0,
la secuencia de matrices
P cobra importancia
, N 1 .
(4.42)
k = 0,
y resolviendo (4.43) para x ( k + 1) , se tiene
x ( k + 1) = I + BR B P ( k + 1)
1 T
Ax ( k )
, N 1,
(4.43)
k = 0,
, N 1,
(4.44)
A+Q .
(4.47)
Ahora slo resta determinar la secuencia de controles ptimos, a partir de los estados
ptimos y de la secuencia P ( k ) . De (4.38), que vincula el control con el co-estado, se
gunda relacin entre x ( k + 1) y x ( k ) :

P ( k ) x ( k ) = Qx ( k ) + A P ( k + 1) x ( k + 1) k = 0,
T
P ( k ) = AT P ( k + 1) + BR 1BT
Ahora, reemplazando (4.42) en la ecuacin de co-estados (4.36), se obtiene una se-
invertible para todo k, se puede escribir de un modo ms compacto (usando nuevamente el lema de inversin de matrices), como sigue:
slo estados
que es una recursin hacia delante de los estados ptimos.
,N .
La ecuacin (4.46) es la conocida ecuacin de Riccati que, suponiendo que P ( k ) es
As, reemplazando (4.42) en (4.39) se tiene
x ( k + 1) = Ax ( k ) BR 1BT P ( k + 1) x ( k + 1)
x0 , la secuencia de estados ptimos, x ( k ) , k = 1,
, N 1 . A su vez, con
tiene
u ( k ) = R 1 BT ( k )
,N - 1 .
para k = 0,
,N - 1 ,
(4.48)
(4.45)
slo estados
95
96
y de (4.42), que vincula el co-estado ( k ) con P ( k + 1) y con el estado x ( k + 1) se
VN =
tiene
u ( k ) = R 1 BT P ( k + 1) x ( k + 1)
= R B P ( k + 1) ( Ax ( k ) + Bu ( k ) )
1
para k = 0,
1 T
1 N 1
T
x0 P ( 0 ) x0 + x ( k + 1) P ( k + 1) x ( k + 1)
2
2 k =0
+ x ( k ) ( Q P ( k ) ) x ( k ) + u ( k ) Ru ( k ) .
T
para k = 0,
,N - 1 .
(4.49)
De este modo, se ha llegado a una realimentacin de estado variante en el tiempo (llamada la secuencia de ganancias de Kalman), de la forma
que
VN =
1 T
1 N 1
T
x0 P ( 0 ) x0 + x ( k ) ( AT P ( k + 1) A + Q P ( k ) ) x ( k )
2
2 k =0
+ x ( k ) AT P ( k + 1) Bu ( k ) + u ( k ) BT P ( k + 1) Ax ( k ) + u ( k )
T
u ( k ) = K ( k ) x ( k ) ,
(4.50)
( B P ( k + 1) B + R ) u ( k )}.
T
Segn la ecuacin de Riccati (4.46), el primer trmino de la sumatoria anterior se
con
puede escribir como
K ( k ) = ( BT P ( k + 1) B + R ) BT P ( k + 1) A .
1
(4.51)
VN =
El sistema a lazo cerrado, utilizando (4.50), queda
x ( k + 1) = ( A BK ( k ) ) x ( k )
k = 0,
+ x ( k ) A P ( k + 1) Bu ( k ) + u ( k ) B P ( k + 1) Ax ( k ) + u ( k )
, N 1 ;
( B P ( k + 1) B + R ) u ( k )}.
(4.52)
La sumatoria en (4.52) puede ser escrita a su vez como (McReynolds 1966):
timos. Al ser la ley recontrol variante en el tiempo, el sistema autnomo que se ob-
VN =
control de est tipo, esto es, ptimo, no se puede obtener por mtodos clsicos del
dominio frecuencial.
T
1
1 T
1 N 1
x0 P ( 0 ) x0 + ( BT P ( k + 1) B + R ) BT P ( k + 1) Ax ( k ) + u ( k )
2
2 k =0
( B P ( k + 1) B + R ) ( B P ( k + 1) B + R )
tiene del lazo cerrado es tambin variante en el tiempo, lo que evidencia que un
cin objetivo, cuando se implementa la ley de control ptima. Ntese primero que
BT P ( k + 1) Ax ( k ) + u ( k ) .
Si se usa ahora la ley de control ptima
Para completar el desarrollo se determinar a continuacin el valor ptimo de la fun-
1
1 T
1 N 1
T
x0 P ( 0 ) x0 + x ( k ) AT P ( k + 1) B ( BT P ( k + 1) B + R ) BT P ( k + 1) A x ( k )
2
2 k =0
T
ecuacin sta que provee una alternativa para el clculo de la secuencia de estados p-
N 1
Teniendo en cuenta ahora la ecuacin de estado x ( k + 1) = Ax ( k ) + Bu ( k ) , se tiene
u ( k ) = ( B P ( k + 1) B + R ) B P ( k + 1) Ax ( k )
1
1
1 N 1
T
T
T
x ( N ) P ( N ) x ( N ) + x ( k ) Qx ( k ) + u ( k ) Ru ( k )
2
2 k =0
,N - 1,
u ( k ) = ( BT P ( k + 1) B + R )
BT P ( k + 1) Ax ( k ) , se tiene la sumatoria anterior es nula. De este modo, slo permane-
ce el trmino inicial, lo que permite escribir
1
T
T
x ( k + 1) P ( k + 1) x ( k + 1) x ( k ) P ( k ) x ( k )
2 k =0
.
1
1
T
= x ( N ) P ( N ) x ( N ) x0T P ( 0 ) x0
2
2
VN* =
cin objetivo (4.34), sin alterarla
N 1
1
1
T
T
x ( N ) P ( N ) x ( N ) + x ( k ) ( Q + K kT RK k ) x ( k )
2
2 k =0
1
= x0T P ( 0 ) x0 .
2
=
Por tanto, se puede agregar la resta del lado izquierdo menos el lado derecho a la fun-
1
1 N 1
T
T
T
2
2 k =0
)
(4.53)
Este resultado, algo asombroso por su simpleza y contundencia, merece an una breve discusin. La secuencia P ( k ) se calcula completamente antes de implementar el
97
98
control ptimo (off-line), de modo que P ( 0 ) se conoce a priori. Luego, dado cualquier
estado inicial x0 , se puede usar (4.53) para determinar el costo completo de aplicar el
control ptimo, antes incluso de haberlo aplicado. En general, se puede considerar cualquier tiempo k en [ 0, N ] como el tiempo inicial de un sub-intervalo, de modo que
Vk*, N =
K = ( BT P B + R ) BT P A .
1
(4.55)
Esto es, se ha llegado a una ley de realimentacin de estado invariante en el tiempo de

la forma
u ( k ) = K x ( k ) .
1
T
x (k ) P (k ) x (k ) ,
2
Cabe ahora la pregunta de cmo queda la funcin objetivo o costo, en el caso de que
donde el subndice k,N significa que el sub-intervalo considerado va de k hasta N. Este

importante resultado significa que dado el estado actual de un sistema, x ( k ) , se puede
k . Este costo toma la forma
V =
conocer el costo para ir hasta (esto es el, el costo que queda para llegar hasta N) de
1
1
T
T
T
x ( ) P x ( ) + x ( k ) Qx ( k ) + u ( k ) Ru ( k ) ,
2
2 k =0
(4.56)
y dado que se supone que el sistema de lazo cerrado es estable, el estado converge a
aplicar el control ptimo desde el tiempo k hasta N.
cero para un tiempo infinito. De este modo la ecuacin (4.56) se puede escribir como
4.5.2. Regulador cuadrtico lineal en tiempo discreto con horizonte infiV =
nito
La ecuacin de Riccati (4.46), como se dijo, se debe resolver en reversa para as obtener la secuencia de matrices P ( k ) , k = 0,
, N 1 a partir de P ( N ) . A medida que
k , la secuencia P ( k ) tiene diferentes tipos de comportamiento: puede converger
converge,
entonces
para
un
grande
se
cumplir
Por ltimo, las tablas 4.1 y 4.2 muestran un resumen de lo expuesto en relacin al re-
P ( k ) = P ( k + 1) . Por tanto, en el lmite, la ecuacin de Riccati (4.46) se convertir
gulador cuadrtico lineal (LQR) de horizonte finito y horizonte infinito, respectivamen-
negativo
1
T
T
x ( k ) Qx ( k ) + u ( k ) Ru ( k )
2 k =0
1
T
= x ( k ) ( Q + K T RK ) x ( k )
2 k =0
1
= x0T P x0 .
2
V* =
va o definida positiva; o bien puede no converger a una matriz finita.

P (k )
El costo ptimo, finalmente, vendr dado por
a una matriz de estado estacionario P ( ) , la cual puede ser nula, semi-definida positi-
Si
1
T
T
x ( k ) Qx ( k ) + u ( k ) Ru ( k )
2 k =0
te.
en
P = AT P PB BT PB + R
BT P A + Q ,
(4.54)
x ( k + 1) = Ax ( k ) + Bu ( k )
Sistema
x ( 0 ) = x0
que es lo que se conoce como ecuacin algebraica de Riccati (ARE) y es una ecuacin
que no depende del tiempo. De este modo, la solucin lmite de la ecuacin de Riccati
Funcin objetivo
(4.46), esto es, la solucin que se obtiene resolviendo en reversa (4.46) hasta infinito,
ser siempre solucin de (4.54) (la inversa no es cierta). En caso de que dicha matriz
Parmetros de la fun-
lmite exista, se denominar P , y la correspondiente ganancia de Kalman estacionaria
cin objetivo
VN =
1
1 N 1
T
T
T
2
2 k =0
P ( N ) 0 , Q 0 , R > 0 y simtricas
ser
99
100
Secuencia de penalizacin terminal.
Ecuacin de Riccati
en el tiempo
V* =
Costo ptimo
1 T
x0 P x0 .
2
No considera restricciones en la variable de control ni en los

Inconvenientes para
u ( k ) = K ( k ) x ( k )
Realimentacin de
estado ptima variante
1
P ( k ) = AT P ( k + 1) P ( k + 1) B BT P ( k + 1) B + R BT P ( k + 1) A + Q
k = 1, , N 1 y P ( N ) dado
estados.
su aplicacin
No considera posibles perturbaciones (control off-line)
K ( k ) = ( BT P ( k + 1) B + R ) BT P ( k + 1) A
1
Tabla 4.2. Resultados referentes al regulador cuadrtico lineal (LQR) de horizonte in1 T
x0 P ( N ) x0 .
2
VN* =
Costo ptimo
finito.
No considera restricciones en la variable de control ni en los

Inconvenientes para
estados.
su aplicacin
Referencias bibliogrficas
No considera posibles perturbaciones (control off-line)
Goodgwin G.C., Seron, M.M. and De Don J.A. Constrained control and estimation.
Tabla 4.1. Resultados referentes al regulador cuadrtico lineal (LQR) de horizonte finito.
Parmetros de la funcin objetivo
F. Lewis. Optimal control. John Wiley & Sons 1986.
x ( k + 1) = Ax ( k ) + Bu ( k )
Sistema
Funcin objetivo
An optimization approach. Springer 2005.
x ( 0 ) = x0
V =
1
T
T
x ( k ) Qx ( k ) + u ( k ) Ru ( k )
2 k =0
Q 0 , R > 0 y simtricas
Penalizacin terminal.
Ecuacin algebraica
P = AT P PB BT PB + R
BT P A + Q
de Riccati (ARE)
Realimentacin de
estado ptima invariante en el tiempo
u ( k ) = K x ( k )
K ( k ) = ( BT P B + R ) BT PP A
1
con P solucin de la ARE
101
102
5.1.1. Importancia de las restricciones:
Parte II
Ms all de que los problemas reales presentan de hecho limitaciones en las entradas
5. Control predictivo basado en modelos
y salidas, la contemplacin explcita de restricciones en la estrategia de control, permite

usar las variables manipuladas en todo su rango, saturndolas cuando es necesario.
5.1. Ventajas y desventajas de MPC
Ntese que en muchos procesos es deseable que las entradas se mantengan en uno de
sus lmites para optimizar gastos energticos (por ej. vlvulas que regulan el suministro
La tcnica MPC es la nica tcnica avanzada de control que ha tenido un impacto

significativo en el control de procesos industriales. Su creciente xito se debe, esencialmente, a las siguientes virtudes (Maciejowsky, 2000, Camacho y Bordons 1999,
Mayne et al. 2000):
de un fluido costoso). Un control que slo se aparta de los lmites no es til en este
caso.
La presencia de lmites en las entradas cambia la naturaleza del sistema. Por ejemplo,
un sistema lineal inestable con restricciones en la entrada presenta un conjunto de per-
1. Posee una formulacin en el dominio del tiempo, flexible, abierta e intuitiva.
turbaciones bien definido, fuera del cual no es posible estabilizar el lazo con entradas
2. Trata problemas de control tanto lineales como no lineales, monovariados como
factibles.
multivariados e interactivos, utilizando la misma formulacin del controlador.
5.2. Formulacin bsica
3. Tiene en cuenta en su formulacin las limitaciones de los actuadores.

4. Permite operaciones en las proximidades de las restricciones (a diferencia de los
controles convencionales), lo que frecuentemente lleva a operaciones ms redituables.
El control predictivo basado en modelos, o MPC, es una variante de la teora general

de control basado en modelos que se enmarca dentro de los controladores ptimos, es
decir, aquellos en los que las actuaciones responden a la optimizacin de un cierto crite-
Entre las desventajas de esta tcnica de control, se pueden anotar las siguientes:
rio. Supngase que un proceso est representado por el siguiente modelo en variables de
1. En algunos casos se requiere el conocimiento de un modelo dinmico del sistema

suficientemente preciso.
estado
x ( k + 1) = Ax ( k ) + Bu ( k )
(5.1)
y ( k ) = Cx ( k )
(5.2)
2. El controlador requiere un algoritmo de optimizacin, por lo que slo puede implementarse por computadora.
3. Se requiere un alto costo computacional, lo que hace difcil su aplicacin a sistemas rpidos.
donde x
nx
, u
nu
e y
ny
Obsrvese que en el modelo (5.1)-(5.2), se presupone que el proceso opera en torno a
4. Resulta compleja la inclusin de incertidumbre en la formulacin.
un estado estacionario representado por ( u ss , y ss ) . De este modo, los vectores de entrada y salida representados en (5.1)-(5.2) son en rigor diferencias respecto de los valores
estacionarios. Esto es,
y ( k ) = y ( k ) y ss ,
103
u ( k ) = u ( k ) u ss ,
104
donde y y u representan los valores reales (esto es, los valores aplicados al proceso) de
pasado
la salida y la entrada respectivamente.
futuro
sp
Considrese ahora un controlador genrico, que para un dado instante k y un dado estado
actual
u ( k / k ) , u ( k + 1/ k ) ,
x (k ) ,
calcula
la
secuencia
de
controles
Y
control implementado al
tiempo k
salida predicha
, u ( k + m 1/ k ) que minimiza la siguiente funcin objetivo:

entrada manipulada
Jk
m 1
( y ( k + j / k ) y ) Q ( y ( k + j / k ) y ) + u ( k + j / k )
p
j =0
sp T
sp
Ru ( k + j / k ) ,
(5.3)
j =0
k+m-1
k+1
k+p
horizonte de control m
sujeta a una serie de restricciones, tanto de entrada como de salida, y donde p es el horisp
zonte de prediccin, m es el horizonte de control, y es la referencia o set point de la
horizonte de prediccin p
salida controlada, u ( k ) = u ( k ) u ( k 1) son los incrementos de entrada, Q y R son

matrices positivas definidas, y el argumento ( k + j / k ) , frecuente en la literatura de
MPC, denota la prediccin de la variable en cuestin en k+j, hecha en base a los datos
Figura 5.1: Entrada y salida a lazo abierto que conforman el costo que minimiza MPC a
conocidos en el tiempo k. Naturalmente, las predicciones de salida dependen del estado
cada instante.
actual x ( k ) , y del modelo definido en (5.1)-(5.2).
5.3. Modelos de prediccin
Ahora bien, de la secuencia de controles obtenida mediante la minimizacin de (5.3),

el controlador MPC slo implementa el primer valor, es decir, u ( k / k ) , y una vez
transcurrido el tiempo de muestreo, repite el clculo partiendo de k+1. Esto es lo que se
conoce como estrategia de horizonte deslizante (receding horizon), y busca en parte
Tomando en cuenta el modelo (5.1)-(5.2), interesa ahora saber cmo se conformarn

las predicciones del costo (5.3). De (5.1)-(5.2) se tiene que
y ( k + j / k ) = CA j x ( k ) + CA j 1 Bu ( k / k ) + CA j 2 Bu ( k + 1 / k ) +
+ CA j m Bu ( k + m 1 / k )
contemplar la posible entrada de perturbaciones al sistema. Ntese, adems, que en las
= CA j x ( k ) + C A j 1
predicciones dadas por (5.3) no se consideran las acciones de control que van desde el
tiempo k+m hacia delante, lo que dio origen a que estas predicciones se conozcan como
donde
predicciones de lazo abierto. De este modo, las predicciones no coinciden, en general,
u (k / k )
u ( k + 1/ k )
uk =
u ( k + m 1/ k )
con el comportamiento real de la salida del sistema, ni siquiera en el caso nominal en

que la planta es igual al modelo y no se consideran perturbaciones. Una representacin
grfica de los componentes que forman el costo (1.3) se muestra en la Figura 5.1.
A j 2
A j m Buk ,
m.nu
Para una representacin ms sencilla del costo (5.3), es posible expresar las predicciones en una forma matricial-vectorial, como sigue:
105
106
yk = Cd Apas x ( k ) + Cd Afut uk ,
pasado
(5.4)
futuro
donde
y (k + 1 / k )
y (k + m / k )
yk =
y ( k + m + 1 / k )
y ( k + p / k )
C
Cd =
0
p .ny
Apas
m
A
= m +1 ,
A
p
A
Afut
Am 1 B
= m
A B
p 1
A B
B
,
AB
p m +1
A
B
0
0
.
0
1
I M = I M , M = 0
0 0
0 0
0 0
1 0
0
0
1
0
1
0
m.nu m.nu
, I =

0
Utilizando (5.6) y definiendo R = diag ( R
m m.nu
R ) , el segundo trmino del costo (5.3)
puede ser escrito como:

m 1
u ( k + j / k )
j =0
Ru ( k + j / k ) = ( I M uk Iu ( k 1) ) R ( I M uk Iu ( k 1) ) .
T
(5.7)
Finalmente, de (5.5) y (5.7) se tiene que el costo (5.3) puede ser escrito como:
J k = ( Cd Apas x ( k ) + Cd Afut uk y sp ) Q ( Cd Apas x ( k ) + Cd Afut uk y sp )
T
y sp

sp
Utilizando (5.4) y definiendo y = , Q = diag ( Q
y sp

+ ( I M uk Iu ( k 1) ) R ( I M uk Iu ( k 1) )
T
Q ) , el primer trmino del
J k = ukT
{(C A
) Q (C
T
fut
Afut ) + I MT RI M uk + 2 ( Cd Apas x ( k ) y sp ) QCd A fut Iu ( k 1)

T
( y (k + j / k ) y ) Q( y (k + j / k ) y )
sp T
RI M } uk + ( Cd Apas x ( k ) y sp ) Q ( Cd Apas x ( k ) y sp ) + u ( k 1) I T RIu ( k 1)
costo (5.3) puede ser escrito como:

p
sp
j =0
= ( Cd Apas x ( k ) + Cd Afut uk y sp ) Q ( Cd Apas x ( k ) + Cd Afut uk y sp )
(5.5)
J k = ukT Huk + 2cTf uk + c .
(5.8)
Ntese que la funcin objetivo del problema de control ser cuadrtica en uk.
Otro tanto puede ser hecho con las entradas. En este caso, la secuencia de incrementos
5.4. Problema de optimizacin on-line de MPC
de entrada pude ser expresada segn:

Segn (5.8), el problema de optimizacin que resuelve MPC instante a instante es
u ( k / k )
u ( k + 1/ k )
uk =
= I u Iu ( k 1) ,
M k
u ( k + m 1/ k )
como sigue:
P1:
(5.6)
min ukT Huk + 2cTf uk

uk
sujeto a:
donde
umin u ( k + j / k ) umax
0 j<m
107
0 j<m
108
donde ahora aparecen incorporadas en forma explcita las restricciones tanto de entrada
yk = NAx ( k ) + DM uk
(5.10)
cmo de incrementos de entrada. Luego, la ley de control de MPC (que no siempre puede ser explicitada), saldr de aplicar la primera accin de control de la secuencia ptima
obtenida en P1.
5.5. DMC (Acrnimo derivado del ingls Dynamic Matrix Control)

Los controladores conocidos como DMC constituyen las primeras versiones de los
controladores MPC. Utilizan un modelo en variable de estado que tiene la siguiente
forma (se supone que el sistema es estable):
x ( k + 1) = Ax ( k ) + Bu ( k ) ,
(5.9)
donde
T
x (k ) = y (k / k )
y ( k + 1/ k )
y (k + n / k )
0
I ny
0
0
0
0
I ny
I ny
ny .( n +1)ny .( n +1)
s1
s
, B = 2

sn +1
y (k + 1 / k )
y (k + m / k )
yk =
y ( k + m + 1 / k )
+
/
y
k
p
k
)
(
s1
s
2
DM =
sm
s p
0
s1
sm 1
s p 1
u ( k / k )
u ( k + 1/ k )
p .ny
, uk =
u ( k + m 1/ k )
, N = I p
0 ,
0
0
(Matriz Dinmica, que da origen el nombre DMC).

s1
s p m +1
ne:
ny .( n +1)nu
J k = ( NAx ( k ) + DM uk y sp ) Q ( NAx ( k ) + DM uk y sp ) + ukT R uk

T
J k = ukT ( DMT QDM + R ) uk + 2 ( NAx ( k ) y sp ) QDM uk

T
+ ( NAx ( k ) y sp ) Q ( NAx ( k ) y sp )
sj: coeficientes de la respuesta al escaln en el instante j.
Observaciones:
As, redefiniendo H = ( DMT QDM + R ) y cTf = ( NAx ( k ) y sp ) QDM , el control

T
* En la representacin dada por (5.9) los estados corresponden a la trayectoria de salida si no se aplica ninguna accin de control. De este modo, la representacin de estado
QDMC (quadratic dynamic matrix control) se obtiene de la solucin on-line del siguiente problema de optimizacin:
es no-mnima.
* La representacin dada por (5.9) esta escrita en trminos de los incrementos de en-
P2:
min ukT H uk + 2cTf uk
trada.
uk
El controlador DMC tiene la misma funcin objetivo definida en (5.3). Sin embargo,
teniendo en cuanta el modelo (5.9), las predicciones de salida son ahora:
m.nu
y sp

Entonces, definiendo como antes y sp = , y substituyendo (5.10) en (5.3), se tie y sp

n: horizonte de estabilizacin del sistema (truncamiento),

0 I ny
0 0
A=
0 0
0 0
donde
109
sujeto a:
110
donde x representa el estado estimado, y representa la salida medida y L es la ganancia
0 j<m
del observador.
0 j < m.
La ecuacin (5.11) puede ser escrita como:
Ntese que la variable de decisin est ahora dada por u , dado que el modelo de
partida esta escrito en la forma incremental.
Para incluir una perturbacin medida en el esquema QDMC, la ecuacin (5.9) puede
x ( k + 1) = ( I LC ) Ax ( k ) + ( I CB ) u ( k ) + Ly ( k + 1) ,
donde aparece explicitada la evolucin del estado estimado respecto de s mismo. De

all se puede intuir que para que el observador sea estable, la matriz (I-LC)A debe ser
ser modificada segn:
Hourwitz, es decir, debe tener todos sus autovalores negativos 16.
sd ,1
s
d ,2
x ( k + 1) = Ax ( k ) + Bu ( k ) + Bd d ( k ) , donde Bd = .

sd ,n
Comentario:
Los controladores DMC originales utilizan un esquema de realimentacin que, traducido en trminos de observadores, hace que la matriz (I-LC)A no sea Hourwitz para sis-
Observaciones:
temas no estables. De all su incapacidad para trabajar con este tipo de sistemas.
* Los controladores DMC o QDMC son las versiones tempranas de MPC, y presen-
5.7. Observador en estado estacionario
tan una formulacin simple y transparente, que basa su desarrollo en modelos de simple
construccin (respuesta al escaln). Es por eso que la mayora de los controladores
Para un tiempo k = k suficientemente grande, y suponiendo al lazo en estado esta-
MPC que se utilizan actualmente en la industria son de este tipo.

* Como contrapartida de su simpleza, se debe mencionar que esta estrategia fue formulada tan slo para el caso de sistemas estables.
cionario, la ecuacin (3.1) se convierte en
xk = Axk + Buk + L yk C ( Axk + Buk )

,
(5.12)
* Adems, este tipo de controladores no garantiza la estabilidad del lazo cerrado.
pues en estado estacionario debe ser x ( k + 1) = x ( k ) , ya que el segundo es slo el pri-
5.6. MPC con realimentacin de salida
mero retrasado un instante de tiempo.

Ntese que si bien se asume un observador estable, nada hay en la ecuacin (5.12)
La forma en que se incorpora la realimentacin de salida en el esquema de MPC basado en modelos de espacio de estado, es actualizando el estado presente (del que depende la funcin costo) segn la ltima lectura de la salida de la planta. Esto se consigue por medio del siguiente observador 15:
x ( k + 1) = Ax ( k ) + Bu ( k ) + L y ( k + 1) C Ax ( k ) + Bu ( k ) ,
que obligue a que la salida predicha segn el estado estimado y el modelo (esto es
C ( Axk + Buk ) ) sea igual a la salida medida en el estado estacionario. La condicin de
estado estacionario slo implica que xk +1 = xk , lo que no significa que xk = Axk + Buk ,
porque el estado estimado no tiene porqu evolucionar segn A, B y C que son slo un
(5.11)
modelo. Esto significa que, en general, ser
L yk C ( Axk + Buk ) 0 ,
(5.13)
15
La ecuacin que se presenta corresponde a un observador actualizado, es decir, un observador que

estima el estado al tiempo k+1, utilizando la salida medida el tiempo k+1.
16
111
Ntese que dicha estabilidad no implica que la salida estimada sea igual a la salida medida.
112
lo que implica que las predicciones de salida en estado estacionario hechas en base a
De este modo se ha mostrado que la forma en que MPC elimina el offset es por medio
C ( Axk + Buk ) no sern precisas. sta es la razn por la cual los controladores MPC no
de la inclusin de modos integradores en el observador, y no por el mero hecho de que
garantizan en principio (ni aun usando modelos incrementales) la eliminacin de offset
los modos integradores aparezcan en el modelo de prediccin. Esto es as, porque las
predicciones en MPC estn basadas en el estado actual estimado, y si este estado no es
de salida.
preciso en cuanto a su capacidad de predecir salidas precisas, entonces aparecer nece-
5.8. Eliminacin de offset en MPC
sariamente offset.
Existe un caso particular en el que el mero hecho de que el observador se estabilice
provoca que la ecuacin (5.13) sea nula. Este es el caso en el que el modelo utilizado
Camacho, E and Bordons. Model Predictive Control (2nd ed.), Berlin: Springer
por el observador contiene modos integradores, esto es, estados que cumplen
(2004).
xi ( k + 1) = x i ( k ) + 0.u ( k ) .
Cano R. A. R. and D. Odloak. Robust model predictive control of integrating process.
Supngase ahora un modelo ampliado A , B , C que agrega estados integradores a los

ya existentes. De este modo, el observador tendr una ganancia ampliada dada por
Li
L = o , donde Li corresponde a la parte integradora agregada y Lo corresponde a la
L
parte original. La ecuacin (5.12) para los estados integradores es
Carrapio O. L. and D. Odloak. A stable model predictive control for integrating

process. Computers & Chemical Engineering, 29, 1089-1099 (2005).
De Don J. A, M. M. Seron, D. Q. Mayne and G. C. Goodwin. Enlarged terminal sets
guaranteeing stability of receding horizon control. System & Control Letters, 47,
57-63 (2002).
+ Bu
,
xki = xki + Li yk C Ax
k
k
Kerrigan, E. C. Robust Constraint Satisfaction: Invariant Sets and Predictive Control.
donde se remarca que el estado que no lleva el superndice, es el vector de estado completo, es decir, los estados originales ms los integradores. Ahora bien, esta ltima condicin implica que si Li es de rango completo, entonces
Journal of Process Conrol, 13, 101-104 (2003).
PhD thesis, University of Cambridge (2000).

Kerrigan, E. C. and J. M. Maciejowski. Invariant sets for constrained discrete-time
systems with application to feasibility in model predictive control. Proceedings of
+ Bu
=0,
y C Ax
k
k
k
the CDC (2000).
con lo que se logra la deseada igualdad entre salida predicha y salida medida. Ms aun,
cuando el trmino entre corchetes se anule, se tendr (segn la misma ecuacin (5.12),
Limn D. Control predictivo de sistemas no lineales con restricciones: estabilidad y

robustez. Tesis Doctoral, Universidad de Sevilla, Espaa, (2002).
Maciejowski J.M. Predictive Control with Constraints. New Jersey: Prentice Hall,
+ Bu
+ Bu
+ L y C Ax
,
xk = Ax
k
k
k
k
k
(2002).
=0
Mayne D. Q, J. B. Rawlings, C. V. Rao and P. O. M. Scokaert. Constrained model
lo que permite utilizar el modelo ampliado A , B , C para conocer los estados estimados
predictive control: Stability and optimality. Automatica, 36, 789814 (2000).
completos en su estado estacionario.
113
114
Michalska, H. & Mayne, D. Q. Robust receding horizon control of constrained

nonlinear systems. IEEE Transactions on Automatic Control, 38(11), 1623-1633
(1993).
Odloak D. Extended robust model predictive control. AIChE Journal, 50 (8) 18241836 (2004).
Rawlings J.B. and K.R. Muske. The stability of Constrained Receding Horizon
Control. IEEE Transaction on Automatic Control, 38, 1512 (1993).
Rodrigues M.A. and D. Odloak. MPC for Stable Linear Systems with Model
Uncertainty. Automatica, 39, 569-583 (2003).
Rodrigues M.A. and D. Odloak. An infinite horizon model predictive control for
stable and integrating process. Computer and chemical Engineering, 27, 11131128 (2003b).
Rossiter J.A. Model-Based Predictive Control. CRC Press (2003).
Scokaert P. O. M. and D. Q. Mayne. Min-Max feedback model predictive control for
constrained linear systems. IEEE Transactions on Automatic Control, 43(8),
1136-1142 (1998).
115
Dicho en pocas palabras, si un sistema (autnomo o a lazo cerrado) alcanza un con-
6. Estabilidad de los controladores predictivos
junto invariante positivo, entonces la evolucin del mismo ya no podr abandonarlo.
Definicin 2 (Mximo conjunto invariante positivo): El mximo conjunto invarianEl tema de la estabilidad es acaso uno de los ms caros a MPC, y gran parte de la literatura especializada de los aos 80s y 90s estuvo destinada a tratarlo. Recientemente,
te positivo para el sistema a lazo cerrado x ( k + 1) = f x ( k ) , ( x ( k ) )
se nombrar
la utilizacin de la teora de Liapunov conjuntamente con la teora de conjuntos inva-
, y viene dado por el mximo invariante positivo contenido en X , donde
riantes ha permitido arribar a una formulacin general que permite, si se atienden ciertas
condiciones, garantizar la estabilidad de los controladores predictivos. Si bien este pro-
{x ( k ) X : ( x ( k ) ) U }
cedimiento es puramente terico, y algo apartado de los objetivos prcticos del control,
es el subconjunto admisible de entrada de X ; es decir, X es el subconjunto en el cual
dos causas principales justifican su estudio: en primer trmino, su exposicin general
la ley de control satisface las restricciones de entrada.
conforma una parte sustancial del desarrollo histrico reciente de MPC, en tanto que,
asombrosamente, contiene como casos particulares a la mayora de las estrategias de
estabilidad restantes. En segundo lugar, su comprensin detallada facilita los desarrollos
referentes a la estrategia conocida como MPC de horizonte infinito, que son la base de
los controladores con estabilidad garantizada que se estn comenzando a utilizar en la
{x : A
x X , f Aj f x U ,
j = 0,1,
Definicin 3 (Conjunto invariante de control): Un conjunto
6.1. Definiciones preliminares
se dice inva-
riante de control para el sistema no autnomo x ( k + 1) = f ( x ( k ) , u ( k ) ) , si existe algu-
Las definiciones que siguen estn asociadas a un dado sistema, no autnomo, dado
n
. Adems, se considera que di-
cho sistema est restringido por el siguiente juego de restricciones de entrada y de esta-
na ley de control u ( k ) = ( x ) tal que sea un invariante positivo para el lazo cerrado
x ( k + 1) = f ( x ( k ) , ( x ) ) .
Ntese que a diferencia de la definicin de conjunto invariante positivo, en la que se
do:
considera un sistema lazo cerrado particular, en esta definicin slo se exige que exista
u ( k ) U
alguna ley de control tal que el conjunto en cuestin sea un invariante positivo. Si un
x (k ) X .
conjunto es un invariante positivo para x ( k + 1) = f x ( k ) , ( x ( k ) ) ; entonces ser un
Definicin 1 (Conjunto invariante positivo): Un conjunto
se dice invarian-
te positivo para el sistema a lazo cerrado x ( k + 1) = f x ( k ) , ( x ( k ) ) , si para todo

x ( 0 ) la evolucin del sistema es tal que x ( k ) para todo k 0 , y adems
u ( k ) = ( x ) U para todo k 0 .
control lineal dada por u = f x , el mximo conjunto invariante positivo est dado por:
donde A f = A B f .
industria.
por la forma general x ( k + 1) = f ( x ( k ) , u ( k ) ) , x
En el caso de sistemas lineales dados por x ( k + 1) = Ax ( k ) + Bu ( k ) , y una ley de
invariante de control para x ( k + 1) = f ( x ( k ) , u ( k ) ) .
Definicin 4 (Funcin de Lyapunov de control): Una funcin V :
se dice
que es una funcin de Lyapunov de control asociada al sistema (no autnomo)

x ( k + 1) = f ( x ( k ) , u ( k ) ) , si es definida positiva y satisface que
117
118
V ( x ) = min V ( f ( x, u ) V ( x ) ) 0
uU
* El clculo de la secuencia de conjuntos controlables puede obtenerse mediante:

Coi +1 ( X , ) = Q ( Coi ( X , ) ) X , con
para todo x de un dado entorno del origen.
es el conjunto de estados x para los cuales existe una actuacin admisible u U (que
caso
en
que
el
conjunto
sea
un
invariante
de
control.
As,
si
x ( 0 ) Coi ( X , )\ Coi +1 ( X , ) , entonces el sistema puede llevarse a en i pasos,

17
depender del estado x) tal que el sistema alcanza el conjunto en un solo paso:
{x ( k )
Co0 ( X , ) = .
* El conjunto Coi ( X , ) no tiene porqu estar incluido en Coi +1 ( X , ) , salvo en el
Definicin 5 (Conjunto a un paso): El conjunto a un paso del conjunto , Q ( ) ,
Q ()
pero no en i+1.
: u ( k ) U tal que f ( x ( k ) , u ( k ) ) .
La definicin de conjunto controlable puede ser extendida a sistemas en lazo cerrado

Esta definicin puede ser extendida a un sistema controlado por una ley de control
u ( k ) = ( x ) de la siguiente manera:
Q
()
{x ( k )
controlados por una ley de control u ( k ) = ( x ) de la siguiente manera:
Coi ( X , )
: ( x ( k ) ) U y f x ( k ) , ( x ( k ) ) .
siendo X
Teorema (Condicin geomtrica de invariante): Un conjunto es un invariante
{x ( 0) X
: x ( k ) X , para todo k = 0,
, i 1 y x ( i ) } ,
{x ( k ) X : ( x ( k ) ) U } .
En este caso, la primera de las propiedades enunciadas se transforma en:
de control si y slo si
CoI +1 ( X , ) = Q ( CoI ( X , ) ) X .
Q () .
Ntese que esta condicin tiene una interpretacin geomtrica. Una vez obtenido el con-
Definicin 7 (Conjunto admisible en i pasos): El conjunto admisible en i pasos,
junto Q ( ) (que puede calcularse por procedimientos geomtricos), basta con compro-
Ci ( X ) , es el conjunto de estados para los cuales existe una secuencia de actuaciones
bar si contiene al conjunto , para ver si este ltimo es un invariante de control.
admisibles tal que la evolucin del sistema permanece en el conjunto X durante los i
Definicin 6 (Conjunto controlable en i pasos): El conjunto controlable en i pasos,

Coi ( X , ) , es el conjunto de estados para los cuales existe una secuencia de actuacio-
instantes siguientes:
Ci ( X )
nes admisibles tal que conduce el sistema hasta el conjunto X en i pasos, con una
trayectoria admisible:
Coi ( X , )
{ x ( 0 ) X : para todo k = 0,1,
{ x ( 0 ) X : para todo k = 0,
, i 1, u ( k ) U tal que x ( k + 1) X } .
Definicin 8 (Conjunto estabilizable en i pasos): El conjunto estabilizable en i pasos al conjunto invariante (de control, o positivo segn una dada ley de control) X ,
es el conjunto de estados Si ( X , ) para los cuales existe una secuencia de actuaciones
, i 1, u ( k ) U
tal que x ( k ) X y x ( i ) }.
El conjunto controlable en i pasos indica los estados que pueden alcanzar un determi-
admisibles tal que conduce el sistema hasta el conjunto en i pasos, con una trayectoria admisible 18:
nado conjunto en i pasos con una evolucin admisible mediante una secuencia de actuaciones admisibles. Este conjunto depende naturalmente del nmero de pasos i, y da origen a una secuencia de conjuntos que poseen una serie de propiedades. A continuacin
se enuncian algunas que resultan de inters:
17
La notacin x X 1\ X 2 significa que el elemento x pertenece a X1 pero no a X2.

En rigor, el conjunto debe ser un invariante de control. Sin embargo, en la definicin de conjunto
estabilizable dada (asociada al sistema x ( k + 1) = f ( x ( k ) , u ( k ) ) ) se incluye tambin la posibilidad de
18
que sea un invariante positivo. Que sea un invariante positivo significa que lo ser respecto de una
119
120
Si ( X , )
{ x ( 0 ) X : para todo k = 0,
, i 1, u ( k ) U
N 1
VN ( x ( k ) , uk ) =
tal que x ( k ) X y x ( i ) }
i =0
Como se puede observar, la nica diferencia entre el conjunto estabilizable Si ( X , ) y

el conjunto controlable Coi ( X , ) es la condicin de que el conjunto debe ser un
conjunto invariante. A continuacin se enuncian algunas propiedades de los conjuntos
estabilizables que resultan de inters:
con
siendo X
{x ( 0) X
funcin de costo terminal destinada a penalizar el ltimo estado dentro del horizonte 19.
El costo propuesto depende tanto del estado inicial x ( k / k ) = x ( k ) como de la secuen-
u ( k + 1/ k )
T
u ( k + N 1/ k ) ;
(6.2)
VN* ( x ( k ) ) .
controlados por una ley de control u ( k ) = ( x ) de la siguiente manera:
( X , )
Q > 0 y R 0 , es el costo de etapa, N es el horizon-
y una vez alcanzado el ptimo, el costo pasa a depender slo del estado inicial,
La definicin de conjunto estabilizable puede ser extendida a sistemas en lazo cerrado
(6.1)
te de control (en este caso coincidente con el horizonte de prediccin) y F ( x ) es una
* Todo conjunto Si ( X , ) es un invariante de control.
( x ( k + i / k ) , u ( k + i / k )) + F ( x ( k + N / k )) ,
( x, u ) = xT Qx + uT Ru , con
uk = u ( k / k )
S0 ( X , ) = .
* Si ( X , ) Si +1 ( X , ) .
donde
cia de entradas futuras
* El clculo de la secuencia de conjuntos controlables puede obtenerse mediante:

Si +1 ( X , ) = Q ( Si ( X , ) ) X ,
: x ( k ) X , para todo k = 0,
El modelo de espacio de estado a partir del cual se hacen las predicciones vendr dado por la forma general x ( k + 1) = f ( x ( k ) , u ( k ) ) , aunque los modelos de inters sern
lineales e invariantes en el tiempo, es decir, la funcin f tomar la forma
, i 1 y x ( i ) } ,
f ( x ( k ) , u ( k ) ) = Ax ( k ) + Bu ( k ) .
{x ( k ) X : ( x ( k ) ) U } .
A continuacin se expondr una formulacin general de MPC que cuenta con todas
las condiciones para garantizar la estabilidad del lazo cerrado. Este resultado fue presen-
En este caso, la primera de las propiedades se transforma en:
tado por Mayne et al., 2000, y representa un punto de inflexin en la materia, en tanto
Si+1 ( X , ) = Q ( Si ( X , ) ) X .
que contiene como casos particulares a casi todas las formulaciones precedentes de
MPC estables. El problema general de MPC, en el que se incluyen todos los ingredien-
Adems, todo conjunto Si ( X , ) es un invariante positivo del sistema.
tes necesarios para abordar la demostracin de factibilidad recursiva y estabilidad asinttica, es el descrito por las siguientes ecuaciones:
6.2. Formulacin general MPC estable. Teorema de Mayne
19
El anlisis riguroso de la estabilidad de MPC se basa en la teora de control ptimo.

Por lo tanto en esta seccin se utilizar una formulacin ligeramente diferente de la que
se ha venido utilizando. Se partir de un costo general dado por
El costo general dado por (6.1) presenta, por provenir de la teora de control ptimo, algunas diferencias respectos de los costos definidos antes. En primer lugar, se considera aqu un nico horizonte, es
decir, el horizonte de control coincide con el de prediccin (m = p = N). En segundo lugar, se trabaja con
un costo de etapa asociado al caso de regulacin que es equivalente al caso de seguimiento de una referencia ysp si se considera la matriz de peso C T QC en lugar de Q, y se trabaja con variables desviacin
tanto para los estados como para las entradas. En el caso de seguimiento, el costo de etapa viene dado por
( x, u ) = ( x xs )
dada ley de control ( x ) . Si un conjunto es un invariante positivo para x ( k + 1) = f x ( k ) , ( x ( k ) ) ;

entonces ser un invariante de control para x ( k + 1) = f ( x ( k ) , u ( k ) ) .
121
C T QC ( x xs ) + ( u us ) R ( u us ) , donde xs y us son los targets estacionarios, y

T
adems y = Cxs . En tercer lugar, se considera un costo terminal F aplicado al ltimo estado dentro del
horizonte, lo que permite dar ms generalidad al tratamiento. En cuarto lugar, el subndice N del costo VN
refiere en este caso al (nico) horizonte de las predicciones.
sp
122
PrN ( x ) :
instante (k + j), solucin en x ( k ) , puede ser distinta a la actuacin ptima para ese
min VN ( x ( k ) , uk )
mismo instante en x ( k + 1) ; es decir, u * ( k + j / k ) u * ( k + j / k + 1) . Por tanto, las tra-
s.a
yectorias ptimas predichas en cada instante son distintas y, en consecuencia, la evolu-
uk
u ( k + j / k ) U
j = 0,1,
, N 1
x (k + j / k ) X
j = 0,1,
, N 1
(6.3)
cin del sistema en bucle cerrado difiere de la evolucin predicha en la resolucin del
sistema 21. Tan slo en el caso de horizonte infinito se verifica que la evolucin real co-
x (k + N / k ) X f
incide con la predicha, pues en ese caso se puede considerar que el horizonte no retro-
Los parmetros del controlador vienen dados por: un controlador local 20 f ( x ) que
gua el sistema de N hacia delante (en las predicciones), una regin terminal X f donde
opera el control local, un costo terminal F ( x ) , un costo de etapa
( x, u ) y un horizonte
N.
cede, y se puede aplicar el principio de optimalidad de Bellman.

En lo que sigue, se utilizar la siguiente notacin: sea una funcin ( x ) :
entonces se define: ( x, u ) ( f ( x, u ) ) ( x ) y [ +
u * ( k + 1/ k )
Sea una funcin costo terminal F : X f

control local f : X f
de
estados
ptimos,
nu
, un conjunto terminal X f y una ley de
que satisfacen:
T
u * ( k + N 1/ k ) , desechndose el resto de la
A1: X f es cerrado y 0 X f ,
secuencia. A su vez, la secuencia de actuaciones ptima se corresponde con una secuencia
( x, u ) .
Teorema 6.1 (Mayne et al. 2000)
problema parametrizado en x ( k ) . Haciendo uso de la estrategia de horizonte deslizante,
uk* = u * ( k / k )
( x, u ) +
Se establecen ahora las condiciones generales de estabilidad:
Este problema depende del estado del sistema en cada instante, siendo por tanto un
en cada instante k se aplica slo la primera actuacin ( u * ( k / k ) ) de la secuencia ptima
] ( x, u )
{ x ( k / k ) x ( k + 1/ k )
*
x* ( k + N / k )} ,
A2: f ( x ) U , x X f (se satisface la restriccin en las actuaciones en X f ),
donde
A3: X f es un invariante positivo para el sistema x ( k + 1) = f x ( k ) , f ( x ( k ) ) ,
x* ( k / k ) = x ( k ) . Dado que la solucin u * ( k / k ) depende del estado de la planta, la ley
de control del MPC viene dada implcitamente por
A4: [ F +
MPC ( x ( k ) ) = u * ( k / k ) .
] ( x, f ( x ) ) 0,
x X f ( F ( ) es una funcin local de Liapunov).
Entonces
Ahora bien, debido a que se supone que el modelo de prediccin es exacto, el estado
al que evoluciona el sistema es exactamente el predicho, esto es, x ( k + 1) = x ( k + 1/ k ) .
*
VN* + ( x, MPC ( x ) ) 0 ;
(6.4)
Pero, dado que el problema a resolver depende del estado, la actuacin ptima en el
21
controlador en un tiempo determinado, sino que, por el contrario, este cambio opera slo en las predicciones (Rossiter, 2003).
Esto significa que aun siendo los modelos exactos existir una discrepancia entre prediccin y comportamiento real. Este detalle, trivial a priori, tiene la siguiente consecuencia: no todo lo que le ocurre a las
predicciones (que comnmente se llaman lazo abierto), debe ocurrirle al sistema real. Por ejemplo, que
las predicciones en un dado instante k alcancen un conjunto en N pasos, no implicar que los estados del
sistema lo alcancen en esa cantidad de pasos, ya que al tiempo k+1 se habrn descartado muchas de las
actuaciones que lo lograban. En general, se puede decir que cuanto ms se aparten prediccin y comportamiento real, ms pobre ser el desempeo del controlador, ya que se estar optimizando sobre la base a
una prediccin deficiente.
20
La idea de utilizar un controlador local, es decir, un controlador que opere ms all del horizonte N en
las predicciones, proviene de lo que se conoce como control MPC de modo dual (Michalska y Mayne,
1993). En la Ecuacin (6.1), el costo terminal F es el que computa el costo de guiar el sistema con el
control local f ( x ) . Un detalle a tener en cuenta, es que el MPC dual no refiere a un cambio real de
123
124
es decir, el sistema controlado por la ley u ( k ) = MPC ( x ( k ) ) = u * ( k / k ) es asinttica-
ltima condicin implica a su vez que f ( x* ( k + N / k ) ) est definido y es admisible y
mente estable con un dominio de atraccin X N dado por todos los estados para los cua-
adems satisface que f x* ( k + N / k ) , f ( x* ( k + N / k ) ) X f , por ser X f un inva-
les existe una secuencia de N actuaciones admisibles tales que el sistema evoluciona
dentro de X hasta alcanzar el conjunto terminal X f . X N es, a su vez, un invariante po-
sitivo para el lazo cerrado x ( k + 1) = f x ( k ) , MPC ( x ( k ) ) .
riante positivo segn f (condicin A3). De todo lo anterior se deduce que uk +1 es una
secuencia factible para el problema en el tiempo k+1.
Ahora bien, el costo correspondiente a la secuencia factible que se acaba de describir,
Demostracin
VN ( x ( k + 1) ) , cumplir con
Factibilidad recursiva:
VN ( x ( k + 1) ) VN* ( x ( k ) ) =
( x ( k ) , u ( k / k )) + { ( x ( k + N / k ) , ( x ( k + N / k )))
*
( (
La factibilidad recursiva se fundamenta en el hecho de que X N es un invariante posi-
))
+ F f x* ( k + N / k ) , f ( x* ( k + N / k ) ) F ( x* ( k + N / k ) ) ,
tivo del sistema en lazo cerrado. Como el conjunto Xf es un conjunto invariante positivo
segn la ley de control local, entonces X N es el conjunto estabilizable en N pasos,
luego, de A4 se tiene
S N ( X , X f ) . Sea x ( k ) S N ( X , X f ) , entonces el estado siguiente puede alcanzar X f
VN ( x ( k + 1) ) VN* ( x ( k ) ) = ( x ( k ) , u * ( k / k ) ) + [ F +
( x ( k ) , u* ( k / k ) )
en N-1 pasos, por lo que x ( k + 1) = x ( k + 1/ k ) S N 1 ( X , X f ) S N ( X , X f ) . Por tanto,
] ( x* ( k + 1/ k ) , f ( x* ( k + 1/ k ) ) )
se verifica la condicin de conjunto invariante y el conjunto X N es un invariante positi-
por tanto, al ser siempre la solucin ptima al tiempo k+1 menor que una solucin facti-
vo del sistema en lazo cerrado.
ble, entonces
VN* ( x ( k + 1) ) VN* ( x ( k ) ) VN ( x ( k + 1) ) VN* ( x ( k ) )
Convergencia:
Sea uk* = u * ( k / k )
u * ( k + 1/ k )
T
u * ( k + N 1/ k )
el tiempo k, x* ( k + j / k ) , j = 1,
la solucin ptima en
, N la secuencia de estados predichos ptima y
VN* ( x ( k ) ) el costo ptimo correspondiente. Considrese ahora la secuencia uk +1 dada
por
( x ( k ) , u ( k / k )) .
*
De este modo se concluye que VN* ( x ) es una funcin de Liapunov, y el sistema es asintticamente estable.
6.3. Casos particulares. IHMPC y MPC Dual con LQR como

control terminal
uk +1 = u ( k + 1/ k )
u ( k + N 1/ k )
*
f ( x ( k + N / k ) ) ,
*
(6.5)
Resulta ahora interesante hacer algunos comentarios respecto a la formulacin prece-
es decir, una secuencia compuesta a partir de k+1 por los controles ptimos pasados, y
dente. Atendiendo fines didcticos, nos detenemos a analizar el caso sencillo de un sis-
completada con la actuacin que surge de aplicar el control local al estado terminal p-
tema
timo predicho al tiempo k. Al ser el problema de optimizacin factible al tiempo k, entonces tanto las actuaciones como los estados predichos satisfacen las restricciones, es
decir, u * ( k + j / k ) U , x* ( k + j / k ) X , j = 1,
, N 1 y x* ( k + N / k ) X f . Esta
125
lineal
( x, u ) = x
x ( k + 1) = Ax ( k ) + Bu ( k ) ,
un
costo
de
etapa
cuadrtico
Qx + u Ru . Un procedimiento a seguir para disear un controlador MPC es

T
el siguiente. En primer lugar se elige una ley de control local, u = f x , que sea esta-
126
Por otro lado, como el sistema estar controlado por la ley f a partir de N, entonces
bilizante. Esta ley de control determinar, junto con las restricciones de entrada U y de
estados X, una regin terminal X f , que vendr dada por el mximo conjunto invariante
positivo:
{x : A
x X , f Aj f x U ,
j = 0,1,
},
evolucionar
x ( k + j ) = Aj f x ( k ) ,
segn
A f = A B f
donde
adems
u ( k + j ) = f x ( k + j ) = f Aj f x ( k ) . De este modo el costo dado por (4.7) se convier(6.6)
donde A f = A B f .
te en
F ( x ( k )) = x ( k )
j =0
Esta regin ser en general tanto mayor cuanto ms conservador sea el control local.
QAj f x ( k ) + x ( k ) f Aj f
( ) (Q +
drtico lineal sin restricciones (LQR), f = K LQR , que se obtiene a partir de la ecuacin
T
f
R f Aj f x ( k )
R f ) Aj f x ( k )
= x ( k ) Qx ( k ) .
T
algebraica de Ricatti. En el primer caso, que es el que se utilizar concretamente en los
Para obtener esta matriz de ponderacin se utiliza la ecuacin de Liapunov. Esto es,
controladores propuestos en prximas secciones, y siempre que el sistema sea estable a

ser el mximo invariante positivo contenido en X del sistema con controles nulos; en el
T
= x ( k ) Aj f
j =0
Como casos extremos se puede considerar el control nulo, f 0 , y el regulador cua-
lazo abierto (o se cancelen oportunamente los modos no estables), la regin terminal
(A )
( ) (Q +
como la serie Q = Aj f
j =0
T
f
segundo, dicha regin vendr determinada por f , X y U, de suerte que cuanto ms
bilizante, entonces se cumple que 22
agresivo sea el control (ms grande sea Q en relacin a R) ms pequeo ser X f . Una
ATf QA f = Aj f
j =1
vez determinada la regin terminal, se puede componer el dominio de atraccin que
( ) (Q +
T
T
f
R f ) Aj f es convergente al ser el control local esta-
R f ) Aj f = Q ( Q + Tf R f ) .
(6.8)
depender naturalmente del horizonte N. Se puede demostrar que, como indica el senti-
Ntese que con esta eleccin para el costo terminal, la condicin A4 se satisface con
do comn, a mayor regin terminal mayor ser el dominio de atraccin.
igualdad. Esto es,
Volvamos ahora al caso de una ley de control (local) general. A partir de dicha ley se
debe calcular un costo terminal F ( x ) que satisfaga A4. Una alternativa para calcular
[ F + ] ( x, f ( x ) ) = F ( A
= xT Aj f+1
j =0
este costo es suponer un horizonte (cola, a partir de N) infinito sobre el que actuar el
) (Q +
T
( x,
x)
T
f
( ) (Q +
R f ) Aj f+1 x xT Aj f
j =0
T
f
R f ) Aj f x
= x ( Q + Tf R f ) x + xT ( Q + Tf R f ) x = 0, x X f ,
T
acotada. Adoptando esta alternativa, el costo terminal que penaliza los estados de N en
es decir, al tener una ley de control fija y un horizonte infinito, la trayectoria de estados
F ( x ( k ) ) = x ( k + j ) Qx ( k + j ) + u ( k + j ) Ru ( k + j ) .
T
x F ( x) +
( x , f x )
estados convergern asintticamente al origen y la suma de los trminos que restan ser
+ xT ( Q + Tf R f ) x
control local elegido. Al ser este control estabilizante y factible en X f , entonces los
delante vendr dado por:
se conserva de un instante al otro, de suerte que la diferencia entre ambas sumas infini(6.7)
j =0
tas es el primer elemento de la serie. Como este elemento coincide con el costo de etapa
22
No siempre es sencillo obtener una solucin a esta ecuacin cuando A f no es diagonal. En general, la
rutina de Matlab (dlyap) no da una solucin aceptable en estos casos.
127
128
de la formulacin general, entonces se cumple la condicin A4 con igualdad. Es intere-
demoran algunos pasos ms. Esto se debe a que se implementa la estrategia de horizonte
sante resaltar que lo anterior se cumple para cualquier control estabilizante, siempre y
deslizante, y lo que se predijo se lograra en el comienzo de la simulacin
cuando exista una matriz Q que satisfaga la ecuacin (6.8). Como se mencion, un caso
( x ( 0 ) = [8.2 0.28] ), no se alcanza luego en la implementacin real, pues en cada
de inters es el control nulo f 0 , que cumple con todo lo anterior siempre y cuando
instante k se van descartando los controles de k+1 hacia delante. Esto no invalida, sin
el sistema a controlar sea estable. Otro caso singular es el regulador cuadrtico lineal,
embargo, la demostracin de estabilidad de Mayne et al., 2000, pues lo nico que se
que vendr determinado por los pesos Q y R. En este caso, la penalizacin terminal
requiere all es la factibilidad en las predicciones, esto es, la factibilidad en el lazo abier-
viene dada por Q = P , siendo P la solucin de la ecuacin algebraica de Ricatti (ARE).
to.
Para visualizar todos los detalles enunciados en esta seccin, se realizar a continuacin
1.5
un ejemplo de simulacin.
Ejemplo de simulacin
Co1
Co2
Sea el siguiente sistema lineal (Kerrigan, 2000): A=[1 1; 0 1]; B=[0.5; 1], y los si-
( x, u ) = xT Qx + uT Ru , don-
x2
guientes parmetros del controlador MPC: costo de etapa:
Xf
0.5
Co3
de Q=[0.01 0; 0 0.01] y R=1; restricciones de entrada y de estado: 0.3 u ( k ) 0.3 ,

0.5} y horizonte N=2. Se utilizar
-0.5
como control local el regulador cuadrtico lineal obtenido a partir de las matrices de
-1
1 x2 ( k ) 1 ; regin terminal: X f = { x
: x
ponderacin Q y R dadas, y el costo terminal F ( x ) = xT Px (donde P es la matriz obte-
-1.5
-10
nida de la ecuacin algebraica de Ricatti). Una vez hecho esto, se calcula la regin ter-
-5
0
x1
10
minal, X f , que vendr dada por el mximo conjunto invariante positivo dado por (6.6).
Figura 6.1: Conjuntos controlables y evolucin de los estados a lazo cerrado para un
A partir de este conjunto, y tomando un horizonte N=3, se determinan los conjuntos
control MPC estable cuando el control local es un LQR.
establizables a 1, 2, y 3 pasos que conducen a esta regin terminal. Ntese que se habla
de conjuntos estabilizables porque ahora la regin terminal es un invariante positivo
para la ley de control local dada. Estos conjuntos, como se defini ms arriba, denotan
los estados que pueden ser llevados en 1, 2 y 3 pasos, respectivamente, por medio de
controles admisibles y a travs de trayectorias admisibles hasta X f . Pero que puedan
ser llevados en N pasos por algn control no implica que el control MPC lo har de esa
manera, pues como se dijo, no todo lo que ocurre en las predicciones ocurrir en el lazo
cerrado. Ms aun, puede ocurrir que lo ptimo para llegar al equilibrio no sea llegar
rpido a la regin terminal. En la Figura 6.1 se puede ver que algunas trayectorias de
Si se utilizase un regulador cuadrtico lineal (sin restricciones) fuera de la regin

terminal, entonces las restricciones, ya sean las de entrada o las de estado, se violaran 23.
De este modo, como el control MPC busca optimizar la trayectoria que lleva el estado
hasta X f , entonces, en su afn de asemejarse al ptimo, saturar alguna restriccin,
pero siempre respetndola. Y esta es una diferencia entre MPC y control ptimo; el control ptimo, para un par de matrices Q y R dadas, no puede guiar el sistema desde un
punto que est por fuera de X f , mientras que MPC s puede hacerlo porque contempla
las restricciones. Una vez dentro de la regin terminal, y dado que el control local utili-
estado alcanzan efectivamente la regin terminal en N=3 pasos, mientras que otras se
23
129
Eso dice precisamente la definicin de mximo invariante dada por (4.6).
130
zado por MPC es precisamente el control ptimo, ambos controladores tendrn idnti-
control LQR.
cas trayectorias. En resumen se puede decir que mientras las restricciones le impidan
asumir la ley de control ptima sin restricciones, K LQR , el control MPC har lo mejor
6.2 se muestra la evolucin del control ptimo tomando como estados iniciales los puntos [8.2 0.28] y [ 8.2 0.28] . All se puede ver como es violada la restriccin en el
segundo estado. El hecho, tan interesante, de que las trayectorias de ambos controles,
ptimo sin restricciones y MPC, coincidan dentro de X f se puede comprobar fcilmente en las simulaciones. Sin embargo, por razones de espacio sus grficas son omitidas.
En la Figura 6.3 se muestran las evoluciones de la entrada y los estados del sistema. En
lneas llenas aparecen las grficas correspondientes a MPC, y en lneas punteadas las
correspondientes al regulador cuadrtico lineal, cuando el estado inicial es
x ( 0 ) = [8.2 0.28] . Ntese cmo el control MPC satisface en todo momento las res-
tricciones. Por ltimo, en la Figura 6.4 se muestra la evolucin del costo en MPC que,
entrada
0
-0.5
0
10
x1
sistema est dentro de X f , aplicar la ley ptima sin restricciones K LQR . En la Figura
10
15
20
25
30
35
40
10
15
20
25
30
35
40
10
15
20
25
tiempo (seg)
30
35
40
0
-10
0
2
x2
posible para llegar a X f , saturando cuando sea necesario las restricciones; cuando el
0.5
0
-2
0
Figura 6.3: Evolucin de la entrada y los estados a lazo cerrado para un control MPC y
segn lo indica el Teorema 4.1, es estrictamente no creciente.
un control LQR.
1.5
Co1
2.5
Co2
Xf
0.5
Co3
costo
x2
2
0
1.5
-0.5
1
-1
0.5
-1.5
-10
-5
0
x1
10
0
0
Figura 6.2: Conjuntos controlables y evolucin de los estados a lazo cerrado para un
131
10
15
20
25
tiempo (seg)
30
35
40
132
Figura 6.4: Costo ptimo del lazo cerrado MPC.
0
d1,1
D =
0
dny ,1
i
d1,1
d1,0nu
, Di =
i
dny0 ,nu
dny ,1
6.4. MPC con estabilidad garantizada, aplicable a procesos industriales (IHMPC)
F = diag ( r1,1,1
En esta seccin se estudiar una serie de formulaciones basadas en la estrategia de
r 1,1,na
d
Dd = diag d1,1,1
costo terminal y horizonte infinito (IHMPC) desarrollada en Rawlings y Muske, 1993.
d
d1,1,
na
Estas formulaciones, sucesivamente presentadas en Rodrigues y Odloak, 2003, y Odloak, 2004, son extensiones que buscan desarrollar controles aplicables a sistemas reales. Dos caractersticas principales se destacan en ellas: trabajan en la forma seguimiento de MPC, es decir, se apartan del caso de regulacin originalmente presentado
J1
J
N = 2

Jny
nd nu
por Rawlings y Muske (debido a esto, se propone un modelo en su forma velocidad,

adaptado para su uso en predicciones de horizonte infinito); y trabajan sobre el caso
general de sistemas que contienen tanto modos estables como modos integradores.
El modelo que se utilizar en esta seccin viene dado por
x ( k + 1) = Ax ( k ) + Bu ( k )
=
0
r1,nu ,1
r1,nu ,na
d1,dnu ,1
1
Ji =
0
d1,i nu
, D 0 , Di
i
dny ,nu
rny ,1,1
d1,dnu ,na
0
0
0
0
0
ny nd , = 1
[
rny ,1,na
dnyd ,1,1
rny ,nu ,1
dnyd ,1,na
nu na nu
ny nu
rny ,nu ,na )
dnyd ,nu ,1
nd nd
dnyd ,nu ,na
nd nd
i = 1, , ny ,
1] nu na .
Este modelo es del tipo velocidad, y bien puede ser calculado a partir de la respuesta
y ( k ) = Cx ( k ) ,
al escaln del sistema, bien mediante una apropiada transformacin de similaridad de un
donde
presente en las aplicaciones reales, en que el sistema tiene modos estables e integrado-
xs
x = xd
i
x
modelo general de espacio de estado. Adems, considera el caso general, muchas veces
res.
nx
, nx = 2ny + nd , nd = ny.nu.na , x
s
0 t Iny
F
0
0
Iny
C = I ny
0ny ,
x =
d
x1,1,1
, x
ny .nu .na
, x
i
ny
La forma incremental de la entrada aporta nuevos modos integradores que se agregan

a los (modos integradores) originales del sistema. Es preciso, entonces, distinguir entre
Iny
A= 0
ny
d
x1,1,na
D + tD
, B = Dd F N
i
D
0
nx nx
s
s
x = x1
d
x1,2,1
s
xny ,
los modos integradores aportados por la forma velocidad del modelo, x s , y los modos
nx nu
, y = y1
yny ,
integradores originales del sistema, xi . Los estados restantes que conforman el modelo
se denominan x d , y representan los modos estables del sistema, es decir, aquellos que
i
i
x = x1
se anulan en el estado estacionario. Este desacople entre estados estables e integradores,
i
xny ,
y mejor aun, entre estados que corresponden al rgimen transitorio y estados que co-
d
x1,2,na
d
x2,1,1
rresponden al rgimen estacionario, proporciona ciertas condiciones favorables para la

d
x2,1,na
d
xny ,1,na
implementacin de MPC. Concretamente, el desacople entre estados (sumado al hecho
T
d
xny ,nu ,na
de que en general la matriz F es diagonal) hace que la ecuacin de Liapunov, necesaria

para computar el costo terminal del controlador, sea sencilla de resolver. Esto permite
133
134
calcular la matriz de peso terminal con una demanda computacional despreciable, facilitando cualquier cambio en la configuracin del controlador 24. Otra ventaja, ms obvia,
de salida, y m es el horizonte de control. Ntese que se supone que u ( k + j / k ) = 0

para j m .
es que al trabajar con un modelo en forma velocidad se torna innecesario conocer la

ganancia de estado estacionario para calcular la entrada que corresponde a una cierta
Adems, se consideran restricciones de entrada del tipo
referencia de salida. Esto es, no hay que calcular el valor de entrada us que cumpla
u ( k + j / k ) U ,
ysp = C ( I A ) Bus ,
umax u ( k + j / k ) umax
j
U = u ( k + j / k )
.
1
/
u
u
k
u
k
i
k
u
(
)
(
)
min
max
i =0
para luego restarlo a la ponderacin de entrada. Los incrementos de entrada, en este

caso, son siempre nulos en el estado estacionario.
j = 0, 1,
, m 1
(6.10)
(6.11)
Este problema corresponde a la estrategia de costo terminal y horizonte infinito des-
6.5. Necesidad de restricciones terminales
arrollada en Rawlings y Muske, pero adaptado al caso de seguimiento de referencias de

salida, es decir, la funcin objetivo penaliza los errores de salida y los incrementos de
Hasta aqu se describieron las virtudes que hacen al modelo apropiado para componer
las predicciones de un control MPC; ahora se pasar a enumerar algunos inconvenientes, y las soluciones propuestas para cada uno de ellos. La funcin objetivo que se busca
minimizar en el problema de optimizacin est dada por
m 1
j =0
donde
(6.9)
j =0
ny ny
es definida positiva,
nu nu
control nulo. Esto significa que los controles (para el caso estudiado los controles son
los incrementos de entrada) ms all del horizonte m sern cero, de suerte que los modos integradores que no hayan sido anulados para entonces, permanecern constantes en
V ( k ) = e ( k + j / k ) Q e ( k + j / k ) + u ( k + j / k ) R u ( k + j / k ) ,
T
entrada. El control local implementado por estos autores consiste, como se dijo, en el
es semi-definida positiva,
e ( k + j / k ) = y ( k + j / k ) y sp = Cx ( k + j / k ) y sp , x ( k / k ) = x ( k ) , es el error predi-
cho incluyendo el efecto de los movimientos de control futuros 25, y sp es la referencia
24
Por ejemplo, es posible alterar las variables que representan las salidas y las entradas.
Ntese que dada la forma del modelo utilizado, el error de salida puede ser escrito como
xsps ysp

e = Cx ysp = C ( x xsp ) , donde xsp = xspd = 0 . Esto se debe a que los estados xs representan preci xspi 0

las predicciones, es decir, no convergern a cero como lo requiere el cmputo del costo
terminal. De este modo, si los modos integradores nos son anulados oportunamente, el
costo ser no acotado, pues se recordar que a partir de m se computa un horizonte de
salida infinito. Esta dificultad del modelo y de la naturaleza integradora de la planta, si
ese fuera el caso, obligan a la inclusin de restricciones que anulen los estados integradores al final del horizonte m:
e s ( k ) + ( Dm0 D2i m ) uk = 0
( e ( k + m) = 0)
(6.12)
xi ( k ) + D1im uk = 0 ,
( x ( k + m) = 0)
(6.13)
25
samente la salida en estado estacionario, una vez que los modos xi se han anulado. De este modo, si se
x s ysp e s

utiliza el vector de estado x = ( x xsp ) = x d = x d en lugar del vector de estado original, el costo
xi xi
dado por (6.9) ser: V ( k ) = x ( k + j / k ) C QC x ( k + j / k ) +

j =0
m 1
u ( k + j / k )
R u ( k + j / k ) .
donde
e s ( k ) = x s ( k ) ysp
Dm0 = D 0
D 0
D2i m = 0 tD i
nym.nu
, D1im = D i
( m 1) tDi
D i
nym.nu
nym.nu
j =0
135
136
uk = u ( k / k )

T
T
u ( k + m 1/ k )
m.nu
6.6. Extensin del dominio de atraccin. Estrategia de dos eta-
Ntese que desde el punto de vista de la formulacin general de MPC, las ecuaciones
(6.12) y (6.13) representan restricciones terminales. Se pude decir, entonces, que la re-
pas de optimizacin
Para el caso que se estudia en esta seccin, la regin terminal viene dada por
gin terminal en este tipo de problemas viene dada por X f = { x : e = 0, x = 0} . Ahora
X f = { x : e s = 0, xi = 0} ; y debido al desacople existente entre los estados integradores
bien, con la inclusin explcita de las restricciones (6.12) y (6.13), el problema de opti-
y los estados estables, se puede afirmar que la regin terminal (y por tanto, el dominio
mizacin se puede escribir como:
de atraccin) resultante para cada tipo de estado ser independiente. Es decir, los esta-
Problema P1
dos integradores tendrn una regin terminal pequea, mientras que los estados estables
m 1
tendrn una regin terminal ilimitada.
min V1 ( k ) = e ( k + j / k ) Q e ( k + j / k ) + u ( k + j / k ) R u ( k + j / k )
uk
j =0
Ahora bien, el horizonte m es el parmetro que afecta ms directamente al costo com-
+ x d ( k + m / k ) Qx d ( k + m / k )
T
putacional de resolver el problema de optimizacin de MPC. Por esta razn, cuando se
(6.14)
busca controlar plantas cuyo tiempo de respuesta es moderado, este horizonte debe ser
pequeo. Por otro lado, cuando se requiere una operacin suave del sistema, los incre-
sujeto a:
mentos de entrada mximos se escogen pequeos para evitar saltos bruscos en las varia-
(6.10), (6.12) y (6.13),
bles manipuladas que, por lo dems, suelen tener lmites fsicos de funcionamiento. Es-
donde Q es la matriz de ponderacin terminal que se obtiene de la ecuacin de Liapu-
tas dos caractersticas hacen que la restricciones terminales sean difciles de cumplir.
nov
Por tanto, el dominio de atraccin de los modos integradores se ve reducido drsticamente, de modo que perturbaciones o cambios de referencia de magnitud moderada,
Q F T QF = F T T QF .
provocan conflictos entre las restricciones (6.10), (6.12) y (6.13). Rodrigues y Odloak,
Ntese que al estar anulados los modos integradores, el costo infinito que comienza
2003b, y Carrapio y Odloak, 2005, propusieron la inclusin de variables de relajacin
en k+m depender exclusivamente de los modos estables, por lo que ser acotado. Por
(en ingls, slack variables) en el problema de optimizacin, con el objeto de ampliar
esa razn, la ecuacin de Liapunov utiliza la matriz F, que es una matriz diagonal
26
de
el dominio de atraccin del controlador formulado por (6.9)-(6.13).
autovalores menores a 1, en lugar de la matriz completa A. Esta forma diagonal de la
Rodrigues y Odloak, 2003b, y Odloak, 2005, propusieron la inclusin de variables de
matriz F, como se dijo, hace mucho ms sencillo el cmputo de la matriz de pondera-
relajacin (en ingls, slack variables) en el problema de optimizacin, con el objeto
cin Q .
de ampliar el dominio de atraccin del controlador.
Mientras el problema de optimizacin permanezca factible, esta formulacin hereda

la garanta de estabilidad del controlador propuesto por Rawlings y Muske. Sin embargo, el problema principal de este controlador reside en el reducido dominio de atraccin
Problema P2
min V2 ( k ) = ( e ( k + j / k ) + ks + jt ki ) Q ( e ( k + j / k ) + ks + jt ki )
uk , ks , ki
j =1
que presenta, como se ver a continuacin.
m 1
+ u ( k + j / k ) Ru ( k + j / k ) + ksT S1 ks + kiT S2 ki
T
j =0
26
Esto es rigurosamente cierto slo si los polos del sistema son diferentes entre s.
137
138

(6.15)
Sea ki * , ua*,k
) la solucin ptima al Problema P4a, y considrese el incremento total
sujeto a:
u ( k + j / k ) U ,
m 1
j = 0, 1,
de entrada correspondiente a esta solucin:
, m 1 ,
ua* (k + j / k ) .
j =0
Este incremento total ptimo es pasado al segundo problema, que se resuelve en el
xi ( k + m ) + ki = 0 ,
mismo instante de muestreo que el anterior:
e s ( k + m ) + ks = 0 ,
Problema P3b
donde S1 y S2 son definidas positiva y ks
ny
y ki
nu
son variables slack. Ntese
que cuando el Problema P1 es factible, la solucin ptima a dicho problema es la solu-
min V4b ( k ) = e ( k + j / k ) + ks
ub , k ,ks
j =0
) Q (e (k + j / k ) + )
T
s
k
m 1
cin ptima del Problema P2 con ks = ki = 0 .
+ ub ( k + j / k ) Rub ( k + j / k ) + ks T S1ks
T
j =0
Es importante resaltar que, aunque la regin terminal relajada vara (disminuye) con
el tiempo, la formulacin garantiza la factibilidad recursiva. Ntese que si el problema
sujeto a:
es factible en un dado instante, entonces se puede elegir como secuencia de control la
ub (k + j / k ) U, j 0
secuencia anterior ms una accin de control nula, y de este modo asegurar que el problema permanecer factible.
e s ( k + m ) + ks = 0
Sin embargo, el problema P2, as formulado, no garantiza la convergencia de la salida
m 1
m 1
del sistema a su referencia. Una forma de lograr la deseada convergencia es dividiendo
j =0
j =0
el problema de optimizacin en dos:
min V4 a ( k ) = ki T S2 ki
(6.16)
ki ,ua , k
ub (k + m 1/ k )T .
La implementacin prctica de este controlador es como sigue. Primero se verifica si

el Problema P2 es factible, lo que se hace comprobando si existe una solucin a la ecuacin (6.13) que satisfaga (6.10). Si tal solucin existe, se implementa el control resultan-
sujeto a:
te del Problema P2; si, por el contrario, no se encuentra solucin, entonces se resuelve
ua (k + j / k ) U, j 0
el Problema P3a, y luego el P3b.
xi ( k + m ) + ki = 0
(6.17)
El controlador resultante del Problema P3 garantiza que la variable de relajacin ki

converge a cero en tiempo finito. De este modo, para una matriz S1 que satisfaga
donde
donde ub,k = ub (k / k )T
Problema 3a
ua ,k = ua (k / k )T
ub (k + j / k ) = ua* (k + j / k )
((
ua (k + m 1/ k )T .
S1 > tD i
139
) (( tD ) )
1 T
T
i 1
(
(
)
)
tD i 1
T
G QG + R
1
i
tD
140
se garantiza tanto la estabilidad del lazo cerrado como la propiedad de la factibilidad

recursiva. Una demostracin rigurosa de estas caractersticas puede verse en Odloak
(2002).
2005. Podra decirse que en este caso se han aprovechado las caractersticas del contro-
lador propuesto por Rawlings y Muske, 1993, para implementar una extensin eficiente
a casos aplicables en la prctica. El hecho de tener desacoplados los modos integradores

puros de los modos estables, y el hecho de que el control local sea el control nulo, hacen
que la restriccin terminal, en general excesivamente conservadora, se pueda ampliar
(relajar) de un modo sencillo. Ntese que ante al ausencia de cualquiera de estas propiedades, cualquier extensin de ese tipo deriva en un excesivo incremento de la complejidad del controlador (incremento de las variables de decisin en la optimizacin), y en
un aumento prohibitivo del costo computacional.

(1993).
(2004).





1136-1142 (1998).
57-63 (2002).
the CDC (2000).

141
142
Referencias bibliogrficas
7. Control predictivo robusto
7.1. Control predictivo robusto basado en desigualdades matriciales lineales (LMI)
(2004).

57-63 (2002).
the CDC (2000).

(2002).
(1993).
143
144
1136-1142 (1998).
145

Apunte de La Catedra Eletronica Industrial Apaisado

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Apunte de La Catedra Eletronica Industrial Apaisado

Uploaded by

Copyright:

Available Formats

Electrnica Industrial

UTN Facultad Regional Paran

APUNTES DE CATEDRA DE LA ASIGNATURA ELECTRONICA INDUSTRIAL

UTN Facultad Regional Paran

4.2. Optimizacin sin restricciones............................................................................. 62

UTN Facultad Regional Paran

UTN Facultad Regional Paran

1.1. Teora de control avanzado versus teora de control conven-

Teora de control conven-

Teora de control avan-

Dominio de las frecuencias

Slo funciones especficas

Permite el uso de una serie

Tipos de sistema conside-

de entrada: funciones im-

pulso, escaln, sinusoida-

lugar de funciones espec-

No permite tener en cuenta

Permite tener en cuenta las

las condiciones iniciales

Permiten el diseo de sis-

UTN Facultad Regional Paran

permiten sistemas de con-

de primer orden, para sis-

Descripcin del sistema

UTN Facultad Regional Paran

prueba y error, que no

Relacin polinmica entrada-salida

temas descriptos por ecuaciones diferenciales de

tas porciones de ste, como lo son los sistemas dinmicos.

orden n (ordenacin matri-

su conocimiento en un instante t = t0 , junto con el conocimiento de la entrada para t t0 ,

determina completamente el comportamiento del sistema para todo tiempo t t0 . De

Descripcin externa del

Descripcin interna del

este modo, el estado de un sistema dinmico en el tiempo t queda unvocamente deter-

minado por el estado al tiempo t0 y la entrada para t t0 , y es independiente de los esta-

Tabla 1.1. Comparacin entre la teora de control convencional y la teora de control

dos y entradas anteriores al tiempo t0.

temas biolgicos, sistemas econmicos, sistemas sociales y otros.

1.2. Conceptos fundamentales

El matemtico francs Pierre Simn de Laplace (1749-1827) afirmaba, categrico,

, xn ( t ) ) que determinan el estado del sistema dinmico. Ntese que las

que si se conociera la velocidad y la posicin de todas las partculas del Universo en un

variables de estado no necesitan ser cantidades fsicamente medibles u observables, si

bien es deseable que lo sean, segn ciertas condiciones de diseo de controladores.

Lo deca con estas elocuentes palabras:

, xn ( t ) son las n variables de estado que descri-

Estas variables de estado se representan en un vector denominado vector de estado,

sistema x ( t ) para cualquier tiempo t t0 , una vez que se obtiene el estado en t = t0 y se

el futuro as como el pasado estaran frente sus ojos.

especifica la entrada u ( t ) para t t0 .

Espacio de Estado. Es el espacio de n dimensiones, cuyos ejes estn formados por

por ms de cien aos su afirmacin pareci correcta y, ms an, la aplicacin literal de

esos conceptos al comportamiento humano condujo a la conclusin filosfica de que el

el comportamiento dinmico del sistema.

UTN Facultad Regional Paran

Ntese que en el anlisis en el espacio de estado se habla de tres tipos de variables,

UTN Facultad Regional Paran

UTN Facultad Regional Paran

2. Representacin de sistemas en espacio de estado

2.1. Representacin en espacio de estado de sistemas lineales en

den. Si los n elementos de un vector representan un conjunto de variables de estado,

2.1.1. Representacin en espacio de estado de sistemas de ecuaciones diferenciales lineales de orden n.