A. Rojas M - 2

CONTROL NO LINEAL MULTIVARIABLE
APLICACIONES EN TIEMPO REAL
ARTURO ROJAS-MORENO, Ph.D.
Modelado de Procesos Implementaci on en Tiempo Real Control Optimo Cuadr atico Control Adaptativo con Modelo Referencial Linealizaci on de la Realimentaci on Control con Modos Deslizantes Programas Fuente en MATLAB y LabVIEW
II
CONTROL NO LINEAL MULTIVARIABLE

APLICACIONES EN TIEMPO REAL
Copyright c 2007 Arturo Rojas-Moreno. Todos los derechos reservados. ISBN Queda rigurosamente prohibida la reproducci on total o parcial de esta obra por cualquier medio o procedimiento, sin la autorizaci on escrita del propietario del Copyright.
A la Memoria de mis Padres
Indice general
III
Prefacio 1. Modelado de Sistemas No Lineales 1.1. Modelado Empleando las Leyes de la F sica . . . . . . . . . . . . 1.1.1. Manipulador Rob otico de 1GDL . . . . . . . . . . . . . . 1.1.2. Manipulador Rob otico con Articulaci on El astica (MRAE) 1.1.3. Sistema P endulo InvertidoGr ua Puente . . . . . . . . . . 1.1.4. Sistema Tanque de Agua . . . . . . . . . . . . . . . . . . 1.2. M etodo de Las Ecuaciones de Lagrange . . . . . . . . . . . . . . 1.2.1. Las Ecuaciones de Lagrange . . . . . . . . . . . . . . . . . 1.2.2. Manipulador Rob otico Traslacional (MRT) . . . . . . . . 1.3. El M etodo de LagrangeEuler . . . . . . . . . . . . . . . . . . . . 1.3.1. El Procedimiento de DenavitHartenberg . . . . . . . . . 1.3.2. El Procedimiento de LagrangeEuler . . . . . . . . . . . . 1.3.3. Manipulador Rob otico Esf erico (MRE) . . . . . . . . . . . 1.4. PROBLEMAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5. Estructura en Tiempo Real . . . . . . . . . . . . . . . . . . . . . 1.6. Sistema de Control del Manipulador de 1GDL . . . . . . . . . . . 1.6.1. Generaci on de la se nal PWM . . . . . . . . . . . . . . . . 1.6.2. El Amplicador de Potencia . . . . . . . . . . . . . . . . . 1.7. Sistema de Control de Manipuladores de 2 y 3GDL . . . . . . . . 1.8. El Sistema de Control del Tanque . . . . . . . . . . . . . . . . . . 2. Control Optimo 2.1. Conguraci on del Sistema de Control Optimo . . 2.2. El Sistema Din amico No Lineal Multivariable . . 2.3. El Controlador PI de Realimentaci on de Estados 2.4. El Observador No Lineal Multivariable . . . . . . 2.5. Procedimiento de Dise no . . . . . . . . . . . . . . 3. Control Adaptativo con Modelo Referencial 3.1. Conguraci on ode un SCAMR . . . . . . . . . 3.2. Estabilidad v a el M etodo Directo de Lyapunov 3.2.1. Conceptos de Estabilidad . . . . . . . . 3.2.2. Funciones de Lyapunov . . . . . . . . .
VII
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
1 1 1 7 11 19 24 24 25 32 32 35 37 46 59 59 60 62 64 65 67 67 68 69 72 73 79 79 80 80 81
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
VI
INDICE GENERAL 3.2.3. Teoremas de Estabilidad de Lyapunov . . . . . . . . . 3.2.4. Teoremas del Conjunto Invariante . . . . . . . . . . . 3.3. SCAMR para Sistemas No Lineales de una Entrada . . . . . 3.3.1. Formulaci on del Problema y de la Ley de Control . . . 3.3.2. La Ley de Adaptaci on . . . . . . . . . . . . . . . . . . 3.3.3. ZonaMuerta para Evitar Corrimiento de Par ametros 3.4. SCAMR para Sistemas No Lineales Multivariables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 87 89 89 90 91 93 101 101 102 103 103 104 104 105 106 106 107 107 108 109 111 112 113 114
4. Linealizaci on por Realimentaci on de Estados 4.1. Herramientas de la Geometr a Diferencial . . . . . . . . . . . 4.1.1. Derivadas y Corchetes de Lie . . . . . . . . . . . . . . 4.1.2. Difeomorsmos y Transformaci on de Coordenadas . . 4.1.3. El Teorema de Frobenius . . . . . . . . . . . . . . . . 4.2. Linealizaci on por Realimentaci on. Caso: SISO . . . . . . . . . 4.2.1. Condiciones para Linealizaci on . . . . . . . . . . . . . 4.2.2. El Grado Relativo de un Sistema . . . . . . . . . . . . 4.2.3. Forma Normal SISO con Linealizaci on Exacta . . . . . 4.2.4. La Ley de Control SISO para Linealizaci on . . . . . . 4.3. Linealizaci on por Realimentaci on: Caso MIMO . . . . . . . . 4.3.1. Modelando Sistemas MIMO Cuadrados . . . . . . . . 4.3.2. Grado Relativo Total . . . . . . . . . . . . . . . . . . . 4.3.3. Forma Normal MIMO para Linealizaci on Exacta . . . 4.3.4. La Ley de Control MIMO Desacoplada . . . . . . . . . 4.4. Observadores No Lineales con Polos Prescritos . . . . . . . . 4.4.1. Observador SISO No Lineal con Polos prescritos . . . 4.4.2. Observadores MIMO No Lineales con Polos Prescritos 5. Control Deslizante 5.1. Control Deslizante para Sistemas de una Entrada . . . . . . . 5.1.1. Conceptos B asicos y Notaci on . . . . . . . . . . . . . . 5.1.2. Control deslizante para Sistemas de la Forma x(n) = 5.1.3. Control Deslizante para Sistemas de la Forma x(n) = 5.1.4. Rendimiento del Seguimiento vs. Errores de Modelado 5.2. Control Deslizante para Sistemas Multivariables . . . . . . . . 5.2.1. El Sistema a Controlar . . . . . . . . . . . . . . . . . . 5.2.2. La Supercie de Conmutaci on . . . . . . . . . . . . . . 5.2.3. Dise no de la Fuerza de Control Multivariable . . . . . . . Bibliograf a Indice alfab etico
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
119 . . . . . 120 . . . . . 120 fi + u . 123 fi + bu 128 . . . . . 131 . . . . . 131 . . . . . 131 . . . . . 132 . . . . . 132 139 142
Prefacio
Esta publicaci on est a dirigida a todos los profesionales, cient cos y especialistas interesados en familiarizarse con el dise no e implementaci on de sistemas de control no lineales multivariables operando en tiempo real. Este libro presenta y discute la simulaci on e implementaci on en tiempo real de varias conguraciones de sistemas de control no lineal con el prop osito de validar los procedimientos de dise no desarrollados en los cap tulos correspondientes. Los diversos estudios de simulaci on desarrollados en los cap tulos se realizan empleando el software MATLAB (usar versi on 5.3 o recientes), mientras que el software de adquisici on de datos y control en tiempo real est a escrito en c odigo LabVIEW versi on 7.1. El CD adjunto contiene todos los archivos desarrollados en este libro. Los programas escritos en c odigo LabVIEW permiten sintonizar en l nea y en forma interactiva los par ametros de los algoritmos de control, de modo tal que se pueda visualizar en tiempo real que el objetivo de control se cumple para cada caso, a saber, que las se nales de salida controladas sigan a las se nales de referencia, cumpliendo las especicaciones de dise no pre-establecidas. Los procedimientos de dise no e implementaci on de los sistemas de control no lineal desarrollados en este libro se pueden aplicar a una gran clase de procesos no lineales, tales como brazos rob oticos (manipuladores), aeronaves de alto rendimiento, veh culos espaciales, procesos qu micos, y otros. Al nal de cada cap tulo se propone un conjunto de problemas relacionados con el modelado, simulaci on y dise no del sistema de control para diversos procesos. Este libro emplea procesos prototipo para ser controlados en tiempo real: manipuladores (de uno o m as grados de libertad) y el sistema tanque de agua. En los manipuladores el objetivo de control es que sus posiciones angulares sigan posiciones angulares de referencia. Tales referencias pueden ser tambi en variantes en el tiempo (problema de seguimiento). En el caso del sistema tanque de agua, el objetivo de control es que la temperatura y nivel del l quido en el tanque sigan a referencias constantes. Espec camente, se controlar an en tiempo real los siguientes procesos (los cuales pueden ser vistos en la parte videos del CD adjunto a este libro): Manipulador de un grado de libertad (1GDL). Manipulador esf erico de 2GDL. Manipulador traslacional de 2GDL. Manipulador traslacionalesf erico de 3GDL. Sistema tanque de agua
VIII
Prefacio
Este libro est a organizado en los cap tulos siguientes: Cap tulo 1: Modelado de Procesos No Lineales. En este cap tulo se deducen los modelos matem aticos que representan la din amica de los procesos a ser controlados en tiempo real. Tales modelos matem aticos son necesarios para poder estimar los par ametros y estados del proceso y formular las leyes de control no lineal. Cap tulo 2: Implementaci on en Tiempo Real. Este cap tulo describe principalmente las estructuras en hardware de los sistemas de control no lineal multivariables implementados. Chapter 3: Optimal Control. El sistema de control o ptimo considerado combina un proceso no lineal pero linealizable, un controlador de realimentaci on de estados proporcional-integral y un observador no lineal para estimar los estados del proceso. El objetivo del sistema de control o ptimo es determinar una funci on de fuerza capaz de minimizar la diferencia entre el vector de salida del proceso y el vector de trayectorias deseadas, a pesar de la presencia de disturbios estoc asticos e incertidumbres en los par ametros del proceso. Cap tulo 4: Control Adaptativo con Modelo Referencial. Este sistema de control no lineal se compone principalmente de cuatro partes: el modelo de referencia, el controlador adaptativo, el proceso no lineal y el el mecanismo de adaptaci on. El modelo de referencia es un modelo din amico auxiliar empleado para especicar la respuesta deseada del proceso, mientras que el mecanismo de adaptaci on es un conjunto de bloques interconectados empleados para implementar la ley de adaptaci on, la cual modica los par ametros del controlador adaptativo en forma tal que el sistema de control adaptativo permanezca estable y que el error de seguimiento converja a cero a pesar de que existan cambios reales en los par ametros del proceso y disturbios externos. El m etodo directo de Liapunov se emplea en este contexto para garantizar estabilidad asint otica en el sistema dise nado. Cap tulo 5: Linealizaci on de la Realimentaci on. Los m etodos de la geometr a diferencial se pueden aplicar a procesos no lineales para determinar si tales procesos son linealizables por realimentaci on; esto es, si la descripci on din amica de un proceso en particular se puede hacer que parezca lineal despu es de de que se le haya aplicado una transformaci on de coordenadas apropiada y una realimentaci on no lineal de estados. Este cap tulo presenta el m etodo para llevar a cabo la linealizaci on de la realimentaci on con el prop osito de dise nar una ley de control desacoplada. Un observador no lineal con asignaci on de polos se emplea tambi en para estimar los estados del proceso. Cap tulo 6: Control con Modos Deslizantes. En un sistema de control con modos deslizantes la descripci on del proceso puede ser imprecisa. La metodolog a aplicada en este tipo de control incluye una ley de control de realimentaci on no lineal que est a conmutando en forma discontinua sobre una supercie que pertenece al espacio de estado del sistema. Si alguna trayectoria de estado originada en esta
IX
supercie, en respuesta al comportamiento natural de la din amica del sistema a lazo abierto, se trata de desviar de la supercie especicada, entonces se deben aplicar acciones de control para hacer retornar a dicha trayectoria a su estado anterior. Es posible modicar la ley de control adecuadamente a n de obtener acciones de control m as moderadas.
Arturo Rojas Moreno, Ph.D. ctlima@viabcp.com
Cap tulo 1
Modelado de Sistemas No Lineales

En general, el problema de control no lineal consiste en obtener las ecuaciones que gobiernan el sistema no lineal en la forma de un modelo din amico que permita especicar las leyes de control requeridas con el prop osito de lograr la respuesta deseada del proceso controlado. La construcci on del modelo din amico se basa en la aplicaci on de las leyes f sicas sobre el proceso, tales como la conservaci on de la energ a y las leyes de Newton. Los m etodos de dise no del controlador presentadas en los siguientes cap tulos se pueden aplicar a una gran clase de procesos no lineales, tales como manipuladores rob oticos, aeronaves de alto rendimiento, veh culos espaciales, procesos qu micos, entre otros. Algunos de estos procesos se proponen en la secci on Problemas de este cap tulo. Este trabajo emplea manipuladores de varios grados de libertad y el sistema tanque de agua a manera de prototipos para validar mediante experimentaci on varias estrategias de control no lineal. La din amica de una gran variedad de sistemas se puede describir mediante un conjunto de ecuaciones diferenciales no lineales. Las siguientes estrategias de modelado se emplean en este libro con la nalidad de obtener tales ecuaciones: aplicaci on de las leyes f sicas (secci on 1.1), aplicaci on de las ecuaciones de Lagrange (secci on 1.2) y el m etodo de LagrangeEuler (secci on 5). Los c odigos de los programas empleados en este cap tulo se encuentran en el CD adjunto a esta publicaci on.
1.1.
Modelado Empleando las Leyes de la F sica
A continuaci on se desarrollan algunos ejemplos de modelado de sistemas no lineales empleando las leyes de la f sica.
1.1.1.
Manipulador Rob otico de 1GDL
El manipulador rob otico de 1GDL (1 Grado De Libertad) mostrado en la gura 1.1 es uno de los procesos prototipo a ser utilizado en esta publicaci on para validar mediante experimentaci on los algoritmos de control empleados. Este proceso se compone de un subsistema el ectrico y un subsistema mec anico. El subsistema el ectrico comprende un servomotor D.C. (Direct Current) con codicador (encoder) de
posici on incorporado, el cual se emplea para medir la posici on angular del brazo del manipulador en cada instante de tiempo. El servomotor posee una caja de engranajes para reducir la velocidad en su eje de salida; de de esta manera, se facilita el control de posici on del manipulador. El subsistema mec anico consiste de un brazo accionado gracias al torque rotacional generado en el actuador (el servomotor D.C.). En el extremo del brazo rob otico se puede acoplar un efector nal, el cual puede ser una pinza para asir objetos, una herramienta para soldar, una herramienta para pintar, etc. En nuestro caso usamos una pinza con dos grados de libertad: un grado para rotar la pinza y otro para abrirla y cerrarla. Con prop ositos de modelado, vamos a suponer que el efector nal y su carga se pueden modelar mediante una masa mh variable. La tabla 1.1 describe las variables y los valores de los par ametros del manipulador mostrado en la gura 1.1. El manipulador de 1GDL es del tipo SISO (Single Input Single Output) ya que s olo posee una entrada: el voltaje de control u aplicado a la armadura del servomotor, y una salida: la posici on angular del brazo.
Figura 1.1: Manipulador rob otico de 1GDL.
Modelo del Subsistema Mec anico Para modelar el subsistema mec anico del manipulador empleamos la segunda ley de Newton para los movimientos lineal y rotacional. La aplicaci on de esta segunda ley se traduce en una ecuaci on de balance mec anico. Con respecto a la gura 1.1, la ecuaci on de balance mec anico en el eje del servomotor articulado al primer engranaje se formula como: 2 m = d m m + Bm m + Tg1 = d (1.1) Tm = Jm dt dt2 on viscosa donde Jm y Bm representan el momento de inercia y la constante de fricci on debido al primer del rotor, Tm es el torque del servomotor y Tg1 es el torque de reacci engranaje. Para los engranajes de reducci on del servomotor podemos formular: n= N2 m = N1 m = n n>1 (1.2)
1.1 Modelado Empleando las Leyes de la F sica
Tabla 1.1: Par ametros y variables del brazo rob otico de 1 GDL. S mbolo u KA Va Ra La ia Km Tm TL L Tg 1 Tg 2 Jm Jg JL Bm Bg BL mh mb L rh Vb Kb g N 1 , N2 n m m Kw Descripci on Voltaje de entrada al sistema Ganancia del amplicador Voltaje de armadura Resistencia de armadura Inductancia de armadura Corriente de armadura Constante del torque motor Torque motor Torque de carga Torque causado por pesos de la carga Torque de entrada a los engranajes Torque de salida de los engranajes Inercia del motor Inercia de los engranajes Inercia de la carga Constante de fricci on del motor Constante de fricci on en engranajes Constante de fricci on en la carga Masa del efector nal Masa del brazo Longitud del brazo Distancia al centro de masa del efector Voltaje contraelectromotriz Constante contraelectromotriz Aceleraci on de la gravedad o N de dientes de los engranajes Relaci on de engranajes (n = N2 /N1 ) Posici on angular del motor Posici on angular de la carga Velocidad angular de la carga Velocidad angular del motor Constante de elasticidad Valor 14.9 7.38 4.64102 31.071103 V H A N-m/A N-m N-m N-m N-m N-m kg-m2 kg-m2 kg-m2 N-m/rad/s N-m/rad/s N-m/rad/s kg kg m m V V/rad/s m/s2 Unidades V
1.9062106 3.5107 1.8338106 105 0.045 0.06377 0.776 0.02 31.0352103 9.81 N2 > N 1 19.741
m = n 5.02102
rad rad rad/s rad/s N-m/rad
La ecuaci on (1.2) es cierta debido a que el espacio angular recorrido por el engranaje de menor radio debe de ser n veces mayor que el espacio recorrido por el el engranaje de radio mayor. Por otra parte, el principio de la conservaci on de la energ a establece que el trabajo realizado por el engranaje de la izquierda debe ser igual al trabajo realizado por el engranaje de la derecha, es decir: Tg2 = Tg1 m = Tg1 n; Tg2 = nTg1 (1.3)
donde Tg2 es el torque de reacci on debido al segundo engranaje. El balance mec anico en el eje articulado al brazo del manipulador produce: + Bg + TL Tg2 = Jg (1.4)
on viscosa donde Jg y Bg representan el momento de inercia y la constante de fricci de la caja de reducci on respectivamente. El torque de carga TL se formula como (ver gura 1.2): + BL + L TL = JL L L = mb g sen + mh g (L + rh )sen = Q sen 2 L Q = mb g + mh g (L + rh ) 2 (1.5) (1.6)
on viscosa de donde JL y BL representan el momento de inercia y la constante de fricci la carga no lineal (brazo m as efector nal), g es la constante gravitacional, mb y mh denotan las masas del brazo y del efector nal (esta masa tambi en incluye la masa de la carga en el efector) respectivamente, y rh denota la distancia desde el extremo del brazo al centro de masa de mh . Para nes pr acticos asumiremos que rh 0. Notar en (1.5) que el torque L se debe a las fuerzas ejercidas por los pesos del brazo y de la esfera. As , el torque mb g L sen se debe al peso mb g del brazo, mientras que el 2 torque mh g (L + rh )sen mh g Lsen es causado por el peso mh g del efector, Las distancias L sen y (L + rh )sen Lsen son los correspondientes brazos de palanca 2 del brazo y del efector respectivamente. El momento de inercia JL de la carga es la suma del momento de inercia del brazo Jb m as el momento de inercia del efector Jh . Asumiendo que la masa mh est a concentrada en su C.M. (centro de masa), entonces: Jh = mh (L + rh )2 mh L2 (1.7)
Del mismo modo, asumiendo que la masa mb del brazo se concentra en su C.M., entonces: L 2 Jb = mb (1.8) 2 Sin embargo, si se considera que la masa del brazo est a distribuida a lo largo de su longitud, entonces debemos aplicar el teorema de los ejes paralelos, el cual establece que el momento de inercia de una masa m alrededor de un eje que no pasa por su centro de masa est a dado por: J = Jo + ma2 (1.9)
donde a es la distancia entre el eje que pasa por el centro de masa de m y el eje paralelo, y Jo es el momento de inercia alrededor del eje que pasa por su centro de masa. Aplicando el teorema de los ejes paralelos al brazo, el momento de inercia Jb con respecto al punto de articulaci on se formula como: 1 mb L2 + mb Jb = 12 L 2
2
1 = mb L2 3
(1.10)
Por simplicidad, sin embargo, emplearemos las f ormulas dadas en (1.7) y (1.8).
Figura 1.2: El brazo rob otico.
Empleando (1.5), (1.6), (1.4), (1.3) y (1.2) en (1.1) y operando se obtiene: + Beq + L = Jeq nTm = Jeq + Beq + Q sen donde: Jeq = n2 Jm + Jg + JL Beq = n2 Bm + Bg + BL Las expresiones de Q, Jh y Jb (tener en cuenta que JL = Jh + Jb ) se dan en (1.6), (1.7) y (1.8) respectivamente. Modelo del Subsistema El ectrico on de las variEl voltaje de armadura Va viene expresado por (ver la descripci ables y par ametros en la Tabla 1.1): Va = ia Ra + La dia + Vb dt (1.12) (1.11)
donde ia , Ra y La son la corriente, la resistencia y la inductancia en la armadura del servomotor respectivamente, y Vb es el voltaje de fuerza contraelectromotriz gobernado por la relaci on: Vb = Kb m = Kb n = Kb n (1.13)
donde Kb es la constante de fuerza contra-electromotriz y est a relacionado con la velocidad angular m del motor. El voltaje de armadura Va es: Va = uKA donde KA es la ganancia del amplicador. Conversi on de Energ a El ectrica en Mec anica La ecuaci on de conversi on en energ a el ectrica en mec anica es: Tm = Km ia donde Km es la constante del motor. Igualando (1.12) con (1.14) obtenemos: KA Kb n Ra dia = u ia dt La La La Empleando (1.15) en (1.11) y despejando = d/dt obtenemos: Beq d Q nKm = sen + ia dt Jeq Jeq Jeq Ecuaci on de Estado Las ecuaciones (1.16) y (1.17) describen el modelo no lineal del proceso. Eligienon angular), x2 = (velocidad angular) do como variables de estado: x1 = (posici y x3 = ia (corriente de armadura), se obtiene: x 1 = x2 x 2 = x 3 Beq Q nKm senx1 x2 + x3 Jeq Jeq Jeq nKb Ra KA = x2 x3 + u La La La (1.17) (1.16) (1.15) (1.14)
(1.18)
nal de control es u. donde la salida es la posici on x1 y la se En la Tabla 1.1 podemos observar que la inductancia de armadura La del servomotor es bastante peque na, de modo tal que puede despreciarse sin que se pierda exactitud en los resultados. Considerando el producto x 3 La = 0 en la tercera ecuaci on de (1.18) y despejando la corriente de armadura x3 obtenemos: x3 = KA nKb u x2 Ra Ra (1.19)
Reemplazando (1.19) en la segunda ecuaci on de (1.18), resulta entonces la ecuaci on de estado no lineal de orden dos del manipulador: x 1 = x2 x 2 = P senx1 Jeq Beq Ra + n2 Km Kb Jeq Ra
x2 +
nKm KA u Jeq Ra
(1.20)
1.1 Modelado Empleando las Leyes de la F sica Linealizaci on del Modelo no Lineal
Despreciando la inductancia La del servomotor, entonces, para desviaciones on peque nas de la posici on = x1 se cumple que senx1 x1 . Aplicando tal aproximaci en la ecuaci on (1.20) obtenemos una ecuaci on de estado lineal de la forma: = Ax + Bu x x 1 x 2 = 0 JQ eq
B R +n2 Km Kb eq a Jeq Ra
(1.21) x1 x2 + 0
nKm KA Jeq Ra
y la correspondiente ecuaci on de salida: y = Cx + Du = Ejemplo 1.1 Gracar la respuesta (la posici on angular ) del modelo no lineal de segundo orden y de los modelos lineales continuo y discreto derivados de dicho modelo. Para nes de an alisis asumir que la se nal de entrada u es de 1.4 voltios de magnitud, que BL = Bg y que el efector nal es una esfera de masa mh y de radio rh . En esta situaci on: 2 2 Jh = mh rh + mh (L + rh )2 5 Soluci on: El programa C3rpta.m determina tales respuestas (ver gura 1.3) as como tambi en las funciones de transferencia, la estabilidad, la controlabilidad y la observabilidad de los modelos lineales continuo y discreto. 1 0 x1 x2 + [0] u (1.22)
1.1.2.
Manipulador Rob otico con Articulaci on El astica (MRAE)
La gura 1.4 muestra el Manipulador Rob otico con Articulaci on El astica (MRAE) de 1GDL, el cual es simplemente un manipulador de un solo eslab on pero con articulaci on el astica. El efecto del acoplamiento el astico entre el eje de salida del servomotor con el brazo (o eslab on) del MRAE, se puede modelar mediante un resorte rotacional con constante de elasticidad Kw . En la gura 1.4, u denota el voltaje de entrada, (la salida del proceso) es on la posici on angular del brazo de longitud L y masa mb , m representa la posici angular del eje del actuador (el servomotor DC) antes de la caja de reducci on. Al extremo del brazo se puede articular un efector nal, como en el caso del manipulador de 1GDL. La tabla 1.1 tambi en describe las variables y los valores de los par ametros del sistema mostrado en la gura 1.1. Ecuaciones Din amicas del MRAE El balance mec anico en el eje del servomotor articulado al primer engranaje se expresa como: m + Bm m + Tg1 Tm = Jm
8
0.8 0.6 0.4 0.2 0 6 y(t) LINEAL [rad] 4 2 0 6 y(k) LINEAL [rad] 4 2 0 0 50
y(t) NO LINEAL [rad]
100
150
50
100
150
50 Tiempo en segundos
100
150
Figura 1.3: Respuestas de los modelos no lineal, lineal continuo y lineal discreto del brazo rob otico a una entrada u escal on de magnitud 1.4 voltios.
Jm Ra
+ + +
Tm
Tg1
u KA
Va -
Vb La m Bm Gearbox Jg
M2 mH JL BL m n Bg K n Tg2
L m
Ia
Figura 1.4: Manipulador Rob otico con Articulaci on El astica (MRAE).
donde Jm y Bm representan el momento de inercia y la constante de fricci on viscosa del rotor, Tm es el torque del servomotor y Tg1 es el torque de reacci on debido al primer engranaje. El balance mec anico del eje articulado a la carga se expresa como: Tg2 = Jg m m + Bg + Kw n n m n
m es el torque originado por el acoplamiento el astico, Tg2 es el en donde Kw n torque debido al segundo engranaje, n = N2 /N1 denota la relaci on de transmisi on de los engranajes, y Jg y Bg representan el momento de inercia y la constante de fricci on
viscosa de la caja de reducci on respectivamente. Asumiendo engranajes ideales, la conservaci on de la energ a requiere que el trabajo realizado por cada engranaje debe de ser el mismo, a saber: m Tg 1 m = Tg 2 n Empleando las relaciones anteriores, la ecuaci on que gobierna el torque servomotor se formula como: Tm = Jeq n m n + Beq n m n + Kw n m n (1.23)
Jeq = n2 Jm + Jg
Beq = n2 Bm + Bg
La ecuaci on que gobierna la din amica del brazo del manipulador se puede expresar como: m + BL + 1 mb gLsen + mh gLsin Kw = JL (1.24) n 2 on viscosa donde JL y BL representan el momento de inercia y la constante de fricci de la carga no lineal (brazo m as efector), g es la constante gravitacional, mb y mh (esta masa tambi en incluye la masa de la carga) denotan la masa del del brazo y del efector respectivamente y, 1 2 mb gLsen y mh gLsin son los torques debido a los pesos del brazo y del efector respectivamente. El momento de inercia de JL = Jh + Jb , asumiendo que las masas mh y mb se concentran en sus respectivos C.M. se da en las ecuaciones (1.7) y (1.8): L 2 JL = mh L2 + mb 2 Para completar el modelado de la parte el ectrica del proceso MRAE, podemos aseverar que: dia Ra ia + La + Vb = KA u (1.25) dt donde KA es la ganancia del amplicador y Vb es el voltaje de la fuerza contra electromotr z y responde a la relaci on: m Vb = Kb (1.26)
donde Kb es la constante de fuerza contra electromotriz. El torque servomotor Tm es tambi en proporcional a la corriente ia , es decir: Tm = Km ia donde Km es la constante del servomotor. Modelo de Lagrange del MRAE Empleando las ecuaciones (1.23) y (1.24), el modelo de Lagrange del MRAE se puede formular como (ver por ejemplo ( 1.113)): T = H q + Cq +d (1.28) (1.27)
10 donde: Jeq Tm n = 0 0
0 JL
m n
Beq n
0 BL
m n
Kw n
m n
d2
d2 =
1 mb + mh Lg sin Kw 2
m n
Despreciando la inductancia de armadura La en (1.25), y despejando ia se obtiene: ia = Kb KA u m + Ra Ra (1.29) el modelo de Lagrange d1 d2 m n (1.30)
Sustituyendo ia en Tm = Km ia de (1.28) y despejando u, toma una nueva forma: m m 0 u p m11 0 11 n n = + 0 JL 0 BL 0 m11 = Ra Jeq nKA Km p11 = Ra Beq nKb + KA nKA Km d1 =
Ra Kw nKA Km
Modelo en el Espacio de Estado del MRAE , x3 = m /n, x4 = Seleccionando como variables de estado: x1 = , x2 = m /n, y x5 = ia , entonces el vector de estado del sistema es de orden 5. Luego, las ecuaciones (1.23), (1.24) y (1.25) (sin despreciar la inductancia La ) producen la siguiente ecuaci on de estado no lineal: x 1 f1 (x, u) x f2 (x, u) 2 = 3 x (1.31) x = f (x, u) = f3 (x, u) x f4 (x, u) 4 x 5 f5 (x, u) f1 (x, u) = x2 Kw BL Kw Lg mb + mh sen x1 f2 (x, u) = x1 x2 + x3 JL JL JL JL 2 f3 (x, u) = x4 Beq Kw Kw nKm f4 (x, u) = x1 x3 x4 + x5 Jeq Jeq Jeq Jeq nKb Ra KA f5 (x, u) = x4 x5 + u La La La 3 = x4 . Si la salida del sistema es donde hemos usado el hecho de que x 1 = x2 y x y = , entonces la ecuaci on de salida del MRAE resulta: y = h(x) = Cx = [1 0 0 0 0] x (1.32)
11
Despreciando la inductancia de armadura La en (1.31), lo que equivale a eliminar un elemento almacenador de energ a independiente (por consiguiente, eliminar una variable de estado), entonces: La x 5 = 0 = nKb x4 Ra x5 + KA u Reemplazando x5 en la cuarta ecuaci on de no lineal de orden 4: x 1 x 2 = x 3 x 4 x5 = nKb KA x4 + u Ra Ra
(1.31), se obtiene una ecuaci on de estado f1 (x, u) f2 (x, u) (1.33) f3 (x, u) f4 (x, u)
f1 (x) = x2 Kw BL Kw Lg m + mH sin x1 f2 (x) = x1 x2 + x3 JL JL JL JL 2 f3 (x) = x4 Kw Kw n2 Km Kb Beq nKm KA x4 + f4 (x) = x1 x3 + u Jeq Jeq Jeq Ra Jeq Jeq Ra La salida del sistema en este caso se expresa como: y = h(x) = Cx = [1 0 0 0] x (1.34)
1.1.3.
Sistema P endulo InvertidoGr ua Puente
El sistema p endulo invertidogr ua puente consiste de una varilla met alica montada sobre un carro que se desplaza sobre rieles. Cuando la varilla toma la posici on vertical hacia arriba (posici on inestable), entonces el sistema se denomina p endulo invertido. Si la posici on de la varilla es vertical y hacia abajo (posici on estable), el sistema se conoce como gr ua puente. La tabla 1.2 muestra la descripci on de las variables y par ametros para los sistemas p endulo invertido y gr ua puente. Los valores de tales par ametros se obtuvieron de las hojas de especicaciones y mediante experimentaci on.
Sistema P endulo Invertido

El sistema p endulo invertido consiste de un p endulo (una varilla) montado sobre un carro que se desplaza en forma horizontal. Este carro est a impulsado por un servomotor D.C. a trav es de un sistema de poleas, tal como se muestra en la gura 1.5. Para mayor claridad, el sistema p endulo invertido se ha separado en dos subsistemas: el subsistema conformado por el carro y el p endulo y el subsistema conformado por el motor y las poleas. Modelado del Subsistema CarroP endulo El subsistema carrop endulo se ilustra en la gura 1.6 y est a conformado por un carro y una varilla met alica jada al carro por medio de un pivote m ovil. Observar que los centros de gravedad de la varilla zv y de la esfera ze se ubican en:
12
Tabla 1.2: Variables y par ametros valorados para el sistema p endulo invertidogr ua puente. S mbolo u KA Va Ra La ia Km Tm Tg 1 Tg 2 Jm Jg Jp Je Jv Bm Bg F me mb L re rp mv mc mp z lv le ze zv ye yv Vb Kb g N 1 , N2 n= m m Descripci on Voltaje de entrada al sistema Ganancia del amplicador Voltaje de armadura Resistencia de armadura Inductancia de armadura Corriente de armadura Constante del torque motor Torque motor Torque de entrada a los engranajes Torque de salida de los engranajes Inercia del motor Inercia de los engranajes Momento de inercia de la polea Momento de inercia de la esfera Momento de inercia de la varilla Constante de fricci on del motor Constante de fricci on en engranajes fuerza aplicada al carro Masa de la esfera (no se us o) Masa del brazo Longitud del brazo Radio de la esfera Radio de la polea Masa de la varilla Masa del carro Masa de la polea Posici on del carro Longitud de la varilla Distancia entre P y la esfera Posici on horizontal (esfera) Posici on horizontal (varilla) Posici on vertical (esfera) Posici on vertical (varilla) Voltaje contraelectromotriz Constante contraelectromotriz Aceleraci on de la gravedad o N de dientes de los engranajes Relaci on de engranajes (n = N2 /N1 ) Posici on angular del motor Posici on angular del p endulo Velocidad angular de la carga Velocidad angular del motor Valor 14.9 7.38 =0 31.071103 V H A N-m/A kg-m kg-m kg-m kg-m2 kg-m2 kg-m2 kg-m2 kg-m2 N-m/rad/s N-m/rad/s N kg kg m m m kg kg kg m m m m m m m V V/rad/s m/s2 Unidades V
1.9062106 =0
1.8338106 =0 0 0.06377 0.776 0.02 0.0648 0.063095 0.92 0.2 0.767
31.0352103 9.81 N2 > N 1 19.741
rad rad rad/s rad/s

+ Fuerza de u control Servomotor D.C. y
13
Pendulo F Carro
Figura 1.5: Sistema p endulo invertido.

y z y
l v /2 0 P
11 00 00 11 00 11
me g mvg le lv z z F
Figura 1.6: Subsistema carrop endulo. ze = z + le sen zv = z + lv sen 2 (1.35)
Para simplicar el procedimiento de modelado del p endulo, aplicaremos las leyes de Newton para los movimientos lineal y rotacional, considerando al p endulo como un todo. Para el movimiento lineal, dicha ley establece que para un sistema de N part culas: N M d2 mi 2 ri = Fj (1.36) dt
i=1 j =1
donde mi es la masa de la i- esima part cula, ri es el vector posici on del centro de esimo vector fuerza aplicada al sistema de masa de la i- esima part cula y Fj es el j- partculas. Aplicando la ecuaci on (1.36) a nuestro sistema en la direcci on z obtenemos: mc d2 d2 d2 z + m z + m e 2 e v 2 zv = F dt2 dt dt (1.37)
Sustituyendo ze y zv (ecuaci on (1.35) en (1.37)) resulta: mc lv d2 d2 d2 z + m ( z + l sen ) + m (z + sen ) = F e e v 2 2 2 dt dt dt 2 (1.38)
14 Desarrollando las derivadas se obtiene: (mc + me + mv ) z (me le + mv
lv 2 (me le + mv lv )(cos ) = F )(sen ) + 2 2
(1.39)
Para completar el modelado, usamos la segunda ley de Newton aplicada al movimiento rotatorio alrededor del punto pivote P del carro. Esta ley establece que para un sistema de N part culas en movimiento rotacional con respecto a un sistema de referencia inercial, y sometidas a M torques externos perpendiculares al plano de giro, se cumple que: N M d 2 i Ji 2 = j (1.40) dt
i=1 j =1
esimo torque externo, Ji es el momento de inercia de la i- esima masa donde j es el j- respecto al punto pivote P y i es el angulo recorrido por la i- esima masa alrededor del punto P. Para aplicar la ley al movimiento rotatorio de la varilla alrededor del punto P, empleamos la tercera ley de Newton de acci on y reacci on, la cual nos permite formular el efecto de la aceleraci on del p endulo en el sistema de referencia Z Y (ver gura 1.6), mediante una fuerza mi z aplicada en el centro de masa de dicho sistema, pero en direcci on opuesta a la aceleraci on. Empleando (1.40) en el p endulo de gura 1.6 obtenemos: lv = me gle sen + mv g lv sen me z le cos mv z cos (Je + Jv ) 2 2 (1.41)
v Observar en (1.41) que los torques me gle sen y mv g l2 sen actuando en P son producidos por los pesos me g y mv g respectivamente, mientras que los torques de reacv ci on me z le cos y mv z l2 cos, actuando ambos tambi en en P, son producidos por las fuerzas de reacci on me z y mv z respectivamente. Reordenando (1.41):
(me le + mv donde:
lv lv )g (sen ) (me le + mv ) z (cos ) = (Je + Jv ) 2 2

2 Je = me le
(1.42)
2 lv (1.43) 3 El momento de inercia de Je con respecto al punto de giro P asume que la masa me est a concentrada en un punto, por ello basta multiplicar la masa me por su distancia al punto P elevado al cuadrado. Para el caso de la varilla, la expresi on dada en Jv corresponde al momento de inercia de una varilla girando por uno de sus extremos (el punto P).
Jv = mv
Modelado del Subsistema MotorPolea El subsistema motor-polea se muestra en la gura 1.7. Sabemos que el voltaje contraelectromotriz es proporcional la velocidad angular m : m Vb = Kb El voltaje de armadura Va se expresa como: Va = KA u = Ra ia + La dia m + Vb = Ra ia + Kb dt La =0 (1.45) (1.44)
15
En la relaci on (1.2) se estableci o para los engranajes de reducci on de un servomotor: n= N2 m = N1 m = n n>1
El torque motor Tm debe vencer a su inercia y al torque Tg1 a la entrada del del tren de engranajes: m + Bm m + Tg1 = nJm + nBm + Tg 1 Tm = Jm (1.46)
Asumiendo engranajes ideales, la conservaci on de la energ a requiere que el trabajo (torque por posici on angular) realizado en cada engranaje sea el mismo: Tg1 m = Tg1 n = Tg2 nTg1 = Tg2 (1.47)
El torque Tg2 a la salida del tren de engranajes debe vencer a la inercia Jg de los engranajes, a la inercia Jp de la polea y al torque de polea F rp (rp es el radio de la polea): + Bg + Jp + Bp + F rp = nTg1 (1.48) Tg2 = Jg Sustituyendo (1.48) en (1.46) se obtiene: + Beq + F rp nTm = Jeq donde: Jeq = Jm + n2 (Jg + Jp ) Beq = Bm + n2 (Bg + Bp ) (1.49)
Para transformar el desplazamiento angular del servomotor en el desplazamiento horizontal z del carro, empleamos: z = rp (1.50)
El torque producido en el eje del servomotor es proporcional a la corriente de armadura: Tm = Km ia = 1 + Beq + F rp = 1 Jeq n n Jeq z z + Beq + F rp rp rp (1.51)
Despejando ia de (1.45), sustituy endola en (1.51) y luego despejando F de la relaci on resultante se obtiene: F = Jeq nKm KA u 2 z Ra rp rp Beq n2 Km Kb + 2 2 n 2 rp Ra rp z (1.52)
Ra Va Vb La
m Jo Jm Bm Bo rp F
u
-
Figura 1.7: Subsistema motor-polea.
16 Igualando (1.39) con (1.52) resulta:
Beq n2 Km Kb z = + 2 2 rp Ra rp lv 2 + (me le + mv lv )(cos ) (1.53) (mc + me + mv ) z (me le + mv )(sen ) 2 2 Jeq nKm KA u 2 z Ra rp rp Las ecuaciones (1.42) y (1.53) representan el modelo din amico no lineal del sistema p endulo invertido controlado por la corriente de armadura. Tales ecuaciones pueden ser escritas en forma compacta como: 2 + M2 (cos ) Kx KA u + Bx z z M2 (sen ) =0 (M1 + J2 ) = 0 (cos ) J1 M2 g (sen ) M2 z donde: M1 = mc + me + mv ; Jeq ; 2 rp M2 = me le + mv nKm ; Ra rp lv ; 2 J1 = Je + Jv
(1.54)
J2 =
Kx =
Bx =
Beq n2 Kb Km + 2 2R rp rp a
Representaci on en el Espacio de Estado , x3 = z y Seleccionemos las siguientes variables de estado: x1 = , x2 = . Es claro que en este sistema de orden 4: x 1 = x2 y x 3 = x4 . Las otras dos x4 = z ecuaciones de estado se determinan de (1.54) como sigue. Multiplicando la primera on ecuaci on por J1 y la segunda por M2 cos y sumando ambas ecuaciones, la expresi resultante nos permite despejar z = x 4 . Multiplicando ahora la primera ecuaci on on por M2 cos y la segunda por M1 + J2 y sumando ambas ecuaciones, la expresi = x resultante nos permite despejar 2 . Operando, se obtiene: x 1 x 2 = x 3 x 4
M2 (sin x1 )(cos x1 )x2 2 Bx (cos x1 )x4 (M1 +J2 )g (sin x1 )+Kx (cos x1 )KA u (M2 (cos2 x1 )(M1 +J2 )J1 )/M2
2 g (sin x )(cos x )J M (sin x )x2 +J B x J K K u M2 1 1 1 2 1 2 1 x 4 1 x A 2 (cos2 x )(M +J )J M2 1 1 2 1
x2
(1.55)
x4
y puesto que en nuestro sistema las salidas disponibles son el desplazamiento angular on de salida toma la forma: x1 de la varilla y el desplazamiento x3 del carro, la ecuaci y = h(x) = Cx donde: C= 1 0 0 0 0 0 1 0 (1.56)
1.1 Modelado Empleando las Leyes de la F sica Obtenci on del Modelo Lineal Notar que (1.55) puede ser x 1 x 2 = x x 3 x 4 puesta en la forma: f1 (x, u) f2 (x, u) = f(x, u) = f3 (x, u) f4 (x, u)
17
(1.57)
Para la operaci on del proceso alrededor del estado de equilibrio xo = [0, 0, 0, 0]T = 0 y uo = 0, las matrices A, B, C y D pueden ser determinadas evaluando las siguientes matrices jacobianas: f1 f1 f1 f1 X1 Xn U1 Um . . . . . . . . . . B= . A = . . . . . . . C =
fn X1 h1 X1
. . .
fn Xn h1 Xn
( xo , u o )
D=
fn U1 h1 U1
. . .
fn Um h1 Um
( xo , u o )
. . .
. . .
. . .
. . .
(1.58)
hr X1
hr Xn
( xo , u o )
hr U1
hr Um
( xo , u o )
As obtenemos el siguiente modelo lineal para el sistema p endulo invertido: = Ax + Bu x donde: B= (1.59)
A=
0
(M 1 + J 2 )M 2 g 2 (M 1 + J 2 )J 1 M 2
2g M 2 2 (M 1 + J 2 )J 1 M 2
1 0 0 0 0 0 0 0
0
Bx M2 2 (M 1 + J 2 )J 1 M 2
Kx M2 KA 2 (M 1 + J 2 )J 1 M 2
J1 B x 2 (M 1 + J 2 )J 1 M 2
J1 Kx KA 2 (M 1 + J 2 )J 1 M 2
Sistema Gr uaPuente El modelado del sistema gr ua-puente es similar al modelado del p endulo invertido. En este caso caso el p endulo debe apuntar hacia abajo, tal como se muestra en la gura 1.8. Al igual que en el caso del p endulo invertido, para mayor facilidad, el sistema gr ua puente se puede subdividir en dos subsistemas: carrovarilla y motor polea. El subsistema carro-varilla est a representado en la gura 1.9. De dicha gura podemos observar que los centros de gravedad zv de la varilla y ze de la esfera son: ze = z le sen zv = z lv sen 2
Con un procedimiento similar al realizado para el sistema p endulo invertido, se puede llegar a las siguientes ecuaciones: 2 M2 (cos ) Kx KA u + Bx z (M1 + J2 ) z + M2 (sen ) =0 = 0 (cos ) J1 M2 g (sen ) + M2 z
(1.60)
18

F Carro y puente Grua
Figura 1.8: Sistema gr uapuente.

y z y
P
0
F lv
2
111 000 000 111 000 111 000 m v g 111

me g
le lv
Figura 1.9: Subsistema carro-varilla de sistema gr uapuente. donde: M1 = mc + me + mv ; Jeq ; 2 rp M2 = me le + mv nKm ; Ra rp lv ; 2 J1 = Je + Jv
J2 =
Kx =
Bx =
Beq n2 Kb Km + 2 2R rp rp a
Como era de esperarse, las relaciones y (1.54) (1.60) s olo se diferencian en los signos. Representaci on en el Espacio de Estado Las ecuaciones arriba obtenidas se representan en el espacio de estados mediante , x3 = z , x4 = z la siguiente asignaci on de variables: x1 = , x2 = . Como en el caso del sistema p endulo invertido, las ecuaciones del sistema gr uapuente en el espacio
1.1 Modelado Empleando las Leyes de la F sica de estado toman la forma: x2 x 1 M2 (sin x1 )(cos x1 )x2 2 Bx (cos x1 )x4 (M1 +J2 )g (sin x1 )+Kx (cos x1 )KA u x (M2 (cos2 x1 )+(M1 +J2 )J1 )/M2 2 = x x4 3 2 g (sin x )(cos x )J M (sin x )x2 J B x +J K K u M 1 1 1 2 1 2 1 x 4 1 x A 2 x 4 2 2
M2 (cos x1 )+(M1 +J2 )J1
19
(1.61)
y puesto que tenemos como salidas disponibles el desplazamiento angular de la varilla y el desplazamiento del carro, tendremos entonces como ecuaci on de salida la expresi on dada en (1.56). Obtenci on del Modelo Lineal El modelo lineal del sistema gr uapuente, como en el caso del p endulo invertido, posee la forma dada en 1.59, pero en este caso con: 0 1 0 0 0 (M 1 + J 2 )M 2 g 0 0 Bx M 2 Kx M2 KA (M 1 + J 2 )J 1 M 2 2 2 (M 1 + J 2 )J 1 M 2 ( M + J ) J M 1 2 1 2 2 ; B = A= (1.62) 0 0 0 1 0 2g J1 Kx KA M 2 J1 B x 0 0 (M + J )J M 2 2 (M 1 + J 2 )J 1 M 2 (M + J )J M 2
1 2 1 2 1 2 1 2
1.1.4.
Sistema Tanque de Agua
El proceso tanque de agua estudiado aqu se muestra en la gura 1.10. En este proceso, el agua fr a que se env a al tanque se calienta en forma controlada. El agua calentada que sale del tanque puede ser usado luego por los consumidores. Este proceso es multivariable porque posee dos entradas de control: el ujo de entrada al tanque y el calor suministrado al agua mediante una resistencia el ectrica, y dos variables a controlar: el nivel del tanque y la temperatura de salida del agua calentada. La tabla 1.3 describe las variables y los valores de los par ametros del tanque de agua mostrado en la gura 1.10. Modelo Lineal del Proceso Nivel El volumen de agua acumulado en el tanque se modela como: S dh = qi qo = Sh dt (1.63)
Considerando un ujo laminar de salida: qo = h Rh (1.64)
on: donde la resistencia hidr aulica Rh se calcula de la relaci Rh = H Q (1.65)
20
Tabla 1.3: Par ametros y variables del proceso tanque de agua. S mbolo dS S H H h Q Qi Qi qi Qo qo Rh g do Ao Av Cc Cv Cd a Cp Ct Rt a o o o i i T o s c Descripci on Di ametro del tanque Secci on circular del tanque Nivel del agua en estado estable Nivel del agua Nivel perturbacional del agua: h = H H Flujo de agua en estado estable Flujo de agua de entrada al tanque Flujo de entrada en estado estable Flujo perturbacional del agua: qi = Qi Qi Flujo de agua de salida del tanque Flujo perturbacional a la salida: qo = Qo Qo Resistencia hidr aulica del tanque: Rh = H/Q Aceleraci on de la gravedad Densidad del agua Di ametro del oricio de salida Secci on del oricio de salida Secci on de la vena contracta Coeciente de correcci on entre Ao y Av Coeciente de correcci on por p erdidas Coeciente de descarga:Cd = Cv Cc Factor de ujo turbulento: a = Cd AO 2g Calor espec co del agua Capacitancia t ermica del tanque: Ct = SHCp Resistencia t ermica del tanque: Rt = C 1 Q
p
Valor 0.0265 0.055 0.12
0.16 0.16
2700 9.81 1000 0.0127 0.000126 0.6 a 1 0.8 a 0.99 0.5 0.00028 4186.8 27633 0.0054 27.0 28.5
Unid. m m2 m m m m3 /h m3 /s m3 /h m3 /s m3 /s m3 /s s/m2 m/s2 kg/m3 m m2 m2
m2.5 /s
J kg K
K/W K/W
oC oC oC oC
Temperatura del ambiente Temperatura en el tanque en estado estable Temperatura del agua de salida Temperatura perturbacional: o = o o Calor entregado por la resistencia el ectrica Calor entregado en estado estable Calor del agua en el tanque Calor que toma el ujo de salida a Calor que se libera al exterior: s = oR t Calor que trae consigo el ujo de entrada
1540
W W W W W W
21
Figura 1.10: Proceso tanque de agua.
Entonces, la ecuaci on de estado del proceso nivel toma la forma: = 1 h + 1 qi h SRh S y su funci on de transferencia resulta: Rh h(s) = qi (s) SRh s + 1 donde el producto SRh es la constante de tiempo del proceso nivel. Determinaci on Experimental de Rh La v alvula de control empleada para regular la entrada de agua al tanque es del tipo VXN015F250, con di ametro nominal DN15, conexi on G1B y actuador mot orico. La abertura m axima se obtiene alimentando con 10 V al actuador, la cual corresponde a un ujo de 0.4 m3 /h, de acuerdo al manual del fabricante. La m nima abertura, 3 con 0 V, corresponde a un ujo de 0 m /h. Esto signica que para una abertura de 1 V el ujo que pasa por la v alvula es de 1/90000 m3 /s. Asumiendo una variaci on lineal entre el ujo Qi que pasa por la v alvula y la altura H del tanque, se realiz o el siguiente experimento. Con una abertura de o convenientemente la v alvula de descarga v alvula para 4 V (0.16 m3 /h), se abri hasta lograr una altura estable de 0.12 m. Luego, con una abertura de v alvula para o abriendo la v alvula de descarga hasta lograr una altura 6 V (0.24 m3 /h), se sigui de 0.18 m. Empleando la relaci on (1.65), la resistencia hidr aulica para cada punto 2 result o aproximadamente Rt = 2700 s/m . Se asume tambi en que los valores estables de H y Qi son H = 0.12 m y Q = 0.16 m3 /h. (1.67) (1.66)
22
Modelo Lineal del Proceso Temperatura El calor en el interior del tanque se modela aproximadamente como: Ct donde: o = Cp Q o Por consiguiente, la ecuaci on de estado del proceso temperatura resulta: 1 1 o + i o = Rt Ct Ct ermica Rt se calculan de: donde la capacitancia t ermica Ct y la resistencia t Ct = SHCp Rt = 1 Cp Q (1.71) (1.70) (1.69) do = i o dt (1.68)
La funci on de transferencia del proceso temperatura toma la forma: o (s) Rt = i (s) Ct Rt s + 1 donde el producto Ct Rt es la constante de tiempo de dicho proceso. Modelo No Lineal del Proceso Tanque de Agua El volumen de agua acumulado en el tanque se modela como: S dH = Qi Qo = SH dt (1.73) (1.72)
donde, para oricios circulares peque nos, se puede formular [?]: Qo = Cd Ao 2gh = a h; a = Cd Ao 2g Se sabe adem as que [?]: Cd = CvCc ; 0.8 Cv 0.99; 0.6 Cc 1
(1.74)
(1.75)
Para nuestro estudio tomaremos Cd =0.5. De (1.73) se obtiene la primera ecuaci on de estado: = a H + 1 Qi H (1.76) S S Por otro lado, el balance de energ a t ermica dentro del tanque se formula: T = o s + c + i donde: T o s c do Q2 o do = SCp H 2 a dt dt = Cp o Qo = Cp ao H o a = Rt = Cp i Qi = SCp (1.78) (1.79) (1.80) (1.81) (1.77)
1.1 Modelado Empleando las Leyes de la F sica La segunda ecuaci on de estado se obtiene despejando
do dt
23 o de (1.77): = (1.82)
1 o a i Qi 1 i o 1 o = a + + + S H SCp Rt H SCp Rt H A h SCp H
Para linealizar el proceso tanque emplearemos la t ecnica del Jacobiano. Para ello se denen los siguientes vectores de estado y de control: X= X1 X2 = H o ; = X 1 X 2 X = f1 f2 ; U= U1 U2 = Qi i (1.83)
de modo tal que (1.76) y (1.82) toman la forma: 1 = a X S X1 + 1 X1 = f1 S (1.84) (1.85)
X2 1 a i U1 1 U2 X2 1 2 = a + + + = f2 X S X1 SCp Rt X1 SCp Rt X1 S X1 SCp X1
Tomando derivadas parciales y haciendo notar que una barra sobre una variable indica el valor estacionario de dicha variable, se obtiene: f1 X1 f1 X2 f1 U1 f1 U2 f2 X1 = = 0 = 1 S a 1/2 a X = 2S 1 2S X 1
= 0 = = a 1 a i 1 3/2 2 2 2 X2 X1 + X2 X1 X 2 U1 X 1 U2 X 1 2S SCp Rt SCp Rt 1 S SCp a X2 1 a i U 1 1 U2 X2 1 + 2S SCp Rt X 2 SCp Rt X 2 S X 2 SCp X 2 3 1 1 1 1 X1 a S 1 X1 1 1 SCp Rt X 1
f2 X2 f2 U1 f2 U2
= = =
i 1 S X1 1 1 SCp X 1
(1.86)
Luego el proceso tanque de agua linealizado queda como: x = Ax + Bu donde: A=

f1 X1 f2 X1 f1 X2 f2 X2 f1 U1 f2 U1 f1 U2 f2 U2
(1.87)
B=
24
Determinaci on de las Fuerzas de Control en Estado Estable El actuador que emplea el sistema de control de temperatura trabaja en el rango de voltaje de 1 a 5 V. Con 5 V, el calefactor proporciona un ujo m aximo de calor de 7700 W, de acuerdo al manual del fabricante. Asumiendo una correspondencia lineal entre el voltaje que ingresa al actuador y el ujo de calor entregado, entonces para subir 1 V en dicho actuador (de 1 a 2 V o de 4 a 5 V por ejemplo), se debe de proporcionar 7700/4 = 1925 W. El c alculo de las matrices A y B requiere conocer los valores de Qi = U 1 y i = U 2 . Para ello, experimentalmente se mantuvo en el tanque una altura de H o en 1 V al actuador (se = 0.11 m a una temperatura de 27.5 o C. Luego, se subi increment o el calor en 1925 W), hasta que la nueva temperatura en el tanque se estabiliz o en 27.5 o C a una altura de 0.12 m. Por consiguiente, los valores a tomar en los c alculos son U 1 = 0.16 m3 /h, correspondiente a una altura de H = 0.12 m (determinado anteriormente) y = U 2 = 1925 W.
1.2.
1.2.1.
M etodo de Las Ecuaciones de Lagrange

Las Ecuaciones de Lagrange
Las ecuaciones diferenciales que gobiernan el movimiento de complicados sistemas mec anicos, se pueden obtener empleando las ecuaciones de Lagrange, las cuales se derivan de las leyes de Newton del movimiento. El m etodo de las ecuaciones de Lagrange considera cantidades escalares (energ as potencial y cin etica) en lugar de vectores (fuerzas y torques), minimizando as la necesidad de complicados diagramas vectoriales. El modelo din amico del sistema obtenido con el m etodo de las ecuaciones de Lagrange ser a denominado modelo de Lagrange. Este modelo tambi en nos permite determinar el modelo en el espacio de estado. El m etodo en cuesti on requiere de la representaci on del proceso mediante un conjunto de coordenadas generalizadas qi (i = 1, 2, . . . , r), una para cada grado de libertad independiente del proceso. Luego, la energ a cin etica V y la energ a potencial U se formulan en t erminos de tales coordenadas y de sus derivadas con el n de establecer la funci on Lagrangiana del proceso, la cual toma la forma: L = V (q1 , . . . , qr , q 1 , . . . , q r ) U (q1 , . . . , qr , q 1 , . . . , q r ) (1.88)
1 , . . . , q r ). Por otra parte, de De la ecuaci on (1.88), es claro que: L = L(q1 , . . . , qr , q acuerdo al principio de de la m nima acci on de Hamilton para sistemas conservativos, la integral I denida por:
t2
I=
t1
L(q1 , . . . , qr , q 1 , . . . , q r )
es un extremo para la trayectoria de movimiento del sistema desde el tiempo t1 hasta el tiempo t2 . En adici on, la variaci on de I es igual al trabajo realizado por fuerzas externas. Basado en el principio de Hamilton, se puede demostrar que las ecuaciones que gobiernan el movimiento de un proceso din amico constituyen las ecuaciones de
1.2 M etodo de Las Ecuaciones de Lagrange Lagrange [1], [2]: d dt L q i L = Qi qi i = 1, 2, . . . , r
25
(1.89)
donde Qi indica las fuerzas y torques generalizados que son externos al proceso o no son obtenibles a partir de una funci on potencial escalar. Si asignamos una variable de i , tendremos estado para cada coordenada generalizada qi y otra para su derivada q entonces 2r ecuaciones diferenciales de segundo orden de la forma dada en (1.89) correspondientes al sistema de r grados de libertad.
1.2.2.
Manipulador Rob otico Traslacional (MRT)
Descripci on del Sistema La gura 1.11 ilustra el manipulador rob otico (MRT) de 2 GDL. M1 es un servomotor DC que posee un mecanismo de reducci on por engranajes y un codicador o ptico y est a articulado a una polea de radio rp . Esta polea usa un cable para transmitir la fuerza F para accionar el movimiento de traslaci on de un carro de masa en un servomc montado sobre un par de rieles a lo largo de un eje x. M2 es tambi motor con codicador o ptimo y mecanismo de reducci on, empleado para accionar el movimiento rotatorio del brazo (el eslab on) del MRT alrededor de un pivote ubicado en el CG (Centro de Gravedad) del carro. Asumiremos que M1 y M2 poseen los mismos par ametros. En la gura 1.11, es la posici on angular del brazo de longitud L y on longitudinal del carro y Ff es la fuerza de fricci on opuesta masa mb , r es la posici al movimiento del carro. Al extremo del brazo se puede articular una mano o efector nal para diferentes prop ositos. El sistema MRT es multivariable cuadrado, denominado as por poseer dos entradas: los voltajes KA1 u1 y KA2 u2 aplicados los terminales de las armaduras de M1 and M2 respectivamente, y dos salidas: r y . Los par ametros KA1 y KA2 son las ganancias de los amplicadores. La tabla 1.4 muestra los valores de los par ametros del sistema MRT.
M 1 M2 F r
Gripper of mass m H L1cos 1
M3 Gripper (lateral view) Rp
M 1 Pulley
Link Cart F1 L1 sin 1 x Pulley
Figura 1.11: El manipulador rob otico traslacional (MRT).
26
Tabla 1.4: Par ametros valorados del sistema MRT. La abreviatura C.M. signica Centro de Masa. S mbolo u 1 , u2 KA V a 1 , Va 2 , Ra La ia 1, ia2 Km Tm1 , Tm2 Tg 1 Tg 2 Jm Jg Jp Jh JL Jb Jeq1 , Jeq2 Beq1 , Beq2 Bm Bg BL Bp Bj F Ff Fc mh mb mc mp L rh rp r L xh , xb yh , yb V b 1 , Vb 2 Kb g N 1 , N2 n m m Descripci on Voltaje de entrada al sistema Ganancia del amplicador Voltaje de armadura Resistencia de armadura Inductancia de armadura Corriente de armadura Constante del torque motor Torque motor Torque de entrada a los engranajes Torque de salida de los engranajes Momento de inercia del motor Momento de inercia de los engranajes Momento de inercia de la polea Momento de inercia del efector Momento de inercia en la carga Momento de inercia del brazo Momento de inercia equivalente Constante de fricci on equivalente Constante de fricci on del motor Constante de fricci on en engranajes Constante de fricci on en la carga Constante de fricci on (punto pivote) Constante de fricci on de la articulaci on Fuerza aplicada al carro Fuerza de rozamiento Constante de fricci on del carro Masa del efector Masa del brazo masa del carro masa de la polea Longitud del brazo Distancia: C.M. del efector al brazo Radio de la polea Posici on del carro Longitud del brazo Posiciones horizontales Posiciones verticales Voltaje contraelectromotriz Constante contraelectromotriz Aceleraci on de la gravedad N o de dientes de los engranajes Relaci on de engranajes (n = N2 /N1 ) Posici on angular del motor Posici on angular del brazo Velocidad angular de la carga Velocidad angular del motor Valor 15 2 0.002 31.071103 V H A N-m/A N-m N-m N-m kg-m2 kg-m2 kg-m2 kg-m2 kg-m2 kg-m2 kg-m2 N-m-s/rad N-m/rad/s N-m/rad/s N-m-s/rad kg-m2 /s kg-m2 /s N N kg/s kg kg kg kg m m m m m m m V V-s/rad m/s2 Unidades V
1.9062106 =0
4.2106 3.36106 1.8338106 1.92103 1.92103
2.81 0.103 0.9574 0.2 0.225 =0 0.05 0.225
25103 9.81 N2 > N 1 12.5
rad rad rad/s rad/s
1.2 M etodo de Las Ecuaciones de Lagrange Ecuaciones de Lagrange del Sistema MRT
27
Las ecuaciones de Lagrange del sistema MRT mostrado en la gura 1.11 se determinan empleando el m etodo descrito en la secci on 1.2. Ecuaciones de Energ a del Carro El carro est a connado a moverse en la direcci on horizontal. Su energ a cin etica a potencial U1 vienen dadas por: V1 y su energ 1 2 V1 = mc r 2 Ecuaciones de Energ a del Brazo as su carga. La energ a cin etica almacenada Sea mh la masa del efector nal m por el brazo es: 1 1 2 2 2 + mb x 2 (1.91) V2 = mh x h b h+y b +y 2 2 De la gura 1.11 obtenemos: xh = r + Lsen xb = r + L sen 2 yh = Lcos yb = L cos 2 U1 = 0 (1.90)
on de las coordenadas generalizadas r y se Por consiguiente, V2 como una funci expresa como: 1 1 1 2 + (2mh + mb )Lr cos + V2 = (mh + mb )r 2 2 2 La energ a potencial almacenada en el brazo es: U2 = mh g Lcos + mb g La funci on lagrangiana toma la forma: L = V U = (V1 + V2 ) (U1 + U2 ) Las Ecuaciones de Lagrange del Sistema MRT Las ecuaciones de Lagrange para las coordenadas generalizadas r y del MRT se formulan como: d dt d dt L r L L = F Ff r L = TL T p Ff = Fc r Tp = Bp (1.94) (1.95) L mb cos = mh + gLcos 2 2 (1.93) 1 2 mh + mb L2 1 4 (1.92)
on actuando donde F es la fuerza generada para mover al carro, Ff es la fuerza de fricci en el carro, Fc es la constante de fricci on, TL es el torque generado para accionar el es el torque de fricci brazo, Tp = Bp on actuando en el punto pivote localizado en el
28
carro, y Bp es su correspondiente constante de fricci on viscosa. Reemplazando L en (1.94) y (1.95) y operando, se obtiene: F = (mc + mh + mb ) r + mh + TL = mb mh + mb L 2 sin + Fc r Lcos (1.96) 2 2
1 mb + mh + mb Lr (1.97) cos mh + Lg sin + Bp mh + mb L2 4 2 2
Partiendo de (1.96) y (1.97) podemos determinar el modelo de Lagrange del sistema TRM. Sin embargo, si estamos interesados en tener como fuerzas de control los voltajes de armadura u1 y u2 en lugar de F y TL respectivamente, entonces se requiere modelar los susbsistemas el ectricos del sistema en la forma usual. Modelado del Servomotor M1 Accionando la Polea La gura 1.12 muestra el servomotor M1 articulado a la polea. Despreciando la inductancia de armadura La , el voltaje de entrada KA u1 aplicado a la armadura es: Ra ia1 + Vb1 = KA u1 (1.98)
El voltaje de fuerza contraelectromotriz es proporcional a la velocidad del servomotor, es decir: m1 Vb1 = Kb (1.99) a dada por (ver gura 1.12): La ecuaci on del torque motor Tm1 est
Ra + u1 -
La + Vb 1 Ia 1
m1 Jg 111 000 Pulley 000 B g 111 111 000 000 111 B F1 Jm m Rp 111 n 000 Tg2 Tm1 Tg1
KA
Figura 1.12: Servomotor M1 articulado a la polea. m1 + Bm m1 + Tg1 Tm1 = Jm El torque Tg2 requerido para mover a la polea se expresa como: Tg2 = nTg1 = (Jg + Jp ) m1 m1 + (Bg + Bp ) + F Rp n n (1.101) (1.100)
donde n > 1 es la relaci on de dientes de los engranajes del mecanismo de reducci on, Jm , Jg y Jp son los momentos of inercia de la armadura, del mecanismo de reducci on y de la polea respectivamente, mientras que Bm , Bg y Bp son las constantes de fricci on de la armadura, del mecanismo de reducci on y de la polea respectivamente.
1.2 M etodo de Las Ecuaciones de Lagrange
29
La relaci on Tg2 = nTg1 se obtiene asumiendo que los engranajes son ideales. En esta situaci on, el principio de conservaci on de energ a requiere que: Tg1 m1 = Tg2 m1 n
El torque servomotor Tm1 es proporcional a ia1 : Tm1 = Km ia1 (1.102)
El movimiento rotacional de la polea se puede transformar en el movimiento traslacional del carro usando la relaci on (ver gura 1.12): r= m1 rp n (1.103)
Usando las ecuaciones (1.98), (1.99), (1.100), (1.101), (1.102) y (1.103) podemos obtener: Jeq1 Beq1 nKm Kb Km KA r (1.104) u1 r + F = 2 2 2 rp Ra nrp nrp nrp donde: Jeq1 = n2 Jm + Jg + Jp Beq1 = n2 Bm + Bg + Bp
Modelado del Servomotor M2 Accionando el Brazo La gura 1.13 muestra al servomotor M2 articulado al punto pivote localizado ametros por ser en el CG del carro. Sabemos que M1 y M2 poseen los mismos par similares. Despreciando la inductancia de armadura La , podemos formular: Ra ia2 + Vb2 = KA u2 donde: Vb2 = Kb n La ecuaci on del torque motor Tm2 es (ver gura 1.13): (1.106) (1.105)
Ra + u 2 + Va2 -
La + Vb2 Ia2
n1 Tm2 Tg1
KA
Jm
000 111 111 000 Bm
Jg Bg
Tg2
00 1 11 11 00 T
L
Figura 1.13: Servomotor M2 articulado al punto pivote del carro
1 + Bm n + Tg 1 Tm2 = Jm n
(1.107)
30
El torque Tg2 requerido para mover el brazo se expresa como: 1 + Bg 1 + TL Tg2 = nTg1 = Jg donde TL es el torque de carga. El torque motor Tm2 es proporcional a ia2 : Tm2 = Km ia2 (1.109) (1.108)
Empleando las ecuaciones (1.105), (1.106), (1.107), (1.108) y (1.109) se puede demostrar que: 1 Beq2 + TL = Jeq2 donde: Jeq2 = n2 Jm + Jg Beq2 = n2 Bm + Bg n2 Km Kb Ra 1 + nKm Kb u2 Ra (1.110)
El Modelo de Lagrange del Sistema MRT Igualando (1.96) con (1.104) y (1.97) con(1.110) el modelo de Lagrange del proceso MRT toma la forma: + p12 2 sin + p11 r + m12 cos u1 = m11 r + p22 + m21 r u2 = m22 cos + d2 sin (1.111) (1.112)
Las ecuaciones (1.111) y (1.112) se pueden transformar en su forma matricial como sigue: M(q)q + P(q, q )q + d(q) = u donde: M= m12 cos m11 m22 m21 cos P= p11 p12 sin 0 p22 d(q) = 0 d2 sin q= r u= u1 u2 (1.113)
m11 = m21 = p11 = p22 =
Ra r p Jeq1 Ra r p L mb mh + mc + mh + mb + 2 2 ; m12 = Km KA n rp Km KA 2 Ra L mb Ra mb 2 mh + Jeq2 + mh L2 + ; m22 = L nKA Km 2 nKA Km 4 Ra r p Beq1 nKm Kb Ra rp L mb Fc + 2 2 + ; p12 = mh + 2 KA Km n rp Ra rp KA Km 2 Ra nKa Km Beq2 + Bp + n2 Km Kb Ra ; d2 = Ra Lg mb mh + nKa Km 2
Ejemplo 1.2
1.2 M etodo de Las Ecuaciones de Lagrange
31
Para el sistema p endulo mostrado en las guras 1.5 y 1.6 asuma que lv = le = l y mv = 0. Determinar el modelo en el espacio de estado del sistema para variaciones peque nas de la posici on , empleando primero las ecuaciones de Lagrange y luego las leyes de la f sica. Soluci on: De la gura 1.6 se observa que: ze = z + l sen ye = l cos
El carro s olo se mueve en la direcci on horizontal. Su energ a cin etica es: 1 Vc = mc z 2 2 Como la esfera se mueve en las direcciones horizontal y vertical, su energ a cin etica es: 1 2 2 e +y e ) Ve = me (z 2 La u nica energ a potencial se almacena en la esfera: Ue = me gye Operando las relaciones anteriores se puede demostrar que la funci on de Lagrange L toma la forma: 1 + 1 me l2 2 me glcos L = Vc + Ve Ue = (mc + me )z 2 + me lcos z 2 2 Las ecuaciones de Lagrange para las coordenadas generalizadas (z, ) son: d dt L z L =F z d dt L L =0
Efectuando las operaciones correspondientes, resulta: me l 2 sen = F z + me l cos (mc + me ) me gl sen = 0 + me l2 me l cosz Para peque nas variaciones de theta, podemos asumir que: sen = cos =1 2 =0
(1.114)
Por lo tanto, las ecuaciones anteriores se convierten en: = F z + me l (mc + me ) mg = 0 me z + me l
, empleando las y x4 = Seleccionado como variables de estado x1 = z , x2 = , x3 = z ecuaciones anteriores se puede encontrar la siguiente ecuaci on de estado con u = F : x = Ax + Bu 0 1 0 0 0 1 me g 0 0 mc g (mc +me ) 0 0 M cl B=
0 0 A= 0 0
1 mc 1 m cl
0 0
32
Aplicando las leyes f sicas, para los movimientos horizontal y rotacional, de acuerdo a las relaciones (1.37) y (1.41) se obtiene: mc d2 d2 z + m e 2 ze = F dt2 dt
= me gl sen me z l cos Je Sustituyendo las relaciones ze = z + l sen, ye = l cos en la primera ecuaci on y Je = me l2 en la segunda, se obtienen las ecuaciones dadas en (1.114).
1.3.
El M etodo de LagrangeEuler
El m etodo de Lagrange-Euler (o simplemente m etodo L-E) usado b asicamente para modelar manipuladores rob oticos, emplea el el procedimiento de DenavitHartenberg (o simplemente procedimiento DH) conjuntamente con el procedimiento LE. Mientras que el procedimiento DH permite representar los sistemas de coordenadas de un manipulador mediante cadenas cinem aticas de lazo abierto, el procedimiento L E determina el modelo din amico del proceso, el cual denominaremos modelo LE. Un estudio completo del m etodo de LE se puede encontrar en [4], [5], [6], [7]. El resultado nal de este estudio se describe a continuaci on.
1.3.1.
El Procedimiento de DenavitHartenberg
Un manipulador rob otico se compone de una secuencia de cuerpos r gidos (los eslabones) unidos mediante articulaciones rotatorias o prism aticas (de deslizamiento). Cada par eslab onarticulaci on representa un Grado de Libertad (GDL). Por consiguiente, un manipulador con n GDL posee n pares eslab onarticulaci on. Se puede establecer un sistema de coordenadas ortonormales dextr ogiro (xi , yi , zi ) para cada articulaci on i, donde i = 1, . . . , n. Como se sabe, los sistemas de coordenadas dextr ogiro cumplen con la regla de la mano derecha. El manipulador normalmente est a articulada a una base soporte (el eslab on 0). El sistema de coordenadas de la base se dene como (x0 , y0 , z0 ) y es tambi en el sistema de coordenadas inerciales del manipulador. El sistema de coordenadas aumentado de la base se dene como (x0 , y0 , z0 , 0). Usualmente, en el u ltimo eslab on del manipulador se articula una mano o efector nal (por ejemplo, una herramienta). Esto signica que el sistema de coordenadas (xn , yn , zn ) corresponde al efector nal del manipulador. El procedimiento de DH (Denavit-Hartenberg) produce una matriz de transformaci on homog enea de 4 4, la cual representa las coordenadas inerciales del manipulador. Para obtener dicha matriz de transformaci on, se requiere establecer las coordenadas (xi , yi , zi ) del manipulador para i = 0, . . . , n de modo tal que nos permita determinar los par ametros correspondientes a cada par eslab onarticulaci on, tal como se ver a m as adelante. El Sistema de Coordenadas DH del Manipulador Cada sistema de coordenadas dextr ogiro DH (xi , yi , zi ), i = 0, . . . , n, se establece conforme a las siguientes reglas:
1.3 El M etodo de LagrangeEuler
33
1. El eslab on 0 corresponde al eslab on de la base ja del manipulador y el eslab on 1 corresponde al primer eslab on m ovil del mismo. Por consiguiente, la primera articulaci on corresponde al primer grado de libertad del manipulador y as sucesivamente. 2. Si una articulaci on es rotatoria, su eje ser a su propio eje de giro. En cambio, si es prism atica, el eje se ubica a lo largo del desplazamiento de la articulaci on. 3. La ubicaci on del sistema de coordenadas dextr ogiro base o jo (x0 , y0 , z0 ) es de libre elecci on, siempre que el eje z0 se ubique a lo largo del eje de movimiento (rotatorio o prism atico) del primer eslab on. atico) de la i 14. El eje zi se alinea con el eje de movimiento (rotatorio o prism esima articulaci on. 5. El origen del i- esimo sistema de coordenadas se ubica en la intersecci on de los ejes zi y zi1 si ambos se cortan, o en la intersecci on del eje zi con la normal com un a los ejes zi y zi1 . un a los ejes zi1 y zi . 6. El eje xi es normal com 7. Aplicar la regla de la mano derecha en la i- esima articulaci on para determinar yi . 8. Generalmente la n- esima articulaci on es del tipo rotatorio. El sistema de coordenadas (xn , yn , zn ) se puede ubicar en el extremo del manipulador, siempre que el eje zn coincida con la direcci on del eje zn1 y apuntando hacia afuera a normal a los ejes zn1 y zn . del manipulador. El eje xn ser Los Par ametros DH para cada par Eslab onArticulaci on Para describir completamente una articulaci on de revoluci on o una prism atica, ametse requiere de cuatro par ametros geom etricos, a saber: i , di , ai , y i . Estos par ros, denominados los par ametros DH, est an asociados con cada par articulaci on eslab on del manipulador. Luego de establecer los sistemas de coordenadas del manipulador, los par ametros DH se pueden determinar como sigue. 1. Obtener i , el cual es el angulo que hay que girar desde el eje xi1 alrededor ngulo resulta del eje zi1 hasta que los ejes xi1 y xi queden paralelos. Este a la variable de la articulaci on i si dicha articulaci on es rotatoria. 2. Obtener di , la cual es la distancia medida desde el origen del sistema de coordenadas (i 1)- esimo a lo largo del eje zi1 , necesaria para hacer coincidir los ejes xi1 y xi . Esta distancia resulta la variable de la articulaci on i si dicha articulaci on es prism atica. 3. Obtener ai , la cual es la distancia medida a lo largo del eje xi necesaria para hacer coincidir el origen del (i 1)- esimo sistema de coordenadas con el origen del (i)- esimo sistema de coordenadas. angulo de rotaci on desde el eje zi1 hasta el eje zi 4. Obtener i , el cual es el alrededor del eje xi , requerido para hacer coincidir los ejes del (i 1)- esimo sistema de coordenadas con los ejes del (i)- esimo sistema de coordenadas.
34
La Matriz de Transformaci on Homog enea DH del Manipulador La matriz de transformaci on homog enea DH caracteriza a cada sistema de coordenadas de un eslab on con su articulaci on, con respecto al sistema de coordeesimo sistema de nadas de del eslab on anterior. Por consiguiente, un punto ri del i- esimo sistema de coordenadas coordenadas se puede expresar como ri1 en el i 1- ejecutando las siguientes operaciones sucesivas: on de un a ngulo i alrededor del eje zi1 para alinear el eje xi1 1. T(z, i ): rotaci con el eje xi . 2. T(z, di ): traslaci on a lo largo del eje zi1 de una distancia di para hacer coincidir los ejes xi1 y xi . 3. T(x, ai ): traslaci on a lo largo del eje xi de una distancia ai para hacer coincidir los or genes (xi1 , yi1 , zi1 ) y (xi , yi , zi ) as como tambi en el eje xi . on de un a ngulo i alrededor del eje xi para hacer coincidir los 4. T(x, i ): rotaci dos sistemas de coordenadas. El producto de estas cuatro operaciones b asicas produce la matriz de transfor1 maci on homog enea DH Ai para lograr una transformaci on completa del eslab on i i con respecto al eslab on i 1, o de la articulaci on i con respecto a la articulaci on i 1. Por consiguiente:
1 = T(z, i )T(z, di )T(x, ai )T (x, i ) Ai i
Ci Si = 0 0
Si Ci 0 0
0 0 1 0
0 1 0 0 0 0 0 1
0 1 0 0
1 0 0 0 0 0 0 1 1 di 0 0 0 1 0 0
0 0 1 0
ai 1 0 0 0 Ci 0 0 Si 0 0 0
0 Si Ci 0
0 0 0 1
Ci Ci Si Si Si ai Ci Si Ci Ci Si Ci ai Si = 0 Si Ci di 0 0 0 1
(1.115)
donde C y S representan las funciones cos y sen respectivamente. La siguiente matriz de transformaci on homog enea: A0 i =
i j =1 j 1 i1 1 Aj = A0 1 A2 Ai
i = 1, 2, . . . , n
(1.116)
determina la ubicaci on del i- esimo sistema de coordenadas con respecto al sistema de coordenadas base. Ejemplo 1.3 Determinar los par ametros DH y las matrices de transformaci on para el manipulador esf erico mostrado en la gura 1.14 y descrito n la subsecci on 1.3.3.
35
Tabla 1.5: Los par ametros DH del manipulador esf erico. Joint 1 2 i 1 2 di b+h 0 ai 0 L2 i 90o 00
Soluci on: Notar que la gura 1.14 ilustra los sistemas de coordenadas DH del manipulador esf erico. La tabla 1.5 muestra los correspondientes par ametros DH 1 extra dos de dicha gura. Por consiguiente, las matrices de transformaci on Ai (i i = 1, 2) del manipulador esf erico toman la forma: C1 S1 A0 1 = 0 0 0 S1 0 0 C1 0 1 0 b+h 0 0 1 C2 S2 S2 C2 A1 2 = 0 0 0 0 0 L2 C2 0 L2 S2 1 0 0 1
L2 C1 C2 C1 C2 C1 S2 S1 S1 C2 S1 S2 C1 L2 S1 C2 0 1 A0 2 = A1 A2 = S2 C2 0 L2 S2 + b + h 0 0 0 1
1.3.2.
El Procedimiento de LagrangeEuler
El procedimiento LE requiere llevar a cabo los siguientes pasos: 1. Asignar a cada par eslab onarticulaci on del manipulador un sistema de coordenadas DE.
1 para i = 1, . . . , n. 2. Obtener las matrices de transformaci on homog enea Ai i 3. El efecto del movimiento de la articulaci on j en todos los puntos del eslab on i se describe mediante las siguientes matrices Uij :
Uij =
A0 i = qj
j 1 A0 j 1 Qj Ai 0
if j i if j > i
(1.117)
0 con A0 esimo sistema 0 = I (la matriz identidad) y donde Aj 1 relaciona el (j 1)- de coordenadas con el sistema de coordenadas base, y:
0 1 1 0 Qi = 0 0 0 0 0 0 Qi = 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 1 0
si la articulaci on i es de rotaci on
si la articulaci on i es prism atica
36
4. Los efectos de interacci on entre las articulaciones se expresan mediante las siguientes matrices Uijk :
Uijk Uij = = qk qk A0 i qj j 1 k 1 if i k j A0 j 1 Qj Ak1 Qk Ai j 1 k 1 0 = Ak1 Qk Aj 1 Qj Ai if i j k 0 if k > i or j > i (1.118)
5. Obtener el tensor momento de inercia Ji de la i- esima articulaci on (o la matriz de inercia del eslab on) dada por: Ix x +Iy y +Iz z i i i i i i Ixi yi Ixi zi mi x i 2 Ixi xi Iyi yi +Izi zi Ixi yi Iyi zi mi y i 2 Ji == (1.119) Ixi xi +Iyi yi Izi zi Ixi zi Iyi zi mi z i 2 mi x i mi y i mi z i mi i , z i ) es el centro de gravedad (CG) del eslab on i con respecto al donde ( xi , y i- esimo sistema de coordenadas, Ixi , Iyi , Izi son los momentos de inercia con respecto al sistema de coordenadas (xi , yi , zi ), mi es la masa del cuerpo i, x i , i son las distancias desde el CG del cuerpo i hacia el sistema de coory i and z denadas (xi , yi , zi ), y Ixi yi , Iyi zi , Ixi zi , Ixi xi , Iyi yi , Izi zi son los correspondientes momentos de inercia producto. 6. Obtener la matriz sim etrica inercial de aceleraci on H de orden n n, cuyos elementos son: Hik =
j =m ax(i,k)
T r Ujk Jj UT ji
i, k = 1, 2, . . . , n
(1.120)
donde T r signica Traza y n es el n umero de GDL. 7. Obtener los t erminos hikm denidos por:
n
hikm =
j =m ax(i,k,m)
T r Ujkm Jj UT ji
i, k, m = 1, 2, . . . , n
(1.121)
8. Obtener el vector no lineal de fuerzas de Coriolis y centr peta c de orden n 1 cuyos elementos ci toman la forma:
n n
ci =
k=1 m=1
hikm q k q m
(1.122)
9. Obtener el vector fuerza de gravedad d de orden n 1 con elementos:

n
di =
j =1
j j mj gUji rj
i = 1, 2, . . . , n
(1.123)
donde g = [gx0 gy0 gz 0 0] es el vector la gravedad expresado en el sistema de xj y j z j 1]T (el elemento 1 es un factor de escala) es el coordenadas base, y rj j = [ centro de masa del eslab on j y expresado en el j - esimo sistema de coordenadas.
1.3 El M etodo de LagrangeEuler 10.
37
Finalmente, la ecuaci on din amica del manipulador, el modelo LE, toma la forma: T = H q+c+d (1.124) donde T es el vector de torques y fuerzas aplicado a cada coordenada generalizada qi . Si en (1.124) se cumple que: c = Cq entonces se obtiene el modelo de Lagrange del sistema: T = H q + Cq +d (1.126) (1.125)
1.3.3.
Manipulador Rob otico Esf erico (MRE)
Descripci on del Proceso La gure 1.14 muestra el proceso Manipulador Rob otico Esf erico (MRE) de 2GDL, donde M1 es un servomotor DC con codicador o ptico que acciona el movimiento rotatorio de una base met alica (la base del MRE) articulada a su eje. Esta base alica o comprende un disco met alico de espesor d y radio rd unido a una barra met 2 prisma de longitud b, secci on a y masa mp y . La barra y el disco conforman un cuerpo r gido con movimiento rotatorio alrededor del eje z0 . M2 es un servomotor montado en el extremo libre de la barra y se emplea para accionar el movimiento de rotaci on de un eslab on de longitud Lb (el brazo del manipulador) y masa mb . Asumiremos que M1 y M2 son similares, por ello poseen los mismos par ametros. En on angular de la base y 2 es la posici on angular del la gura 1.14, 1 es la posici brazo. Al extremo del brazo se puede articular un efector nal de de masa mh . El manipulador MRT representa un sistema multivariable cuadrado, denominado as por poseer dos entradas: los voltajes KA1 u1 y KA2 u2 aplicado a los terminales de las armaduras de M1 and M2 respectivamente, y dos salida: 1 y 2 . Los par ametros KA1 y KA2 son las ganancias de los amplicadores. La tabla 1.6 muestra los valores de los par ametros del sistema MRT. El Modelo LE del MRE El modelo LE del sistema MRE se determina aplicando el procedimiento de LagrangeEuler desarrollado en la subsecci on 1.3.2, como sigue. Los Par ametros DH del MRE Ver la tabla 1.5, la cual se obtuvo en el ejemplo 1.3).
1 del MRE La Matriz de Transformaci on Homog enea Ai i i1 del MRE para i = 1, 2, se determinaron en el Las matrices de transformaci on Ai ejemplo 1.3.
38
Tabla 1.6: Variables y par ametros del sistema MRE. Las abreviaciones C.G. y c.r. signican centro de gravedad y con respecto, respectivamente. S mbolo md mp mb mh d rd b a Lb Ly1 Lx2 Jh Jm Bm Jg1 , Jg2 Bg1 , Bg2 n Ra La V b 1 , Vb 2 V a 1 , Va 2 ia1 , ia2 KA Km Kb u 1 , u2 g Descripci on Masa del disco Masa de la barra o prisma Masa del brazo (eslab on) Masa del efector nal Espesor del disco Radio del disco Longitud de la barra Lado de la secci on de la barra Longitud del brazo (eslab on) Longitud del C.G. c.r. a (x1 , y1 , z1 ) Longitud del C.G. c.r. a (x2 , y2 , z2 ) Momento de inercia del efector nal Momento de inercia de M1 y M2 Constante de fricci on de M1 y M2 Momento de inercia de los engranajes Constante de fricci on en engranajes Relaci on de engranajes de M1 y M2 Resistencia de armadura de M1 y M2 Inductancia de armadura de M1 y M2 Voltaje contraelectromotriz Voltaje de armadura Corriente de armadura Ganancia del amplicador Constante del motor de M1 y M2 Constante contraelectromotriz Voltaje de entrada Constante gravitacional Valor 0.4 1.0 0.1 0.01 0.07 0.21 0.044 0.3 Unidad kg kg kg kg m m m m m m m kg-m2 kg-m2 N-m-s/rad kg-m2 N-m-s/rad H V V A N-m/A V-s/rad V m/s2
1.8104 1.83106 5.63105 7.05105 18.5 2.8 1.5103 24 0.7 14.9 0.9 0.9 1.4 9.81
39
y y M Link L2
y
2
M3 z2
x2 Gripper z2
x2
q
2
1111 0000
y
1
M3
Lx2 x a z0 Metallic bar of lenght b Disk : Axis is pointing away from the plane x y 0
0
z1 Ly1
z1
1
x1 a b z 0
M2
h q
1
x0
y0 q
1
Servomotor M 1
M1
Frontal view
Lateral view
Figura 1.14: El manipulador rob otico esf erico (MRE).
Determinaci on de las Matrices Uij Para simplicar la notaci on, se emplean las relaciones siguientes: Si = seni y Ci = cosi para i = 1, 2. Para el sistema MRE se cumple que: 0 1 0 0 1 0 0 0 Q1 = Q2 = (1.127) 0 0 0 0 0 0 0 0 Sustituyendo (1.127) en (1.117) se obtiene: S1 0 C1 0 C1 0 S1 0 U12 = 0 U11 = 0 0 0 0 0 0 0 0 S1 C2 S1 S2 C1 L2 S1 C2 C1 C2 C1 S2 S1 L2 C1 C2 U21 = 0 0 0 0 0 0 0 0 C1 S2 C1 C2 0 L2 C1 S2 S1 S2 S1 C2 0 L2 S1 S2 U22 = C2 S2 0 L2 C2 0 0 0 0
40 Determinaci on de las Matrices Uijk El empleo de (1.118) para el MRE produce: C1 S1 = 0 0 0 S1 0 C1 0 0 0 0 0 0 0 0
U111
U112 = U121 = U122 = 0
C1 C2 C1 S2 S1 L2 C1 C2 S1 C2 S1 S2 C1 L2 S1 C2 U211 = 0 0 0 0 0 0 0 0 S1 S2 S1 C2 0 L2 S1 S2 C1 S2 C1 C2 0 L2 S1 C2 U212 = 0 0 0 0 0 0 0 0 S1 C2 0 L2 S1 S2 S1 S2 C1 S2 C! C2 0 L2 C1 S2 U221 = 0 0 0 0 0 0 0 0 C1 C2 C1 S2 0 L2 C1 C2 S1 C2 S1 S2 0 L2 S1 C2 U222 = S2 C2 0 L2 S2 0 0 0 0 Determinaci on de la Matriz de Inercia del Eslab on Ji La matriz de inercia del eslab on Ji del SRM se computa a partir de la relaci on (1.119) con i = 1 para la base (disco m as la barra) e i = 2 para el brazo L2 . La base s olo posee movimiento rotacional alrededor del eje de giro y1 . Por consiguiente: Ix1 x1 = Iz1 z1 = Ix1 y1 = Ix1 z1 = Iy1 z1 = 0 Iy1 y1 = Iy1d y1d + Iy1b y1b = 2I1 donde Iy1d y1d y Iy1p y1p son los M.I. (momentos de inercia) del disco y de la barra con respecto al sistema de coordenadas (x1 , y1 , z1 ) (ver gura 1.14). Despreciando la longitud del radio del servomotor M2 : 1 h 2 Iy1d y1d = md rd + md ( + b)2 2 2 Iy1p y1p = 1 b mp (a2 + a2 ) + mp ( )2 12 2
2 2 donde 1 on, md ( h 2 md rd es el M.I. del disco girando en su eje de rotaci 2 + b) es el M.I. 1 2 2 del disco con respecto al sistema (x1 , y1 , z1 ), 12 mp (a + a ) es el M.I. de la barra
41
b 2 girando en su eje de rotaci on (paralelo al lado b) y mp ( 2 ) es el M.I. de la barra con respecto al sistema (x1 , y1 , z1 ). Por consiguiente, J1 toma la forma:
0 0 0 I1 0 I1 0 m1 Ly1 J1 = 0 0 I1 0 0 m1 Ly1 0 m1
(1.128)
where m1 = md + mb + mM 2 y Ly1 es la distance desde el origen del sistema de coordenadas (x1 , y1 , z1 ) al centro de gravedad de m1 . El brazo presenta movimiento rotatorio alrededor del eje z2 . Por consiguiente: Ix2 x2 = Iy2 y2 = Ix2 y2 = Ix2 z2 = Iy2 z2 = 0 y considerando al brazo una barra de masa mb y longitud Lb : Iz2 z2 = 1 Lb 2 mb L2 ) + Jh = 2I2 b + mb ( 12 2
1 donde 12 mb L2 b es el M.I. del brazo girando en un eje perpendicular a la barra y que b 2 pasa por su C.M. y mb ( L 2 ) es le M.I. del brazo referido al sistema de coordenadas (x2 , y2 , z2 ) (ver gura 1.14) y Jh es el M.I. de la mano del manipulador de masa mh , la cual incluye tambi en la masa de la carga aplicada a la mano. Luego, la matriz J2 para i = 2 viene a ser: I2 0 0 m2 Lx2 0 I2 0 0 (1.129) J2 = 0 0 0 I2 m2 Lx2 0 0 m2
donde: m2 = mb + mh , Lx2 es la distancia del sistema de coordenadas (x2 , y2 , z2 ) al centro de gravedad de m2 . Determinaci on de la matriz sim etrica inercial de aceleraci on H Empleando (1.120), los elementos de H se determinan como:
T T 2 H11 = T r(U11 J1 U11 ) + T r(U21 J2 U21 ) = 2I1 + (I2 + 2m2 Lx2 L2 m2 L2 2 )cos q2 T H12 = T r(U22 J2 U21 )=0 T H21 = T r(U21 J2 U22 )=0
T ) = I2 + 2m2 Lx2 L2 m2 L2 H22 = T r(U22 J2 U22 2
Por consiguiente:
H11 = 2I1 + H22 cos2 q2
Determinaci on de los t erminos hikm Usando la relaci on (1.121) para el MRE, se obtiene:
T T ) + T r(U211 J2 U21 )=0 h111 = T r(U111 J1 U11
42

T h112 = T r(U212 J2 U21 ) = (m2 L2 2 2m2 L2 lc2 I2 )senq2 cosq2 T h121 = T r(U221 J2 U21 ) = (m2 L2 2 2m2 L2 lc2 I2 )senq2 cosq2 T h122 = T r(U222 J2 U21 )=0 T ) = (2m2 L2 lc2 m2 L2 h211 = T r(U211 J2 U22 2 + I2 )senq2 cosq2 T T T h212 = T r(U212 J2 U22 ) = h221 = T r(U221 J2 U22 ) = h222 = T r(U222 J2 U22 )=0
El Vector Fuerza de Coriolis y Centr peta c = [ci ] del MRE Usando (1.122), los elementos ci vienen a ser:
2 2 c1 = h111 q 1 + h112 q 1 q 2 + h121 q 2 q 1 + h122 q 2 2 2 c2 = h211 q 1 + h212 q 1 q 2 + h221 q 2 q 1 + h222 q 2
= 2(m2 L2 1 q 2 sin q2 cos q2 = 2H22 q 1 q 2 sin q2 cos q2 2 2m2 L2 Lx2 I2 )q

2 2 = (2m2 L2 Lx2 m2 L2 1 sin q2 cosq2 = H22 q 1 sin q2 cosq2 2 + I2 )q
Determinaci on del Vector Fuerza de Gravedad d Aplicando (1.123) en el MRE se obtiene:

1 = [0 Ly1 0 1]T r 1 2 r 2 = [Lx2 0 0 1]T
g = [gx0 gy0 gz 0 0] = [0 0 g 0]
1 2 m2 gU21 r2 =0 d1 = m1 g U11 r1 2 d2 = m2 g U22 r2 = m2 gLx2 cos q2
donde g es la constante gravitacional. El Modelo de LagrangeEuler del sistema MRE De acuerdo a (1.124), el proceso MRE se puede describir como: T= T1 T2 = H(q) q + c(q, q ) + d(q) (1.130)
donde (suprimiendo los argumentos por simplicidad): H= H11 H12 H21 H22 c= c1 c2 d= d1 d2 (1.131) (1.132)
1 + H12 q 2 + c1 + d1 = H11 q 1 + c1 T1 = H11 q T2 = H21 q 1 + H22 q 2 + c2 + d2 = H22 q 2 + c2 + d2 El modelo de Lagrange del Sistema MRE
Siempre que c = Cq, el modelo de Lagrange dado por (1.126) se puede obtener de (1.130). Sin embargo, si se requiere tener como fuerzas de de control los voltajes de armadura u1 y u2 en lugar de T1 y T2 respectivamente, necesitamos entonces modelar los subsistemas el ectricos del MRE como sigue.
1.3 El M etodo de LagrangeEuler Modelado de M1 Accionando la Base del SRM
43
La gura 1.15 muestra el servomotor M1 accionando la base del MRE. El voltaje de entrada KA1 u1 aplicado a la armadura est a dado por:
Ra1 + u
1
La1 + Vb1 I a1 Tg1 J g1 111 000 000 B g1 111 111 000 00 1 11 B m1 J m1 n 11 00 1 T T Tm1 g2
1
+ Va1 KA1 -
Figura 1.15: Servomotor M1 accionando la base del MRE
a1 + Ra1 Ia1 + Vb1 = La1 I a1 + Ra1 Ia1 + Kb1 n1 q 1 Va1 = KA1 u1 = La1 I
(1.133)
on de engranajes. El torque motor Tm1 est a dado por: en donde n1 es la relaci 1 + Bm1 n1 q 1 + Tg1 Tm1 = Km1 Ia1 = Jm1 n1 q (1.134)
on se mientras que la ecuaci on del torque Tg2 requerido para accionar el primer eslab expresa como: 1 + Bg1 q 1 + T1 (1.135) Tg2 = nTg1 = Jg1 q donde T1 es el torque de carga. Substituyendo (1.135) en (1.134) se obtiene: 1 + Beq1 q 1 + T1 n1 Km1 Ia1 = Jeq1 q donde: Jeq1 = n2 1 Jm1 + Jg 1 Beq1 = n2 1 Bm1 + Bg 1 (1.136)
Reemplazando (1.131) en (1.136) nos conduce a: 1 + Beq1 q 1 + H11 q 1 + C1 n1 Km1 Ia1 = Jeq1 q La derivada de (1.137) produce:
(3) 11 q 1 a1 = Jeq1 q (3) + Beq1 q 1 + H11 q1 + H 1 + C n1 Km1 I 1
(1.137)
q1
(3)
d 3 q1 dt3
(1.138)
Empleando (1.133), (1.137), y (1.138), se encuentra que la ley de control u1 es:

(3) (3) 11 q 1) u1 = LT 1 (H11 q1 + Jeq1 q1 + H 1 + Beq1 q 1 + C
1 + Beq1 q 1 + H11 q 1 + C1 ) + NT 1 q 1 + RT 1 (Jeq1 q donde: LT 1 = La1 n1 KA1 Km1 Ra 1 n1 KA1 Km1 n1 Kb1 Km1
(1.139)
RT 1 =
NT 1 =
44
Modelando M2 Accionando el Brazo del MRE La gura 1.15 muestra el servomotor M2 accionando el brazo del MRE. Siguiendo el mismo procedimiento para determinar u1 , el voltaje de control u2 resulta:
3 3 2 ) 2 + d + Jeq2 q2 + Beq2 q 2 + C u2 = LT 2 (H22 q2
+ RT 2 (Jeq2 q 2 + Beq2 q 2 + H22 q 2 + C2 + d2 ) + NT 2 q 2 donde: Jeq2 = n2 2 Jm2 + Jg 2 LT 2 = La2 n2 KA2 Km2 RT 2 = Beq2 = n2 2 Bm2 + Bg 2 Ra 2 n2 KA2 Km2 NT 2 = n2 Kb2 Km2
(1.140)
Despreciando las inductancias de armadura de los servomotores M1 y M2 , es decir,
Ra2 + u 2 + Va2 -
La2 + Vb2 Ia2 Tm2 Tg1
KA1
J m2
111 000 000 111 111 000 B m2
J g2 B g2
n2
Tg2
00 2 11 11 00 T
2
Figura 1.16: Servomotor M2 accionando el brazo del MRE jando en cero LT 1 y LT 2 en (1.139) y (1.140) respectivamente, los voltajes de control u1 y u2 toman la forma: 1 + Beq1 q 1 + T1 ) + NT 1 q 1 u1 = RT 1 (Jeq1 q 2 + Beq2 q 2 + T2 ) + NT 2 q 2 u2 = RT 2 (Jeq2 q mientras que el modelo de Lagrange del MRE viene a ser: M(q)q + P(q, q )q + d(q) = u donde: M(q) = q= q1 q2 u= u1 u2 (1.143) (1.141) (1.142)
0 RT 1 (Jeq1 + 2I1 + H22 cos2 q2 ) 0 RT 2 (Jeq2 + H22 )
P(q, q ) =
2 sin q2 cos q2 ) + NT 1 RT 1 H22 q 1 sin q2 cos q2 RT 1 (Beq1 H22 q RT 2 H22 q 1 sin q2 cos q2 RT 2 Beq2 + NT 2 d(q) = 0 RT 2 m2 g Lx2 cos q2
1.3 El M etodo de LagrangeEuler El Modelo No Lineal de Orden n = 4 en el Espacio de Estado
45
Para obtener un modelo el espacio de estado del MRE de orden n = 4 podemos seleccionar las siguientes variables de estado: x1 = 1 (posici on angular de la base), 1 (velocidad angular de la base), y on angular del brazo), x3 = x2 = 2 (posici 2 (velocidad angular del brazo). Empleando tales variables de estado el modelo x4 = de Lagrange del MRE dada en (1.143), el modelo no lineal de orden n = 4 en el espacio de estado resulta: x 1 f1 (x, u) x 2 = f (x, u) = f2 (x, u) x = (1.144) x f3 (x, u) 3 f4 (x, u) x 4 donde: f2 (x) = x4 f1 (x, u) = x3 [RT 1 (Beq1 2H22 x4 sin x2 cos x2 ) + NT 1 ]x3 + u1 f3 (x, u) = RT 1 (Jeq1 + 2I1 + H22 cos2 x2 ) (RT 2 Beq2 + NT 2 )x4 RT 2 (H22 x2 3 sin x2 + m2 gLx2 )cos x2 + u2 f4 (x, u) = RT 2 (Jeq2 + H22 ) La ecuaci on de estado para las salidas y1 = x1 and y2 = x2 toma la forma: y= y1 y2 = h1 (x) h2 (x) = 1 0 0 0 0 1 0 0 x (1.145)
El Modelo No Lineal de Orden n = 6 en el Espacio de Estado Para obtener un modelo el espacio de estado del MRE de orden n = 6 podemos on angular de la base), seleccionar las siguientes variables de estado: x1 = 1 (posici 1 (velocidad angular de la base), y x2 = 2 (posici on angular del brazo), x3 = 2 (velocidad angular del brazo), x5 = 1 (aceleraci on angular de la base), and x4 = x6 = 2 (aceleraci on angular del brazo). Empleando las relaciones (1.139) y (1.140), el modelo no lineal de orden n = 6 en el espacio de estado resulta: f1 (x, u) x 1 . . . (1.146) x = . . = f (x, u) = . x 6 donde: f1 (x) = x3 f5 (x) = f2 (x) = x4 P1 + u1 LT 1 (H11 + J1 ) f3 (x) = x5 f4 (x) = x4 P2 + u2 f6 (x) = LT 2 (H22 + J2 ) f6 (x, u)
11 q 1 ) + RT 1 (Jeq1 q P1 = LT 1 (H 1 + Beq1 q 1 + C 1 + Beq1 q 1 + H11 q + C1 ) + NT 1 q 1 2 ) + RT 2 (Jeq2 q 2 + d P2 = LT 2 (Beq2 q 2 + C 2 + Beq2 q 2 + H22 q + C2 + d2 ) + NT 2 q 2 La ecuaci on de estado para las salidas y1 = x1 and y2 = x2 resulta: y= y1 y2 = h1 (x) h2 (x) = 1 0 0 0 0 0 0 1 0 0 0 0 x (1.147)
46
1.4.
Problema 1.1
PROBLEMAS
Determinar el modelo de Lagrange del MRAE (manipulador rob otico con articulaci on el astica) descrito en la subsecci on 1.1.2, empleando el m etodo de la ecuaciones de Lagrange. Problema 1.2 Para el manipulador rob otico con articulaci on ja mostrado en la gura 1.1 y descrito en la subsecci on 1.1.1, determinar: (a) Su modelo de Lagrange (ecuaci on (1.28)) aplicando las leyes f sicas. (b) Su modelo de Lagrange (ecuaci on (1.28)) aplicando las ecuaciones de Lagrange. (c) Su descripci on no lineal en el espacio de estado (ecuaciones de estado y de salida). Problema 1.3 Determinar la descripci on no lineal en el espacio de estado del manipulador rob otico traslacional descrito en la subsecci on 1.2.2, para los casos siguientes: (a) Despreciando la inductancia de armadura La de los servomotores. (b) Sin despreciar la inductancia de armadura La de los servomotores. Problema 1.4 Para el manipulador rob otico esf erico descrito en la subsecci on 1.2.2: (a) Vericar su modelo LE (ecuaci on (1.130)) aplicando las leyes f sicas. (b) Vericar su modelo LE (ecuaci on (1.130)) usando las ecuaciones de Lagrange. Problema 1.5 La gura 1.17 ilustra un Manipulador Rob otico Traslacional Subactuado (MRTS) on por de 3 GDL. M1 es un servomotor DC que posee un mecanismo de reducci engranajes y un codicador o ptico articulado a una polea de radio Rp . Esta polea usa un cable para transmitir la fuerza F1 para accionar el movimiento de traslaci on de un carro de masa Mc montado sobre un par de rieles a lo largo de un eje x. M2 es tambi en un servomotor con codicador o ptimo y mecanismo de reducci on, empleado para accionar el movimiento rotatorio del primer eslab on del MRTS alrededor de un pivote ubicado en el CG del carro. Este primer eslab on es tambi en articulado a un segundo eslab on. En esta segunda articulaci on se monta un codicador o ptico de masa despreciables para detectar la posici on angular del segundo eslab on. En la gura 1.17 1 es la posici on angular del primer eslab on longitud L1 y masa m1 , 2 es la posici on angular del segundo eslab on longitud L2 y masa m2 , r es la posici on longitudinal del carro y F es la fuerza de fricci on opuesta al movimiento del carro. El sistema MRTS a ser controlado a lazo cerrado, representa un sistema no cuadrado porque posee dos entradas de control: los voltajes KA1 u1 y KA2 u2 aplicados los terminales de las armaduras de M1 and M2 respectivamente, y tres salidas por controlar: r, 1 y 2 . Los par ametros KA1 y KA2 son las ganancias de los amplicadores. La tabla 1.4 muestra los valores de los par ametros del sistema. El MRTS
1.4 PROBLEMAS
47
tambi en se denomina subactuado porque el n umero de entradas (dos) es menor que el n umero de salidas (3). (a) Determinar el modelo de Lagrange del MRTS. (b) Determinar las ecuaciones de estado y de salida del MRTS cuando La = 0. (c) Determinar las ecuaciones de estado y de salida del MRTS cuando La = 0.
y y Pulley M2 u2 F r x1
L2 2
1
Gripper
M3
u1 M1
Link 2 L1 Link 1 F1
M 3 Gripper of mass m H (lateral view) Pulley x Rp
Figura 1.17: El manipulador rob otico traslacional subactuado (MRTS).
Problema 1.6 La gure 1.18 muestra un Manipulador Rob otico Esf erico Subactuado (MRES) de 3 ptico que acciona el movimienGDL, donde M1 es un servomotor DC con codicador o to rotatorio de una base met alica (la base del MRE) articulada a su eje. Esta base alica de comprende un disco met alico de espesor h y radio Rd unido a una barra met gido con movimienlongitud b y secci on a2 . La barra y el disco conforman un cuerpo r to rotatorio alrededor del eje z0 . M2 es un servomotor montado en el extremo libre de la barra y se emplea para accionar el movimiento de rotaci on del primer eslab on de longitud L2 y masa m2 . Este primer eslab on est a articulado a un segundo eslab on de on se monta un codicador o ptico longitud L3 y masa m3 . En esta segunda articulaci de masa despreciable para detectar la posici on angular del segundo eslab on. En la gura 1.18, q1 es la posici on angular de la base, q2 es la posici on angular del primer eslab on y q3 es la posici on angular del segundo eslab on. Las salidas q1 , q2 y q3 del sistema ser an controladas a lazo cerrado. El sistema MRES representa un sistema no cuadrado porque posee dos entradas de control: los voltajes KA1 u1 y KA2 u2 aplicados los terminales de las armaduras de M1 and M2 respectivamente, y tres salidas por controlar: q1 , q2 y q3 . Los par ametros KA1 y KA2 son las ganancias de los amplicadores. La tabla 1.6 muestra los valores de los par ametros del sistema. El MRES tambi en se denomina subactuado porque el n umero de entradas (dos) es menor que el n umero de salidas (tres). (a) Determinar modelo LE del MRES.
48

x x3
y Link L 3 y
2
3 q
M3 3
3 Gripper z 3 z3 Lx3
1111 0000 y
x2
2
y 3
M3
y M
q
2
Link L2
z2
x2 Encoder Lx2
z2 y z1
1
Encoder
z1 Ly1 a z0
x1 a b z0
M2
Metallic bar of lenght b : Axis is pointing away from the plane Disk y x
0 0
h q
1
x0
y0 q
1
h M1
Servomotor M 1
Frontal view
Lateral view
Figura 1.18: El manipulador rob otico esf erico subactuado (MRTS).
(b) Determinar el modelo de Lagrange del MRES. (c) Determinar la ecuaci on de estado y de salida del MRES para La = 0. (d) Determinar la ecuaci on de estado y de salida del MRES para La = 0. Problema 1.7 La gura 1.19 muestra dos plataformas P1 y P2 de masas m1 y m2 acopladas por resorte y actuadas hidr aulicamente. Las salidas de este sistema son las posiciones nales de referencia se jan mediante individuales y1 e y2 de las plataformas. Las se los potenmci ometros RP1 y RP2. El objetivo de control en este problema consiste en dise nar dos fuerzas de control (generadas por dos actuadores hidr aulicos r apidos) que lleven a cero sucientemente r apido los errores de posici on e1 = r1 y1 y e2 = r2 y2 . Asumir que el uido hidr aulico disponible proviene de una fuente a presi on constante y que la compresibilidad del uido es despreciable. Se sabe tambi en que para desplazamientos peque nos de la salida ci (i = 1,2), el ujo volum etrico Qi en el actuador est a relacionado con el error ei y la presi on es del pist on mediante la relaci on: diferencial Pi a trav Qi = A dci = ke Gei kP Pi dt
donde A es la secci on del pist on y G es la ganancia del amplicador. Para el sistema descrito: (a) Determine su modelo de Lagrange. (b) Determine su modelo en el espacio de estado (ecuaciones de estado y de salida) .
1.4 PROBLEMAS
49
e1 + u1
r1
1 0 0 1
1 0 0 1 0 1 0 1 0 1 0 1 0 1
1
1 0 0 1 0 1 P 1 0 0 1 0 1 P
r2
R 1 0 0-+ 1 0 1 0 1
Y1 + K1 u2 B1
1 0 y 0 1 0 1
y 1 0 0 1 0 1 B2
e1 or e2 Return Pressure source
Electric actuator
1 0 01
R2
1 0 0 1 0 1 0 1 0 1 0 1 0 1
Y2 e2 K2
Return P 1 or y 1 or y 2 P2
111111111111111 000000000000000
Figura 1.19: Plataformas acopladas por resorte (izquierda) y su actuador hidr aulico (derecha).
Problema 1.8 Considere ahora que los dos actuadores hidr aulicos del problema 1.7 se reemplazan por cilindros neum aticos. Las ecuaciones que describen la din amica de cada cilindro neum atico son: y i = vi kyi bvi + Api v i = m RT Rv psupply ui RT Rv pi pi Avi p i = Ayi
i = 1, 2
donde m = 0.05 kg es la masa del aire, b = 0.01 kg/s es el coeciente de fricci on, k = 0.9 kg/s2 es el coeciente de rigidez, A = 1.57104 m2 es el area de la secci on 2 2 del pist on, R = 287.05 m /K s es la magnitud de la constante para aire seco, Tmax = 315.15 K y Tmin = 275.15 K son las temperaturas m axima y m nima del aire 9 en el cilindro, Rv max = 3.33310 m s y Rv min = OOJJOOO 109 m s son las resistencias m axima y m nima de la v alvula, y psupply es la presi on de alimentaci on del aire. Para este caso: (a) Determine el modelo de Lagrange del sistema de plataformas. (b) Determine el correspondiente modelo en el espacio de estado. Problema 1.9 La gura 1.20 ilustra una columna de destilaci on para fraccionar petr oleo pesado. El modelo con tiempos muertos del fraccionador (ecuaci on (1.148)), en el cual p es el operador de Laplace, se describe en [28] y [27]. Tal modelo considera tres variables que deben de ser controladas: la composici on de los productos de la parte superior
50
Y1 y lateral y2 de la columna, y la temperatura de fondos Y3 . Las se nales o fuerzas de control correspondientes (las variables manipuladas) son: el ujo superior U1 , el ujo lateral U2 y el reujo de fondos U3 . Considerar que que se dispone de la energ a calor ca requerida por la columna. Para el sistema en cuesti on: (b) Determine su modelo en el espacio de estado. (a) Determine su modelo de Lagrange. 4,05e27p 1,77e28p 5,88e27p 1+50p 1+60p 1+50p Y1 (p) 5,39e18p 5,72e14p 6,9e15p U1 (p) U2 (p) Y2 (p) = (1.148) 1+50p 1+60p 1+40p 20p 22p Y3 (p) U ( p ) 3 4,38e 4,42e 7,2
1+33p 1+44p 1+19p
PC
T LC FC
Upper Reflux T Intermediate Reflux T T LC T Side Stripper
Top Draw
FC
A Bottoms Reflux Feed LC F T
Side Draw
Bottoms
Figura 1.20: Columna de destilaci on para fraccionar petr oleo pesado.
Problema 1.10 El modelo din amico del reactor qu mico con chaqueta de enfriamiento ha sido tomado de [29] y [27]. La gura 1.21 muestra este reactor en el cual ingresa un uido liquido que contiene el producto A. Este liquido se revuelve dentro del tanque mediante un agitador para formar una mezcla perfecta. El producto A en esta condici on va a experimentar una reacci on irreversible exot ermica. Debido a que este tipo de reacci on libera calor, es entonces necesario que la temperatura en el interior del tanque sea controlada por medio del agua de refrigeraci on que circula en la chaqueta que rodea
1.4 PROBLEMAS
51
al reactor. La reacci on qu mica del producto o componente A dentro del tanque para formar el componente B se formula como: A B
Esta reacci on se realiza a una velocidad espec ca K en horas1 , cuya expresi on se da m as adelante. Los par ametros y variables que intervienen en el sistema de reacci on (ver gura 1.21) son:
Product A
Coolant Fc Tc 0
11 00 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11
Reactor
Tl
A Ca
B Cb
11 00 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11
Ca 0
Fl
Tl 0
Tc Jacket
Fc
Products A and B Ca Cb Fl Tl
Figura 1.21: Reactor qu mico con chaqueta de enfriamiento.
1) A: producto que ingresa al reactor. 2) B: producto resultante de la transformaci on del producto A dentro del tanque. 3) Ca0 : concentraci on del producto A que ingresa al reactor. 4) Tl0 : temperatura del liquido que contiene el producto A. es del reactor. Cuando el ujo ingresa al 5) F : Flujo del liquido que pasa a trav reactor, contiene solamente el producto A. Cuando el ujo sale del reactor, contiene los productos A y B. Este ujo es la alimentaci on al reactor. 6) T : temperatura del liquido que sale del reactor. on del producto B a la salida del reactor y en el interior. 7) Cb : Concentraci 8) Ca : Concentraci on del producto A. Siempre debe de cumplirse la desigualdad: Ca < Ca0 . En el estado estacionario se tiene: Ca + Cb = Ca0 . 9) Tc0 : temperatura del agua de refrigeraci on que ingresa a la chaqueta. on en el interior y en la salida de la la 10) Tc : temperatura del agua de refrigeraci chaqueta. on. 11) Fc : ujo del agua de refrigeraci
52
Las concentraciones se dan en kmol/m3 , los ujos en m3 /h y las temperaturas en o C (grados Celcius). A continuaci on se muestran las ecuaciones diferenciales que describen la din amica del sistema. Para ello se aplican las leyes de conservaci on de la masa y de la energ a. Para hacer esto, se supone que no existe liquido acumulado en el reactor, que las concentraciones y temperaturas son homog eneas y que las p erdidas de energ a hacia el exterior son despreciables. Las ecuaciones de balance de masa son: d(V Ca ) dt d(V Cb ) dt = F Ca0 V kCa F Ca = V kCa F Cb (1.149) (1.150)
donde: F Ca0 es el ujo del componente A en kmol/h que ingresa al sistema, F Ca es el ujo de A que sale del sistema, V es el volumen del liquido en el sistema, V kCa es la velocidad de formaci on de A (el signo negativo indica que el componente A on, F Cb es el se est a consumiendo), d(VdtCa ) es el ujo de A (en kmol/h) en transici on de B a partir ujo de B que sale del sistema, +V kCb es la velocidad de formaci de A (por esta raz on posee signo positivo) y d(VdtCb ) es el ujo de B (en kmol/h) en transici on. Las ecuaciones de balance de energ a se formulan como: d(V Cp T ) dt d(Vc c Cp c Tc ) dt = F Cp T 0 F Cp T Q + V kCa H = Fc c Cp c (Tc0 Tc ) + Q (1.151) (1.152)
co entregado al sistema, F Cp T es el ujo donde: F Cp T 0 es el ujo calor calor co que sale del sistema, Q es el ujo calor co absorbido por el agua de reco producido en la reacci on debido a la entalp a frigeraci on, V kCa H es ujo calor H de la reacci on, d(V Cp T )/dt es el ujo calor co en transici on (acumulado) en el interior del tanque, Fc c Cp c (Tc0 Tc ) es el ujo calor co absorbido en el sistema (refrigeraci on) y d(Vc c Cp c Tc )/dt es el ujo calor co en transici on (acumulado) en la chaqueta del tanque. Todos los ujos calor cos est an en kJ/h, mientras que la entalp a H posee unidades de kJ/kmol. El balance de energ a en el sistema asume que la temperatura Tc es uniforme en toda la chaqueta. La transferencia de calor entre el sistema de reacci on (que se realiza on (que se realiza a la temperatura Tc ), a la temperatura T ) y el agua de refrigeraci se describe mediante la relaci on: Q = U S (T Tc ) (1.153)
donde U es el coeciente global de transmisi on de calor en kJ/(h m2 K), S es la supercie efectiva de transferencia de calor en m2 . Tener en cuenta que en general la supercie S puede variar debido a los ujos que ingresan al reactor y cuando algunas supercies dentro del tanque no est an completamente cubiertas todo el tiempo con la masa liquida de la reacci on. La velocidad de reacci on k en h1 tiene la forma: k = eEa /R(272+T
)
(1.154)
donde Ea es la energ a de activaci on en kJ/kmol y R es la constante universal de los gases. La tabla 1.7 muestra los valores nominales de los par ametros del sistema.
1.4 PROBLEMAS
53
El objetivo de control es estabilizar la temperatura T , as como tambi en la concentraci on Cb a la salida del reactor, cumpliendo determinadas especicaciones de dise no, tales como tiempo de estabilizaci on, m aximo sobrepico de las respuestas controladas y error en estado estable de las respuestas con respecto a las se nales de referencia o set points. Las fuerzas de control para lograr este objetivo son el ujo on Fc . Para este sistema: F del liquido y el ujo de refrigeraci (a) Determine su modelo en el espacio de estado. (b) Determine su modelo de Lagrange. on F , gracar (c) Para un cambio escal on de 25 a 26 m3 /h en el ujo de alimentaci la respuesta no lineal a lazo abierto correspondiente a Cb , T , Ca y Tc . (d) Para un cambio de 1 m3 /h en el ujo de enfriamiento Fc , graque la respuesta a lazo abierto no lineal del sistema correspondiente a Cb , T , Ca y Tc . Tabla 1.7: Par ametros nominales del reactor qu mico con chaqueta de enfriamiento. S mbolo R Ea H U c Cp Cp c S V Vc Tl 0 Tc 0 Ca0 : Descripci on Coeciente de la velocidad de reacci on Constante de los gases ideales Energ a de activaci on Entalp a de reacci on Coeciente global de transmisi on de calor Densidad del liquido Densidad del refrigerante Calor espec co del l quido Calor espec co del refrigerante Supercie efectiva de intercambio de calor Volumen del tanque Volumen de la chaqueta Temperatura del liquido entrante Temperatura del refrigerante entrante Concentraci on del liquido de entrada Valor 29.063 8.314 2100 2100 4300 800 1000 3 4.1868 24 24 8 34 20 8 Unidades h1 kJ/K kmol kJ/kmol kJ/kmol kJ/(h m2 K) kg/m3 kg/m3 kJ/(kg K) kJ/(kg K) m2 m3 m3
oC oC
kmol/m3
Problema 1.11 El modelo din amico no lineal de la aeronave mostrada en la gura 1.22 comprende tres conjuntos de ecuaciones diferenciales de primer orden, involucrando las siguientes variables: Los angulos , y que caracterizan la posici on del avi on con respecto a los
54
Modelado de Sistemas No Lineales llamados ejes del viento. El a ngulo , y se denominan de gui nada (yaw en ingl es), de cabeceo (pitch) y de alabeo (roll) respectivamente. Las velocidades p, q y r son los componentes del vector velocidad angular w con respecto a un cuadro referencial jo con la aeronave. Las componentes p, q y r se denominan tasa pitch, tasa roll y tasa yaw respectivamente. La amplitud V de la velocidad a lo largo de la trayectoria de vuelo, y dos a ngulos y que identican la direcci on del vector tangente a la trayectoria de vuelo con respecto al eje de simetr a principal del avi on. Tales a ngulos se denominan angulo de ataque y a ngulo de desplazamiento lateral. es el angulo entre la tangente a la trayectoria de vuelo y el eje longitudinal en la direcci on pitch, y es el angulo entre la tangente a la trayectoria de vuelo y el eje longitudinal en la direcci on yaw. Las derivadas con respecto al tiempo de los angulos , y son: = M(, , ) w p w = q r
donde w es el vector velocidad angular expresado con respecto a los ejes del viento y M es una matriz de la forma: 0 sin sec cos sec cos sin M(, , ) = 0 1 sin tan cos tan El vector w se puede expresar como: w = J1 S(w)Jw + J1 T donde S es la matriz de oblicuidad sim etrica: 0 r q p S(w) = r 0 q p 0 J es la matriz de inercia: 0 Ixz Ix Iy 0 J= 0 Ixz 0 Iz y T representa el vector de torques externos. Finalmente, las derivadas de V , y con respecto al tiempo tienen la forma: V = (D/m) g sin
= q q sec (p cos + r sin ) tan = r + p sin r cos
1.4 PROBLEMAS
55
donde D es una cantidad escalar llamada la fuerza de arrastre, m es la masa del avi on y g es la aceleraci on de la gravedad. Para completar el modelo din amico es necesario especicar la relaci on de las tasas de p, q y r que aparecen en el primer y tercer conjunto de ecuaciones, est an relacionadas con las otras variables como sigue: p = p cos cos + (q ) sin + r sin cos 1 (L mg cos cos ) q = mV 1 (S + mg cos sin ) r = mV en donde S y L son dos cantidades escalares denominadas fuerza lateral y de sustentaci on respectivamente. Reemplazando p , q y r en las ecuaciones previas, y resolviendo para , se obtiene un sistema de nueve ecuaciones diferenciales de primer orden en las variables , , , p, q , r, V , y ), las cuales pueden constituir las variables de estado del sistema. El vector de torque externos T y el vector columna fuerzas externas con elementos D, L y S , contienen las variables de entrada. T puede expresarse como: 0 b13 cos a11 V 2 sin + a12 rV + a13 pV b11 cos a e 0 b22 cos 0 T = a21 V 2 + a22 V 2 sin + a23 qV + 2 r a31 V sin + a32 rV + a33 pV 0 0 b33 cos ametros aerodin amicos jos que dependen de la en donde aij s y los bij s son los par geometr a del avi on, de la densidad del aire, etc., y a , e y r denotan las deexiones del aler on, del elevador y del tim on. El vector columna con elementos D, L y S se puede expresar como: D cos cos c11 V 2 + c12 V 2 cos L = c21 V 2 + c22 V 2 sin 2 + P P sin 2 c31 V sin 2 S cos cos donde los cij s son par ametros de ganancia ja, P indica el m aximo empuje y p la posici on del acelerador. Las ecuaciones presentadas describen un sistema cuyo estado on del vector de est a denido en una cierta vecindad abierta U de R9 , sujeto a la acci entrada u con elementos a , e , r y P . (a) Determine el modelo no lineal en el espacio de estado de la aeronave.
V
Figura 1.22: Aeronave. (b) Determine el modelo de Lagrange de la aeronave. Problema 1.12
56
La gura 1.23 muestra un motor DC en el cual el voltaje de armadura se mantiene constante mientras que el voltaje de campo es variable. El modelo de este motor ha sido tomado de [11]. El balance el ectrico en el devanado del estator se describe como:
+ Vr -
Rr
Lr
Ls
Rs
- Vs +
Figura 1.23: Nonlinear DC motor.
Ls
dIs + Rs If = Vs dt
donde Is es la corriente del estator, Vs es el voltaje del estator, Rs y Ls son la resistencia e inductancia del devanado del estator respectivamente. El balance el ectrico en el devanado del rotor resulta: Lr dIr + Rr Ir = Vr E dt
donde Ir es la corriente del rotor, Vr es el voltaje del rotor, Rr y Lr son la resistencia e inductancia del devanado del rotor respectivamente, y E es el voltaje de fuerza contra electromotriz. Considerando s olo fricci on viscosa, el balance mec anico en la carga est a dado por: d J + F = T dt donde representsa la velocidad angular del eje del motor, J denota la inercia de la carga, F es la constante de fricci on viscosa, y T es el torque de carga. Si denota el ijo asociado con el devanado del estator, entonces: E = Ke T = Km Ir = Ls Is
donde Ke y Km son constantes. Asumiendo 100 % de eciencia en la conversi on de energ a, entonces Ke = Km = K . Para el sistema descrito considere que el voltaje u = Vs es la entrada del sistema y seleccione como variables de estado: x1 = Is , x2 = Ir , x3 = . Luego: (a) Determine el modelo de Lagrange del motor DC. (b) Determine el modelo en el espacio de estado. Problema 1.13 La gura 1.24 muestra un manipulador rob otico polar vertical de 2 GDL extra do de [22]. (a) Determinar su modelo LE. (b) Determinar su modelo de Lagrange empleando las ecuaciones de Lagrange.
1.4 PROBLEMAS
57
Figura 1.24: Manipulador rob otico polar vertical de 2GDL.
Problema 1.14 La gura 1.25 muestra un manipulador rob otico polar horizontal de 2GDL extra do de [22]. (a) Determinar su modelo LE. (b) Determinar su modelo de Lagrange empleando las ecuaciones de Lagrange. Figura 1.25: Manipulador rob otico polar horizontal de 2GDL.
Problema 1.15 La gura 1.4 muestra el manipulador rob otico con articulaci on el astica tratado en la subsecci on 1.1.2. Formular su modelo din amico no lineal empleando las ecuaciones de Lagrange. Problema 1.16 La gura 1.26 muestra un servomotor con carga no lineal de dos grados de libertad (2GDL). Notar que la carga posee dos grados de libertad. La uni on de la carga con el eje del servomotor no es exible. Asumir que la inductancia de armadura no es despreciable. Formular el modelo din amico no lineal del sistema empleando las ecuaciones de Lagrange y las ecuaciones de la f sica.
Mo L1 m1 R
+
Ro
m eb
u
-
Va L
Union no flexible
Lo m BL JL
Jm Bm
Figura 1.26: Servomotor con carga no lineal de 2GDL. El acoplamiento de la carga al eje del motor no es exible.
Problema 1.17 P endulo Doble
58
La gura 1.27 muestra el proceso p endulo doble no lineal. El acoplamiento entre los dos p endulos no es exible. Las varillas poseen longitud L1 y L2 . Despreciando la inductancia de armadura, formular el modelo din amico no lineal del sistema empleando las ecuaciones de Lagrange y las ecuaciones de la f sica.
+ Fuerza de u control Servomotor D.C. y z F Carro z
Figura 1.27: Sistema p endulo doble no lineal.
Problema 1.18 Doble Gr ua Puente La gura 1.28 muestra el proceso doble gr ua puente no lineal. El acoplamiento entre las dos secciones de la varilla no es exible. Las varillas poseen longitud L1 y L2 . Despreciando la inductancia de armadura, formular el modelo din amico no lineal del sistema empleando las ecuaciones de Lagrange y las ecuaciones de la f sica.
F Carro
z y
Doble puente grua
Figura 1.28: Sistema doble gr ua-puente.
1.5 Estructura en Tiempo Real
59
1.5.
Estructura en Tiempo Real
La estructura en tiempo real mostrada en la gura 1.29 se emplea para la implementaci on de los sistemas de control de posici on de los manipuladores rob oticos y para el sistema de control del tanque de agua.
Figura 1.29: Estructura del sistema de control en tiempo real empleado. Notar en la gura 1.29 que cualquier algoritmo de control se implementa en la PC. De hecho, los algoritmos de control implementados en este trabajo, emplean el lenguaje del software LabVIEW, versi on 7.1. La interfaz entre la PC y el usuario es una tarjeta de adquisici on de datos PCI 6229 de NI (National Instrument). Las se nales medidas y generadas para cada sistema de control se discuten en las siguientes secciones.
1.6.
Sistema de Control del Manipulador de 1GDL
La gura 1.30 muestra la estructura en tiempo real para controlar la posici on angular del manipulador rob otico de 1GDL. El sistema de control requiere la medici on de la posici on angular, la cual se logra gracias al sensor de posici on en cuadratura (encoder) que posee el servomotor D.C. en su eje. La se nal medida ingresa por uno de los dos contadores que posee la tarjeta PCI 6229, ubicado en sus terminales PFI (Programmable Function I/O). La se nal medida se procesa en la PC empleando LabVIEW. El detalle de la programaci on del contador se puede ver en los programas
60
Figura 1.30: Sistema de control en tiempo real para el manipulador rob otico de 1GDL. en tiempo real para controlar la posici on del brazo rob otico. Tales programas se encuentran en el CD adjunto a este trabajo. El algoritmo de control grabado en la PC procesa tal medici on y genera una se nal de control. Esta se nal resulta d ebil para poder alimentar directamente la armadura el servomotor D.C. Por ello es que se procesa empleando la t ecnica de modulaci on por ancho de pulsos (en ingl es PWM: Pulse Width Modulation) y luego pasa a un amplicador con conguraci on en H para darle el nivel de potencia adecuado para hacer girar al servomotor en la direcci on adecuada.
1.6.1.
Generaci on de la se nal PWM
La se nal PWM se genera por software. Para ello se emplea el microcontrolador PIC 16f877 de Microchip. La sigla PIC (Peripheral Interface Controller) signica que tal dispositivo es un controlador de la interfaz perif erica. El generador de PWM, cuyo diagrama de ujo se muestra en la gura 1.31, genera pulsos de ancho diverso, en concordancia con la se nal generada por el algoritmo de control. Tal se nal de control puede variar en el rango de - 2.5 a 0 V para giro antihorario del servomotor, y de 0 a 2.5 V para giro horario. Esto signica que la posici on (por ende la velocidad) del servomotor var a de acuerdo a la magnitud del ancho del pulso generado. Para que el PIC 16f877 trabaje con rangos positivos, mediante LabVIEW, el rango de - 2.5 a 0 V se convierte en uno de 0 a 2.5 V, mientras que el rango de 0 a 2.5 V se convierte en otro de 2.5 a 5 V (ver gura 1.32). De este modo, las se nales de control en el rango de 0 a 5 V ingresan al PIC 16f877 por el pin RAO, tal como se muestra en la gura 1.33. Estas se nales se convierten en pulsos PWM que operan a una frecuencia aproximada de 7.8 kHz, que luego de pasar por el amplicador en
1.6 Sistema de Control del Manipulador de 1GDL
61
H, obtienen el nivel adecuado de potencia para conmutar el giro del motor tal como se explica en la siguiente secci on. La subsecci on ?? muestra el c odigo en lenguaje ensamblador del programa para generar las se nales PWM, mientras que la gura 1.33 muestra el diagrama circuital para realizar la placa del generador de pulsos PWM empleando ORCAD.
Figura 1.31: Diagrama de ujo para la generaci on de los pulsos PWM.
62
Figura 1.32: Rangos de trabajo en el PIC 16f877.
Figura 1.33: Dise no ORCAD para implementar la placa del generador de pulsos PWM.
1.6.2.
El Amplicador de Potencia
El Circuito Amplicador Un circuito amplicador por conmutaci on puede ser construido de varias formas, ya sea cambiando la frecuencia de conmutaci on, modicando el ciclo de trabajo (duty cycle) o cambiando ambas. El efecto buscado en un m etodo u otro es que el promedio de voltaje de salida sea proporcional a la tensi on de control. El m etodo m as com un de un conmutador amplicador es la modulaci on PWM (por ancho de pulso). En nuestro caso, los dispositivos conmutadores, conmutan a una frecuencia constante, dando como resultado la variaci on de la tensi on de salida entre dos valores extremos. Por variaci on del ancho de pulso o el duty cycle, el valor promedio de voltaje de salida puede ser cambiado en forma proporcional a la tensi on de control. El conmutador amplicador implementado es del tipo H y su diagrama se muestra en la gura 1.34. Dicho amplicador emplea dispositivos conmutadores MOSFET IRFZ34 de 30 A y una fuente de 24 voltios y 8 A. La principal ventaja del conmutador
1.6 Sistema de Control del Manipulador de 1GDL
63
en H es que s olo necesita una fuente. Los dispositivos conmutadores son conmutados en pares generando una tensi on bipolar a la salida. Para disparar los MOSFET se necesita circuiter a adicional para generar la tensi on de disparo en cada conmutador. En s ntesis, cuando el sistema de disparo cierra el conmutador (A1 A4 ) y abre (A2 A3 ), el sentido de la corriente es la l nea punteada, induciendo de esta forma una tensi on +Vcc en el servomotor. Luego, si el sistema de disparo abre al conmutador A1,4 y cierra A2,3 , el sentido de la corriente es la l nea continua, induciendo as una tensi on Vcc en el servomotor. Por lo tanto, el servomotor ve en sus terminales una onda de voltaje cuadrada variando entre Vcc y la corriente que pueda absorber depender a de la capacidad en corriente de los dispositivos usados en los conmutadores y de la fuente.
Figura 1.34: Esquema del circuito amplicador con su circuito de control.
El Circuito de Control de Disparo de los MOSFET El objetivo del circuito de control de disparo mostrado en La gura 1.34 es realizar la conmutaci on de (A1 A4 ) a (A2 A3 ) o viciversa, de forma tal que no se generen cortocircuitos durante la conmutaci on. Tales cortocircuitos se pueden generar cuando los dos pares de conmutadores se encuentran cerrados, ya que en tal situaci on puede circular una gran corriente capaz de deteriorar al dispositivo conmutador. La l ogica del circuito de control de disparo de los MOSFET responde a la tabla 1.8. Notar en esta tabla que cuando las se nales PWM1 y PWM2 que salen del generador de PWM poseen igual amplitud, los conmutadores A1 , A2 , A3 y A4 estar an siempre en el estado OFF. Una protecci on adicional para evitar corrientes de cortocircuito en los conmutadores se logra introduciendo los diodos D1 , D2 , D3 y D4 , tal como se muestra en
64
Tabla 1.8: Conmutaci on de los MOSFETs. P W M ON 0 0 1 1 P W M OSN 0 1 0 1 A1 OFF ON OFF OFF A2 OFF OFF ON OFF A3 OFF ON OFF OFF A4 OFF OFF ON OFF
la gura 1.34. La gura 1.35 muestra los circuitos de disparo de los MOSFET Q14, Q5, Q6 y Q7. Tales circuitos emplean compuertas l ogicas de tecnolog a TTL (Transistor Transistor Logic) conformado por los integrados 7404, 7486, 7408 y dos resistencias de 500 . El circuito de disparo de Q14 comprende los transistores Q1 y Q3 formando un amplicador que trabaja en clase B. Este circuito de disparo trabaja simult aneamente con el circuito de disparo del MOSFET Q6 (transistores Q8 y Q9). Del mismo modo, los circuitos de disparo de los MOSFET Q5 (transistores Q2 y Q4) y Q7 (transistores Q10 y Q11) trabajan en conjunto. Por ejemplo para el MOSFET Q14, cuando en la salida de la compuerta 7417 existe una se nal ON, el transistor Q1 se corta mientras que Q3 se satura. De este modo a la base del MOSFET llega una corriente que lo habilita. En caso contrario, cuando en la salida de la compuerta 7417 existe una se nal OFF, el transistor Q1 se satura mientras que Q3 se corta. De este modo a la base del MOSFET no llega una corriente y lo inhabilita. El mismo an alisis se puede hacer para todos los circuitos de disparo.
1.7.
Sistema de Control de Manipuladores de 2 y 3GDL
La estructura en tiempo real para controlar la posici on angular de los manipuladores rob oticos de 2GDL (manipulador traslacional y manipulador esf erico) es una extensi on de la estructura mostrada en la gura 1.30. Para el caso de 2GDL, el sistema de control en tiempo real requiere de la medici on simult anea de dos posiciones angulares, la cual se logra gracias al sensor de posici on en cuadratura que posee en su eje cada uno de los dos servomotores D.C. que emplea el manipulador. Estas se nales de posici on medidas ingresan por los dos contadores que posee la tarjeta PCI 6229, ubicado en sus terminales PFI (Programmable Function I/O). La se nales medidas se procesan luego en la PC empleando LabVIEW. El detalle de la programaci on de los contadores trabajando simult aneamente se puede ver en los programas en tiempo real para controlar las posiciones de los brazos de dichos manipuladores. Tales programas se encuentran en el CD adjunto a este trabajo. El algoritmo de control multivariable grabado en la PC, procesa tales mediciones y genera dos se nales de control. Estas se nales son d ebiles en potencia para poder hacer girar convenientemente a los servomotores D.C. Por esta raz on es que cada una de ellas se procesa empleando la t ecnica de modulaci on por ancho de pulsos (PWM) y luego se amplican por separado empleando para ello un amplicador de potencia con conguraci on en H. Las se nales de control amplicadas ingresan a los terminales
1.8 El Sistema de Control del Tanque
65
Figura 1.35: Circuitos de control del amplicador de potencia.
de las armaduras de los servomotores, para hacerlos girar en la direcci on adecuada. Para el caso de 3GDL, el sistema de control en tiempo real requiere de la medici on simult anea de tres posiciones angulares, la cual se logra gracias al sensor de posici on en cuadratura que posee en su eje cada uno de los dos servomotores D.C. que emplea el manipulador. Dos de estas se nales de posici on medidas ingresan por los dos contadores que posee la tarjeta PCI 6229, ubicado en sus terminales PFI (Programmable Function I/O). Debido a que la tarjeta PCI 6229 posee s olo dos contadores de pulsos para medir posiciones, se ha tenido que realizar un programa ad-hoc en LabVIEW para poder medir la tercera se nal de posici on, que tambi en ingresa a uno de los terminales PFI de la tarjeta. Este programa se encuentra en el CD adjunto a esta publicaci on. El procedimiento que sigue a continuaci on ya es conocido: el algoritmo de control multivariable grabado en la PC, procesa tales mediciones y genera tres se nales de control que se procesan empleando la t ecnica PWM y se amplican por separado empleando para ello un amplicador de potencia con conguraci on en H.
1.8.
El Sistema de Control del Tanque
La gura 1.36 muestra La estructura en tiempo real para controlar simult aneamente o por separado el nivel y la temperatura del agua contenido en el tanque. Los
66
sistemas de control a realizarse requieren de la medici on del nivel y de la temperatura del agua. La medici on de nivel se logra empleando un transmisor de presi on Valcom de rango 0 a 1.25 m, mientras que la medici on de la temperatura emplea una termoresistencia con sensor Pt 100 y de rango 0 a 100 o C. La medici on de nivel debe ingresar a la PC a trav es de la tarjeta de adquisici on de datos en un rango de voltaje adecuado. Para ello se emplea el convertidor e indicador de nivel Sar tipo P, el cual convierte los 4 a 20 mA que proporciona el transmisor de nivel Valcom tipo P, a una se nal de voltaje de 0 a 10 V, que equivale al rango de 0 a 1.25 m de medici on de nivel. El transmisor usado sirve tambi en como indicador digital del nivel. De mismo modo, la se nal que proporciona la termoresistencia se convierte al rango de voltaje de 0 a 10 V empleando para ello el transmisor de temperatura nal Valcom tipo T, el cual convierte el rango de temperatura de 0 a 100 o C a una se de voltaje de 0 a 10 V. El convertidor usado sirve tambi en como indicador digital de la temperatura.
Figura 1.36: Sistema de control en tiempo real para el tanque. El algoritmo de control grabado en la PC procesa tal medici on y genera dos se nales de control. Estas se nales salen a trav es de dos de las cuatro salidas anal ogicas que posee la tarjeta PCI 6229. La primera se nal de rango 0 a 10 V, va directamente a la v alvula mot orica Sauter AVM104S, la cual sirve para controlar el ujo de agua de entrada al tanque. La segunda se nal de rango 1 a 5 V, sirve para excitar al controlador de potencia SPC1-35, el cual genera la corriente adecuada para alimentar a la resistencia el ectrica con el prop osito de producir el calor necesario para calentar el agua del tanque a una temperatura deseada.
Cap tulo 2
Control Optimo
Este cap tulo trata el problema del control o ptimo cuadr atico gaussiano, denominado as porque el ndice de rendimiento o funci on de costo que emplea es una funci on cuadr atica de los estados y de las se nales de control. La soluci on del problema de control planteado consiste en determinar un extremo de la funci on de costo mediante minimizaci on con el prop osito de generar la ley de control optima. La conguraci on del sistema de control optimo no lineal desarrollado en este cap tulo comprende el modelo no lineal multivariable del sistema a controlar, un observador no lineal para estimar los estados del sistema y un controlador de realimentaci on de estados del tipo proporcionalintegral. El dise no del sistema de control optimo consiste en producir una fuerza de control u que sea capaz de hacer que el vector de salida y del sistema (la salida controlada) siga al vector de referencias deseadas r cumpliendo ciertas especicaciones de dise no, no obstante la presencia de incertidumbres en los par ametros y de disturbios estoc asticos gaussianos actuando sobre el sistema en operaci on.
2.1.
Conguraci on del Sistema de Control Optimo
La conguraci on del sistema de control optimo no lineal empleada en este cap tulo se ilustra en la gura 2.1. Tal conguraci on combina en su dise no la representaci on de un sistema no lineal, un observador no lineal para estimar los estados del sistema, y un controlador de realimentaci on de estados del tipo proporcionalintegral. El objetivo del sistema de control o ptimo consiste en seleccionar una fuerza de control u capaz de minimizar la diferencia entre el vector de salida y del sistema y el vector de trayectorias de referencia deseadas r, a pesar de la presencia de incertidumbres en los par ametros y de disturbios estoc asticos gaussianos actuando sobre el sistema controlado. La implementaci on en tiempo real del sistema mostrado en la gura 2.1 opera como sigue: despu es de cada tiempo de discretizaci on, el observador no lineal estima los estados x del sistema empleando los datos proporcionados por el vector de entrada u y el vector de salida y. Invocando el bien conocido teorema de la separaci on, tales estados estimados y la integral de la salida y, pueden ser usados para computar el controlador proporcionalintegral de realimentaci on de estados u (la ley de control) del sistema. La ley de control act ua sobre el proceso no lineal (pero linealizable) para hacer que el error entre r (el vector de referencias) y y tienda a cero, cumpliendo
68
Control Optimo
^ x
Nonlinear state observer r z y +
State-feedback controller
MIMO nonlinear process
Figura 2.1: Conguraci on de un sistema de control o ptimo no lineal.
ciertas especicaciones de dise no.
2.2.
El Sistema Din amico No Lineal Multivariable
El sistema din amico no lineal multivariable (de m ultiples entradas u m ultiples salidas) se puede describir como: x = f (x, u) + v x1 . x= . . xn y = h(x) + w u1 . u= . v= . um f1 (x, u) . . f = . fn (x, u) v1 . . . vn x(0 ) = 0 y1 . y= . . yp h1 (x) . . h= . hp (x) (2.1)
w1 . w= . . wp
donde x es el vector de estado, u es el vector de control (la entrada al sistema) e y es el vector de salida. Asumiremos que las funciones vectoriales de variable vectorial f (x, u) y h(x) son operadores no lineales diferenciables que representan la din amica del sistema y la din amica de la salida respectivamente. Los vectores v de orden n 1 y w de orden p 1 son los disturbios en los estados del sistema (ruidos en los estados) y en sus salidas (ruidos de medici on) respectivamente. Sean x0 , u0 e y0 los vectores de referencia (o nominales) correspondientes a x, u e y respectivamente. Si la entrada del sistema se selecciona exactamente igual a a x0 . Entonces x0 satisface: u0 , su respuesta ser x 0 = f (x0 , u0 ) + v y0 = h(x0 ) + w x0 (0 ) = 0 (2.2)
Si la entrada del sistema u no es exactamente, pero s muy cercana a u0 , el vector de trayectorias x resultante, el vector de estado, diere muy poco de x0 . Para tal situaci on, las trayectorias actuales pueden formularse como: x = x0 + x u = u0 + u y = y0 + y (2.3)
2.3 El Controlador PI de Realimentaci on de Estados
69
donde los vectores residuales x, u y y representan desviaciones con respecto a los correspondientes vectores de estado, de control y de salida respectivamente. Reemplazando (2.3) en (2.1) produce: x 0 + x = f (x0 + x, u0 + u) + v y0 + y = h(x0 + x) + w (2.4)
Como hemos asumido que las desviaciones actuales son peque nas, entonces el sistema (2.4) admite ser linealizado alrededor de un vector de trayectorias nominales o de referencia x0 . La expansi on de (2.4) en series de Taylor alrededor de x0 y u0 resulta: x A x + B u + v y C x + w donde: A = C =
f1 x1
x(0 ) = 0 (2.5)
. . .
fn x1 h1 x1
.. . .. .
f1 xn

( x0 ) (x0 ,u0 )
B=
. . .
f1 u1
. . .
fn xn h1 xn
fn u1
.. .
f1 um

(x0 ,u0 )
. . .
fn um
. . .
. . .
(2.6)
hp x1
hp xn
Observar que las matrices jacobianas Ann , Bnm , Cpn y Dpm necesitan ser evaluadas alrededor de los vectores de referencia x0 y u0 . Para resolver el problema del control optimo en consideraci on, se requiere dise nar una apropiada ley de control de realimentaci on de estados de la forma u = Gx, donde G de dimensi on m n, es la la matriz de ganancia de realimentaci on de estados, la cual se dise na empleando el siguiente sistema linealizado: x = A x + B u + v y = C x + w u = G x (2.7) x(0 ) = 0
2.3.
El Controlador PI de Realimentaci on de Estados
De acuerdo a la referencia [12], el controlador proporcional de realimentaci on de estados mostrado en la gura 2.2 es una matriz de ganancia de realimentaci on de estados G, de modo tal que la ley de control de realimentaci on de estados que genera y expresada como: u = G x (2.8) minimiza la siguiente funci on de costo cuadr atica:
I=
0
e2t [ xT (t)Q x(t) + uT (t)R u(t)]dt
(2.9)
70 sujeta a la ecuaci on de restricci on: x = A x + B u + v x(0 ) = 0
Control Optimo
(2.10)
donde A de orden n n y B de orden n m son matrices constantes, Q = QT de orden n n y R = RT de orden m m son matrices de peso denidas positivas. Tambi en, 0 es una constante de peso.
g + + f(x) u -D f(.)
x h
Figura 2.2: Sistema de control o ptimo con un controlador proporcional de realimentaci on de estados.
La bien conocida condici on de controlabilidad establece que un sistema lineal de la forma x = A x + B u es de estado controlable siempre que su matriz de controlabilidad M posea rango completo: rango M = rango [B AB An1 B] = n (2.11)
Cuando el sistema linealizado dado en (2.10) es de estado controlable, la matriz de ganancia de realimentaci on de estados G se determina de: G = R1 BT K (2.12)
nica matriz denida positiva soluci on de la donde K = KT de orden n n es la u siguiente ecuaci on asociada de Riccati: K(A + I) + (A + I)T K KBR1 BT K + Q = 0 (2.13)
donde I es la matriz identidad de dimensiones apropiadas. Para mejorar el rendimiento del controlador proporcional de realimentaci on de estados, se le puede a nadir acci on integral ubicando un integrador a la salida del sistema, tal como se muestra en la gura 2.3; es decir: z = ydt. Luego: z = y = C x + w (2.14)
Combinando ( 2.14) con el sistema descrito en (2.7), la descripci on aumentada en el espacio de estado de (2.7) toma la forma: x a = A a xa + B a u + v a y = Ca xa + w (2.15)
2.3 El Controlador PI de Realimentaci on de Estados
71
g + + f(x) f(.) u
x h
x z
-D
x z
Figura 2.3: Sistema de control o ptimo con controlador PI (ProporcionalIntegral) de realimentaci on de estados.
donde el super ndice a signica aumentado. Los vectores xa de orden n + p, va de orden n + p y las matrices Aa de orden (n + p) (n + p), Ba de orden (n + p) m y Ca de orden p (n + p) toman la forma: xa = x z ; va = v w ; Aa = A 0 C 0 ; Ba = B 0 ; Ca = C 0 (2.16) Siempre que el sistema descrito por: x a = A a xa + B a u + v a xa (0 ) = 0 (2.17)
cumpla la condici on de controlabilidad dada en (2.11), que para este caso es: rango Ma = rango Ba A a Ba (Aa )n1 Ba = n + p (2.18)
entonces, la matriz de ganancia de realimentaci on de estados aumentada Ga de orden m (n + p) puede ser computada de: Ga = R1 (Ba )T Ka (2.19)
donde Ka = (Ka )T de orden (n + p) (n + p) es la u nica matriz soluci on denida positiva de la siguiente ecuaci on de Riccati: Ka (Aa + I) + (Aa + I)T Ka Ka Ba R1 (Ba )T Ka + Qa = 0 (2.20)
Por consiguiente, la ley de control de realimentaci on de estados aumentada (el controlador PI de realimentaci on de estados): u = Ga xa = G1 G2 x z (2.21)
minimiza la siguiente funci on de costo cuadr atica aumentada: Ia =

0
e2t [( xa )T (t)Qa xa (t) + uT (t)R u(t)]dt
(2.22)
sujeto a la ecuaci on de restricci on dada en (2.17), donde Qa = (Qa )T de orden T (n + p) (n + p) y R = R de orden m m son matrices de peso denidas positiva y
72
Control Optimo
0 es una constante de peso exponencial. Observar que las matrices para ponderar el rendimiento del sistema (las matrices de sintonizaci on) son R, Q y Qa . De acuerdo al teorema de la separaci on [12], los controladores de realimentaci on de estado se pueden implementar empleando los estimados de los estados en lugar de los estados actuales del sistema. Por consiguiente, las leyes de control (2.8) y (2.21) se pueden implementar tambi en como: u = G x u = Ga xa = Gx Gz x z (2.23)
Para obtener el vector actual de estado estimado x emplearemos un observador no lineal (section 2.4). El vector estimado actual z se obtiene directamente integrando la salida actual y. Sin embargo, para calcular la matriz de ganancia del observador, se emplea el sistema linealizado dado en 2.7, como veremos a continuaci on.
2.4.
El Observador No Lineal Multivariable
Consideremos la estructura de la gura 2.4 para la estimaci on de estados y control del sistema descrito en (2.1). El observador no lineal ilustrado se puede describir por: x = f (x, u) + H(y y) y = h(x) x(0 ) = 0 (2.24)
donde x e y son los vectores estimados de x e y respectivamente, y H es una matriz residual de ganancia de orden n p a ser determinada. Por otra parte, asumamos que los disturbios v y w en (2.1) sean ruido blanco gaussiano con media (o esperanza) nula. El ruido blanco gaussiano posee la propiedad de ser no correlacionado en cada instante de tiempo. En otras palabras, no existe una interrelaci on (correlaci on) entre v y w. La propiedad de la media nula implica que toda la informaci on estad stica del ruido se acumula en la covarianza de los disturbios. En t erminos matem aticos: E [v(t)vT ( )] = V (t ) E [w(t)w ( )] = W (t )
T
E [v] = 0 E [w] = 0 (2.25)
donde E [.] es la operaci on matem atica esperanza, (t ) es la funci on delta de Kronecker denida como: (t ) = 1 para t = y nula en otro caso. Tambi en, V de orden n n y W de orden p p son matrices de covarianza denidas positivas. Es un hecho conocido que un sistema lineal de la forma dada en (2.7) pero con v = w = 0, es observable siempre que su correspondiente matriz de observabilidad N posea rango completo: C CA (2.26) rango N = rango =n . . . CAn1
2.5 Procedimiento de Dise no
73
+ +
v x h f(.) +
+ w y + r=0 z
f(x) u -D a
^ x ^ z
^= z z ^ x ^ y
g + + + + f(x) f(.)
y +
E
Figura 2.4: Estructura del sistema de control o ptimo para estimaci on de estados y control.
Cuando el modelo linealizado de (2.7) es observable, la matriz residual de ganancia H del observador no lineal descrito en (2.24), se calcula de: H = SCT W1 (2.27)
donde S = ST de orden n n es la u nica matriz denida positiva soluci on de la siguiente ecuaci on asociada de Riccati: 0 = S(A + I)T + (A + I)S SCT W1 CS + V (2.28)
El estimador de estados resultante mostrado en la gura 2.4 es conocido tambi en como el ltro extendido de Kalman de ganancia constante H [12].
2.5.
Procedimiento de Dise no
En sistemas de control optimo del mundo real, generalmente estamos interesados que la salida controlada y(t) siga a una trayectoria deseada r(t) cumpliendo las especicaciones de dise no. Como el dise no del sistema de control optimo minimiza una funci on de costo, entonces el objetivo de control se cumple cuando la fuerza de control logre que todos los estados del sistema se minimicen (tiendan al estado cero), incluyendo el vector de salida y(t). Cuando trabajamos con variables residuales (conocidas tambi en como perturbacionales), tales variables se pueden considerar como se nales de error con respecto a las variables reales. Por ejemplo, para la variable residual de salida y(t) se formula: r(t) = y(t) r(t)
74
Control Optimo
donde y(t) es la salida real del sistema que debe de seguir a la trayectoria de referencia r(t) cumpliendo ciertas especicaciones de dise no previamente establecidas. Es claro que cuando se cumpla el objetivo de control del sistema, es decir, cuando y(t) = 0, r ( t ). entonces: y(t) = El procedimiento de dise no del sistema de control optimo desarrollado sigue los pasos siguientes: (1) Formular el problema: describir el sistema a controlar, denir las especicaciones de dise no y determinar el modelo no lineal del sistema en la forma dada en (2.1). (2) Determinar el modelo linealizado del sistema (ecuaci on (2.5)). (3) Determinar la controlabilidad y observabilidad del sistema linealizado (ecuaciones (2.18) y (2.26) respectivamente). (4) Computar la matriz de ganancia Ga de la ley de control PI del sistema (ecuaciones (2.19) y (2.20)). (5) Computar la matriz de ganancia Ha del observador no lineal del sistema (ecuaciones (2.27) y (2.28)). (6) Simular el sistema de control o ptimo empleando las ecuaciones din amicas no lineales (2.1) y (2.24). (7) Implementar el sistema de control optimo (hardware). (8) Desarrollar el software de control en tiempo real del sistema. (9) Ejecutar pruebas de funcionamiento en tiempo real. Ejemplo 2.1 Design and Simulation of an Optimal Control System for the EJRM. IN PROGRESS Ejemplo 2.2 Design and Simulation of an Optimal Control System for the TRM. IN PROGRESS Ejemplo 2.3 Dise no y Simulaci on de un Sistema de Control Optimo para el MRT. Las matrices A, B y C dadas en (2.5) se pueden obtener empleando las matrices jacobianas, a partir del modelo no lineal (de orden n = 4) en el espacio de estado del MRT mostrado en las ecuaciones (1.144) and (1.145)). Esto es: A= 0 0 0 0 0 1 0 0 R T 1 b1 + N T 1 0 RT 1 (J 1 + a 1 + a 2 ) 0 0 0 1 0
R T 2 b2 + N T 2 R T 2 (J 2 + a 2 )
2.5 Procedimiento de Dise no B= Por consiguiente: Aa = A 0 C 0 Ba = B 0 Ca = C 0 0 0 0 0 0

1 R T 2 (J 2 + a 2 )
75 C= 1 0 0 0 0 1 0 0
1 R T 1 (J 1 + a 1 + a 2 )
Las matrices de sintonizaci on se pueden elegir como: Q = 4I, R = 10I, Qa = 0,01I, V = 0,1I, W = 0,1I. La ganancia Da del controlador y la ganancia H del observador fueron determinadas usando los comandos de MATLAB lqr y lqe, respectivamente, usando el hecho de que el sistema es completamente controlable y completamente observable. El par ametro del ndice de rendimiento se j o en 5. La simulaci on se llev o a cabo ejecutando el archivo srm4opt.m (que se encuentra en el CD adjunto), para las siguientes trayectorias deseadas: xd1 (t) = sin t + 0,1t y xd2 (t) = cos t. La t relaci on z = 0 yd se aproxim o en el dominio discreto como z(k + 1) = z(k ) + T x(k ), donde T = 0,0014 s es el tiempo de muestreo y k = t/T es el tiempo discreto. Los resultados de la simulaci on se muestran en las guras 2.5 y 2.6.
2.5 Base trayectory (rad) 2 1.5 1 0.5 0
0.2
0.4
0.6
0.8 Time
1 (s)
1.2
1.4
1.6
1.8
3 2 Control signal (volt) 1 0 1 2 3 4 0 0.2 0.4 0.6 0.8 Time 1 (s) 1.2 1.4 1.6 1.8 2
Figura 2.5: Posici on angular de la base del MRE controlada.
PROBLEMAS
Problema 2.1 Con relaci on a las plataformas acopladas con actuadores hidr aulicos descrito en el problema 1.7 y mostrado en la gura 1.19, determine la estabilidad y controlabilidad del modelo linealizado para un punto de operaci on apropiado y dise ne un sistema de control o ptimo cuya salida sea capaz de seguir a una trayectoria determinada. Asumir valores m nimo y m aximo de las masas de las plataformas m1 and m2 .
76 Problema 2.2
Control Optimo
Dise ne un sistema de control optimo cuya salida sea capaz de seguir a una trayectoria determinada a las plataformas acopladas con actuadores neum aticos descrito en el problema 1.8 y mostrado en la gura 1.19. Asumir valores m nimo y m aximo de las masas de las plataformas m1 and m2 . Problema 2.3 Dise ne un sistema de control optimo cuya salida sea capaz de seguir a una trayectoria determinada, para la plataforma inercial descrita en el problema ?? e ilustrada en la gura ??. Asumir valores m nimo y m aximo de ... IN PROGRESS Problema 2.4 Design a robust nonlinear optimal control system for the heavy oil fractionator described in the problem 1.9 and depicted in gure 1.20. Assume minimum and maximum values of the ... IN PROGRESS Problema 2.5 Design a robust nonlinear optimal control system for the chemical jacket reactor described in the problem 1.10 and depicted in gure 1.21. Assume minimum and maximum values of the ... IN PROGRESS Problema 2.6 Design a robust nonlinear optimal control system for the high purity distillation column described in the problem ?? and depicted in gure ??. Assume minimum and maximum values of the ... IN PROGRESS
1.5
Arm trajectory (rad)
0.5
0.5
0.2
0.4
0.6
0.8 Time
1 (s)
1.2
1.4
1.6
1.8
15 Control signal (volt)
10
0.2
0.4
0.6
0.8 Time
1 (s)
1.2
1.4
1.6
1.8
Figura 2.6: Posici on angular del brazo del MRE controlada.
2.5 Procedimiento de Dise no Problema 2.7
77
Design a robust nonlinear optimal control system for the aircraft described in the problem 1.11 and depicted in gure 1.22. Assume minimum and maximum values of the ... IN PROGRESS Problema 2.8 Design a robust nonlinear optimal control system for the spacecraft described in the problem ?? and depicted in gure ??. Assume minimum and maximum values of the ... IN PROGRESS Problema 2.9 Design a robust nonlinear optimal control system for the nonlinear DC motor described in the problem 1.12 and depicted in gure 1.23. Assume minimum and maximum values of the ... IN PROGRESS
Cap tulo 3
Control Adaptativo con Modelo Referencial

3.1. Conguraci on ode un SCAMR
La gura 3.1 ilustra la conguraci on de un Sistema de Control Adaptativo con Modelo Referencial (SCAMR) que puede ser empleado en una gran variedad de aplicaciones. El SCAMR se compone b asicamente de un modelo de referencia, un controlador adaptativo, el sistema a controlar y un mecanismo de adaptaci on . El esquema b asico en consideraci on se denomina un SCAMR paralelo debido a la ubicaci on relativa del modelo referencial con respecto al sistema.
Reference model r Adaptive controller Process + -
Adaptation mechanism
Figura 3.1: Conguraci on de un Sistema de Control Adaptativo con Modelo Referencial (SCAMR).
El modelo de referencia, el cual est a excitado por una entrada externa r, es un sistema din amico auxiliar usado para especicar la respuesta deseada del sistema. Tal respuesta debe de ser lograda por el SCAMR a pesar de las restricciones generadas por inexactitudes en el modelado de la estructura del modelo de referencia y el modelo del sistema. La ley de adaptaci on es la relaci on entre el error e y el vector estimado de par ametros . El error e es a la vez, la diferencia entre la salida del modelo y la del sistema. el mecanismo de adaptaci on es un conjunto de bloques interconectados usado
80
para implementar la ley de adaptaci on. De hecho, la ley de adaptaci on es el algoritmo de control empleado para modicar los par ametros del controlador adaptativo, de modo tal que el SCAMR permanezca estable y que el error de seguimiento converja a cero en la presencia de par ametros del sistema variantes con el tiempo y disturbios externos. Se asume que el sistema es no lineal. Por consiguiente, su descripci on puede ser imprecisa; esto es, el modelo din amico del sistema puede presentar incertidumbres en su estructura o din amica no modelada en su representaci on. Ya que la descripci on del sistema permite incertidumbres, el control adaptativo (en general) se puede considerar una aproximaci on particular de control robusto. El controlador debe de ser capaz de realizar un seguimiento perfecto en la presencia de incertidumbres en los par ametros. Esto es, en presencia de par ametros conocidos o desconocidos, los par ametros del controlador requieren ser reajustados por el mecanismo de adaptaci on con el n de hacer cero el error de seguimiento e. El m etodo directo de Lyapunov ser a empleado para determinar que el SCAMR dise nado garantice convergencia global de las se nales controladas con respecto a sus trayectorias deseadas. Si la ley de control (el algoritmo de control) posee estructura lineal con par ametros ajustables, estaremos frente a una parametrizaci on lineal.
3.2.
Estabilidad v a el M etodo Directo de Lyapunov
A. M. Lyapunov trata el problema de la estabilidad de sistemas descritos mediante ecuaciones diferenciales empleando dos m etodos. El denominado primer m etodo analiza el comportamiento de la estabilidad de una soluci on expl cita del modelo no lineal del sistema y se aplica solamente a ciertos casos. El segundo m etodo, o m etodo directo de Lyapunov, es de gran generalidad y potencia porque no requiere de la soluci on de la descripci on del sistema, como s lo requiere el primer m etodo.
3.2.1.
Conceptos de Estabilidad
Un sistema no lineal de la forma: x = f (x, t) (3.1)
se dice que es no aut onomo si f depende del tiempo, por ejemplo, si f posee par ametros variantes con el tiempo. por consiguiente, un sistema aut onomo puede ser descrito por: x = f (x). Las trayectorias de estado para procesos aut onomos son independientes del tiempo inicial, mientras que para los no aut onomos generalmente no lo son. Un estado o punto de equilibrio xe (realmente un vector constante) de un sistema aut onomo se puede determinar de: 0 = f (xe ) (3.2)
Ya que nosotros debemos de tratar la estabilidad en el origen del sistema aut onomo b asico: x = f (x) x(0) = 0 (3.3) Entonces debemos de hacer ciertas suposiciones con relaci on a al gura 3.2. Denotaremos como B (R) a la regi on esf erica (bal on) ||x|| < R y como S (R) a la esfera
3.2 Estabilidad v a el M etodo Directo de Lyapunov
81
||x|| = R en s . La regi on esf0rica anular cerrada r ||x|| R ser a denotada coR mo Br . Asumiremos que en una cierta regi on esf erica : ||x|| < B (R), todas las derivadas parciales xi /xj existen y son continuas en . Entonces diremos que el origen es: estable si alguna trayectoria que empieza en B (r) en un punto arbitrario xo nunca logra alcanzar la esfera frontera S (R) de B (R); asint oticamente estable cuando es estable y en adici on cada trayectoria de estado que empieza en B (R) en un punto arbitrario xo , tiende hacia le origen conforme el tiempo se incremente indenidamente; inestable cuando para alg un R y r, ya sea grande o peque no, alguna trayectoria de estado que empieza en B (R) en un punto arbitrario x0 logra alcanzar la esfera frontera S (R). Observar en la gura 3.2 que para la trayectoria T el origen es inestable en el sentido de Lyapunov, a pesar de que tal trayectoria de estado muestre convergencia.
Asymptotically stable Stable B(r) R
Unstable
0 r x0
S(R)
H(A) B(R) T S(A)

Figura 3.2: Estabilidad en sistemas aut onomos.
3.2.2.
Funciones de Lyapunov
Un tipo especial de funci on escalar V (x), la denominada funci on de Lyapunov juega un importante rol en el an alisis de la estabilidad y el dise no de sistemas de control. Una funci on de Lyapunov V (x) verica las siguientes propiedades: (a) V (x) y sus primeras derivadas parciales V (x) = V (x) x son continuas en una cierta regi on abierta alrededor del origen.
82 (b) V (0) = 0
(c) Fuera del origen, pero siempre en , V (x) es positiva. Por consiguiente, el origen es un m nimo aislado de V (x). (x) = V (x) x (d) V = V (x) f (x) 0 in . V (x) es una funci on denida positiva si satisface las propiedades (a)(c). La gura 3.3 ilustra una funci on de Lyapunov para un sistema de segundo orden. Notar que V (x1 , x2 ) tiene el aspecto general de un espejo parab olico apuntando hacia arriba. Si V fuera denida negativa, el espejo parab olico deber a de apuntar hacia abajo. Por consiguiente, V (x) es denida negativa si V (x) es denida positiva. Tambi en, V (x) es semidenida positiva si V (0) = 0 y V (x) 0 para x = 0; V (x) es semidenida negativa si V (x) es semidenida positiva. Para una matriz cuadrada V de orden n n, las expresiones V > 0, V 0, V < 0 y V 0 denotan que V es denida positiva, semidenida positiva, denida negativa y semidenida negativa respectivamente, siempre y cuando V est e asociada a su forma cuadr atica. on cuadr atica V es denida positiva (V > 0), es decir, xT Vx > 0, si la funci xT Vx es denida positiva para x = 0. Tambi en, V es denida positiva si todos sus eigenvalores o sus menores principales son mayores que cero. En general, los menores principales mi de V = [vij ] (de orden n n) son: v11 v12 v13 v11 v12 ; m3 = det v21 v22 v23 ; m0 = 1; m1 = v11 ; m2 = det v21 v22 v31 v32 v33 y as sucesivamente hasta llegar a mn = det(V). V es semidenida positiva (V 0), es decir, xT Vx 0, si la funci on cuadr atica T x Vx es semidenida positiva para x = 0. Tambi en, V 0 si V es singular de rango r < n, y r eigenvalores o r menores principales de V son positivos y el resto (n r) son nulos. on cuadr atica V denida negativa (V < 0), es decir, xT Vx < 0, si la funci T x Vx es denida negativa para x = 0. Tambi en, V < 0 si V es no singular y todos los eigenvalores o los menores principales de V son negativos. on cuadr atica V semidenida negativa (V 0), es decir, xT Vx 0, si la funci T x Vx 0 a para x = 0. V 0 si V es singular de rango r < n, y r eigenvalores o r menores principales de V son negativos y el resto (n r) son nulos. Si la matriz cuadrada V de orden n n posee eigenvalores positivos y negativos, entonces V es indenida. Ejemplo 3.1 La funci on V (x) = (x1 + x2 )2 con x = [x1 x2 ]T es semidenida positiva desde que V (0) = 0 y V (x) 0 para x = 0 (por ejemplo, para x1 = x2 , V (x) = 0), 2 mientras que la funci on V (x) = x2 1 + x2 no es denida positiva ni negativa porque V (x) > 0 for x1 = 0 and V (x) < 0 for x2 = 0. Es f acil de demostrar que la funci on 2 es denida positiva. V (x) = x2 + x 1 2 Ejemplo 3.2
83
V(x1 , x 2)
x2
V(x1 , x 2) x2 x1
Figura 3.3: Graphical representation of a Lyapunov function.
x1
El circuito mostrado en la gura 3.4 contiene un resistor no lineal RN que obedece la ley i = N e3 , N > 0. Determine si la energ a almacenada en el capacitor C es una funci on de Lyapunov.
R
+
i
+
u
-
e -
RN
Figura 3.4: Circuito no lineal.
Soluci on: Sumando las corrientes que salen del nodo superior derecho (ver la gura 3.4) produce: eu + N e3 = 0 Ce + R 2 La energ a almacenada en el capacitor est a dada por V (e) = 1 2 Ce . Para el sistema no actuado (u = 0) tenemos: (e) = Cee V = e2 1 + N e2 R 0
Por consiguiente, la funci on V (e) es una funci on de Lyapunov. Ejemplo 3.3 La gura 3.5 muestra un sistema masaamortiguadorresorte no lineal cuyo modelo din amico es: Mx + Bo x + B1 x |x | + K0 x + K1 x3 = 0 + B1 x |x |) caracteriza un amortiguador no lineal con coecientes de amordonde (B0 x tiguaci on B0 , B1 > 0 constantes, y donde (K0 x + K1 x3 ) representa un resorte no lineal con coecientes de resorte K0 , K1 > 0 constantes. Demostrar que la energ a total almacenada en el sistema es una funci on de Lyapunov.
84
M K0 K1 B b(t)
111111111111 000000000000
Figura 3.5: Sistema masaamortiguadorresorte. Soluci on: La energ a del sistema es: 1 2 + V (x) = M x 2
x 0
1 1 1 2 + K0 x2 + K1 x4 (K0 x + K1 x3 )dx = M x 2 2 4
Se puede demostrar f acilmente que: (x) = M x V x + (K0 x + K1 x3 )x = [B0 x B1 x |x |]x = B0 x 2 B1 |x |3 0 Por consiguiente, V (x) es una funci on de Lyapunov. Funciones de Lyapunov para Sistemas No Aut onomos El sistema no aut onomo en consideraci on se describe en la regi on : ||x|| < A mediante: x = f (x, t) f (0, t) = 0 t0 (3.4) Siempre que W (x) es una funci on de Lyapunov en , entonces V (x, t) es una funci on de Lyapunov si: (a) V (x, t) est a denida en para alg un t 0; (b) V (0, t) = 0 para alg un t 0; (c) V (x, t) W (x) para alg un t t0 ; (x, t) 0 para alg (d) V un t 0, donde: V V = dV = V + V x = + f (x, t) V dt t x t x Se dice que una funci on V (x, t) es denida positiva si satisface las condiciones (a)(c). Tambi en se dice que V (x, t) es una funci on denida positiva si esta funci on domina a otra funci on denida positiva W (x), por ejemplo, cuando V (x, t) W (x). Tambi en, V (x, t) es denida negativa si V (x, t) es denida positiva; V (x, t) es semidenida positiva si esta funci on domina a otra funci on semidenida positiva W (x); V (x, t) es semidenida negativa si V (x, t) es semidenida positiva. Ejemplo 3.4
85
Desprecie el t ermino no lineal x |x | del amortiguador descrito en el ejemplo 3.3 y considere un coeciente de amortiguaci on b(t) variante con el tiempo en lugar de B0 , de modo tal que el sistema se convierta en uno no aut onomo. Demostrar que la siguiente funci on V (x, t) es una funci on de Lyapunov. V (x, t) = 1 M (x + x)2 + 2 2 1 2 K0 + K1 M 2 + b(t) x2 2
(x, t) produce: Soluci on: El c omputo de V 1 (x, t) = (M b(t))x (t) 2k0 ) K1 x4 < 0 V 2 + (b 2 (t) < 2K0 . De acuerdo al ejemplo 3.3, la energ siempre que > 0, b(t) > M y b a del sistema es una funci on de Lyapunov, a saber: 1 1 1 W (x) = M x 2 + K0 x2 + K1 x4 2 2 4 Podemos observar que V (x, t) > W (x). Por consiguiente, V (x, t) es una funci on de Lyapunov.
3.2.3.
Teoremas de Estabilidad de Lyapunov
Los teoremas de estabilidad de Lyapunov generalizan la idea de que cerca al estado de equilibrio de un sistema f1sico, la energ a del sistema es siempre decreciente. Teoremas de Estabilidad para Sistemas Aut onomos I. Teorema de Estabilidad. El equilibrio en el origen es estable si all existe en alguna vecindad del origen, una funci on de Lyapunov V (x). II. Teorema de Estabilidad Asint otica. El equilibrio en el origen es asint otica es denida positiva (esto es: V > 0) en . mente estable si V III. Teorema de Estabilidad Completa (Global). Considere una funci on escalar V (x) con primeras derivadas parciales continuas para todo x = 0 tal que (x) < 0, y V (x) cuando ||x|| . entonces el sistema aut V (x) > 0, V onomo (3.4) es completamente (globalmente) asint oticamente estable. IV. teorema de Inestabilidad of Ce teav. Sea una vecindad en el origen. Sea una regi on en . Dada una funci on V (x) en , entonces el equilibrio en el origen es inestable si: (a) V (x) posee derivadas parciales continuas en . (x) son denidas positivas en . (b) V (x) y V (c) V (x) = 0 en los puntos de frontera de dentro de . (d) El origen es un punto de frontera de . La gura 3.6 ilustra el teorema de inestabilidad de C eteav.
86
El teorema de inestabilidad de C eteav se convierte en el denominado primer teorema de inestabilidad si = 1 , cuando es una cierta vecindad del origen. Si, en adici on > 0 es reemplazada por: a la condici on = , la condici on V (x) V (x) 0 V t0 x
donde es una constante positiva, de este modo el teorema de inestabilidad de C eteav se convierta en el denominado segundo teorema de inestabilidad. Las demostraciones de los teoremas descritos anteriormente se realizan b asicamente en forma geom etrica en [16], [3].
V=0
.
1
x0
V = constant
Figura 3.6: Representaci on gr aca del teorema de estabilidad de C eteav.
Teoremas de Estabilidad de Lyapunov para Sistemas no Aut onomos V. teorema de Estabilidad. El equilibrio en el origen es estable, si all existe en alguna vecindad del origen, una funci on de Lyapunov V (x, t). VI. Teorema de Estabilidad Asint otica Uniforme. El equilibrio en el origen es uniformemente asint oticamente estable si la funci on denida positiva V (x, t) ies decreciente (lo que signica que V est a dominado por una funci on denida positiva > 0) en . W (x) para alg un t 0) y V (x, t) es denida positiva(es decir, V VII. Teorema de Inestabilidad. Sea una vecindad del origen. Sea una regi on en . Dada una funci2n V (x, t) en , entonces el equilibrio del origen en el tiempo t0 es inestable si: (a) V (x, t) posee derivadas parciales continuas en . (x, t) son denidas positivas en 1 . (b) V (x, t) y V (c) V (x, t) = 0 para alg un t t0 en los puntos de frontera de dentro de . (d) El origen es un punto de frontera de dentro de . En forma similar, el teorema de inestabilidad anterior se convierte en el denominado primer teorema de inestabilidad si = , donde es una cierta vecindad
87
> 0 es reemplazada del origen. Si en adici on a la condici on = , la condici on V por (x, t) V (x, t) 0 V t t0 x donde es una constante positiva, entonces el teorema de inestabilidad se convierte en el denominado segundo teorema de inestabilidad. Las demostraciones de estos teoremas se pueden encontrar en [3]. Ejemplo 3.5 Determine la estabilidad del sistema aut onomo descrito en los ejemplos 3.2 y 3.3 aplicando el m etodo directo de Lyapunov. Soluci on: Del ejemplo 3.2 podemos establecer que la funci on de Lyapunov V (e) = 1 2 cuando ||e|| . Por consiguiente, el sistema aut Ce onomo no lineal 2 descrito en dicho ejemplo es completamente (globalmente) asint oticamente estable. Del ejemplo 3.3 podemos establecer que la funci on de Lyapunov: 1 1 1 2 + K0 x2 + K1 x4 V (x) = M x 2 2 4 cuando ||x|| . Por consiguiente, el sistema aut onomo no lineal descrito en dicho ejemplo es completamente (globalmente) asint oticamente estable. Ejemplo 3.6 Determine la estabilidad el sistema no aut onomo descrito en el ejemplo 3.4 aplicando el m etodo directo de Lyapunov. Soluci on: Del ejemplo 3.4 se puede establecer que la funci on de Lyapunov: V (x, t) = 1 M (x + x)2 + 2 2 1 2 K0 + K1 M 2 + b(t) x2 2
(t) < 2K0 . Por consiguconforme ||x|| , siempre que > 0, b(t) > M , y b iente, el sistema no aut onomo descrito en tal ejemplo es completamente (globalmente) asint oticamente estable.
3.2.4.
Teoremas del Conjunto Invariante
En aplicaciones relacionadas con sistemas de control, estabilidad asint otica es m as importante que estabilidad. Claramente, peque nas desviaciones de las salidas controladas con respecto a se nales de referencia deseadas se pueden cancelar como resultado de la operaci on de un sistema asint oticamente estable. Sin embargo, la aplicaci on del 0 en lugar segundo teorema de estabilidad nos conduce a menudo a la relaci on V > 0 para estabilidad asint de la requerida condici on V otica. Para tales casos, puede ser de gran utilidad emplear el denominado teorema del conjunto invariante atribuido a La Salle [16] con la nalidad de obtener m as conclusiones acerca de la estabilidad asint otica.
88
Conjunto Invariante. Se dice que un conjunto G es el conjunto invariante de un sistema din amico x = f (x) si cada trayectoria de estado x(t) que comienza desde un punto x0 en G permanece en G para todo tiempo. por consiguiente, una trayectoria de estado cerrada en G es un conjunto invariante. De acuerdo a tal denici on, alg un punto de equilibrio es un conjunto invariante. El dominio de atracci on del punto de equilibrio es tambi en un conjunto invariante. VIII. Teorema del Conjunto Invariante Local. Considere el sistema dado en (3.3). Sea V (x) una funci on escalar con primeras derivadas parciales continuas. Sea on acotada denida por V (x) < , con > 0. Asumamos que: una regi (x) 0 V (3.5)
(x) = 0, para todo x en . Sea R el conjunto de todos los puntos dentro de donde V y sea M el m as grande conjunto invariante en R. Entonces, cada soluci on x(t) en tiende a M conforme t . Que M sea el conjunto invariante m as grande en R signica que M es la uni on de todos conjuntos invariantes dentro de R. La interpretaci on geom etrica de este teorema se ilustra en la gura 3.7.
V V=l
l R
M x2 x0 x1
Figura 3.7: Interpretaci on geom etrica del teorema del conjunto invariante.
Si la condici on (3.5) se sustituye por (x) < 0 V for all x = 0 in (3.6)
oticamente estable, y cada soluci on y el origen est a en , entonces tal origen es asint en tiende hacia el origen conforme t .
3.3 SCAMR para Sistemas No Lineales de una Entrada
89
IX. Teorema del Conjunto Invariante Global. Considere el sistema dado en (3.3). Sea V (x) una funci on escalar con primeras derivadas parciales continuas. (x) 0. Sea R el conjunto de todos Suponga que V (x) > 0 para todo x = 0 y V (x) = 0, y M el conjunto invariante m los puntos donde V as grande en R. Entonces todas las soluciones convergen completamente (globalmente) asint oticamente en M conforme t . En vista de los teoremas del conjunto invariante, una funci on de Lyapunov V tiene que converger a cero debido a tiene que desaparecer gradualmente. Esto es, V que V es acotado inferiormente. Demostraci on de los teoremas del conjunto invariante se pueden encontrar en [16], [3]. Ejemplo 3.7 Considere el sistema din amico:
2 2 x 1 = x1 (x2 1 + x2 4) 4x1 x2 2 2 x 2 = 4x2 1 x2 + x2 (x1 + x2 4)
para el punto de equilibrio x = 0 considere la funci on:

2 V (x) = x2 1 + x2
es: A lo largo de una trayectoria de estado, su derivada V

2 2 2 (x) = 2(x2 V 1 + x2 )(x1 + x2 4)
(x) < 0 dentro de un c Observe que V rculo de radio 2. Por consiguiente, usando el teorema de estabilidad II de Lyapunov, podemos inferir que el origen es asint otica2 < 4 es acotada y el mente estable. Para = 4, la regi on denida por V (x) = x2 + x 1 2 conjunto R es el origen, el cual es un conjunto invariante. Por consiguiente, cualquier trayectoria que se inicia dentro del c rculo de radio 2 converge hacia el origen y esta regi on constituye el dominio de atracci on.
3.3.
3.3.1.
SCAMR para Sistemas No Lineales de una Entrada

Formulaci on del Problema y de la Ley de Control
Consideremos el siguiente sistema no lineal en su forma asociada: y

(n) m
+
i=1
i fi (x, t) = bu
dn y dtn
y (n)
(3.7)
y b son constantes donde x = [y y . . . y (n) ]T es el vector de estado de orden n, i desconocidas, y fi son funciones no lineales conocidas. Dividiendo ambos miembros de (3.7) por b, se obtiene:
h y (n) +
i fi (x, t) = u
i=1
h=
1 b
i =
i b
(3.8)
90
Denamos el error de seguimiento a la salida: e = y yd donde yd es la trayectoria deseada, de modo tal que el error combinado s se pueda expresar como:
(n1) s = e(n1) + n2 e(n2) + + 0 e = (p)e = y (n1) yr
(3.9)
donde:
(p) = pn1 + n2 pn2 + + 0 = (p p1 ) . . . (p pn )

(n1) yr = yd (n1)
n2 e(n2) 0 e
en el cual p es el operador de Laplace y (p) es un polinomio estable Hurwitz, lo cual signica que todas las ra ces complejas pi = i + ji , i = 1, . . . , n de (p) = 0 verican la condici on i < 0. Asumamos la siguiente ley de control:
(n) ks+ u = h yr m
i fi (x, t)
i=1 (n)
(3.10)
donde las constantes k y h poseen el mismo signo. La variable yr , denotada como la variable de referencia de y (n) , se determina de:
(n) yr
(n) yd
n2 e
(n1)
0 e
(n) yr
dyr = dt
(n1)
Sustituyendo (3.10) en (3.8) nos conduce al error de seguimiento din amico: hs +ks = 0 (3.11)
Observar que (3.11) es exponencialmente convergente en s, lo cual a la vez garantiza la convergencia del error de seguimiento e.
3.3.2.
La Ley de Adaptaci on
Reemplazando los par ametros h y i de (3.10) por sus valores estimados h y i respectivamente, entonces la ley de control del SCAMR toma la forma:
(n) ks+ u = h yr m
i fi (x, t)
i=1
(3.12)
Ahora denamos h = h h and i = i i . Sustituyendo (3.12) en (3.8) produce el error de seguimiento din amico:
(n) hs + k s = h yr + m
i fi (x, t)
i=1
(3.13)
el cual se puede reescribir como: s= 1/h (n) + h yr p + (k/h)

m
fi (x, t)
i=1
(3.14)
3.3 SCAMR para Sistemas No Lineales de una Entrada donde p es el operador de Laplace. Considere la siguiente ley de adaptaci on: (n) h = sgn(h)s yr = sgn(h)s fi
91
(3.15)
donde es la ganancia de adaptaci on. Para determinar si el SCAMR garantiza convergencia de seguimiento global, consideremos la siguiente funci on de Lyapunov: V = |h|s2 + 1 h2 +
m i=1 2 i
(3.16)
Usando el hecho de que h sign(h) = |h| y k sign(k ) = |k | y dado que k y h poseen el mismo signo, se puede demostrar f acilmente que: = 2|k |s2 < 0 V (3.17)
lo cual garantiza convergencia de seguimiento global del SCAMR en el sentido del m etodo directo de Liapunov (subsecci on 3.2.3). Ahora, considere la ley de adaptaci on: n h = h sgn(h)s yr i = sgn(h)s fi
(3.18)
ametro desdonde las ganancias de adaptaci on h y k son diferentes para cada par conocido. Seleccionando la siguiente candidata para funci on de Lyapunov:
1 2 1 h + k V = |h|s2 + h m i=1 2 i
(3.19)
nos conduce a (3.17), lo cual garantiza converse puede demostrar f acilmente que V gencia de seguimiento global del SCAMR.
3.3.3.
ZonaMuerta para Evitar Corrimiento de Par ametros
El an alisis de los SCAMR hasta ahora realizado s olo ha tomado en cuenta incertidumbre en los par ametros. Sin embargo, en el mundo real, sistemas controlados tienen que trabajar en la presencia de incertidumbres no param etricas tales como: din amica de alta frecuencia no modelada en actuadores o estructuras sujetas a vibraci on, din amica de baja frecuencia no modelada tales como las fricciones est atica y de Coulomb, ruido de medici on, retardos en el dominio discreto, error computacional de redondeo, etc. En sistemas de control es intuitivamente comprensible que mientras m as grande sean las incertidumbres param etricas, m as grande ser a el error de seguimiento. Consecuentemente, los SCAMR se pueden volver inestables en presencia de grandes incertidumbres param etricas. Por otro lado, estudios de simulaci on han demostrado que cuando un SCAMR es persistentemente excitado, entonces el sistema muestra cierta robustez con respecto a las incertidumbres no param etricas. Por el contrario, a un peque nas incertidumbres param etricas pueden causar problemas de estabilidad si el SCAMR no est a excitado permanentemente.
92
El problema del corrimiento de par ametros hacia valores peligrosos est a asociado con las incertidumbres no param etricas. Tal problema se origina principalmente cuando el SCAMR no est a excitado permanentemente o debido a la presencia del ruido de medici on. El corrimiento de los valores de los par ametros puede causar que el SCAMR se torne inestable si se permite que los par ametros estimados desplacen sus valores hacia valores que puedan provocar que los polos del SCAMR realimentado se vuelvan inestables. La experiencia dicta que la presencia de peque nos errores de seguimiento pueden originar el corrimiento de los par ametros a valores peligrosos. La t ecnica m as simple de modicaci on de la ley de control para evitar este problema es detener el mecanismo de adaptaci on en presencia de peque no errores de seguimiento. Esta t ecnica conocida como zonamuerta, sustituye los t erminos de (3.18): (n) h = h sgn(h)s yr por: h = i = h sgn(h)s yr 0 sgn(h)s fi 0
(n)
i = k sgn(h)s fi
|s| > y |s| < y |s| > f |s| < f (3.20)
no de la zonamuerta. Las expresiones dadas en donde h y f representan el tama (n) 3.20 nos indican que cuando |s| < y , entonces h debe de tomar el valor h sgn(h)s yr i debe de previamente computado. Del mismo modo, cuando |s| < f , entonces tomar el valor k sgn(h)s fi computado en el tiempo de muestreo anterior. Ejemplo 3.8 El modelo din amico del MRAF (manipulador rob otico con articulaci on el astica) mostrado en la gura 1.4 se muestra en (1.30). Determinar su forma asociada (ecuaci on (3.7)). Soluci on: Denamos y = y x = [ y y y y (3) ], entonces (1.30) se puede expresar en su forma asociada como: hy donde: h= 2 =
(3) 4
+
i=1
i fi (x) = u
Jeq La KA
1 =
Beq La Ra Jeq + KA nKA Km meq gLLa KA 4 = meq gLRa nKA Km f4 = sen y
Ra Beq nKb + KA nKA Km f1 = y
3 =
1 meq = m + mH 2
f2 = y
f3 = y cos y
3.4 SCAMR para Sistemas No Lineales Multivariables
93
Aplicaci on 3.1 Implementar un SCAMR para el Manipulador de 1GDL En esta aplicaci on se dise na e implementa en tiempo real un SCAMR para el manipulador rob otico de 1GDL mostrado en la gura 1.1 y descrito en la subsecci on 1.1.1. Denamos y = y x = [ y y y y (3) ], entonces (1.30) se puede expresar en su forma asociada como: hy donde: h= 2 = Jeq La KA 1 = Beq La Ra Jeq + KA nKA Km meq gLLa KA 4 = meq gLRa nKA Km f4 = sen y
(3) 4
+
i=1
i fi (x) = u
Ra Beq nKb + KA nKA Km f1 = y
3 =
1 meq = m + mH 2
f2 = y
f3 = y cos y
3.4.
SCAMR para Sistemas No Lineales Multivariables
Del cap tulo 1 sabemos que una gran clase de sistemas no lineales electro mec anicos, tales como manipuladores rob oticos, se pueden describir mediante su modelo LE (por ejemplo ver (1.113) and (1.143)), a saber: q1 . q= . . qm u1 . u= . . um
M(q)q + P(q, q )q + d(q) = u
(3.21)
donde las matrices M, P y d representan la inercia del sistema a controlar, los torques centr petos y de Coriolis, y los torques gravitacionales respectivamente. Tambi en, q es el vector de coordenadas generalizadas y u es el vector de control. El objetivo de control del SCAMR es dise nar una ley de control u capaz de hacer que la salida del sistema q(t) siga a la taryectoria deseada qd (t) con velocidad suciente a pesar de la presencia de incertidumbres en los par ametros. Asumamos que todos los t erminos en (3.21) dependen linealmente de un vector de par ametros a con elementos conocidos, a saber: Ya = u (3.22) donde Y es una matriz conocida. Considere la siguiente ley de control: u = Y a KD s (3.23)
ermino derivativo y Ya es el t ermino anticipativo. En los t erminos donde KD s es el t descritos, a es el vector estimado de par ametros, KD (la ganancia derivativa) es una matriz sim etrica constante denida positiva y s es un vector de supercies deslizantes
94
cuyos elementos si , i = 1, . . . , m se denen mediante la ecuaci on escalar si (q, t) = 0, de modo tal que: si = ( d + i )n1 qi = (p + i )n1 qi dt (3.24)
donde i > 0 es una constante (el ancho de banda), p es el operador de Laplace y: qi = qi qdi es el error de seguimiento. Por ejemplo, para n = 2, (3.24) se convierte en un error de seguimiento compuesto de velocidad y posici on: + q = q s=q q r donde: s = [s1 ... sm ]T = [q q 1 ... ]T q m = = [q q r r1 1 0 0 2 . . . . . . 0 0 ... ... ... 0 0 . . . (3.26) ]T q rm q = q qd q r = q d q (3.25)
qd = [qd1
...
qdm ]T
... . . . m
La conservaci on de la energ a requiere que: 1 d T [q Mq ] = q T (u d) 2 dt (3.27)
donde q T Mq es la energ a cin etica del sistema y q T (u d) es la potencia de entrada generada por el actuador. Diferenciando el miembro izquierdo de (3.27): 1 T q T M Mq =q T (u d) q+ q 2 (3.28)
De (3.21) obtenemos: M q = u d Pq . Sustituyendo este t ermino en (3.28): 2P)q =0 q T (M (3.29)
2P) = J es antisim Ha sido establecido en [24], [3] que (M etrica. Por consiguiente: = 2P + J M Considere la siguiente candidata para funci on de Lyapunov: V (t) = 1 T s Ms + aT 1 a 2 (3.31) (3.30)
donde es una matriz sim etrica denida positiva y a = a a es el error de estimaci on de par ametros. Diferenciando (3.31) se obtiene: 1 T 1 a (t) = sT M +a V s + sT M 2
95
y empleando la relaci on s = q q r (ecuaci on (3.25)) en la expresi on anterior se obtiene: 1 T 1 a (t) = sT (M +a q + M qr ) + sT Ms V 2 produce: Sustituyendo (3.30), (3.23) y M q de (3.21) en V T 1 a (t) = sT (Ya KD s M V qr P q r d) + a (3.32)
en donde hemos usado el hecho de que sT Js = 0, dado que J es antisim etrica1 . La actualizaci on de los par ametros estimados a se puede formular como: = YT s a mientras que la propiedad de parametrizaci on lineal en (3.32) establece que: Y(q, q ,q r, q r )a = M(q)q r + P(q, q )q r + d(q) Reemplazando (3.34)y (3.33) en (3.32) produce: (t) = sT KD s 0 V (3.35) (3.34) (3.33)
+ q (ver (3.25)), entonces (3.35) garantiza que los errores de Dado que s = q tiendan a 0 conforme t . En otras seguimiento de posici on q y de velocidad q palabras, los errores de seguimiento convergen en la supercie s = 0. El resultado establecido en (3.35) es tambi en v alido para el modelo LE dado en (1.130). Para este caso, las relaciones (3.22), (3.23) y (3.34) toman las formas siguientes: Ya = T (3.36) u = Y a KD s r )a = H(q)q r + C(q, q )q r + d(q) T = Y(q, q ,q r, q (3.37) (3.38)
La actualizaci on de los par ametros estimados a dado en (3.33) se pueden emplear tambi en para este caso. Aplicaci on 3.2 Dise no e Implementaci on de un SCAMR para el MRT En esta aplicaci on el objetivo es dise nar e implementar en tiempo real un SCAMR para el MRT (manipulador rob otico traslacional), cuyo modelo LE se da en (1.113), donde m12 = p12 y d2 = g m21 . Empleando la denici on dada en (3.34), el modelo LE tome la forma: )q r + d(q) = u M(q)q r + P(q, q qr = rr r 1 u= u1 u2 = Ya
1 Suponga que sT Js = c = 0, donde c es una constante. Como J es antisim etrica: J = JT ; luego nica soluci on posible para la constante es: c = 0 sT Js = c. Entonces, la u
96
Deniendo a1 = m11 , a2 = p12 , a5 = p11 , a3 = m21 , a4 = m22 y a6 = p22 , el modelo param etrico lineal correspondiente u = Ya se formula como: a1 a2 1 cos 1 2 sin 1 a3 r 0 0 r 0 1 u= 1 a4 1 0 0 0 cos 1 g sin 1 a5 a6 La ley de control (3.23) se puede escribir como: Ks q u = Y a KD s = Y a KD q donde, por simplicidad, KD = diag [KD ] y KP = KD = diag [KP ]. La simulaci on del SCAMR dise nado ( archivo trmmrac.m) asume las siguientes condiciones iniciales: on del brazo). Para un tiempo r(0) = 0 m (posici on del carro) y 1 = 0 rad (posici de muestreo de T = 0,01 s, los par ametros de la ley de control se jan en KD = 1,5 y KP = 2, mientras que la matriz de la ley de adaptaci on (3.33) se ja en = diag 0,09 0,16 0,3 0,01 4,1 0,05 . Las trayectorias deseadas son: cos(0,2 kT ) 1d (t) = cos(0,2 kT ) 4 4 donde k es el tiempo discreto. Los resultados de la simulaci on se muestran en las guras 3.8, 3.9 y 3.10. rd (t) =
1
Cart position (m)
0.5
0.5
4 Time
5 (s)
10
4 3 Control voltage u1 2 1 0 1 2 0 1 2 3 4 Time 5 (s) 6 7 8 9 10
Figura 3.8: Posici on controlada del carro del MRT. Aplicaci on 3.3 Implementar un SCAMR para el MRS De acuerdo con la ecuaci on (3.38), el modelo de LagrangeEuler del manipulador rob otico esf erico dado en (1.130) se puede redenir como: r )a = H(q)q r + C(q, q )q r + d(q) T = Y(q, q ,q r, q (3.39)

1 0.5 0 0.5 1 1.5
97
Link position (rad)
4 Time
5 (s)
10
8 6 Control voltage u2 4 2 0 2 4 6 0 1 2 3 4 Time 5 (s) 6 7 8 9 10
Figura 3.9: Posici on controlada del brazo del MRT.
0.04 0.02 ae1 ae2 0 0.02 0.2 0.1 ae3 0 0.1 0.2 0.6 0.4 ae5 0.2 0 0.2 0 2 4 6 Time (s) 8 10 ae6 0 2 4 6 8 10 ae4 0 2 4 6 8 10
0.05 0 0.05 0.1 0.15 0.05 0 2 4 6 8 10
0.05 0.02 0.01 0 0.01
10
4 6 Time (s)
10
Figura 3.10: Par ametros estimados del MRT.
Deniendo: a1 = 2T1 a2 = H22 a3 = m2 gLx2
98
entonces (3.39) se determina como: T1 T2 = Y11 Y12 Y13 Y21 Y22 Y23 a1 a2 a3 a1 + a2 cos2 q2 0 0 a2 q r1 q r2 + q r1 q r2
2 sin q2 cos q2 a2 q 1 sin q2 cos q2 a2 q a2 q 1 sin q2 cos q2 0 donde: r1 Y11 = q Y13 = 0
0 a3 cos q2
Y12 = q r1 cos2 q2 q r1 q 2 sin q2 cos q2 q r2 q 1 sin q2 cos q2 Y21 = 0 Y22 = q r2 + q r1 q 1 sin q2 cos q2 Y23 = cos q2
La ley de control est a dada por (3.36): T = Y a KD s Sin embargo, los voltajes de control se computan de (1.141) y (1.141): 1 + Beq1 q 1 + T1 ) + NT 1 q 1 u1 = RT 1 (Jeq1 q u2 = RT 2 (Jeq2 q 2 + Beq2 q 2 + T2 ) + NT 2 q 2 La simulaci on del SCAMR dise nado (archivo srmmrac.m) asume las siguientes condion de la base) y q2 (0) = /2 rad (posici on del ciones iniciales: q1 (0) = 0 rad (posici brazo). Para un tiempo de muestreo de T = 0,01 s, los par ametros de la ley de control an dadas por: se jaron en KD = diag [1,5]. Las trayectorias deseadas est qd1 (k ) = sin 2kT qd2 (k ) = cos 2kT
donde k = t/T es el tiempo discreto. La matriz de la ley de adaptaci on (3.33) se j o en = diag 0,05 0,075 0,1 . Los resultados de la simulaci on se muestran en las guras 3.11, 3.12 y 3.13.
PROBLEMAS
IN PROGRESS
99
1.5 1 Base position (rad) 0.5 0 0.5 1 1.5 0 1 2 3 4 5 6 7 8 9 10
8 6 Voltage control u1 4 2 0 2 4 0 1 2 3 4 Time 5 (s) 6 7 8 9 10
Figura 3.11: Trayectoria 1 (t) controlada y su se nal de control.
1.5 1 Link position (rad) 0.5 0 0.5 1 1.5 2 0 1 2 3 4 5 6 7 8 9 10
10 8 Voltagr control u2 6 4 2 0 2 4 0 1 2 3 4 Time 5 (s) 6 7 8 9 10
Figura 3.12: Trayectoria 2 (t) controlada y su se nal de control.
100
0.15 0.1 ae1 0.05 0 0.05 0.6 0.4 ae2 0.2 0 0.2 1.3 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
ae3 1.25 0
4 Time
5 (s)
10
Figura 3.13: Par ametros estimados.
Cap tulo 4
Linealizaci on por Realimentaci on de Estados

4.1. Herramientas de la Geometr a Diferencial
Los m etodos de la geometr a diferencial se aplican principalmente a sistemas no lineales para determinar si tales sistemas son linealizables mediante realimentaci on de estados; esto es, si la descripci on din amica de un sistema en particular se puede hacer que parezca lineal, luego de efectuar una apropiada transformaci on de coordenadas y aplicar la correspondiente linealizaci on de estados no lineal. En concordancia con la terminolog a empleada en geometr a diferencial [10], [3], [11], la siguiente funci on vectorial n-dimensional: f1 (x1 , . . . , xn ) f1 (x) . . . . (4.1) f (x) = = . . fn (x) fn (x1 , . . . , xn )
se denomina un campo vectorial, si a cada funci on vectorial f le corresponde un campo de vectores en un espacio n-dimensional Rn . En lo que sigue, nosotros nos ocuparemos s olo de campos vectoriales suaves de la forma f (x), signicando que tales funciones vectoriales poseen derivadas parciales continuas de cualquier orden. El concepto de suavidad se aplica tambi en a funciones. El gradiente de una funci on escalar suave h(x) se dene como: h(x) = h = x
h x1
h xn
(4.2)
Los elementos de h son (h)i = h/xi . De la misma manera, el jacobiano de f (x), de elementos (f )ij = fi /xj , se dene como: f (x) = f (x) = x
f1 x1
. . .
fn x1
.. .
f1 xn
(4.3)
. . .
fn xn
102
4.1.1.
Derivadas y Corchetes de Lie
Derivadas de Lie La derivada de Lie de una funci on escalar h(x) con respecto al campo vectorial f (x) es una nueva funci on escalar Lf h denida como: Lf h = h f = h h f1 + + fn x1 xn (4.4)
Observar que la derivada de Lie es el producto interno entre h(x) y f (x). Derivadas de Lie repetidas se pueden formular en forma recursiva como: L0 fh = h
i1 i1 Li f h = Lf (Lf h) = (Lf h) f
for i = 1, 2, . . .
(4.5)
Si f y g son campos vectoriales, entonces: Lg Lf = (Lf ) g Corchetes de Lie El corchete de Lie de dos campos vectoriales f y g es otro campo vectorial [f , g] denido como: [f , g] = g f f g (4.7) La notaci on adf g (donde ad signica adjunta) se emplea frecuentemente en lugar de [f , g]. Corchetes de Lie repetidos se pueden formular en forma recursiva: adf0 g = g (4.6)
adfi g = [f , adfi1 g]
para i = 1, 2, . . .
(4.8)
Siempre que f , f1 , f2 , g, g1 y g2 sean campos vectoriales suaves, 1 and 2 sean constantes escalares, y h(x) sea una funci on escalar suave de x, se puede formular la siguiente propiedad del corchete de Lie: 1) Bilinealidad: [1 f1 + 2 f2 , g] = 1 [f1 , g] + 2 [f2 , g] [f , 1 g1 + 2 g2 ] = 1 [f , g1 ] + 2 [f , g2 ] 2) Anti-conmutatividad: [f , g] = [g, f ] 3) Identidad de Jacoby: Ladf g h = Lf Lg h Lg Lf h (4.11) (4.10) (4.9)
4.1 Herramientas de la Geometr a Diferencial
103
4.1.2.
Difeomorsmos y Transformaci on de Coordenadas
Una funci on denida en una regi on se conoce como un difeomorsmo si 1 ambos, y su inversa son funciones suaves. Si la regi on es Rn (el espacio total), entonces, (x) se denomina un difeomorsmo global. Por otra parte, un difeomorsmo local se dened s olo en una vecindad nita de un punto dado x0 . Una funci on suave (x) denida en una regi on en Rn es un difeomorsmo local, siempre que la matriz jacobiana x sea no singular en un punto x = x0 de la regi on . Empleando difeomorsmo, nosotros podemos transformar los estados de un sistema no lineal en un nuevo conjunto de estados correspondiente al sistema no lineal transformado. La metodolog a es bien conocida. Consideremos un sistema SISO (de una entrada y una salida) no lineal descrito por: x = f (x) + g(x)u y = h(x) (4.12)
donde u es la u nica entrada e y es la u nica salida. Denamos un nuevo conjunto de estados z = (x). Efectuando diferenciaci on en z: z = donde f = f x g = g x x = 1 (z) h = h x = (f (x) + g(x)u) = f (z) + g (z)u x x y = h (z) (4.13)
4.1.3.
El Teorema de Frobenius
Suponga que f1 , f2 , . . ., fm es un conjunto de campos vectoriales linealmente independientes en Rn . El teorema de Frobenius establece que tal conjunto es completamente integrable s y s olo si dicho conjunto es involutivo. Se dice que el conjunto de campos vectoriales arriba denido es completamente integrable s y s olo si existen n m funciones escalares h1 (x), h2 (x), . . ., hnm (x) que satisfacen el siguiente sistema de ecuaciones diferenciales parciales. hi fj = 0 1 i n m, 1jm (4.14)
en linealmente independientes. donde los gradientes h1 , h2 , . . ., hnm son tambi El conjunto de campos vectoriales en consideraci on se dice que es involutivo, s y s olo si existen funciones escalares ijk en R (el espacio unidimensional) que satisfacen:
m
[fi , fj ](x) =
k=1
ijk (x) fk (x)
i, j
(4.15)
La u ltima ecuaci on indica que el campo vectorial resultante [fi , fj ](x) es una combinaci on lineal del conjunto original de campos vectoriales f1 , f2 , . . ., fm . De (4.15), podemos postular: 1) El conjunto de campos vectoriales constantes f1 , f2 , . . ., fm es siempre involutivo porque el corchete de Lie de cualquier par de de tales campos siempre es nulo, esto es: [fi , gj ] = 0
104
Linealizaci on por Realimentaci on de Estados lo cual signica que estos campos se pueden representar como una combinaci on lineal.
2) Un conjunto que contiene un u nico campo vectorial f es involutivo porque: [f , f ] = 0. 3) El conjunto de campos vectoriales f1 , f2 , . . ., fm es involutivo si x y i, j rank f1 (x) . . . fm (x) = rank f1 (x) . . . fm (x) [fi (x), fj ](x)
donde la notaci on rank . representa el rango de una matriz de campos vectoriales columna.
4.2.
Linealizaci on por Realimentaci on. Caso: SISO
Esta secci on presenta la metodolog a para generar una relaci on entradasalida para procesos SISO no lineales con el prop osito de dise nar controladores estables. El sistema no lineal en consideraci on se puede describir como: x = f (x) + g(x)u x1 f1 (x) . . . x= . f = . . xn fn (x) y = h(x) g1 . g= . . gn (4.16)
donde x es el vector de estado de orden n 1, u es la entrada de control, y es la salida del sistema, f y g son campos vectoriales suaves de orden n 1, y h es una funci on suave.
4.2.1.
Condiciones para Linealizaci on
El sistema no lineal x = f (x) + g(x)u es linearizable por realimentaci on de estados, s y s olo si las siguientes condiciones son verdaderas para una regi on :
n1 g son linealmente independientes en 1) Los campos vectoriales g, adf g, . . ., adf la regi on . n2 g } es involutivo en . 2) El conjunto {g, adf g, . . ., adf
Para sistemas SISO lineales se sabe que f (x) = Ax y g(x) = B, donde A de orden n n y B de orden n 1 son las matrices de estado y de control (o de distribuci on) respectivamente. Por consiguiente, la primera condici on se convierte en la bien conocida condici on de estabilidad completa dada en (2.11), a saber, un sistema lineal de la forma: x = Ax + Bu y = Cx (4.17) es controlable en sus estados si su matriz de controlabilidad C posee rango completo: rank C = rank [B AB An1 B] = n (4.18)
La primera condici on descrita arriba puede ser interpretada como la Condici on de Estabilidad Generalizada.
4.2 Linealizaci on por Realimentaci on. Caso: SISO
105
4.2.2.
El Grado Relativo de un Sistema
Diferenciemos la salida y de (4.16): y = h(x)(f + gu) = Lf h(x) + Lg h(x)u un x = x0 , entonces la siguiente transformaci on en la entrada: Si Lg h(x) = 0 para alg u= 1 (Lf h(x) + v ) Lg h(x)
genera una relaci on diferencial lineal entre la salida y y la nueva entrada v , de la on de y forma: y = v . Por el contrario, si Lg h(x) = 0 para todo x, la diferenciaci produce: y = L2 f h(x) + Lg Lf h(x)u Si Lg Lf h(x) = 0 para todo x, necesitamos diferenciar y (3) , . . ., y (i) como sigue: y (i) = d iy i1 = Li f h(x) + Lg Lf h(x)u dt i
hasta que para alg un entero r = i y para alg un x = x0

1 Lg Lr h(x) = 0 f
Sustituyendo la siguiente ley de control: u= en:

r 1 h(x)u y (r) = Lr f h(x) + Lg Lf
1 (Lr f h(x) r 1 Lg Lf h(x)
+ v)
genera una relaci on diferencial lineal entre la salida y y la nueva entrada v de la ( r ) r forma: y = d y/dt r = v . Por consiguiente, un sistema SISO posee un grado relativo r en el punto x0 en una regi on si, para todo x : Lg Li f h(x) = 0 = 0 0i<r1 (4.19) (4.20)
1 Lg Lr h(x) f
Observar que r es el n umero de diferenciaciones ejecutadas en la salida y requeridas para que la entrada u aparezca. En general: r n (recordar que n es el orden del sistema). Si r = n, entonces la linealizaci on entradasalida se denomina exacta y en esta situaci on todos los estados se realimentan. Por otra parte, el grado relativo de un sistema no lineal es indenido en x0 si el coeciente of u (equation (4.20)) is zero en x0 , pero no es cero en algunos puntos x cercanos a x0 .
106
4.2.3.
Forma Normal SISO con Linealizaci on Exacta
El sistema no lineal (4.16) se puede transformar a su forma normal usando los resultados establecidos en la subsecci on 4.1.2. Sabemos que linealizaci on exacta de un sistema no lineal descrito por (4.16) ocurre cuando el grado relativo r es igual al orden del sistema n. Para linealizaci on exacta, la transformaci on de estados: h(x) 1 (x) z1 y 2 (x) Lf h(x) y z2 = (4.21) z = . = (x) = = . . . . . . . . . . . zn n (x)
n1 h(x) Lf
yn
conduce a la siguiente descripci on en el espacio de estado: z 1 z2 z z3 2 . . . . z = . = . z n1 zn z n b(z) + a(z)u donde:

n1 h(1 (z)) a(z) = Lg Lf 1 b(z) = Ln f h( (z))
y = z1
(4.22)
(4.23)
4.2.4.
La Ley de Control SISO para Linealizaci on
Consideremos la siguiente ley de control de linealizaci on: u= 1 [b(z) + v ] a(z) (4.24)
donde v es una nueva entrada a ser determinada, a(z) y b(z) est an dadas en (4.23), y z es el nuevo estado para linealizaci on. Substituyendo (4.24) en (4.22) produce la siguiente representaci on can onica invariante con el tiempo: z = Mz + Nv donde: M= 0 1 0 0 0 1 . . . . . . . . . . . . 0 0 0 0 0 0 0 0 1 0 0 0 . . . N= 0 1 0 0 . . . C 1 0 0 0 y = Cz (4.25)
La funci on de transferencia del sistema es: 1 y (s) = H (s) = C(sI M)1 N = n v (s) s (4.26)
4.3 Linealizaci on por Realimentaci on: Caso MIMO
107
donde s es el operador de Laplace. La entrada v se dise na para ubicar los polos del sistema lineal equivalente. Entonces, la entrada u se computa usando (4.24). Empleando (4.26), el sistema lineal equivalente se puede seleccionar de: v= d ny + Kn y = y (n) = (n) + K1 y (n1) + + Kn1 y dt n (4.27)
donde (t) es la trayectoria deseada e y (t) = (t) y (t) es la se nal de error de seguimiento. La ecuaci on caracter stica del sistema lineal equivalente es: + Kn y (n1) + + Kn1 y =0 y (n) + K1 y (4.28)
Para comportamiento asint otico estable, es decir, y = ( y ) 0 para t , ninguna de las ra ces de (4.28) se deben de localizar en el semiplano derecho del plano s, incluyendo el eje imaginario. Los par ametros Ki , i = 1, . . . , n del controlador se seleccionan para cumplir este requerimiento.
4.3.
4.3.1.
Linealizaci on por Realimentaci on: Caso MIMO

Modelando Sistemas MIMO Cuadrados
Un sistema MIMO no lineal se denomina cuadrado cuando el n umero de sus entradas iguala al n umero de sus salidas. El sistema cuadrado por considerar, en la vecindad del punto x0 , se describe por:
m
x = f (x) + G(x)u = f (x) +

j =1
gj (x)uj (x)
y = h(x) u1 . u= . . um
(4.29)
x1 . x= . . xn
f1 (x) . . f (x) = . fn (x)
y1 . y= . . ym
h1 (x) . . h(x) = . hm (x)
G11 (x) . . . G1m (x) . . G(x) = = . ... Gm1 (x) . . . Gmm (x)
g1 (x) gm (x)
donde x es el vector de estado de orden n 1, u es el vector de control (la entrada) de orden m 1, y es el vector de salida de orden m 1, f es un campo vectorial suave de orden n 1, h es un campo vectorial suave de orden m 1, y G es una matriz de dimensi on n m cuyas columnas son campos vectoriales gj de orden of order n 1. Los elementos de gj y h son funciones suaves.
108
4.3.2.
Grado Relativo Total
En la referencia [11], se establece que el sistema cuadrado descrito por (4.29) posee un grado relativo total r = r1 + . . . + rm si: 1) Para todo x en una vecindad de x0 Lgj Lk f hi (x) = 0 j, i = 1, . . . , m k < ri 1 (4.30)
2) La siguiente matriz de orden m m es no singular en x = x0 : r 1 1 r 1 1 Lg1 Lf h1 (x) Lgm Lf h1 (x) r 1 Lg L 2 h2 (x) Lg Lr2 1 h2 (x) m f 1 f A(x) = . . . . . . . . . r m 1 r m 1 hm (x) Lgm Lf hm (x) Lg1 Lf
Observando las las de A, podemos postular que cada entero ri est a relacionado con la i- esima salida del sistema. Tambi en, notar que ri es el n umero de diferenciaciones ejecutadas en la salida yi requeridas para que aparezca al menos uno de los componentes del vector de entrada u. La no singularidad de A(x) en x = x0 es la versi on multivariable de la condici on impuesta por la ecuaci on (4.20). Ejemplo 4.1 La descripci on en el espacio de estado del sistema MRE (manipulador rob otico esf erico) de dos entradas y dos salidas se da en (1.146) y (1.147). Determinar el grado relativo total del MRE. Soluci on: Las primeras tres derivadas de la salida y1 = h1 (x) = x1 produce: y 1 = y 1 = h1 (x) = Lf h1 (x) = f1 (x) = x x 1 = x3 x Lg1 h1 (x) = 0
(Lf h1 (x)) = Lf (Lf h1 (x)) = f3 (x) = x x 3 = x5 Lg1 (Lf h1 (x)) = 0 x (Lf (Lf h1 (x))) (3) = Lf (Lf (Lf h1 (x))) = f5 (x) x y1 = x Lg1 (Lf (Lf h1 (x))) = G51 (x) = 0
en, las primeras tres Por consiguiente, el grado relativo para y1 resulta r1 = 3. Tambi derivadas de la salida y2 = h2 (x) = x2 produce: y 2 = y 2 = h2 (x) = Lf h1 (x) = f1 (x) = x 2 = x4 x x Lg2 h2 (x) = 0
(Lf h2 (x)) = Lf (Lf h2 (x)) = f4 (x) = x x 4 = x6 Lg2 (Lf h2 (x)) = 0 x (Lf (Lf h2 (x))) (3) = Lf (Lf (Lf h2 (x))) = f6 (x) x y2 = x Lg2 (Lf (Lf h2 (x))) = G62 (x) = 0
Por consiguiente, el grado relativo para y2 resulta r2 = 3 y el grado relativo total del sistema viene a ser: r = r1 + r2 = 6.
109
4.3.3.
Forma Normal MIMO para Linealizaci on Exacta
Si el grado relativo total del sistema cuadrado descrito en (4.29) es r, entonces: r = r1 + r2 + + rm n Un sistema MIMO descrito por (4.29) posee linealizaci on exacta, si su grado relativo on n del total r = r1 + . . . + rm es igual al orden n del sistema, es decir, la dimensi vector de estados. Para linealizaci on exacta, la transformaci on de estados: 1 (x) z1 . . . . . . r1 (x) z r 1 1 (x) zr1 +1 . . . . . . = z = (x) = (4.31) r (x) zr 1 + r 2 2 . . . . . . 1 (x) zr +r ++1 1 2 . . . . . . zr1 +r2 ++rm rm (x) donde 1 (x) = h1 (x) = y1 (x); 1 (x) = h2 (x) = y2 (x); . . . 1 (x) = hm (x) = ym (x);
r 1 1 2 (x) = Lf h1 (x); ; r1 (x) = Lf h1 (x) r 2 1 2 (x) = Lf h2 (x); ; r2 (x) = Lf h2 (x)
r m 1 2 (x) = Lf hm (x); ; rm (x) = Lf hm (x)
conduce a la siguiente descripci on en el espacio de estado: 1 (x) = 2 (x) y 1 = . . . y1

(r ) y1 1 (r1 1)
r 1 (x) = r (x) = 1 1
m j =1 r 1 1 Lgj Lf h1 (1 (z))uj
r (x) = Lr1 h1 (1 (z)) + = 1 f
1 (x) = 2 (x) y 2 = . . . y2
(r ) y2 2 (r2 1)
r 1 (x) = r (x) = 2 2
m j =1 r 2 1 Lgj Lf h2 (1 (z))uj
r (x) = Lr2 h2 (1 (z)) + = 2 f . . .
110
Linealizaci on por Realimentaci on de Estados 1 (x) = 2 (x) y m = . . .

(rm 1) r 1 (x) = r (x) = ym m m (r m ) r (x) = Lrm hm (1 (z)) + ym = m f m j =1 r m 1 Lgj Lf hm (1 (z))uj
(4.32)
Ejemplo 4.2 La forma normal MIMO del MRE Determinar la forma normal MIMO del proceso MRE. Soluci on: Del ejemplo 4.1, la condici on para linealizaci on exacta se cumple para el sistema MRE porque r = 6 = n (orden del sistema). Aplicaci on de las relaciones (4.31) y (4.32) en el sistema MRE nos conduce a: z= z1 z2 z3 z4 z5 z6 = (x) = h1 Lf h1 (x) L2 f h1 (x) h2 (x) Lf h2 (x) L2 f h2 (x) = x1 x3 x5 x2 x4 x6 = y1 y 1 y 1 y2 y 2 y 2 1 x = (z) = z1 z4 z2 z5 z3 z6
(4.33) = z donde: z 1 z 2 z 3 z 4 z 5 z 6 = z2 z3 v1 z5 z6 v2 = Mz + Nv v1 v2 M= 1 0 0 0 0 0 0 0 0 1 0 0 y1 y2 z1 z4
y=
= Cz
(4.34)
v=
0 0 0 0 0 0
1 0 0 0 0 0
0 1 0 0 0 0
0 0 0 0 0 0
0 0 0 1 0 0
0 0 0 0 1 0
N=
0 0 1 0 0 0
0 0 0 0 0 1
C=
111
4.3.4.
La Ley de Control MIMO Desacoplada
Es importante anotar que el grado relativo ri , i = 1, . . . , m, es el entero m as peque no requerido para que al menos una de las entradas aparezca en (seever (4.32)):
ri yi
1 i Lr f hi ( (z))
+
j =1
r i 1 Lgj Lf hi (1 (z))uj
r i 1 Por consiguiente, Lf hi (1 (z))uj = 0 para al menos un j en la vecindad de x0 . Ahora consideremos la siguiente ley de control desacoplada:
u = A1 (z)[B(z) + v]
(4.35)
donde v = [v1 . . . vm ]T es una nueva entrada por determinar, y A(z) (ver (4.30)) y B (z) son matrices con elementos: aij = Lgi Lf j
r 1
hj (1 (z))
i, j = 1, . . . , m i = 1, . . . , m
1 i bi = Lr f hi ( (z))
on (4.35)) en respectivamente. Sustituci on de los elementos ui , i = 1, . . . , m (ecuaci (4.32) conduce a la representaci on can onica invariante con el tiempo del sistema (r ) MIMO, es decir, ecuaci on (4.32) con yi i = vi . Por otra parte, de la relaci on y(s) = H(s)v(s), f acilmente se puede demostrar que la matriz de transferencia H(s) del sistema MIMO linealizado es: H(s) = 1/sr1 0 . . . 0
(r )
0 1/sr2 . . . 0
.. .
0 0 . . .
(4.36)
1/srm
lo cual signica que yi i = d ri yi /dt ri = vi , i = i, . . . , m, donde cada entrada vi se dise na para ubicar los polos del correspondiente subsistema lineal equivalente. Tal subsistema se puede seleccionar como: vi = d r i yi (r ) (r ) (r 1) i +Ki,ri y = yi i = i i +Ki,1 y i i + +Ki,ri 1 y i r i dt i = 1, . . . , m (4.37)
esima trayectoria deseada y, y i (t) = i (t) yi (t) es la i- esima se nal donde i (t) es la i- de error de seguimiento. La i- esima ecuaci on caracter stica del subsistema resulta: y i
(r i )
+ Ki,1 y i
(ri 1)
i + Ki,ri y + + Ki,ri 1 y i = 0
i = 1, . . . , m
(4.38)
Para comportamiento asint otico estable, es decir, cuando y i 0 o cuando yi i para t , ninguna de las ra ces de (4.38) debe de estar localizada en el semiplano derecho del plano-s, incluyendo el eje imaginario. Ejemplo 4.3
112
Determinar la ley de control MIMO desacoplada para el proceso MRE. Soluci on: Conforme a (4.34), la nueva entrada v = [v1 v2 ]T para el sistema MRE es:
3 =x 5 = q 1 = v1 z 3 = z1 = y1 3 z 6 = z2 = y2 =x 6 = q 2 = v2 (3) (3) (3) (3)
(4.39)
Usando (4.37), las entradas v1 y v2 toman la forma: 12 + K12 1 + K11 1 K13 y 12 K2 y 1 K11 y1 v1 = 1 + K13 v2 = 2 + K23 2 + K22 2 + K21 2 K23 y 2 K22 y 2 K21 y2
(3) (3)
(4.40)
donde 1 y 2 son las trayectorias deseadas. Empleando (4.39), y (4.40) en (1.139) y (1.140), la ley de control desacoplada del MRE viene a ser: u1 = v1 LT1 (H11 + J1 ) + P1 u2 = v2 LT2 (H22 + J2 ) + P2 (4.41)
4.4.
Observadores No Lineales con Polos Prescritos
El dise no de controladores por ubicaci on de polos para sistemas lineales [13], [14] asume que todos los estados del sistema est an disponibles en la realimentaci on. En este caso, es posible forzar para que el sistema posea polos predeterminados a lazo cerrado, es decir, polos prescritos (o eigenvalores) en localizaciones deseadas. En la pr actica, s olo parte de los estados son disponibles para procesamiento, y adem as, no debemos de dejarnos tentar en la diferenciaci on de variables de estado con el n de generar una nueva. Es bien conocido que la simple diferenciaci on de una se nal pude hacer decrecer por varias veces la relaci on se nal a ruido. Los observadores de estado para sistemas lineales estiman estados no medibles sin un sistema de diferenciaci on. El dise no de un observador de estado lineal es muy similar al dise no de un controlador por ubicaci on de polos. En otras palabras, la expresi on de la matriz de ganancia del observador de estados es la expresi on dual de la matriz de ganancia del controlador de realimentaci on de estados. Vimos en la subsecci on 4.3.3 que linealizaci on exacta nos permite dise nar una ley de control desacoplada (subsecci on 4.3.4) usando eigenvalores prescritos para asegurar la estabilizaci on del sistema descrito por (4.29). Apelando al concepto de dualidad como en el caso lineal discutido l neas arriba, nosotros enfrentaremos el problema de s ntesis de observadores no lineales con eigenvalores prescritos para la estimaci on de estados. estimation.
4.4 Observadores No Lineales con Polos Prescritos
113
4.4.1.
Observador SISO No Lineal con Polos prescritos
Sistemas lineales SISO de la forma dada en (4.17) o (4.25) son observables si su matriz de observabilidad O posee rango completo (see also (2.26)), es decir: rank O = rank C CM . . . =n (4.42)
CMn1 Se puede demostrar f acilmente que la matriz de observabilidad del sistema (4.25) posee rango completo. Para sistemas no lineales con entrada y salida escalares descritos por: x = f (x) + g(x)u y = h(x) (4.43) la matriz de observabilidad generalizada se puede formular como; h(x) h(x) L h ( x ) L f f h(x) z = ( x ) = O(x) . . . . x . . n1 n1 Lf h(x) Lf h(x) (4.44)
donde O es de orden nn, z = (x) es la transformaci on de estados descrita en (4.22). Es f acil de vericar que la ecuaci on (4.42)) se convierte en (4.44)) para f (x) = Ax and h(x) = Cx. la descripci on en el espacio de estado del sistema en el dominio-z est a dado por la ecuaci on (4.22)mientras que la ecuaci on (4.25) describe su correspondiente representaci on can onica invariante en el tiempo. Empleando (4.22) y la transformaci on z = (x), podemos formular: x = O(x)(f (x) + g(x)u) = Mz + Nv x n1 1 h(1 (z))u v = Ln f h( (z)) + Lg Lf z = y = Cz (4.45)
El observador no lineal para el sistema descrito por las ecuaciones 4.22) y (4.25) posee la forma: = M z z + Nv + P(y C z) y = C z (4.46)
donde zyy son los estimados de z y y , respectivamente, y P de orden n 1 es la matriz de ganancia del observador. Notar que (4.46) se convierte en un observador lineal cuando v es una entrada lineal. z and x = x , y usando el hecho Asumamos la existencia de O1 (x). Para z = de que y = C z = h(x ), entonces la ecuaci on (4.45) toma la forma: O(x )(f (x ) + g(x )u) = M z + Nv C z = h(x ) (4.47)
114
Substituyendo (4.47) en (4.46) nos conduce al siguiente observador no lineal en el dominio de x . = f (x )P(y h(x )) (4.48) x ) + g(x )u + O1 (x Sea e = z z el error de estimaci on. Substrayendo (4.25) de (4.47) y usando el hecho de que y = Cz, es f acil de vericar que: e = (M PC)e (4.49)
La matriz de ganancia P requiere ser seleccionada de modo tal que los eigenvalores de la ecuaci on caracter stica del observador no lineal: det [sI M + PC] = 0 haga el error de estimaci on e = 0 con suciente rapidez. Tal matriz de ganancia P se puede computar de [13]: P = (M)O1 [0 0 0 1]T (4.50)
(M) = Mn + 1 Mn1 + + n1 M + n I donde los par ametros i , . . . , n se pueden determinar de: (s 1 ) . . . (s n ) = sn + 1 sn1 + + n1 s + n donde 1 , . . . , n son los polos a lazo cerrado del observador no lineal.
4.4.2.
Observadores MIMO No Lineales con Polos Prescritos
Considere que el sistema MIMO no lineal cuadrado descrito por (4.29) posee un grado relativo total r = r1 + + rm . Para linealizaci on exacta, la transformaci on de estados dada en (4.31) nos conduce a la descripci on en el espacio de estado dada por (4.32). Por consiguiente, la correspondiente matriz de obsevabilidad generalizada se puede formular como: O(x) (x) x z = (x) (4.51)
por consiguiente (ver ecuaci on (4.45)): x = O(x)(f (x) + g(x)u) = Mz + Nv x n1 1 h(1 (z))u v = [v1 . . . vm ]T v = Ln f h( (z)) + Lg Lf z = y = Cz El observador MIMO toma la forma: = M z z + Nv + P(y C z) y = C z (4.53) donde zyy son los estimados de z y y, respectivamente, y P de orden n m es la matriz de ganancia del observador. La ecuaci on no lineal del observador en el dominio de x est a dado por: = f (x )P(y h(x )) x ) + G(x )u + O1 (x (4.54) (4.52)
4.4 Observadores No Lineales con Polos Prescritos Sea e = z z el error de estimaci on. Sustraendo (4.52) de (4.53), obtenemos: e = (M PC)e
115
(4.55)
Como en el caso SISO, la matriz de ganancia P requiere ser seleccionado de modo tal que los eigenvalores de la ecuaci on caracter stica del observador no lineal: eigenvalues of the characteristic equation of the nonlinear observer det [sI M + PC] = 0 0 con suciente rapidez. Tal matriz de ganancia P haga el error de estimaci on e = se puede computar de OOOOOOJJJJJOOOOO: det [sI M + PC] = (s 1 ) . . . (s n ) = 0 (4.56)
donde 1 , . . . , n son los polos deseados a lazo cerrado del observador no lineal. Ejemplo 4.4 El observador MIMO no lineal MIMO para el MRE Determinar el observador MIMO no lineal para el proceso MRE. Soluci on: La matriz de observabilidad (4.51)): h1 () Lf h1 (x) 2 L h ( x ) 1 f O(x) = = x h2 (x) x Lf h2 (x) L2 f h2 (x) La inversa de (4.57) is: 1 O (x) = 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 generalizada del MRE posee la forma (ver
x1 x3 x5 x2 x4 x6
1 0 0 0 0 0
0 0 0 1 0 0
0 1 0 0 0 0
0 0 0 0 1 0
0 0 1 0 0 0
0 0 0 0 0 1
(4.57)
Luego, el observador no lineal dado por (4.54) toma la forma: = f (x )P(y y ) x ) + G(x )u + O1 (x 1 x 2 x 3 x 4 x 5 x 6 x = ) f1 (x ) f2 (x f3 (x ) f4 (x ) f5 (x ) f6 (x ) + 0 0 0 0 0 0 0 0 x) 0 G51 ( 0 G62 ( x) u1 u2 (4.58)
116 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0
Linealizaci on por Realimentaci on de Estados 0 0 0 1 0 0 0 0 0 0 0 1 P11 P21 P31 P41 P51 P61 P12 P22 P32 P42 P52 P62 1 x1 x x2 x 2
Las funciones fi , i = 1, . . . , 6, G51 y G62 fueron denidas en (1.146). Ejemplo 4.5 Dise nar y simular el sistema de control del proceso MRE empleando linealizaci on de la realimentaci on. Soluci on: La gura 4.1 ilustra el diagrama de bloques usado para la simulaci on del sistema de control de trayectoria no lineal MIMO para el MRE. Dicha simulaci on emplea los resultados obtenidos en los ejemplos 4.1 a 4.4. Los polos del sistema a lazo cerrado controlado se ubican en 2,2 0,85 and 6500. Las trayectorias deseadas seleccionadas son: 1 = sin(0,75kT ) y 2 = cos(0,75kT ). Los valores de los par ametros se dan en la tabla 1.6. En adici on, considere una masa de la mu neca de la mano del manipulador de 0.2 kg y una masa de la pinza de of 0.4 kg. La pinza puede llevar consigo una carga de 0.2 kg of mass. Las condiciones iniciales para la base es de o rad, mientras que para el brazo (el eslab on) es de /2 rad. Las gures 4.1 y 4.2 muestran los resultados de la simulaci on obtenidos con el programa srm4.m. El tiempo de estabilizaci on y la fuerza de control m axima en la salida y1 del sistema son 2 s y 2.2 V, mientras que para la segunda salida y2 son 4 s y 26 V. Una segunda simulaci on sin considerar la carga revela que se obtienen aproximadamente los mismos resultados..
Linear controller v = v ( , z) u = u( ^ x, v) u x=fx+Gu Nonlinear process Pole-placement loop

^ z ^ ^ z = (x) ^ x
Nonlinear observer Linearization loop
Transformation
Figura 4.1: Diagrama de bloques del sistema de control no lineal por realimentaci on de estados. donde a(z) y b(z) est an dadas en (4.23). IN PROGRESS
4.4 Observadores No Lineales con Polos Prescritos

1.5 BASE POSITION (rad) 1 0.5 0 0.5 1 1.5 0 1 2 3 4 5 TIME 6 (s) 7 8 9 10
117
CONTROL VOLTAGE u1 (vol)
2.5 2 1.5 1 0.5 0 0.5 1 0 1 2 3 4 5 TIME 6 (s) 7 8 9 10
Figura 4.2: Trayectoria controlada y1 y la correspondiente fuerza de control u1 .

2 LINK POSITION (rad) 1.5 1 0.5 0 0.5 1 1.5 0 1 2 3 4 5 TIME 6 (s) 7 8 9 10
CONTROL VOLTAGE u1 (vol)
30
20
10
10
5 TIME
6 (s)
10
Figura 4.3: Trayectoria controlada y2 y la correspondiente fuerza de control u2 ..
PROBLEMAS
IN PROGRESS
Cap tulo 5
Control Deslizante
Esate cap tulo se ocupa del control de sistemas no lineales usando la metodolog1a del denominado control por modos deslizante, o simplemente control deslizante. Para el control deslizante, la descripci on din amica del sistema puede ser imprecisa; esto es, el modelo din amico del sistema puede presentar incertidumbre param etrica en su estructura o din amica no modelada en su representaci on. Dado que la descripci on del proceso permite incertidumbres, el control deslizante puede ser considerado una aproximaci on particular del control robusto. La metodolog a del control deslizante incluye una ley de control no lineal de realimentaci on que conmuta discontinuamente sobre una supercie que pertenece al espacio de estad del sistema, de forma tal que si una trayectoria de estado que se origina en su supercie (como respuesta al comportamiento natural del sistema din amico a lazo abierto), tarta de desviarse de dicha supercie, entonces se aplica una fuerza de control co el n hacer retornar el estado de nuevo a su sistema. Por consiguiente, trayectorias de estado naturales del sistema controlado est an restringidos a deslizarse a lo largo de su supercie. Cualquier trayectoria de estado en la supercie dada debe de satisfacer la relaci on algebraica que describe dicha supercie. Por otro lado, es posible introducir una ecuaci on algebraica deseada en el espacio de estado del sistema a lazo abierto que sea capaz de connar la din amica del sistema en una determinada supercie. La relaci on introducida debe de ser independiente de ciertos disturbios, incertidumbre en los par ametros y din amica no modelada. De hecho, el control deslizante es un tipo particular de Control con Estructura Variable (CEV) [8], [9]. Tal tipo de control emplea en su dise no dos o m as leyes de control de realimentaci on y una regla de decisi on: la funci on de conmutaci on. En el control deslizante, el CEV se dise na para conducir y entonces connar el comportamiento el comportamiento del sistema de control dentro de una vecindad de la funci on de conmutaci on. La primera parte de este cap tulo sigue la metodolog a presentada en [3],donde un problema de control de n- esimo orden (esto es,, un problema donde el sistema se describe mediante ecuaciones diferenciales de orden n) se sustituye por un problema de control equivalente pero de primer orden. Luego, el problema de control transformado se resuelve para lograr estabilidad y rendimiento consistente en la presencia de incertidumbre param etrica y din amica no modelada, sin embargo, pagando el precio
120
Control Deslizante
de una gran actividad de la ley de control que a la larga le es perjudicial. Modicaciones apropiadas en la ley de control pueden lograr que la ley de control tenga moderada actividad. to moderate control activity. En la mayor parte del libro, espec camente en las aplicaciones del control deslizante para sistemas multivariables, se emplea el modelo de Lagrange del sistema a controlar. Tal t ecnica de modelado fue desarrollada en la secci on . Cabe anotar que el modelo de Lagrange de un sistema tambi en se puede determinar empleando las leyes de la f sica.
5.1.
5.1.1.
Control Deslizante para Sistemas de una Entrada

Conceptos B asicos y Notaci on
Considere el sistema din amico de una entrada y lineal en u: x(n) = dxn = f (x) + b(x)u dtn (5.1)
donde el escalar x es ;la salida de inter es del sistema, el escalar u es la entrada de control, x = [x x x(2) . . . x(n1) ] es el vector de estado, y las funciones f (x) y g (x) no son exactamente conocidas pero son acotadas por funciones conocidas dependientes de x. En adici on, b(x) es de signo conocido. Dada una trayectoria de (2) (n1) estado variante con el tiempo xd = [xd x d xd . . . xd ], con: xd (0) = x(0) (5.2)
el problema de control a resolver es dise nar un control nito u que fuerce al estado x seguir a la trayectoria deseada xd a pesar de la presencia de incertidumbres en los par ametros y din amica no modelada. Denamos el error de seguimiento x y el vector de error de seguimiento x como: x = x xd x x = x xd = [ x x (2) . . . x (n1) ]T (5.3)
Adem as, consideremos la supercie S (t) variante con el tiempo en el espacio de estado Rn denido mediante la ecuaci on escalar s(x, t) = 0, tal que: s(x, t) = ( d (n1) + )n1 x = (p + )n1 x = x(n1) xr dt (5.4)
donde es una constante positiva cuya selecci on se discutir a luego, p es el operador (n1) es una funci on que puede ser computada de x y xd . Por ejemplo, de L:aplace y xr para un sistema de orden n = 3, s toma la forma: + 2 x s = (p + )2 x = (p2 + 2p + 2 ) x=x + 2x = x +x r 2 x x r = x d 2x (5.5)
Notar que s resulta la suma ponderada del error de aceleraci on x , del error de veloci y el error de posici dad x on x .
5.1 Control Deslizante para Sistemas de una Entrada
121
La relaci on (5.4) establece que un problema de control de trayectoria de orden n se puede reemplazar por problema de estabilizaci on de primer orden, es decir, por el problema de mantener el escalar s en cero. Tal problema de estabilizaci on se puede resolver seleccionando la ley de control u de (5.1) de forma que fuera de la supercie S (t): 1d 2 s =s s |s| (5.6) 2 dt donde es una constante positiva. Como se ilustra en la gura 5.1(a) para el caso n = 2, todas las trayectorias de estado que satisfacen la condici on (5.6), la condici on de deslizamiento, hacen de la supercie S (t) un conjunto invariante en el sentido de Lyapunov, implicando que las trayectorias del sistema fuera de S (t) apuntar an tal supercie, y las trayectorias del sistema en S (t) permanecer an en ella. Tambi en se puede establecer que din amica no modelada, incertidumbre param etrica o ciertos disturbios, ser an tolerados por un sistema que satisfaga la condici on dada en (5.6). S (t) es conocida como la supercie de deslizamiento porque satisface la condici on de deslizamiento. El comportamiento del sistema sobre una supercie de deslizamiento se denominad modo de deslizamiento.
S(t)
(a) dx dt s=0
.
0 (b) dx dt s=0
xd x
.
0 (c)
xd x
Figura 5.1: (a) La supercie de deslizamiento S (t). (b) Convergencia exponencial. (c) Fen omeno del chattering.
Consideremos el caso de aquellos sistemas que satisfacen la condici on (5.6), pero no la condici on (5.2), esto es, xd (0) = x(0). Para tales sistemas, la supercie de deslizamiento s(t) = 0 ser a golpeada por alguna trayectoria del sistema en un tiempo thit , el cual se puede computar como sigue. Asumiendo ques(t = 0) > 0 e integrando
122 (5.6) entre t = 0 y t = thit :

thit s(t=thit )
Control Deslizante
s dt =
0 s(t=0)
ds
thit
dt
0
(5.7)
nos conduce a thit s(t = 0)/ . Se puede obtener el mismo resultado si se arranca con s(t = 0) < 0. Por consiguiente: th |s(t = 0)|/ (5.8)
La gure 5.1(b) ilustra el caso de una trayectoria de estado que evoluciona con una condici on inicial arbitraria, y luego golpea a la supercie s(t) = 0 en un tiempo nito thit |s(t = 0)|/ . En el modo de deslizamiento, tal trayectoria se desliza.a lo largo de S (t) con el objeto de alcanzar exponencialmente a xd con una constante de tiempo igual a 1/. Por cierto, la expresi on de (5.4) para n = 2: s = (p + ) x x = 1/ s (1/)p + 1
posee una constante de tiempo igual a 1/. La implementaci on de sistemas de control deslizantes requiere de una ley de control realimentado , la cual se puede obtener de (5.4) y (5.1) de modo tal que s2 en la ecuaci on (5.6) se comporte muy parecido a una funci on de Lyapunov con e n de garantizar estabilidad asint otica del sistema a lazo cerrado. En modo deslizante para el caso ideal, por ejemplo, cuando el modelo del sistema (5.1) representa exactamente al sistema actual, la ley de control dise nada forzar a a todas las trayectorias de estado a deslizarse a lo largo de s = 0 tal como se observa en la gura 5.1(b). Sin embargo, debido a la presencia de imprecisiones en el modelado (incertidumbres en los par ametros y din amica no modelada) y de disturbios, la ley de control forzar a a todas las trayectorias de estado a deslizarse discontinuamente a lo largo de s = 0 tal como se muestra en la gura 5.1(c), es decir, la ley de control en modo deslizante necesita ser discontinua a trav es de S (t), produciendo as el fen omeno conocido como chattering. Desde que el chattering implica unamuy elevada actividad de control, entonces, por consideraciones pr acticas, la fuerza de control u necesita ser suavizada adecuadamente, a pesar de la p erdida de precisi on en el seguimiento y en el ancho de banda. Ejemplo 5.1 Para el sistema x = u denamos la supercie s(t) = x(t). Consideremos una ley de control de la forma: u=x = sgn(x) = u+ = 1 if s(t) > 0 u = +1 if s(t) < 0
donde sgn(.) es la funci on signo denida como: sgn(x) = +1 sgn(x) = 1 if x > 0 if x < 0
123
La gura 5.2 muestra las trayectorias del sistema x(t) = t y x(t) = t originadas por la ley de control u+ y u respectivamente. La supercie s(t) = x(t) = 0 es una supercie de deslizamiento porque satisface la condici on (5.6) para 1. Tal supercie ser a golpeada por alguna trayectoria de estado del sistema en estudio en un tiempo (5.7).
x
s=0
Figura 5.2: La supercie de deslizamiento s(t) = 0, por ejemplo 5.1.
5.1.2.
Control deslizante para Sistemas de la Forma x(n) =

dxn = dtn
fi + u
Considere el sistema de orden n: x(n) = fi + u

i
(5.9)
donde el escalar x es la salida de inter es del sistema, el escalar u es la entrada de (2) ( n ) control, x = [x x x . . . x ] es le vector de estados, y fi es una funci on no on (o incerconocida exactamente, pero si estimada como fi . El error de estimaci tidumbre) correspondiente a fi se dene como fi = |fi fi | y se asume que es acotado por alguna funci on conocida Fi = Fi (x) como sigue: fi = |fi fi | Fi (5.10)
Con el n de lograr perfecto seguimiento, es decir, x(t) = xd (t), necesitamos denir una nueva supercie de deslizamiento s = 0 de conformidad con (5.4), como sigue:
(n1) s = (p + )(n1) x = x(n1) xr
(5.11)
Entonces:
n) s = x(n) x( r = i
n) fi + u x( r
(5.12)
Sea u la mejor aproximaci on de una ley de control continua para alcanzar s = 0. Por consiguiente: n) (5.13) fi + x( u= r
i
La ley de control estimada u es tambi en conocida como la ley de control equivalente Ley de control equivalente. Co la nalidad de satisfacer la condici on de deslizamiento
124
Control Deslizante
(5.6) en la presencia de incertidumbres descrita por (5.10), necesitamos adicionar a u un t ermino discontinuo de la forma k (x)sgn(s) a trav es de s = 0, a saber: u = u k (x)sgn(s) (5.14)
La condici on de deslizamiento (5.6) se verica reemplazando (5.14) en (5.12), luego, usando la expresi on resultante en: 1 d 2 s =s s = 2 dt (fi fi ) k sgn(s) s
i i
|fi fi ||s| k |s|
(5.15)
Finalmente, sustituyendo: k=
i
Fi +
(5.16)
en (5.15) nos conduce a la condici on de deslizamiento. (5.6). Ejemplo 5.2 Considere un sistema descrito por: 2 + a2 (t)x 2 cos 2x + a3 (t)x3 cos 3x = u x + a1 |x|x donde a1 = 2,1, a2 (t) y a3 (t) son desconocidas pero verican que 2,5 < a2 (t) < 5 y 2 < a3 (t) < 4 respectivamente. Por consiguiente, f1 = a1 |x|x 2 f1 = f1 F1 = 0 f2 = a2 (t)x 2 cos 2x 2 cos 2x f2 = 3,75x F2 = 1,25x 2 cos 2x f3 = a3 x3 cos 3x f3 = 3x3 cos 3x F3 = x3 cos 3x
+ x. Por Desde que el orden del sistema es n = 2, entonces: s = (p + )x = x consiguiente: = s =x x d + x fi + u x d + x

i
La ley de control equivalente es: u=

i
d x fi + x
La ley de control posee la forma u = u k sign(s) con k = F2 + F3 + . La gura 5.3 muestra el resultado de la simulaci on obtenido ejecutando el archivo scexa.m con = 10, = 2,4, xd = sin(t/2) y condiciones iniciales x(0) = 0 y x (0) = /2.

2 POSITION x(t) 1 0 1 2 CONTROL INPUT u(t) 20 10 0 10 0.2 0.1 0 0.1 0.2 0 0.5 1 1.5 2 2.5 TIME 3 (s) 3.5 4 4.5 5 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
125
0.5
1.5
2.5
3.5
4.5
Figura 5.3: Resultados de la simulaci on del ejemplo 5.2.
Suavizando La Ley de Control Discontinua u Co el n de eliminar una alta actividad de control por consideraciones pr acticas, el fen omeno chattering debe de evitarse suavizando la discontinuidad de la ley de control, es decir, reemplazando en (5.14) el t ermino sgn(s) por sat(s/) como sigue: u = u k (x)sat(s/) donde la funci on de saturaci on sat(.) se dene como: sat(s/) = s/ if |s/| 1 otherwise (5.18) (5.17)
s(t)TRAJECTORIES
sat(s/) = sign(s/) y la frontera de > 0 verica: |s(t)|
t0
(5.19)
En realidad, la frontera de dene una capa de frontera de atracci on B (t) siempre que la ley de control u satisfaga la condici on de deslizamiento (5.6). En concordancia con lo expuesto, B (t) resulta en un conjunto invariante (tener en cuenta que la supercie de deslizamiento S (t) es tambi en un conjunto invariante), es decir, todas las trayectorias del sistema que se inician en el interior de B (t = 0) permanecen en B (t) para todo t 0. La gura 5.4 ilustra la relaci on entre u y s en B (t). Cuando es variante con el tiempo, y al mismo tiempo B (t) pude permanecer como un conjunto invariante, entonces necesitamos modicar la condici on (5.6) de modo tal que la distancia a la capa de frontera B (t) siempre sea decreciente, a saber: s s d (s ) dt d (s ()) dt
126
Control Deslizante
^ u
B(t)
Figura 5.4: Suavizando la ley de control en el interior de la capa de frontera B (t).
1d 2 )|s| s ( (5.20) 2 dt a la ganancia de control Para vericar (5.20), se requiere adicionar la cantidad discontinua k (x). La ganancia de control modicada k (x) es entonces: |s| (x) = k (x) k consecuentemente, el control (5.17) toma la forma: (x)sat(s/) u=uk (5.22) (5.21)
Therefore
En el interior de la capa de frontera B (t), sat(s/) pasa a ser s/. Sustituyendo (5.22) con sat(s/) = s/ en (5.12) produce: s =
i n) fi + u x( r = k (x)
fi
i
(5.23)
+ xd , entonces (5.23) se puede donde fi = fi fi . Usando el hecho de que: x = x reescribir como: (xd ) s T (fi (xd ), x s = k , xd ) (5.24) , xd ) representa todos los otros t erminos dependientes de x y xd . donde T (f (xd ), x Por otra parte, denamos el ancho de banda (recordar que es la frecuencia de corte del ltro (5.4)) como sigue: = (xd ) k (5.25)
Reemplazando (5.25) en (5.24) se obtiene: s= 1 (T (fi (xd ), x , xd )) p+ (5.26)
Sabemos que la variable s es una medida de la distancia algebraica a la supercie de deslizamiento S (t) y, de acuerdo a (5.26), constituye la salida de un ltro de primer
127
orden lter, cuya din amica (p + ) depende de xd (ver (5.25)), y cuyas entradas son perturbaciones e incertidumbres. Por consiguiente, tal ltro puede librar al sistema del fen omeno chattering. La estructura del error din amico a lazo cerrado cuando = (t) se muestra en la gura 5.5, donde el primer ltro se dise na de acuerdo a (5.26) para eliminar perturbaciones e incertidumbres, de modo tal que el segundo ltro pasa bajo, de acuerdo a la denici on (5.4) pueda proporcionar el error de seguimiento x . De (5.25) podemos deducir que el espesor de la capa de frontera requiere ser sintonizada tal que (5.26) pueda representar un ltro de primer orden con ancho de banda . Ahora,
T(f (x d ), ~ x ,x d )
1 (p + )
1 (p + )
n-1
~ x
Figura 5.5: Estructura del error din amico a lazo cerrado para = (t).
reemplazando (5.25) en (5.21) nos conduce a: + = k (xd ) (5.27)
Claramente, la ecuaci on (5.27) representa la din amica deseada del espesor de la capa de frontera. Dado que la selecci on de afecta el ancho de banda (por cierto, ver la gura 5.5), la ecuaci on (5.25) ser a denominada la condici on de balance. De hecho, requiere ser sintonizado de modo tal que la din amica del ltro de orden n: 1 x = s (p + )n se comporte como un sistema de orden n cr ticamente amortiguado. Ahora, usando (x) se obtiene: (5.27) en (5.21), k (x) = k (x) k (xd ) + k (5.28)
De acuerdo a (5.4), x es una versi on ltrada de s. Sin embargo, la trayectoria s, es decir, s = s(t) representa m as que ello. En realidad, s(t) se puede considerar como un descriptor del comportamiento a lazo cerrado del sistema, en vista de que la actividad de control regulada por la ley de control depende de s (ver (5.22) y (5.14)). (n1) n1 es una funci En adici on, de acuerdo a (5.4), s(t) = x(n1) xr , donde xr on que on din amica se puede computar de x y xd . Por consiguiente, s(t) es una representaci de las suposiciones relacionadas con las imprecisiones del modelo. Ejemplo 5.3 Considere nuevamente el ejemplo 5.2 con un espesor de la capa de frontera (t) variante con el tiempo. Entonces, la ley de control u = u k sign(s) requiere ser + = k (xd ), (x) sat(s/) con k (x) = k (x) k (xd )+ y reemplazada por u = u k en donde: 3 k (xd ) = 1,25x 2 d |cos 2xd | + |xd cos 3xd | +
128
Control Deslizante
La gura 5.6 muestra los resultados de la simulaci on obtenidos ejecutando el archivo scexc.m para = 10, = 2,4, xd = sin(t/2) y las condiciones iniciales x(0) = 0, + = k (xd ) x (0) = /2 y (0) = 0,55. El valor 0.365 se obtuvo usando la relaci on for t = 0.
2 POSITION x(t) 1 0 1 CONTROL INPUT u(t) 20 10 0 10 1 a 0.5 0 b 0.5 c 1 0 0.5 1 1.5 2 2.5 TIME 3 (s) 3.5 4 4.5 5
0.5
1.5
2.5
3.5
4.5
0.5
1.5
2.5
3.5
4.5
Figura 5.6: Resultados de la simulaci on para el ejemplo 5.3. Las trayectorias a, b y c corresponden a (t), s(t) y (t) respectivamente.
Control Integral (q )dq instead of x be the variable of interest in the surface (5.4). Therefore, Let 0 x the process (5.9) turns into a nth -order process with respect to the variable of interest, namely t d (n1) x (q )dq = (p + )n x = x(n1) xr (5.29) s(x, t) = ( + )n dt 0 Since equations (5.29) and (5.11) possess the same form, then relations (5.14) and (n1) in (5.29) contains the variable (5.16) remain unchanged. Note that the term xr of interest. IN PROGRESS
t
5.1.3.
Control Deslizante para Sistemas de la Forma x(n) =

dxn = dtn
s(t)TRAJECTORIES
fi + bu
Considere ahora el sistema de orden n: x(n) = fi + bu

i
(5.30)
donde el escalar x es la salida de inter es del sistema, el escalar u es la entrada de control y la funci on fi no es exactamente conocida, pero si estimada como fi y
129
con incertidumbre dada en (5.10). La ganancia de la ley de control b = b(x, t) es desconocida pero con umbrales (o cotas) conocidos: 0 < bmin b bmax (5.31)
Recordar que |fi fi | es una incertidumbre tipo aditivo. Dado que la ganancia de control b multiplica la entrada de control u, parece entonces razonable denir un estimado de tipo multiplicativo b: b = (bmin bmax )1/2 Es f acil vericar que los l mites (5.31) toman la forma: 1 donde: b b 1 b b (5.33) (5.32)
= (bmax /bmin )1/2
(5.34)
Con el prop osito de conseguir un seguimiento perfecto, es decir que x(t) = xd (t), debemos usar la supercie de deslizamiento s = 0 descrita en (5.4) o (5.11):
(n1) = x(n1) xr s = (p + )(n1) x
Entonces:
n) s = x(n) x( r = i
n) fi + bu x( r
(5.35)
Sea ub el control equivalente que puede lograr que s = 0; por consiguiente: ub = b1 (

i n) 1 fi + x( r )= b u
(5.36)
donde u =
fi + xr
(n)
(ver ecuaci on (5.13)). Con u denida como: u = b1 (u k sgn(s)) (5.37)
el l mite: k
i
Fi +
+ | 1||u|
= b b 1
(5.38)
satisface la condici on de deslizamiento (5.6). Para demostrar este hecho, reemplazar (5.37) en (5.35): s =
i
fi b b1
i
n) 1 fi (1 b b1 )x( r b b k sgn(s)
=
i
(fi fi ) +
i
fi b b1
i 1
n) 1 fi (1 b b1 )x( r b b k sgn(s)
=
i
(fi fi ) (1
)u 1 k sign(s)
(5.39)
Sustituyendo (5.38) en (5.39), entonces multiplicando ambos miembros de la relaci on resultante por s y usando el hecho de que s sign(s) = |s|, se puede f acilmente demostrar que ss |s| (la condici on de deslizamiento).
130 Ejemplo 5.4
Control Deslizante
El modelo din amico del sistema MRAF mostrado en la gura ?? y dado por (??) se puede reformular con x = como: x(3) = donde: a1 = a4 = Beq Ra Beq Ra nKb + a2 = + Jeq nKm La Jeq La nKm La Jeq meq gL Ka b= nKm Jeq La Jeq La a3 = meq gL Jeq
4
fi + bu = a1 x a2 x a3 cos x x a4 sin x + bu
i=1
(5.40)
IN PROGRESS Suavizando la Ley de Control Discontinua u Se sabe del la subsecci on 5.1.2 que el fen omeno de chattering se puede eliminar suavizando la discontinuidad del control como sigue. Reemplazando en (5.37) el t ermino sgn(s) por sat(s/), se obtiene: u = b1 (u k (x)sat(s/)) (5.41)
donde la funci on de saturaci on sat(.) fue denida en (5.18). Con el objeto de vericar (5.20) para el caso = 0 en la ganancia de control, la ganancia de control modicada (x) dada en (5.42) necesita ser reformulada como (ver problema 5.1): k >0 <0 (x) / k (x) k
(5.42)
La condici on de balance (5.25) se puede modicar como: = b(xd ) b(xd )

max
(xd ) k
= d
(xd ) k
(5.43)
con una condici on inicial denida por: (0) = d k (xd (0))/ (5.44)
Sustituyendo (5.43) en (5.42) con x y reemplazado por xd y d respectivamente, a saber: produce el comportamiento deseado de , >0 <0 /d = k (x) d = k (x) d d
(5.45)
5.2 Control Deslizante para Sistemas Multivariables Es f acil vericar que (5.45) se puede reescribir como: (xd ) k d (xd ) k d + = d (xd ) + = d (xd ) 2 d
131
(5.46)
Finalmente, o bien la ecuaci on (5.28) o (5.21) se puede reformular como: (xd ) = k (x) k (xd ) + (x) = (k (x) k (xd )) + k k d Ejemplo 5.5 IN PROGRESS (5.47)
5.1.4.
Rendimiento del Seguimiento vs. Errores de Modelado
Se estipul o que t 0, |s(t)| , donde la frontera de es realmente el espesor de la capa de fontera. Por consiguiente, (5.4) se convierte en la siguiente relaci on acotada: | (5.48) |(p + )n1 x donde es una constante positiva conocida como el ancho de banda. Una aproximaci on razonable para determinar el l mite del error de seguimiento |x | es jar p = 0 en (5.48), lo cual corresponde al comportamiento en estado estable de tal l mite. Por consiguiente: (5.49) |x | n1 = donde es conocido como la precisi on del seguimiento. Empleando (5.49) en la condici on de balance (5.43) implica que: n d k (xd ) bandwidthn tracking precision parametric uncertainty along xd
5.2.
5.2.1.
Control Deslizante para Sistemas Multivariables

El Sistema a Controlar
Esta secci on sigue el procedimiento desarrollado en [25]. La representaci on din amica del sistema no lineal multivariable, el modelo de Lagrange, est a dado por (1.143): M(q)q + P(q, q )q + d(q) = u (5.50) donde q es un m 1 vector de coordenadas generalizadas, M(q) es una matriz de inercia denida positiva de orden m m, P(q, q ) es una matriz de orden m m que representa las fuerzas de Coriolis y centr peta, d(q) es un vector de orden m 1 que representa las fuerzas gravitacionales y u es un vector de orden m 1 de fuerzas generalizadas. El vector de estado correspondiente a (5.50) posee la forma x = [q q ]T . Sean qdi (t) y q di (t) para i = 1, . . . , m las trayectorias deseadas, las
132
Control Deslizante
cuales se suponen ser funciones del tiempo continuamente diferenciables. Los vectores de error se denen como: q(t) = q qdi (t) = q q q di
o lo que es lo mismo empleando sus componentes: qi (t) = qi (t) qdi (t) (t) = q q i (t) q di (t) i
5.2.2.
La Supercie de Conmutaci on
Sea la siguiente supercie de conmutaci on: si (x, t) = si (q, q , t) = o en forma matricial: = s(x, t) = s(q, q , t) = L q+q s1 (q, q q1 s1 (x, t) , t) 0 11 . . . . . .. . . . = = . . . + . . . . . , t) qm sm (x, t) sm (q, q 0 mm (5.52) q 1 . . . q
m ii qi (t)
(t) +q i
i = 1, . . . , m
(5.51)
donde las constantes positivas ii son los elementos de una matriz diagonal L de orden m m. Asumiendo que una fuerza de control dise nada es capaz de connar todas las trayectorias que se originan en la intersecci on de tales supercies y hacerlas permanecer all , entonces en tal situaci on se cumple, de acuerdo a 5.51, que: , t) = 0 = si (q, q
ii qi (t)
(t) +q i
i = 1, . . . , m
i (t) deben converger exponencialmente a Esta u ltima relaci on nos indica que q i (t) y q cero, esto es: q i (t) = qi (t) qdi (t) = 0 i (t) = q q i (t) q di (t) = 0
i (t) = q di (t), con lo cual se logra el objetivo de Por consiguiente: qi (t) = qdi (t) y q control.
5.2.3.
Dise no de la Fuerza de Control Multivariable
El dise no de la fuerza o ley de control requerida para connar las trayectorias del sistema que se originan en la intersecci on de las supercies de deslizamiento y hacerlas permanecer all emplea el m etodo directo de Lyapunov. Omitiendo por simplicidad la dependencia de los argumentos, consideremos la siguiente candidata para funci on de Lyapunov: 1 V = sT Ms 2 Denamos ahora la siguiente ley de control: u = u0 Usgn(s) (5.53)
5.2 Control Deslizante para Sistemas Multivariables
133
+ + u1 u u1 + u u1 sign(s1 ) 0 1 1 . 1 1 . . . . .. . . . . . . . = 2 . . . . 2 + + um um um 0 um um sign(sm ) o en funci on de sus elementos: u0i = 1 + ui + u i 2 Ui = 1 + ui u i 2
La derivada de s (ecuaci on 5.52) produce: +q = Lq + (q s = Lq q d ) Despejando q de (5.50) y reemplazando la expresi on resultante en la ecuaci on anterior se obtiene: s = M1 (u0 U sgn(s) ueq ) donde: + Pq ueq = MLq + d + M qd Por consiguiente: 1 = sT M = sT [u0 Usgn(s) ueq ] + 1 sT Ms V s + sT Ms 2 2 En la referencia [24] se establece que: P= 1 MJ 2 (5.55) (5.54)
donde J es una matriz antisim etrica, es decir: J = JT . Empleando (5.55) en (5.54) nos conduce a: = sT [u0 Usgn(s) + Ps ueq ] + 1 sT Js V 2 T etrica, entonces: Dado que s Js = 0 debido a que J es antisim
m m
= sT [u0 + Ps ueq ] sT Usgn(s) =

j =1 m m
sj [u0 + Ps ueq ]j Ui
j =1
|sj | (5.56)
j =1
|sj [u0 + Ps ueq ]j | Ui

j =1
|sj |
Seleccionando: Ui |[u0 + Ps ueq ]j | +

m
>0
(5.57)
y reemplazando esta u ltima expresi on en (5.56) se obtiene: V

j =1
|sj |
>0
lo que signica que se ha cumplido la condici on de deslizamiento y a la vez se garantiza (t) convergen exponencialmente a cero. Partiendo de la desigualdad (5.57) que q (t) y q se obtienen otras dos: [u0 + Ps ueq ]i Ui [u0 + Ps ueq ]i (Ui ) (5.58)
134 Usando (5.58), es f acil demostrar que:

+ u i + [ueq Ps]i ui
Control Deslizante
(5.59)
+ Por consiguiente, los controles u i y ui se pueden seleccionar para satisfacer (5.59). son los estimados de u y P respectivamente, podemos formular: Si u eq y P
+ u+ i = [ueq Ps]i + u i ui = [ueq Ps]i + u i Reemplazando (5.60) en (5.59) se obtiene:
i = 1, . . . , m
(5.60)
s]i u eq P + u i + [u i u eq = ueq ueq =PP P
(5.61)
lo cual verique (5.59). Si seleccionamos u + i = Ki y u i = Ki , entonces de (5.60) obtenemos: 1 + u Ui = Ki u0i = (u+ i ) = [ueq Ps]i 2 i o lo que es lo mismo, en forma matricial: + u1 + u 1 1 . . u0 = = ueq Ps . 2 + um + um + u1 u 0 K1 0 1 1 . . . . .. .. . . . (5.62) U = = . . . . . . . 2 + 0 um um 0 Km Asumiendo que el t ermino gravitacional se puede expresar como: d = ueq Ps entonces la ley de control dada por (5.53) toma la forma: K1 0 . .. . . u = u0 Usign(s) = d . . . . sgn(s) 0 Km + y la relaci on (5.61) con u i = Ki y u i = Ki se expresa como: Ki [ueq Ps d]i + + Pq Ahora, dado que ueq Ps = MLq + d + Mq d Ps, entonces las ganancias Ki se pueden seleccionar siempre que: + Pq Ki |(M Lq + Mq d P s)i | + en donde M and P son las cotas superiores de M y P respectivamente. (5.65) (5.63)
(5.64)
135
Ejemplo 5.6 Design and Simulation of a Sliding Control for the Process TRM The elements of the matrices M and P given by (1.113) may be upper-bounded as |M11 | m11 |M22 | m22 |P21 | = 0 M 11 M 22 P 21
2
|M12 | m12 |P11 | p11 |P22 | m22 P 22
M 12 P 11
|M21 | m21 1 | |P12 | |p12
M 21 |P 12 |
Using (5.65), the variable Ki is computed from Ki =

j =1
(M ij |q dj
j | jj q
+ P ij |q j sj |) +
where q1 is the car position r and q2 is the angular position 1 of the arm. The switching control force given by (5.64) is found to be u1 u2 = 0 d2 sin 1 K1 sgn(s1 ) K2 sgn(s2 )
in which d2 was found in (1.113). The simulation of the sliding control system was performed for the following initial conditions: r(0) = 0 m, 1 (0) = /2 rad. The desired trajectories are set to: rd (t) = 1 m and d1 (t) = 4 cos(2t) rad. The parameter takes on the value of 0.1 while the gripper carries out a payload of 0.2 kg of mass. Figure 5.7 depicts the simulation results. Such results can be obtained executing the m-le trmsc.m. Ejemplo 5.7 Design and Simulation of a Sliding Control for the Process SRM The elements of matrices M and P given by (1.143) can be upper-bounded as follows 12 |M12 | = 0 M |M11 | RT 1 (Jeq1 + 2I1 + H22 ) M 11 21 |M21 | = 0 M |M22 | RT 2 (Jeq2 + H22 ) M 22 |P11 | |RT 1 (Beq1 H22 q 2 ) + NT 1 | P 11 |P12 | |RT 1 H22 q 1 | |p21 | |RT 2 H22 q 1 | P21 |P22 | RT 2 Beq2 + NT 2 P 22 Using (5.65), the variable Ki can be computed from
2
P 12
Ki =
j =1
(M ij |q dj
jj q j |
+ P ij |q j sj |) +
The switching control force given by (5.53) (see also (1.143))is found to be u1 u2 = 0 RT 2 m2 g Lx2 cos q2 ) K1 sat(s1 /) K2 sat(s2 /phi)
where = 0.5. The simulation of the sliding control system was performed for the following initial conditions: q1 (0) = q2 (0) = 0,1 rad. The desired trajectories are: qd1 (t) = 0.1745 rad and qd2 (t) = (0,1745/2)t2 rad. The parameter takes on the value of 0.2 while the gripper carries out a payload of 0.2 kg of mass. Figure 5.8 shows the simulation results. Such results can be obtained executing the m-le srmsc.m.
136
1.5 1 0.5 0 5 5 0 5 10 4 2 0 2 4 5 SURFACE s2 0 5 10 0 2
Control Deslizante
CONTROL VOLTAGE u1
5 5
10
CONTROL VOLTAGE u2
4 6 Entradas
10
LINK POSITION (rad)
CART POSITION (M)
10
10
SURFACE s1
0 5 10
4 6 TIME (seconds)
10
4 6 TIME (seconds)
10
Figura 5.7: Simulation results corresponding to the example 5.6.
PROBLEMS
Problema 5.1 Verify relations ... IN PROGRESS
137
POSITION q1 (rad)
POSITION q2 (rad) 0 1 2 3 4
1.5 1 0.5 0
0.18 0.16 0.14 0.12 0.1 0.04 0 1 2 3 4
0.02 Control u1 (V) 0 0.02 0.04 0.06 0.3 SURFACE s1 0.2 0.1 0 0.1 0 1 TIME 2 3 (seconds) 4 SURFACE s2 0 1 2 3 4 Control u2 (V)
0.03 0.02 0.01 0 0.05 0 0 1 2 3 4
0.05 0.1 0.15 0 1 TIME 2 3 (seconds) 4
Figura 5.8: Simulation results corresponding to the example 5.7.
Bibliograf a
[1] H. Goldstain, Mec anica Cl asica, segunda edici on. Editorial Revert e, S.A., 1996, ISBN: 84-291-4306-8 [2] , Din amica de Lagrange. McGraw-Hill de M exico, S.A., 1972 [3] Jean-Jacques E. Slotine and Weiping Li, Applied Nonlinear Control, Prentice Hall, Englewood Clis, New Jersey 07632, 1991. [4] K. S. Fu, R. C. Gonz ales, and C. S. G. Lee, Din amica del Brazo del Robot, Rob otica, Control,Detecci on, Visi on e Inteligencia, McGrawHill/Interamericana, Madrid, 1988. [5] R. P. Paul, Dynamics, Robot Manipulators, Mathematics, Programming and Control, The MIT Press, Massachussets, 1982. [6] J. J. Craig, Manipulator Dynamics, Introduction to Robotics, Addisson Wesley, 2nd edition, 1989. [7] Mohsen Shahinpoor, A Robot Engineering Textbook, Harper & Row, Publishers, New York, Cambridge, Philadelphia, and others, 1987. [8] V. I. Utkin, Variable structure systems with sliding modes, IEEE Trans. Automat. Contr., vol. 22, pp. 2-22, Feb. 1993. [9] J. Y. Hung, W. Gao, and A. Homaifa, Variable structure control: a survey, IEEE Trans. Ind. Electron., vol. 42, pp. 212-222, Feb. 1986. [10] M. Vidyasagar, Nonlinear Systems Analysis (Second Edition), Prentice Hall, Englewood Clis, New Jersey 07632, 1993. [11] Alberto Isidori, Nonlinear Control Systems (Second Edition), Springer-Verlag Berlin Heidelberg New York London Paris Tokyo Hong Kong, 1989. [12] M. G. Sofonov, Stability and Robustness of Multivariable Feedback Systems, The MIT Press Cambridge, MA, and London, England, 1980. [13] Katsuhiko Ogata, Designing Linear Control Systems with MATLAB, Prentice Hall, Englewood Clis, New Jersey 07632, 1944. [14] Bernard Friedland, Control System Design. An Introduction to State-Space Methods, McGraw-Hill, Inc., New York St. Louis y otras, 1986.
140
BIBLIOGRAF IA
[15] A. M. Lyapunov, Probl eme g eneral de la stabilit e du mouvement. Reprinted in Annals of Mathematics Study No. 17 (Princeton Univ. Press, Princeton, New Jersey) of the 1907 French translation of the fundamental Russian paper by Lyapunov, published in 1892. 1980. [16] Joseph La Salle and Solomon Lefschetz, Stability by Liapunovs Direct Method With Applications, Academic Press new York, London, 1961. [17] I. Gustavsson, Comparison of dierent methods for identication of linear models for industrial processes, in Preprints IFAC Symp. on Identif., 1970, paper 11.4. [18] G. N. Saridis, Comparison of ve popular identication algorithms, Automatica, vol. 10, no. 1, pp. 6979, Jan. 1974. [19] B. D. O. Anderson, Exponential stability of linear systems arising from adaptive identication, IEEE Trans. on Auto. Contr., 22-2 (1977). [20] A. P. Morgan and K. S. Narendra, On the uniform asymptotic stability of certain linear nonautonomous dierential equations, S.I.A.M. of Control and Optimization, 15 (1977). [21] Olle I. Elgerd, Control Systems Theory, McGraw-Hill Kogakusha, Ltd., Tokyo, Auckland, Dusseldorf, and others, 1967. [22] A. Barrientos, L. F. Pe nin, C. Balaguer, and R. Aracil, Fundamentos de Rob otica, McGraw-Hill/Interamericana de Espa na, S. A., Madrid, Buenos aires, Caracas, and others, 1997. [23] A. F. Filippov, Dierential Eequations with discontinuous right-hand sides, Mathematicheskii Sbornik, 51.1 (1960), in Russian. Trnaslated in English, Aw. Math. Soc. Trans., 62, 199 (1964). Addisson Wesley, 2nd edition, 1989. [24] D. E. Koditschek, Proc. 23rd I.E.E.E. Conf. on Decision and Control, Las Vegas, p. 733, 1984. [25] E. Bailey and A. Arapostathis, Simple sliding mode control scheme applied to robot manipulators, Int. J. Control, 1987, vol. 45, No. 4, p. 11971209. [26] Lab-PC+ User Manual, National Instruments Corporation, Part Number 320502B-01, August 1994. [27] Eduardo F. Camacho y Carlos Bordons, Model Predictive Control, SpringerVerlag London Limited 1999. [28] D.M. Prett and M. Morari, Shell Process Control Workshop,Butterworths, 1987. [29] T. Alvarez, M. Sanzo, and C. Prada, Identication and Constrained Multivariable Predictive Control of Chemical Reactors,4th IEEE Conference on Control Applications, Albany, pages 21:577-582, 1977.
BIBLIOGRAF IA
141
[30] Manfred Morari y Evanghelos Zariou, Robust Process Control. PTR Prentice Hall, Englewood Clis, New Jersey 07632, 1989. [31] William H. Press, Brian P. Flannery y Saul A. Teukolosky, Numerical Recipes in C, Cambridge University Press, Cambridge, 1988. [32] MathWorks, Inc., MATLAB Reference Guide, Prentice Hall, Englewood Clis, New Jersey, primera edici on, 1998. [33] MathWorks, Inc., SIMULINK Users Guide, Prentice Hall, Englewood Clis, New Jersey, primera edici on, 1996. [34] R. De Keyser, A Gentle Introduction to Model Based Predictive Control. In PADI2 International Conference on Control Engineering and Signal Processing, Piura, Per u, 1998. [35] A. Rojas-Moreno, Design of Self-tuning Controllers for Processes Having Multiple Unknown Time-varying Delays, Ph.D. Thesis, Utah State University, Logan, UT, 1995.
Indice alfab etico

Autonomous system, 68 Balance condition, 112, 115 CGEKF: Constant-Gain Extended Kalman Filter, 61 Chattering, 108 Complete (global) stability, 73 Composite adaptation for MIMO processes, 84 Control law the MIMO decoupling , 96 the SISO linearizing, 92 Controllability condition, 57, 90 generalized condition, 90 matrix, 57, 90 Coordenadas generalizadas, 1 Covariance matrices, 61 Dieomorphism, 88 Dierential geometry, 87 Ecuaciones de Lagrange, 1, 2 del proceso MRT, 12, 15 El modelo de Lagrange, 9 Equilibrium state, 68 Equivalent control, 109, 117 Equivalent linear system, 92, 97 characteristic equation, 92, 97 Exact linearization of MIMO processes, 94 of SISO processes, 91 Feedback linearization, 87 of MIMO processes, 93 of SISO processes, 90 partial, 102 Frobenius Theorem, 89 Frobenius-Perron theorem, 119 Funci on lagrangiana, 2 Instability theorem, 73, 74 Invariant set, 107 Invariant set theorems, 75 Involutive vector elds, 89 Kalman lter gain, 61 LagrangeEuler procedure, 5 Lie brackets, 88 Lie derivatives, 87 LQG: Linear quadratic gaussian problem, 55 Lyapunov equation, 60, 62 Lyapunov function, 78 Lyapunovs rst method, 68 second or direct method, 68 stability theorems, 72 Lyapunov,s functions, 69 M etodo de LagrangeEuler, 2 Manipulador rob otico traslacional subactuado, 27 Manipulador rob otico con articulaci on el astica, 7 Manipulador rob otico esf erico, 18 Manipulador rob otico esf erico subactuado (MRTS)., 28 Manipulador Rob otico Translacional, 12 Matriz de inercia del eslab on, 6, 21 Matriz de transformaci on homog enea, 18 Matriz de transformaci on homog enea de DenavitHartenberg, 4 Matriz sim etrica inercial de aceleraci on, 6, 22
INDICE ALFABETICO MIMO normal form, 94 Modelo de Lagrange, 7, 23 del MRTS, 28 del proceso MRT, 17 Modelo de LagrangeEuler, 7, 23 Modelo en el espacio de estado del MRAE, 10 del MRE, 25, 26 Modelo LE, 7 Modelo LE del MRE, 18 MRACS: Model-reference adaptive control system conguration, 67 the adaptation mechanism, 68 the controller, 68 the reference model, 67 Nonautonomous system, 68 Nonlinear observer characteristic equation of the, 99, 100 Nonlinear observer:with prescribed poles, 98, 99 NSO: Nonlinear State Observer, 60 Observability condition, 61 matrix, 61 Observability matrix, 98 generalized, 98, 99 Par ametros DH (DenavitHartenberg), 3 Par ametros de DenavitHartenberg, 18 Parametric uncertainties, 68, 105 PISFC: Proportional-Integral State-Feedback Controller, 59 Positive/negative denite functions, 70 Procedimiento de DenavitHartenberg, 2 PSFC: Proportional State-Feedback Controller, 57 Quadratic cost function, 57 augmented, 59 Relative degree, 90, 102 total, 93, 96 undened, 91 Riccati equation, 58, 59, 61
143
SFC: State-Feedback Controller, 57 SISO normal form, 91 for relative degree r < n, 102 Sistema de coordenadas DH (Denavit Hartenberg), 3 Sliding condition, 107, 111, 118 control, 105 mode, 107, 117 surface, 107, 109, 114, 117, 118 surface vector, 80 Smoothness, 87 Stability in autonomous systems, 72 in nonautonomous systems, 73 in the sense of Lyapunov, 69 Stability margins and nondivergency for the NSO, 62 and Robustness for LQSFC, 60 by state-feedback, 59 State-feedback gain matrix, 58, 59 Surface equation, 114 Tracking error, 77, 106 Unmodeled dynamics, 68, 105 Variable structure, 117 Variable Structure Control, 105 Vector Coriolis y fuerza centr fuga, 7 Vector fuerza de Coriolis y centr peta, 22 Vector fuerza de gravedad, 7, 23

A. Rojas M - 2

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

A. Rojas M - 2

Uploaded by

Copyright:

Available Formats

CONTROL NO LINEAL MULTIVARIABLE

APLICACIONES EN TIEMPO REAL

ARTURO ROJAS-MORENO, Ph.D.

CONTROL NO LINEAL MULTIVARIABLE

A la Memoria de mis Padres

Arturo Rojas Moreno, Ph.D. ctlima@viabcp.com

Modelado de Sistemas No Lineales

Modelado Empleando las Leyes de la F sica

Manipulador Rob otico de 1GDL

Modelado de Sistemas No Lineales

Figura 1.1: Manipulador rob otico de 1GDL.

1.1 Modelado Empleando las Leyes de la F sica

rad rad rad/s rad/s N-m/rad

Modelado de Sistemas No Lineales

1.1 Modelado Empleando las Leyes de la F sica

Figura 1.2: El brazo rob otico.

Modelado de Sistemas No Lineales

Manipulador Rob otico con Articulaci on El astica (MRAE)

Modelado de Sistemas No Lineales

y(t) NO LINEAL [rad]

Figura 1.4: Manipulador Rob otico con Articulaci on El astica (MRAE).

1.1 Modelado Empleando las Leyes de la F sica

Modelado de Sistemas No Lineales

1.1 Modelado Empleando las Leyes de la F sica

Sistema P endulo InvertidoGr ua Puente

Sistema P endulo Invertido

Modelado de Sistemas No Lineales

1.8338106 =0 0 0.06377 0.776 0.02 0.0648 0.063095 0.92 0.2 0.767

31.0352103 9.81 N2 > N 1 19.741

rad rad rad/s rad/s

1.1 Modelado Empleando las Leyes de la F sica

Figura 1.5: Sistema p endulo invertido.

Figura 1.6: Subsistema carrop endulo. ze = z + le sen zv = z + lv sen 2 (1.35)

Sustituyendo ze y zv (ecuaci on (1.35) en (1.37)) resulta: mc lv d2 d2 d2 z + m ( z + l sen ) + m (z + sen ) = F e e v 2 2 2 dt dt dt 2 (1.38)

14 Desarrollando las derivadas se obtiene: (mc + me + mv ) z (me le + mv

Modelado de Sistemas No Lineales

lv 2 (me le + mv lv )(cos ) = F )(sen ) + 2 2

lv lv )g (sen ) (me le + mv ) z (cos ) = (Je + Jv ) 2 2

1.1 Modelado Empleando las Leyes de la F sica

En la relaci on (1.2) se estableci o para los engranajes de reducci on de un servomotor: n= N2 m = N1 m = n n>1

Figura 1.7: Subsistema motor-polea.

16 Igualando (1.39) con (1.52) resulta:

Modelado de Sistemas No Lineales

Modelado de Sistemas No Lineales

F Carro y puente Grua

Figura 1.8: Sistema gr uapuente.

111 000 000 111 000 111 000 m v g 111

Figura 1.9: Subsistema carro-varilla de sistema gr uapuente. donde: M1 = mc + me + mv ; Jeq ; 2 rp M2 = me le + mv nKm ; Ra rp lv ; 2 J1 = Je + Jv

Sistema Tanque de Agua

Considerando un ujo laminar de salida: qo = h Rh (1.64)

on: donde la resistencia hidr aulica Rh se calcula de la relaci Rh = H Q (1.65)

Modelado de Sistemas No Lineales

Valor 0.0265 0.055 0.12

Unid. m m2 m m m m3 /h m3 /s m3 /h m3 /s m3 /s m3 /s s/m2 m/s2 kg/m3 m m2 m2

1.1 Modelado Empleando las Leyes de la F sica

Figura 1.10: Proceso tanque de agua.

Modelado de Sistemas No Lineales

1 o a i Qi 1 i o 1 o = a + + + S H SCp Rt H SCp Rt H A h SCp H

de modo tal que (1.76) y (1.82) toman la forma: 1 = a X S X1 + 1 X1 = f1 S (1.84) (1.85)

X2 1 a i U1 1 U2 X2 1 2 = a + + + = f2 X S X1 SCp Rt X1 SCp Rt X1 S X1 SCp X1

= 0 = = a 1 a i 1 3/2 2 2 2 X2 X1 + X2 X1 X 2 U1 X 1 U2 X 1 2S SCp Rt SCp Rt 1 S SCp a X2 1 a i U 1 1 U2 X2 1 + 2S SCp Rt X 2 SCp Rt X 2 S X 2 SCp X 2 3 1 1 1 1 X1 a S 1 X1 1 1 SCp Rt X 1

Luego el proceso tanque de agua linealizado queda como: x = Ax + Bu donde: A=

Modelado de Sistemas No Lineales