You are on page 1of 12

Extremos Condicionados

Beatriz Porras
1 Introduccion
A lo largo de la historia se han buscado leyes que describan los fenomenos del
mundo fsico. El primer cientco que formulo un principio general para el com-
portamiento del universo fue Pierre Louis Moreau de Maupertuis, seg un el cual, y
dicho brevemente, las leyes fsicas son consecuencia de un principio de economa
de medios: los fenomenos de la naturaleza siempre se producen de manera que se
minimice alguna cantidad. Por ejemplo, los sistemas fsicos tienden a un punto
de equilibrio de mnima energa; la forma esferica de las pompas de jabon esta
relacionado con el echo de que la esfera es la supercie de area mnima que
encierra un volumen dado.
As, muchos problemas fsicos se describen en terminos equivalentes a encon-
trar el maximo o el mnimo de alguna funcion, y los problemas de maximos y
mnimos son uno de los objetivos de las matematicas.
Ya hemos estudiado algunas tecnicas para la determinacion de maximos y
mnimos. En este captulo vamos a intentar completar el estudio. Hasta ahora
sabemos que si una funcion escalar diferenciable f tiene un maximo o un mnimo
en un punto interior de su dominio, x
0
, este punto debe ser un punto crtico:
debe ser f(x
0
) =

0; y ademas en este caso, con un poco de suerte, podemos
aplicar el teorema de clasicacion de puntos crticos para saber si es de verdad
maximo o mnimo relativo, seg un el signo de la derivada segunda de f en x
0
.
A un as no sabemos si es o no un extremo absoluto de f. Y tambien sabemos que
una funcion continua en un conjunto compacto alcanza el maximo y el mnimo
absolutos, pero no sabemos en que puntos.
Hay muchos problemas en los que la funcion a maximizar o minimizar no
esta denida en un conjunto abierto, o el objetivo x
0
no es un punto interior al
dominio: consideremos el ejemplo de las pompas de jabon, pero con una gura
un poco mas sencilla para operar.
Tratamos de encontrar las dimensiones del paraleleppedo de menor area, que
encierre un volumen dado V.
1
AVAVAR
x
y
z
Si las dimensiones del paraleleppedo son x, y, z (profundidad, anchura y al-
tura), el area total sera A(x, y, z) = 2xy + 2zx + 2yz, pero para que encierre
un volumen V tiene que ser V (x, y, z) = xyz = V . As que tenemos que
encontrar el mnimo de la funcion A(x, y, z) denida en el conjunto de puntos
N = {(x, y, z) : xyz = V }, que no es un conjunto abierto en R
3
Este tipo de problemas se denominan problemas de extremos condiciona-
dos, o problemas de extremos con restricciones. Las tecnicas para estudiar este
tipo de problemas tienen en cuenta condiciones sobre el tipo de conjuntos donde
estan denidas las funciones (restricciones), y el tipo de funcion.
2 Funciones Regulares
Denicion (Funcion regular).
Sea U un abierto de R
p
, y G : U R
m
. Se dice que G es regular en U si es
de clase C
1
en U, y ademas para todo x U dG(x) tiene rango maximo.
Si p > m, G sera regular si es de clase C
1
y rg(dG(x)) = m para todo x. Y
si p = m, es regular si det(dG(x)) = 0 para todo x.
Por ejemplo, si G(x, y) = x
2
+y
2
1, G sera regular en el conjunto de puntos
U donde el rango de la diferencial de G sea uno.
dG(x, y) = (2x, 2y)
el rango de G es cero si x = 0 e y = 0. En otro caso, el rango es uno. Entonces
G es regular en el conjunto U = R
2
\ {(0, 0)}
Generalizando el concepto de los conjuntos de nivel de una funcion escalar
que vimos en el primer captulo, podemos denir conjuntos de nivel de funciones
vectoriales
Denicion (Conjuntos de Nivel).
Sea U un abierto de R
p
, y F : R
p
R
m
, donde m < p. Se llaman conjuntos
2
AVAVAR
de nivel de F a los conjuntos de puntos de U donde F toma un mismo valor:
dado z R
m
, el conjunto de nivel z de F es
N
z
= {x U : F(x) = z} = F
1
(z) U
Es decir, N
z
es el conjunto de soluciones, en U, del sistema de ecuaciones
f
1
(x
1
, . . . , x
p
) = z
1
.
.
.
.
.
.
f
m
(x
1
, . . . , x
p
) = z
m
_

_
siendo F = (f
1
, . . . , f
m
) y z = (z
1
, . . . , z
m
)
Los conjuntos de nivel de las funciones regulares de R
p
en R
m
(m < n) forman
parte de una clase mas amplia de conjuntos, llamados variedades diferenciales de
dimension n = p m en R
p
. La condicion de que F sea regular hace que estos
conjuntos de nivel tengan un aspecto geometrico singular, como vamos a ver.
Consideremos primero el caso del conjunto de nivel cero, N
0
, de una funcion
regular F denida en un abierto U de R
p
y con valores en R
m
, donde p > m.
N
0
= {x U : F(x) = 0} = F
1
(0) U
Sea x
0
N
0
. Como F es regular, rg(dF(x
0
)) = m, y por tanto en la matriz
de la diferencial de F en x
0
hay un menor de dimension m distinto de cero. Por
comodidad, vamos a suponer que es el formado con las ultimas m columnas.
Podemos aplicar a F el Teorema de la Funcion Implcita entorno a x
0
.
Escribimos R
p
= R
n
R
m
, los puntos de R
p
como pares (x, y), el punto
x
0
= (a, b), y tenemos F : U R
m
una funcion de clase C
1
en U, con
F(a, b) = 0,
dF(a, b) =
_
_
_
df
1
dx
1
. . .
df
1
dx
n
df
1
dy
1
. . .
df
1
dy
m
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
df
m
dx
1
. . .
df
m
dx
n
df
m
dy
1
. . .
df
m
dy
m
_
_
_
(a,b)
y J
Y
F(a, b) = 0
Aplicando el Teorema de la Funcion Implcita, existe un abierto V entorno de
x
0
= (a, b), V U, en el que el conjunto de soluciones del sistema F
1
(0)V es
la graca de una funcion de clase C
1
, y = y(x
1
, . . . , x
n
) denida en un entorno
A de a en R
n
, con y(a) = b
Es decir, para cada punto del conjunto N
0
, hay un entorno en el que el
conjunto N
0
es la graca de una funcion de R
n
en R
m
Para otros conjuntos de nivel N
z
0
la situacion es similar, sustituyendo la
funcion F por la funcion F z
0
.
3
AVAVAR
Ejemplo 1. Conjuntos de nivel de funciones regulares en el plano y en el espacio
Si n = 1, N
0
es una curva, variedad diferencial de dimension 1; si n = 2, N
0
es una supercie, variedad diferencial de dimension 2.
F(x, y) = x
2
+ y
2
1
N
0
es la circunferencia de centro (0, 0) y radio 1.
F(x, y, z) = x
2
+ y
2
+ z
2
1
N
0
es la esfera de centro (0, 0, 0) y radio 1
G(x, y, z) = (x + y + z, x 1)
N
0
es una recta

Siguiendo con las propiedades de los conjuntos de nivel, hemos dicho que
existe un entorno V de (a, b) en R
n
R
m
de modo que la parte del conjunto de
nivel N
0
que esta en V es la graca de una funcion
V N
0
= {(x, y) V : F(x, y) = 0} = {(x, y(x)), x A}
Eso signica que la funcion H(x) = F(x, y(x)) es identicamente nula en A
H(x) = F(x, y(x)) = 0 para todo x A
lo que a su vez implica que todas las derivadas parciales de todas las componentes
de H son cero en todos los puntos de A.
Cada componente h
j
de H es de la forma
h
j
(x
1
, . . . , x
n
) = f
j
(x
1
, . . . , x
n
, y
1
(x
1
, . . . , x
n
), . . . , y
m
(x
1
, . . . , x
n
))
Calculando esas derivadas parciales,
0 =
dh
j
dx
i
(x) =
df
j
dx
i
(x, y(x)) +
df
j
dy
1
(x, y(x))
dy
1
dx
i
(x) + +
df
j
dy
m
(x, y(x))
dy
m
dx
i
(x)
Esta expresion se puede escribir en forma de un producto escalar
0 =< f
j
(x, y(x)), (e
i
,
dy
dx
i
(x)) >
4
AVAVAR
donde
dy
dx
i
(x) = (
dy
1
dx
i
(x), . . . ,
dy
m
dx
i
(x)), y e
i
= (0, . . . , 1
(i)
, . . . , 0) es el i-esimo
vector de la base canonica de R
n
.
En consecuencia, en particular para x = a, y(a) = b, tenemos que el vector
f
j
(a, b) es ortogonal a todos los vectores de la forma (e
i
,
dy
dx
i
(a))
El espacio vectorial T generado por esta familia de vectores, {(e
i
,
dy
dx
i
(a)); 1
i n} tiene dimension n en R
p
= R
n+m
, y se denomina espacio vectorial tan-
gente a N
0
en (a, b)
Por otro lado, la condicion de que F sea regular, asegura que la familia
de vectores que forman la matriz de dF(a, b), {f
j
(a, b); 1 j m}, es
linealmente independiente y por tanto genera un espacio vectorial L de dimension
m, que hemos visto que es espacio ortogonal a T en R
n+m
. L se denomina
espacio vectorial normal a N
0
en (a, b)
Utilizando los conocimientos de algebra lineal, podemos decir que el espacio
normal a N
0
en (a, b) es la imagen de la aplicacion transpuesta de la diferencial
de F en (a, b) y el espacio tangente es el n ucleo de dF(a, b).
Denicion (Espacio tangente y espacio normal).
Sea U un conjunto abierto en R
p
, y F : R
p
R
m
una funcion regular en U
(m < p). Sea N
0
el conjunto de nivel cero de F, N
0
= {x U : F(x) = 0}, y
x
0
N
0
. Se llama espacio vectorial normal a N
0
en x
0
al espacio L imagen de
la aplicacion transpuesta de dF(x
0
), y se llama espacio tangente a N
0
en x
0
al
espacio T ortogonal a L, que es el n ucleo de la aplicacion dF(x
0
)
L =
_

_
x = (dF(x
0
))
t
=
_
_
_
df
1
dx
1
(x
0
) . . .
df
m
dx
1
(x
0
)
.
.
.
.
.
.
.
.
.
df
1
dx
p
(x
0
) . . .
df
m
dx
p
(x
0
)
_
_
_
_
_
_

1
.
.
.

m
_
_
_
_

_
R
n+m
T =
_

_
x R
n+m
:
_
_
_
df
1
dx
1
(x
0
) . . .
df
1
dx
p
(x
0
)
.
.
.
.
.
.
.
.
.
df
m
dx
1
(x
0
) . . .
df
m
dx
p
(x
0
)
_
_
_
_
_
_
x
1
.
.
.
x
p
_
_
_
=
_
_
_
0
.
.
.
0
_
_
_
_

_
Se llaman espacio afn normal a N
0
en x
0
y espacio afn tangente a N
0
en x
0
a los espacios anes paralelos a L y T respectivamente que pasan por x
0
Ejemplo 2. Espacios Tangentes y Normales
1) Sea G(x, y) = x
2
+ y
2
1, y (a, b) un punto de la circunferencia N
0
;
dG(a, b) = (2a, 2b)
5
AVAVAR
El espacio tangente a N
0
en (a, b) es el conjunto de los puntos (x, y) R
2
que verican
2ax + 2by = 0
y el espacio tangente afn en (a, b) es la recta
2ax + 2by = 2a
2
+ 2b
2
= 2
o equivalentemente
ax + by = 1
que corta a los ejes de coordenadas en los puntos (1/a, 0) y (0, 1/b)
(a, b) 1/b
1/a
a
x
+
b
y
=
1
2) Sea f(x) una funcion derivable con derivada continua en un intervalo
(, ), y sea G(x, y) = y f(x) G es de clase C
1
en (, ) R y
dG(x, y) = (f

(x), 1)
tiene siempre rango uno, luego G es regular.
Ademas N
0
= {(x, y : G(x, y) = 0} = {(x, y) : y = f(x)} es la graca de
f. La ecuacion de la recta vectorial tangente a N
0
en un punto (x
0
, f(x
0
) sera
{(x, y) : < G(x
0
, f(x
0
)), (x, y) >= 0} = {(x, y) : f

(x
0
)x + y = 0}
y la recta tangente afn a N
0
que pasa por (x
0
, f(x
0
) sera
{(x, y) : f

(x
0
)x + y = f

(x
0
)x
0
+ f(x
0
)} =
= {(x, y) : y f(x
0
) = f

(x
0
)(x x
0
)}
que coincide con la ecuacion de la recta tangente a una graca que ya conocemos.
6
AVAVAR
3 Teorema de los Multiplicadores de Lagrange
Sea ahora U un abierto de R
p
, y F : U R
m
(m < p) una funcion regular.
Consideramos el conjunto de nivel 0 de F en U, N = {(x U : F(x) = 0}. N
es el conjunto de soluciones del sistema de ecuaciones
f
1
(x
1
, . . . , x
p
) = 0
.
.
.
f
m
(x
1
, . . . , x
p
) = 0
_

_
Y sea f : U R una funcion escalar. Se trata de encontrar los pun-
tos extremos, maximos o mnimos, de f sobre N, es decir, los extremos de
f(x
1
, . . . , x
p
) con la condicion de que x = (x
1
, . . . , x
p
) N, o dicho de otra
forma, los extremos de f|
N
: N R
El teorema de los Multiplicadores de Lagrange da una condicion necesaria para
que un punto de N pueda ser un extremo relativo de f|
N
, similar a la condicion
de punto crtico de los extremos de una funcion en un conjunto abierto.
Vamos a ver dos demostraciones del teorema, una basada en la propiedad
de los conjuntos de nivel de las funciones regulares que hemos visto antes, de
ser localmente la graca de una funcion, y otra directa. Ambas demostraciones
utilizan basicamente el teorema de la Funcion Implcita.
Observemos que f|
N
tendra un maximo relativo en un punto x
0
N si existe
una bola B(x
0
, r) U en R
n
tal que f(x) f(x
0
) para todo x B(x
0
, r) N;
y tendra un mnimo relativo si es f(x) f(x
0
) para todo x B(x
0
, r) N. El
extremo sera estricto si las desigualdades son estrictas.
7
AVAVAR
Teorema (Teorema de los Multiplicadores de Lagrange).
Sea U un abierto de R
p
, f : U R diferenciable, y
F : U R
m
regular (m < p). Sea N el conjunto de
nivel 0 de F, N = {x U : F(x) = 0}, y x
0
N.
Si f|
N
tiene un extremo relativo en x
0
, entonces existen
n umeros
1
, . . . ,
m
tales que
f(x
0
) =
m

i=1

i
f
i
(x
0
)
donde F = (f
1
, . . . , f
m
). Los n umeros
1
, . . . ,
m
se de-
nominan multiplicadores de Lagrange.
Demostracion: (Saltar al nal de la demostracion)
Supongamos que f|
N
tiene en x
0
un maximo relativo. La demostracion sera
analoga si fuera un mnimo. Entonces existe una bola B(x
0
, r) U tal que para
todo x B(x
0
, r) N se tiene f(x) f(x
0
). Podemos suponer que f esta
denida en esa bola abierta (U = B(x
0
, r)).
Puesto que F es regular, en la matriz de dF(x
0
) hay un menor de orden m
distinto de cero. Vamos a suponer que es el menor formado por las ultimas m
columnas, y vamos a escribir R
p
= R
n
R
m
, donde n = p m, los vectores de
R
p
como pares (x, y), x
0
= (a, b), y f y F como f(x, y) y F(x, y).
Aplicando a F el Teorema de la Funcion Implcita, existira un abierto V
contenido en U, con (a, b) V , en el que la ecuacion F(x, y) = 0 permite
despejar y = y(x) como funcion implcita de clase C
1
en un abierto A R
n
,
de modo que el conjunto de puntos de V que son soluciones de la ecuacion
F(x, y) = 0 es la graca de la funcion y(x) en R
n+m
. Es decir
V N = {(x, y(x)); x A}
Como f(x
0
) = f(a, b) f(x, y) para todo (x, y) B(x
0
, r) N, tambien
f(a, b) f(x, y) para todo (x, y) V N B(x
0
, r) N; luego f(a, b)
f(x, y(x)) para todo x A
Ahora, la funcion h(x) = f(x, y(x)) es una funcion diferenciable en un con-
junto abierto A de R
n
, que tiene un maximo en el punto x = a, y por tanto
tiene diferencial cero en ese punto.
8
AVAVAR
Calculando las derivadas parciales de h, tenemos:
dh
dx
i
(x) =
df
dx
i
(x, y(x)) +
df
dy
1
(x, y(x))
dy
1
dx
(x) + +
df
dy
m
(x, y(x))
dy
m
dx
i
(x)
o lo que es lo mismo,
dh
dx
i
/(x) =< f(x, y(x)), (e
i
,
dy
dx
i
(x)) >
donde
dy
dx
i
(x) = (
dy
1
dx
(x), . . . ,
dy
m
dx
i
(x)) y e
i
es el i-esimo vector de la base canonica
de R
n
.
En particular, si x = a, las derivadas de h se anulan, luego el vector f(a, b)
es ortogonal a todos los vectores (e
i
,
dy
dx
i
(a)), que como hemos estudiado antes
generan el espacio vectorial T tangente a N
0
en x
0
= (a, b). Por tanto el vector
f(a, b) esta en el espacio normal a N
0
en (a, b), L, generado por los vectores
f
j
(a, b), 1 j m, y se tiene el resultado: existen n umeros
1
, . . . ,
m
tales
que
f(x
0
) =
1
f
1
(x
0
) + +
m
f
m
(x
0
)
2
a
Demostracion: (Ver Analisis Matematico T.M. Apostol)
Se trata de demostrar que en las condiciones del enunciado, el sistema de
ecuaciones
df
dx
1
(x
0
) =
1
df
1
dx
1
(x
0
) + +
m
df
m
dx
1
(x
0
)
.
.
.
.
.
.
df
dx
p
(x
0
) =
1
df
1
dx
p
(x
0
) + +
m
df
m
dx
p
(x
0
)
_

_
en las variables
1
, . . . ,
m
tiene solucion.
La hipotesis de que F es regular, nos asegura que rang(dF(x
0
)) = m, as
que vamos a suponer, por comodidad, que las m ultimas columnas determinan
en la matriz de dF(x
0
) un menor distinto de cero.
Escribimos a partir de ahora, R
p
= R
n
R
m
, donde n = p m, x = (x, y),
y x
0
= (a, b), y f(x) = f(x, y), F(x) = F(x, y), donde x = (x
1
, . . . , x
n
) e
y = (y
1
, . . . , y
m
). La condicion de regularidad implica que J
Y
F(a, b) = 0
El sistema de ecuaciones queda entonces de la forma
df
dx
1
(a, b) =
1
df
1
dx
1
(a, b) + +
m
df
m
dx
1
(a, b)
.
.
.
.
.
.
df
dx
n
(a, b) =
1
df
1
dx
n
(a, b) + +
m
df
m
dx
n
(a, b)
df
dy
1
(a, b) =
1
df
1
dy
1
(a, b) + +
m
df
m
dy
1
(a, b)
.
.
.
.
.
.
df
dy
m
(a, b) =
1
df
1
dy
m
(a, b) + +
m
df
m
dy
m
(a, b)
_

_
= S
9
AVAVAR
Si observamos las ultimas m las del sistema de ecuaciones, tenemos un
sistema lineal de m ecuaciones y m incognitas, cuya matriz de coecientes es la
transpuesta de d
Y
F(a, b), que hemos supuesto que tiene determinante distinto
de cero. As pues, tiene solucion. Por tanto tenemos una familia de n umeros

1
, . . .
m
que verican las ultimas m ecuaciones. Hay que demostrar que para
esos valores se verican tambien las n primeras ecuaciones.
Vamos a suponer tambien que f|
N
tiene un maximo relativo en x
0
. Si fuese un
mnimo, la demostracion sera analoga. Entonces existe una bola B(x
0
, r) U
tal que f(x) f(x
0
) para todo x B(x
0
, r) N. Consideraremos las funciones
f y F en esta bola.
La condicion x
0
= (a, b) N signica que F(a, b) = 0, ademas F es de clase
C
1
, y J
Y
F(a, b) = 0. Todo esto nos permite utilizar el Teorema de la Funcion
Implcita: existe un abierto V B(x
0
, r) que contiene a (a, b), un entorno A
de a en R
n
, y una unica funcion y = y(x) denida en A, de clase C
1
, tal que
y(a) = b y V N = {(x, y) V : F(x, y) = 0} = {(x, y(x)), x A}. Es
decir, en un entorno V de (a, b), N es la graca de la funcion y(x).
El teorema implica en particular que F(x, y(x)) = 0 para todo x A.
Y tambien que para todo x A, como (x, y(x)) V N B(x
0
, r) N,
se tiene f(x, y(x)) f(a, b) = f(a, y(a))
Denimos las funciones H(x) = F(x, y(x)) para x A, H : A R
m
H(x
1
, . . . , x
n
) = F(x
1
, . . . , x
n
, y
1
(x
1
, . . . , x
n
), . . . y
m
(x
1
, . . . , x
n
))
y h(x) = f(x, y(x)) para x A, h : A R,
h(x
1
, . . . , x
n
) = f(x
1
, . . . , x
n
, y
1
(x
1
, . . . , x
n
), . . . y
m
(x
1
, . . . , x
n
))
Tenemos que H(x) = 0 para todo x A, y que h(x) tiene un maximo
relativo en a A
De la primera condicion,
h
i
(x
1
, . . . , x
n
) = f
i
(x
1
, . . . , x
n
, y
1
((x
1
, . . . , x
n
), . . . y
m
(x
1
, . . . , x
n
)) = 0
para todo i = 1, . . . , m, y para todo x A, se deduce que todas las derivadas
parciales de h
i
son cero en todo A, luego al calcular las derivadas parciales de
cada h
i
10
AVAVAR
(I)
dh
i
dx
j
(x) =
=
df
i
dx
j
(x, y(x)) +
df
i
dy
1
(x, y(x))
dy
1
dx
j
(x) + +
df
i
dy
m
(x, y(x))
dy
m
dx
j
(x) =
=
df
i
dx
j
(x, y(x)) +
m

k=1
df
i
dy
k
(x, y(x))
dy
k
dx
j
(x) = 0
para todo x A, y en particular en x = a, y(a) = b, para todo i = 1, . . . , m y
todo j = 1, . . . , n
Y de la segunda condicion, h tiene que tener un punto crtico en a luego
dh(a) = 0, es decir, todas las derivadas parciales de h se anulan en a:
(II)
dh
dx
j
(a) =
df
dx
j
(a, b) +
m

k=1
df
dy
k
(a, b)
dy
k
dx
j
(a) = 0
para todo j = 1, . . . , n
Para j jo, multiplicamos cada ecuacion de (I) por
i
, sumamos, y se lo
restamos a (II),
df
dx
j
(a) +
m

k=1
df
dy
k
(a, b)
dy
k
dx
j
(a)

i=1
_

i
df
i
dx
j
(x, y(x)) +
m

k=1

i
df
i
dy
k
(x, y(x))
dy
k
dx
j
(x)
_
= 0
m

k=1
_
df
dy
k
(a, b)
m

i=1

i
df
i
dy
k
(a, b)
_
dy
k
dx
j
(a) +
df
dx
j
(a, b)
m

i=1

i
df
i
dx
j
(a, b) = 0
Aqu,
_
df
dy
k
(a, b)
m

i=1

i
df
i
dy
k
(a, b)
_
= 0
para todo k = 1, . . . , m por la denicion de
1
, . . . ,
m
(es la segunda parte del
sistema de ecuaciones S), luego el primer sumando se anula, y queda solo
11
AVAVAR
df
dx
j
(a, b) =
m

i=1

i
df
i
dx
j
(a, b)
para todo j = 1, . . . , n, que es la primera parte del sistema de ecuaciones S, lo
que termina la demostracion.
(Volver al enunciado)

12

You might also like