You are on page 1of 258

Clculo II

Notas de Clase
Lorena Zogaib
Enero 12, 2015

Contenido
Contenido

Prlogo

1 El Espacio Rn

1.1 Vectores

1.2 Curvas paramtricas. Vector tangente a una curva paramtrica

29

1.3 Rectas en el espacio. Segmento de recta

37

1.4 Planos e hiperplanos

43

1.5 Conjuntos abiertos, cerrados, acotados, compactos, convexos

53

2 Funciones de varias variables

69

2.1 Dominio e imagen. Representacin geomtrica

69

2.2 Conjuntos de nivel

72

2.3 Superficies cuadrticas

75

2.4 Lmites y continuidad

83

3 Diferenciacin

91

3.1 Derivadas parciales. Interpretacin geomtrica

91

3.2 Diferenciabilidad. Linealizacin y diferenciales

98

3.3 Regla de la cadena

103

3.4 Diferenciacin implcita

107

3.5 Derivada direccional y vector gradiente. Recta normal y plano


tangente

112

3.6 Funciones homogneas. Teorema de Euler

122

4 Funciones cncavas y cuasicncavas

131

4.1 Polinomio de Taylor de orden 2. Matriz hessiana

131

4.2 Funciones cncavas y funciones convexas

137

4.3 Funciones cuasicncavas y funciones cuasiconvexas

143

5 Optimizacin

154

5.1 Optimizacin libre. Criterio del Hessiano


5.1.1 Condiciones necesarias de primer orden
5.1.2 Condiciones suficientes de segundo orden
5.2 Optimizacin con restricciones de igualdad. Multiplicadores de
Lagrange
5.2.1 Condiciones necesarias de primer orden. Significado del
multiplicador de Lagrange
5.2.2 Condiciones suficientes de segundo orden
5.2.3 El caso multidimensional
5.2.4 Cualificacin de las restricciones: cundo falla el mtodo
de los multiplicadores de Lagrange?
5.3 Optimizacin con restricciones de desigualdad. Condiciones de
Kuhn-Tucker
5.3.1 Problemas de maximizacin
5.3.2 Problemas de minimizacin
5.3.3 Cualificacin de las restricciones: cundo fallan las
condiciones de Kuhn-Tucker?

154
156
159
165
166
173
175
178
182
183
204
210

5.4 Teorema de la envolvente


5.4.1 Optimizacin libre
5.4.2 Optimizacin restringida

212
213
225

6 Temas selectos de clculo avanzado

231

6.1 Funciones de Rn en Rm

231

6.2 Regla de la cadena en el caso general

238

6.3 Teorema general de la funcin implcita

239

6.4 Teorema del punto fijo

244

A Cnicas

247

B Teoremas de concavidad para funciones en Rn

251

Bibliografa

258

Prlogo
Este documento constituye un material de apoyo para el curso de Clculo II para
las carreras de Economa y Direccin Financiera en el ITAM. Se trata de una
recopilacin de mis notas de clase, con el fin de agilizar la discusin de los temas
en el aula. El material se presenta en estricto apego al orden del temario vigente,
aunque es discutido bajo un enfoque personal y en un lenguaje un tanto coloquial.
Estas notas no pretenden sustituir la lectura de la bibliografa seleccionada para
el curso. Estn basadas en el material extrado precisamente de esos textos, as
como de documentos y libros escritos por mis colegas y amigos del Departamento
de Matemticas del ITAM. En particular, tom prestados varios conceptos y
ejemplos del Documento de Trabajo Matemticas IV, elaborado por Guillermo
Pastor. Para algunos temas de optimizacin, me bas en el libro Mtodos Dinmicos
en Economa: Otra Bsqueda del Tiempo Perdido, de Hctor Lomel y Beatriz
Rumbos. Muy especialmente, quiero expresar mi gratitud y gran admiracin por
Knut Sydsaeter, de la Universidad de Oslo, quien fue el autor de una coleccin
maravillosa de textos de matemticas para economistas. De l aprend mucho,
aunque nunca tuve el privilegio de conocerlo. Estuve a punto de hacerlo, en
un taller de matemticas que l iba a impartir en Mxico. Desafortunadamente,
Sydsaeter falleci en un accidente en octubre de 2012, faltando una semana para su
visita a este pas.
Se espera que el estudiante resuelva una gran variedad de ejercicios, que no han
sido incluidos en este documento debido a su extensin. Al respecto, el estudiante
puede utilizar el Documento de Trabajo Clculo II, Cuaderno de Ejercicios,
Lorena Zogaib, Departamento de Matemticas, ITAM, enero 12 de 2015.
Agradezco todas las sugerencias y correcciones que he recibido de mis colegas
y varias generaciones de estudiantes. Me han enriquecido mucho los comentarios
de mis amigos Carmen Lpez y Ramn Espinosa. Igualmente importantes han sido
las observaciones de las varias generaciones de alumnos que han consultado estas
notas. Especialmente, estoy muy agradecida con Francisco Contreras Marroqun,
quien estudi Ciencia Poltica en el ITAM, por sus valiosas aportaciones en
relacin con el captulo de Optimizacin.
De antemano ofrezco una disculpa al lector por los errores y omisiones que
encuentre en este texto. Siempre sern bienvenidas las correcciones y cualquier
comentario que me hagan llegar.
Lorena Zogaib
4

Captulo 1
El Espacio Rn
1.1 Vectores
Considera los precios p1 , p2 , . . . , pn de n bienes. Conviene representar este
conjunto de precios por

p1
p2

(p1 , p2 , . . . , pn ) o bien
...

pn
Un conjunto ordenado de nmeros como ste, que se caracteriza no slo por
los elementos que lo constituyen sino por el orden en que estn colocados, se
llama un vector o n-vector. Nota que un vector con una sola componente es
un simple nmero real, tambin denominado un escalar. La representacin
del lado izquierdo se conoce como vector rengln, mientras que la del lado
derecho es un vector columna. Por lo general utilizaremos la representacin
de vector rengln a lo largo de este texto, con excepcin de algunos temas de
los captulos 3 y 6.
Hay varias maneras cortas de designar el vector de precios (p1 , p2 , . . . , pn ),
por ejemplo,

p = (p1 , p2 , . . . , pn ), p = (p1 , p2 , . . . , pn ), p = (p1 , p2 , . . . , pn ), . . .

La primera de stas,
p , utiliza una flechita encima del nombre del vector,

y esto est relacionado con su significado geomtrico, como discutiremos


un poco ms adelante en esta seccin. Aqu adoptaremos precisamente esa
notacin para designar cualquier n-vector arbitrario (a1 , a2 , . . . , an ), es decir,

a = (a , a , . . . , a ),
a Rn .
1

Los nmeros a1 , a2 , . . . , an se llaman las componentes escalares del vector

a , y decimos que ai es la i-sima componente de


a . La notacin
a Rn

indica que cada una de las n componentes del vector


a es un escalar en el
campo de los reales, R.
5

Captulo 1 El Espacio Rn
Operaciones con vectores

a y b son iguales o equivalentes si todas sus


Definicin. Dos vectores
componentes son iguales. En ese caso, escribimos

a = b.
Si el nmero de componentes, su valor numrico o su distribucin son diferentes,

a = b.
decimos que
Ejemplo:

Sean
x = (x, y, z) y
a = (1, 0, 3). Se tiene entonces que
x =
a si y slo
si x = 1, y = 0 y z = 3.

Definicin. Sean
a = (a1 , a2 , . . . , an ), b = (b1 , b2 , . . . , bn ) Rn y R.

a) El producto del escalar con el vector


a es el vector
a Rn , dado por

a = (a1 , a2 , . . . , an )
= (a1 , a2 , . . . , an ).

b) La suma de los vectores


a y b es el vector
a + b Rn , dado por

a + b = (a1 , a2 , . . . , an ) + (b1 , b2 , . . . , bn )
= (a1 + b1 , a2 + b2 , . . . , an + bn ).

Ejemplo:

Sean
a = (3, 2, 5) y b = (3, 0, 3). As,

2
a = 2(3, 2, 5) = (6, 4, 10),

a + b = (3, 2, 5) + (3, 0, 3) = (0, 2, 8).

Definicin. Sean
a = (a1 , a2 , . . . , an ), b = (b1 , b2 , . . . , bn ) Rn . La resta o

a con b es el vector
a b Rn , dado por
diferencia de

a b =
a + (1) b
= (a1 b1 , a2 b2 , . . . , an bn ).
6

1.1 Vectores
Ejemplo:

a = (3, 2, 5) y b = (3, 0, 3). As,


Sean

a b = (3, 2, 5) (3, 0, 3) = (6, 2, 2).

a Rn la diferencia
a
a es el vector nulo o vector
Definicin. Para cada

cero 0 , dado por

0 = (0, 0, . . . , 0).
Nota que

a b = 0
a = b.

Definicin. Si
a 2, . . . ,
a m Rn y 1 , 2 , . . . , m R, entonces el
a 1,
n-vector

1
a 1 + 2
a 2 + + m
am

se conoce como una combinacin lineal de los vectores


a 1,
a 2, . . . ,
a m.
Ejemplo:

Sean
a = (3, 2, 5) y b = (3, 0, 3). As,

3
a 5 b = 3(3, 2, 5) 5(3, 0, 3) = (9, 6, 15) + (15, 0, 15) = (24, 6, 0).
Reglas de adicin de vectores y multiplicacin por escalares

Si
a , b ,
c Rn y , R, entonces

1.
a + b +
c =
a + b +
c

2.
a + b = b +
a

3. a + 0 = 0 + a =
a

4. a + ( a ) = ( a ) +
a = 0

5. ( + )
a =
a +
a

6. a + b = a + b

7. (
a ) = ()
a

8. 1 a = a

Captulo 1 El Espacio Rn
Ejemplo:

a , b Rn halla un vector
x Rn tal que 3
Dados
x + 2
a =5b.
Usando las reglas anteriores, se tiene

3
x + 2
a + (2
a ) = 5 b + (2
a)

3
x + 0 = 5 b 2
a

3x = 5 b 2a

1
1

3
x =
5 b 2
a
3
3
2
5

b
a
1
x =
3
3
2
5

b
a.
x =
3
3
Interpretacin geomtrica de los vectores en el plano R2
La palabra vector proviene del latn y significa transporte. Por esa razn, un
vector se asocia con un desplazamiento. Podemos describir ese desplazamiento en
el plano xy por la distancia dirigida a1 que se mueve en la direccin del eje x y
por la distancia dirigida a2 que se mueve en la direccin del eje y. Entendemos por
distancia dirigida al hecho de que a1 > 0 si se desplaza hacia la derecha del punto
inicial y a1 < 0 si se desplaza hacia la izquierda. Similarmente, se tiene a2 > 0 si
el desplazamiento es hacia arriba o a2 < 0 si es hacia abajo.
Geomtricamente, esta translacin se puede visualizar como una flecha o
segmento de recta dirigido de un punto A a otro punto B, que denotamos por

AB. Si desplazamos la flecha paralelamente a s misma, de tal manera que su

nuevo origen sea A y el nuevo destino B , la flecha resultante A B describir


el mismo desplazamiento, porque sus componentes x y y siguen siendo a1 y a2 ,
respectivamente.

De esta manera, se tiene que


AB = A B .
8

1.1 Vectores
As, desde el punto de vista geomtrico, decimos que dos vectores son iguales
o equivalentes si tienen la misma direccin y longitud (dados por las mismas

componentes a1 y a2 ). En consecuencia, es claro que AB = BA.

Definicin. Dados dos puntos A(x1 , y1 ) y B(x2 , y2 ) del plano R2 , el vector


v

que va de A hacia B es el vector v = AB = (x2 x1 , y2 y1 ).

Ejemplos:

1. Si A(1, 1), B(2, 1) y


v = AB es el vector que va de A a B, entonces

v = (2 1, 1 1) = (1, 2).

2. Si C(1, 0), D(3, 3) y


w = DC es el vector que va de D a C, entonces

w = (1 (3), 0 (3)) = (2, 3).

3. Si E(3, 2), F (1, 1) y


u = EF es el vector que va de E a F, entonces

u = (1 (3), 1 (2)) = (2, 3).

Observamos que los vectores


w y
u son iguales, puesto que estn descritos por
las mismas componentes, es decir, la misma direccin y magnitud, a pesar de tener

asociados diferentes puntos de origen y destino. De hecho, los vectores


w y
u son

tambin iguales al vector r = OP que va del origen de coordenadas O(0, 0) al


punto P (2, 3).
9

Captulo 1 El Espacio Rn

De acuerdo con la definicin, la multiplicacin de un vector


v por un escalar

c es un nuevo vector, c v , cuyas componentes son las componentes de


v

multiplicadas cada una por el factor c. Geomtricamente, el vector c


v es paralelo

v es un vector en el
a
v , con las siguientes caractersticas: i) si c > 0, entonces c

mismo sentido que


v , y si c < 0, su sentido es opuesto, ii) si |c| > 1, entonces c
v

es un vector de magnitud mayor que v , y si |c| < 1, su magnitud es menor.

Por ejemplo, si
v = (1, 2), entonces

a) 3
v = 3(1, 2) = (3, 6)

b)
v = (1, 2) = (1, 2)

c) 2
v = 2(1, 2) = (2, 4)

a y b son paralelos si son mltiplos entre


Definicin. Dos vectores no nulos

s, es decir, si existe un escalar = 0 tal que b =


a . Que los vectores
a y b

sean paralelos se denota por


a b.
10

1.1 Vectores
Ejemplo:

v1 =
El vector

v 1 = 35
v 2.

1
, 35
5

es paralelo al vector
v 2 = 13 , 1 , ya que

v1+
Por otra parte, sabemos de la definicin que la suma
v 2 de dos vectores

v 1 y v 2 es la suma de sus componentes, como se muestra en la siguiente figura.

El vector suma
v 2 se construye ms fcilmente a partir del mtodo del
v1+
paralelogramo, as como el mtodo del tringulo, ilustrados en la siguiente figura.

La siguiente figura muestra la suma de los vectores


a = (1, 2) y

b = (2, 1), dada por a + b = (1, 2) + (2, 1) = (1 + 2, 2 + 1) = (1, 1).

11

Captulo 1 El Espacio Rn
Asimismo, combinando las dos operaciones anteriores, se puede construir

cualquier combinacin lineal de vectores en R2 . Por ejemplo, para


v 1 = (1, 1) y

v 2 = (2, 3), la siguiente figura muestra la combinacin lineal

2
v 2 + 3
v 1 = 2(2, 3) + 3(1, 1) = (4, 6) + (3, 3) = (7, 3).

Por ltimo, sabemos que el vector resta


v 2 se construye como la suma
v1

de vectores v 1 + ( v 2 ), como se muestra en las figuras de la izquierda. Esto

equivale a decir que la resta


v1
v 2 es el vector que une las puntas de los

vectores v 1 y v 2 , en direccin de
v 2 hacia
v 1 , como se muestra en las figuras
de la derecha.

Un resultado muy til es que la suma


v1+
v 2 y la resta
v1
v 2 pueden

asociarse con las diagonales del paralelogramo formado al unir los vectores
v1y

v 2 , de la manera que se muestra en la siguiente figura.

12

1.1 Vectores
Existe una representacin alternativa para los vectores en el plano, utilizando
los llamados vectores base. Estos ltimos son vectores en trminos de los cuales
podemos expresar cualquier otro vector. En el caso de R2 se necesitan dos vectores
base, no paralelos, para poder generar cualquier vector en el plano. La base ms
simple es la base cannica, dada por los vectores = (1, 0) y = (0, 1), mostrados
en la siguiente figura.

Definicin. Cualquier vector


v = (x, y) R2 se puede expresar como

v = x + y
,
con = (1, 0) y = (0, 1).

Definicin. Si
v = x + y
, entonces los vectores x y y
son los vectores

componentes o componentes vectoriales de v en las direcciones y ,

respectivamente. Los nmeros x y y son las componentes escalares de


v en las
direcciones y , respectivamente.
Ejemplo:

Por ejemplo, si
v = 3 + 2
, entonces

i) 3 es la componente vectorial de
v en la direccin

ii) 2
es la componente vectorial de
v en la direccin

13

Captulo 1 El Espacio Rn

iii) 3 es la componente escalar de


v en la direccin

v en la direccin
iv) 2 es la componente escalar de

Interpretacin geomtrica de los vectores en el espacio R3


Los resultados anteriores pueden extenderse fcilmente para vectores en el
espacio R3 , como se presenta a continuacin.
Definicin. Dados dos puntos A(x1 , y1 , z1 ) y B(x2 , y2 , z2 ) en el espacio, el

vector
v que va de A a B es el vector

v = AB = (x2 x1 , y2 y1 , z2 z1 ).

Por otra parte, la base cannica en R3 son los vectores


= (1, 0, 0),

= (0, 1, 0),

mostrados en la siguiente figura.

14

k = (0, 0, 1),

1.1 Vectores

v = (x, y, z) en R3 puede
En trminos de estos vectores base, cualquier vector
expresarse como

v = x + y
+ z k.
Ejemplos:

1. Dibuja el vector
v = + 2
+ 3k

2. Dibuja los vectores


a = + 2
, b = 3k y
c =
a + b.

Norma de un vector en Rn
Como ya se mencion, una de las dos caractersticas de un vector es su longitud,
tambin conocida como su norma. Para vectores en Rn la norma se determina a
partir del teorema de Pitgoras generalizado, como se define a continuacin.

v = (x1 , x2 , . . . , xn ) Rn es
Definicin. La norma, o magnitud, de un vector

el nmero real no negativo


v dado por

v =

x21 + x22 + . . . + x2n .


15

Captulo 1 El Espacio Rn
En particular, se tienen los siguientes casos:

v = x + y
R2 , entonces
i) si
v =

x2 + y 2 .

ii) si
v = x + y
+ z k R3 , entonces
v =

x2 + y 2 + z 2 .

Cabe sealar que la norma


de un vector
v = x en R es simplemente su valor

2
absoluto, ya que v = x = |x|.
Ejemplos:

1. Si
u = + , entonces
u = 12 + 12 = 2.

2. Si
v = 3 + 4
, entonces
v =

(3)2 + 42 =

entonces
3. Si
w = + 2
3k,
w =

16

25 = 5.

(1)2 + 22 + (3)2 =

14.

1.1 Vectores
Nota que existe una infinidad de vectores con una misma norma dada. Por
ejemplo, todos los siguientes vectores poseen norma 5.

v1

v2

v3

v4

v
5

= 5
= 3 + 4

= 5

= 3 + 4

= 3 4

Las cabezas de todos estos vectores describen


una circunferencia de radio 5.

Propiedades de la norma

Sean
v ,
w Rn y sea c R. Entonces,
a)
b)
c)
d)

v 0

v =0
v = 0

c
v = |c|
v

v +w
v +
w Desigualdad del tringulo

Las propiedades a) y b) establecen que la norma de un vector es no negativa,


y slo es cero si v es el vector nulo. La propiedad c) establece que se preserva la
escala al calcular la norma del mltiplo de un vector; as, por ejemplo, la expresin

3
v = |3|
v =3
v

establece que la norma 3


v del triple de un vector
v , es el triple de su norma,

3 v . Por ltimo, la propiedad d), o desigualdad del tringulo, establece que la

hipotenusa de un tringulo mide menos que la suma de sus catetos (figuras de la


izquierda) y slo es igual a la suma de estos cuando son paralelos (figura de la
derecha).

v +
w <

v +
w

v +
w =
17

v +
w

Captulo 1 El Espacio Rn

v ,
w,
As, por ejemplo, de acuerdo con la propiedad d), para vectores arbitrarios
se tiene

3
v 5
w = 3
v + 5
w ,

3 v 5w = 3 v 5w .
Definicin. La distancia euclidiana d(A, B) entre dos puntos A(a1 , a2 , . . . , an )
y B(b1 , b2 , . . . , bn ) en Rn est dada por
d(A, B) =

(b1 a1 )2 + (b2 a2 )2 + + (bn an)2 .

Esta es una generalizacin del teorema de Pitgoras en n dimensiones. Ms

generalmente, si denotamos por


a = (a1 , a2 , . . . , an ) al vector OA que va del

origen al punto A(a1 , a2 , . . . , an ) y por b = (b1 , b2 , . . . , bn ) al vector OB que va


del origen al punto B(b1 , b2 , . . . , bn ), entonces la distancia d(A, B) entre los puntos
A y B es la norma del vector que los une, es decir,

d(A, B) = d(
a, b )= b
a =
a b .

Propiedades de la distancia euclidiana

Sean
a , b ,
c Rn . Entonces,

a) d(
a, b)0

b) d(
a, b)=0
a = b

c) d(
a , b ) = d( b ,
a ) Simetra

d) d(
a , b ) + d( b ,
c ) d(
a ,
c ) Desigualdad del tringulo
A un conjunto X con una funcin distancia d : X X R que satisface estas
propiedades se le llama espacio mtrico. En particular, el espacio Rn es un espacio
mtrico.
18

1.1 Vectores
Definicin. Un vector unitario u es un vector con norma igual a 1, es decir,
u = 1.
En el caso de R2 , los vectores unitarios son todos aquellos que pueden dibujarse
dentro de una circunferencia de radio 1 y centro en el origen, como es el caso de
los siguientes vectores.

1
1
a
= +
2
2
3
4
b =
5
5
= = a
= b = 1.
Como la norma de un vector unitario es, por definicin, siempre igual a 1, su
nica caracterstica importante es su direccin. De ah que los vectores unitarios
son conocidos tambin como vectores de direccin. En el caso particular de un
vector unitario en el plano, u R2 , su direccin se define como el ngulo
que ste determina con el eje x, medido en la direccin contraria al giro de las
manecillas del reloj. As, cualquier vector unitario en R2 ,
u = x + y
,
donde u =

x2 + y 2 = 1, puede expresarse como


u = cos + sen ,

en donde se ha utilizado que


cos =

x
= x,
1

sen =

19

y
= y.
1

Captulo 1 El Espacio Rn
Ejemplos:
1
1
1. Determina la direccin del vector unitario a = + .
2
2
1
1
En este caso, cos = y sen = . Por lo tanto,
2
2
1
1

= sen1
= ,
4
2
2
1
1
en donde cos x y sen x denotan ngulo cuyo coseno es y ngulo cuyo
seno es, que son las funciones inversas de las funciones coseno y seno.
2. Determina la direccin del vector unitario b = .
= cos1

En este caso, cos = 1 y sen = 0. Por lo tanto,

= cos1 (1) = sen1 (0) = .

Cualquier vector no nulo,


v Rn , puede escribirse siempre en trminos del

v , de acuerdo con
vector unitario v que apunta en la misma direccin que

v =
v v.

De esta manera, el vector unitario v del vector no nulo


v = 0 est dado por el
cociente

v
v =
.

v
Ejemplos:

1. Calcula el vector unitario a


del vector
a = 3 + 4
.

Como
a = (3)2 + 42 = 5, por lo tanto,

a
3 + 4

3
4
a
=
=
= + .

5
5
5
a
20

1.1 Vectores

x = 2
+ 3k.
2. Calcula el vector unitario x del vector

Como
x = 12 + (2)2 + 32 = 14, por lo tanto,

x
2
+ 3k
1
2
3

x =
= + k.
=

x
14
14
14
14

3. Encuentra un vector
v con magnitud (norma) igual a 5 y que tenga la misma

direccin que el vector


w que va del punto A(1, 2, 1) al punto B(2, 0, 3).

v = 5w, con w el vector de direccin


De acuerdo con el enunciado es claro que

de w = AB.

Para calcular w, notamos primero que

w = AB = ((2) (1), 0 2, 3 1) = (1, 2, 2)

= 2
+ 2k.

Como
w = (1)2 + (2)2 + 22 = 3, por lo tanto,

w
1
2
2
+ 2k
= +
w=
=

3
3
3
w

2
k.
3

De este modo,
1
2

v = 5w = 5 +
3
3

2
k
3

5
10
10
= + k.
3
3
3

Adems del producto c


v de un vector
v por un escalar c existen otros dos
productos importantes que involucran vectores. Uno de ellos, conocido como el
producto punto o producto escalar, reviste de gran utilidad para este curso, por lo
que se define a continuacin. El otro producto se conoce como el producto cruz o
producto vectorial, pero se omitir en estas notas.

21

Captulo 1 El Espacio Rn
Producto punto

a b , de dos vectores
a y
Definicin. El producto escalar o producto punto,

2
3
b en el plano R , o en el espacio R , es el escalar

a b =
a
b cos ,

donde es el ngulo entre


a y b , con 0 .

Observa que
a b no es un vector, sino un escalar. Geomtricamente,

a b representa el producto de la norma de cualquiera de los dos vectores por


la componente del otro vector en la direccin de ste, como se muestra en las
siguientes figuras.

a b =
a

b cos

a b = b (
a cos )

La siguiente tabla resume algunos casos especiales.

Vectores paralelos
0
Vectores perpendiculares 2
Vectores antiparalelos

a b =
a

a
b
0

b cos
valor mximo
valor mnimo

Observa que, de acuerdo con la definicin, el producto punto es conmutativo, es


decir,

a b = b
a.
22

1.1 Vectores

a y b son perpendiculares u
Definicin. Decimos que dos vectores no nulos

a b = 0. Que los vectores


a y b sean perpendiculares
ortogonales si y slo si

se denota por
ab.
Ejemplos:

1. Calcula el producto punto de los vectores


a = y b = 2
en R2 .

Sabemos que
a = 2 y b = 2. De la figura se observa que el ngulo

a y b es 135 , es decir, =
entre
. As,
4

3
1

= ( 2)(2)
= 2.
a b =
a
b cos
4
2

2. Calcula el producto punto de los vectores


en R2 .
a = 3 y b = + 3

Sabemos que
a = 3 y b = 2. De la figura se observa que el ngulo entre

a y b es 60 . As,

a b =
a

b cos
3

23

= (3)(2)

1
2

= 3.

Captulo 1 El Espacio Rn

a = 2 + y b = 3k en R3 .
3. Calcula el producto punto de los vectores

Sabemos que
a = 5 y b = 3. De la figura se observa que el ngulo

a y b es 90 , es decir, = . As,
entre
2

a b =
a
b cos
2

= ( 5)(3) (0) = 0.

En general, la expresin
a b =
a
b cos puede resultar poco prctica

a y b , ya que requiere conocer el ngulo


para calcular el producto punto de

entre a y b . Por esta razn, a continuacin desarrollaremos una expresin

alternativa para calcular


a b a partir de las componentes de estos vectores, que

suele ser la informacin que se tiene disponible.

Para este fin consideramos dos vectores


a y b , as como su vector diferencia,

c = b
a . Estos tres vectores determinan un tringulo, cuyos catetos estn
relacionados entre s por la ley de los cosenos, dada por

=
a

2
a

b cos ,

24

1.1 Vectores

a y b . Nota que esta igualdad se reduce al


en donde denota el ngulo entre

teorema de Pitgoras en el caso particular = /2 . El trmino


a
b cos en

a b entre
a y b , es decir,
el lado derecho es precisamente el producto punto

=
a

de modo que

a b =

2 a b,

.
2

Para el caso particular de vectores


a = a1 + a2 y b = b1 + b2 en R2 , el vector

c = b
a est dado por
c = (b1 a1 ) + (b2 a2 )
, de modo que
2
2

(a21 + a22 ) + (b21 + b22 ) (b1 a1 ) + (b2 a2 )

.
a b =
2
Desarrollando cuadrados en el numerador es posible simplificar varios trminos,
quedando simplemente,

a b = a1 b1 + a2 b2 .

De esta manera, el clculo de


a b se reduce a multiplicar trmino a trmino las

componentes escalares de
a y b . Similarmente, es posible demostrar que en el

caso de vectores
a = a1 + a2 + a3 k y b = b1 + b2 + b3 k en R3 el producto
punto est dado por

a b = a1 b1 + a2 b2 + a3 b3 .
El resultado anterior puede extenderse muy fcilmente para cualesquiera dos
vectores en Rn , como se enuncia en el siguiente teorema.

Teorema. El producto escalar, o producto punto,


a b , de dos vectores

a = (a1 , a2 , . . . , an ) y b = (b1 , b2 , . . . , bn ) en Rn es el escalar

a b = a1 b1 + a2 b2 + + an bn .
Ejemplos:

1. Calcula
x
y , si
x = (1, 3, 0) y
y = (2, 1, 3).
En este caso,

x
y = (1)(2) + (3)(1) + (0)(3) = 5.
25

Captulo 1 El Espacio Rn

u = 2 + 3
y
v = 6 + 4
son perpendiculares
2. Demuestra que los vectores
entre s.
Como

u
v = (2)(6) + (3)(4) = 0,

u
v.
por lo tanto
3. Escribe el ingreso I = p1 q1 + p2 q2 + + pn qn como un producto punto de
vectores.

El ingreso I puede expresarse como I =


p
q , donde
p = (p1 , p2 , . . . , pn ) es

el vector de precios y q = (q , q , . . . , q ) es el vector de cantidades.


1

Calcula el vector
4. Sean
a = + 2
+ 3k y b = 4 + k.

v =
a b
a b a
.

por lo tanto,
Por una parte, como
a b = 3 + 3
+ 2k,

a b = 9 + 9 + 4 = 22.
Por otra parte,

a b = 4 2
+ 3 = 5.

Por ltimo, como a = 1 + 4 + 9 = 14, por lo tanto


1
+2
+ 3k .
a
=
14
De esta manera,
v =

a b

a b a
=
22 (5)
+2
+ 3k
14

11
11
11
+ 10
+ 15
k.
7
7
7

5. Encuentra un vector
w R2 que tenga norma 5 y sea perpendicular a

v = 3 + 2
.

Sea w = x + y
el vector que buscamos, representado en la siguiente figura.
=

26

1.1 Vectores

w debe satisfacer las siguientes dos condiciones


De acuerdo con el enunciado,

w =
x2 + y 2 = 5,

w
v = (3)(x) + (2)(y) = 0.

De la segunda condicin se tiene y = 3x/2, que sustituido en la primera


condicin implica
9
x2 + x2 = 5.
4

w1 y
w 2 que satisfacen las
De este modo, x = 1013 . As, existen dos vectores

10
15
10
condiciones del problema, w 1 = 13 13 y w 2 = 13 + 1513 .
Propiedades del producto escalar

Para todos
a , b ,
c , d Rn y R se cumplen las siguientes propiedades:

1.
a
a 0y
a
a = 0 si y slo si
a = 0.

2.
a b = b
a

3. ( a ) b = a b =
ab

4.
a ( b +
c)=
a b +
a
c

5. (
a + b ) (
c + d)=
a
c +
a d + b
c + b d

6.
a b
a

b Desigualdad de Cauchy-Schwarz

De la propiedad 6 se sigue un resultado interesante. Para ello, reescribimos la


desigualdad de Cauchy-Schwarz de la siguiente manera

a b
a
b


a b
a
b


a
b cos
a

1 cos 1,
que permite generalizar el concepto de ngulo entre dos vectores en el espacio Rn ,
como lo establece la siguiente definicin.

Definicin. El ngulo entre dos vectores no nulos


a , b Rn est dado por

a b
= cos1
,
0 .

a
b
27

Captulo 1 El Espacio Rn
Ejemplos:

x = + y
y = .
1. Encuentra el ngulo entre los vectores

x
y = 1, por lo tanto = cos1
Como
x = 2,
y =1y

.
4

2. Encuentra el ngulo entre los vectores


x = 2
y
y = 2 + 3k.

x
y = 0, por lo tanto
Como
x = 5,
y = 14 y

1
= 2 . Concluimos entonces que
x
y.
= cos
5 14
Por otra parte, en relacin con el concepto de perpendicularidad, y en
vista que los vectores base cannicos en R3 son todos unitarios, es decir,
= = k = 1, se obtiene el siguiente resultado:

= = k k = 1
= k = k = 0

Utilizando este resultado, junto con la propiedad 5 del producto escalar, podemos
llevar a cabo una diversidad de manipulaciones algebraicas. Por ejemplo, sin hacer

uso de la ley de los cosenos podemos demostrar que


a b = a1 b1 + a2 b2 + a3 b3 ,

para
a y b en R3 , de la siguiente manera:

a b = a1 + a2 + a3 k b1 + b2 + b3 k
= a1 b1 ( ) + a1 b2 ( ) + a1 b3 k

+a2 b1 (
) + a2 b2 (
) + a2 b3 k

+a3 b1 k + a3 b2 k + a3 b3 k k
= a1 b1 + a2 b2 + a3 b3 .

Asimismo, tomando en cuenta que el producto punto de un vector


a consigo
2

a cos 0 = a
a (1) =
a , se
mismo est dado por a a = a
tiene

a =
a
a.
28

1.2 Curvas paramtricas. Vector tangente a una curva paramtrica


As, por ejemplo,

2
u 3
v

= (2
u 3
v ) (2
u 3
v)

= 4 ( u u ) 6 ( u v ) 6 (
v
u ) + 9 (
v
v)
2
2

= 4
u 12 (
u
v)+9
v .

1.2 Curvas paramtricas. Vector tangente a una curva paramtrica


Una manera frecuente de definir una curva en el plano R2 es la representacin
cartesiana, en donde la curva es el conjunto de puntos P (x, y) que satisfacen una
ecuacin de la forma y = f(x).

Existen otras maneras para representar una curva en R2 , que pueden resultar
ms convenientes que la cartesiana, dependiendo del tipo de simetras de la
curva o la naturaleza de sus posibles aplicaciones. Aqu nos interesa la llamada
representacin paramtrica, que adems de proporcionar una informacin ms
detallada que en la forma cartesiana, puede extenderse fcilmente al caso general
de curvas en Rn .
La representacin paramtrica de una curva en el plano R2 expresa las
coordenadas x y y de cada punto de la curva como funciones de una tercer variable,
digamos t, que juega el papel de variable exgena o parmetro. Al ir cambiando de
valores el parmetro t, se van generando nuevos puntos (x(t), y(t)) de la curva,
como se muestra en las siguientes figuras.

29

Captulo 1 El Espacio Rn
La figura de la izquierda muestra la evolucin de cada una de las coordenadas x(t)
y y(t) al incrementarse t. La figura de la derecha presenta el mismo razonamiento
pero en un lenguaje vectorial, considerando para cada t la evolucin del vector de
posicin

r (t) = x(t) + y(t) .


Definicin. Una curva paramtrica o trayectoria es una funcin vectorial,

r : S R Rn , que a cada nmero t S le asigna un nico vector


r (t) Rn .
De acuerdo con nuestra discusin anterior, en el caso del plano R2 una curva

paramtrica se representa mediante una funcin vectorial


r : R R2 , de la forma

r (t) = x(t) + y(t) ,


en donde x y y son funciones del parmetro t en R. Similarmente, en el caso del
espacio R3 una curva paramtrica se representa mediante una funcin vectorial

r : R R3 , de la forma

r (t) = x(t) + y(t) + z(t) k,


en donde x, y y z son funciones del parmetro t en R. Un argumento similar
se sigue para curvas en Rn , n 4. Cabe mencionar, por ltimo, que la
parametrizacin de una curva no es nica, como se ilustra en el ejemplo 2 a
continuacin.
Ejemplos:

1. Identifica la curva
r (t) = x(t) + y(t) en R2 , con
x(t) = 1 + t
y(t) = 2 + t, t R.
Asignando diferentes valores al parmetro t se obtiene la recta mostrada en la
figura.

30

1.2 Curvas paramtricas. Vector tangente a una curva paramtrica


Efectivamente, al eliminar el parmetro t en el sistema x = 1 + t, y = 2 + t, se
obtiene la ecuacin cartesiana de esta curva, dada por la recta
y = x + 1.

r (s) = x(s) + y(s) en R2 , con


2. Identifica la curva
x(s) = 1 s
y(s) = 2 s,

s R.

Eliminando el parmetro s en el sistema x(s) = 1 s, y(s) = 2 s, se obtiene


la ecuacin cartesiana y = x + 1, de modo que se trata de la misma curva que
en ejemplo 1.

3. Identifica la curva
r () = x() + y() en R2 , con
x() = r cos
y() = r sen ,

0 < 2,

r > 0 constante.

Aqu no es fcil eliminar el parmetro mediante mtodos algebraicos. En lugar


de esto, conviene utilizar identidades trigonomtricas, de la siguiente manera.
y 2
x 2
Tomando en cuenta que cos2 + sen2 = 1, se tiene
+
= 1. As, la
r
r
ecuacin cartesiana de la curva en este caso corresponde a la circunferencia
x2 + y 2 = r 2 ,
como se muestra en la figura. Ah se ilustra cmo se van generando los puntos
de esta curva a medida que va cambiando el parmetro .

4. Identifica la curva
r () = x() + y() + z() k en R3 , con
x() = cos
y() = sen
z() = 3, 0 < 2.

0 < 2, las primeras dos


Para la curva
r () = cos + sen + 3 k,
componentes describen una circunferencia, mientras que la tercera permanece
31

Captulo 1 El Espacio Rn
constante (igual a 3). As, la curva correspondiente es una circunferencia que
est elevada 3 unidades en el eje vertical.

r () = cos + sen + k en R3 , con 0 < .


5. Identifica la curva

Para esta curva, las primeras dos componentes describen una circunferencia,
mientras que la tercera se incrementa continuamente de manera lineal. La curva
obtenida se conoce como hlice (espiral), como se ilustra en la figura.

6. Como una aplicacin a economa, considera el problema de maximizacin de


la utilidad u(x1 , x2 ) correspondiente a una canasta (x1 , x2 ) de dos bienes, con
precios fijos p1 y p2 . Si se dispone de un ingreso I, se tendr una restriccin
presupuestal dada por p1 x1 + p2 x2 = I. Esto nos lleva a un problema de
optimizacin restringida, de la forma
maximizar u(x1 , x2 )
sujeto a p1 x1 + p2 x2 = I.
Como veremos en el captulo 5, el ptimo (x1 , x2 ) de este problema ocurre en
el punto de tangencia de la recta presupuestal p1 x1 + p2 x2 = I con alguna
curva de indiferencia de la funcin u, lo que se conoce como la condicin de
equimarginalidad.

32

1.2 Curvas paramtricas. Vector tangente a una curva paramtrica


De esta manera, la canasta ptima depende del nivel de ingreso I, es decir,
(x1 , x2 ) = (x1 (I), x2 (I)).
Aqu el ingreso I es un parmetro que al cambiar de valor hace que el punto
ptimo (x1 (I), x2 (I)) se mueva a lo largo de distintas curvas de indiferencia. La
trayectoria que sigue la canasta ptima como funcin del parmetro I se conoce
como curva de ingreso-consumo o senda de expansin del consumo.

r : R R2 que para
La curva de ingreso-consumo es la curva paramtrica

+
cada valor del ingreso I R le asigna una canasta ptima
r R2 , dada por

r (I) = x (I) + x (I) .


1

Como una curva paramtrica


r (t) es funcin del parmetro t, tiene sentido

preguntarse sobre su razn de cambio o derivada, d


r /dt, con respecto al parmetro
t. Para ello, primero necesitaramos definir los conceptos de lmite y continuidad,
cuya definicin formal omitiremos aqu.

Definicin. Sea
r (t) una funcin vectorial, con
r : S R Rn . La derivada

de r (t) con respecto a t es la funcin vectorial d r /dt dada por

d
r (t)
r (t + t)
r (t)
= lm
,
t0
dt
t
cuando este lmite existe.
Como se ilustra en la siguiente figura, de esta definicin se sigue que el vector

r (t), para cada t.


d r /dt es un vector tangente a la curva

33

Captulo 1 El Espacio Rn

Observa que el vector tangente d


r /dt no necesariamente es perpendicular a la

curva
r (t) en cada valor del parmetro t.

El clculo de la derivada d
r /dt es muy sencillo. Por ejemplo, para una funcin

vectorial r (t) = f (t) + g(t) + h(t) k en R3 , se tiene

d
r (t)
=
dt
=

r (t + t)
r (t)
lm
t0
t
lm

f (t + t) + g(t + t) + h(t + t) k f(t) + g(t) + h(t) k

t
f (t + t) f (t)
g(t + t) g(t)
h(t + t) h(t)
= lm
+ lm
+ lm
k
t0
t0
t0
t
t
t
df (t)
dg(t)
dh(t)
+
+
k,
=
dt
dt
dt
siempre y cuando f, g y h sean todas funciones diferenciables de t.
t0

Teorema. Sea
r (t) = f1 (t)e1 + f2 (t)e2 + . . . + fn (t)en una funcin vectorial
n
en R , con (f1 , f2 , . . . , fn ) : R R derivables y e1 , . . . en la base cannica en Rn .

r /dt dada por


La derivada de
r (t) con respecto a t es la funcin vectorial d

d
r (t)
df1 (t)
df2 (t)
dfn (t)
=
e1 +
e2 + . . . +
en .
dt
dt
dt
dt
Ejemplos:

1. Encuentra la derivada de
r (t) = te3(t1) + (t ln t) , t > 0, en t = 1.

Para cada t > 0 la derivada d


r (t)/dt es la funcin vectorial

d
r (t)
= (1 3t) e3(t1) + (1 + ln t) .
dt
As, en t = 1 se tiene

d
r (t)
= 2 + .
dt t=1

r () = cos + sen en el
2. Encuentra un vector tangente a la circunferencia
punto correspondiente a = 0. Ilustra con una figura.
Por una parte, el punto correspondiente a = 0 es
r(0) = .
34

1.2 Curvas paramtricas. Vector tangente a una curva paramtrica

Por otra parte, la derivada d


r ()/d es la funcin vectorial

d
r ()
= sen + cos ,
d
que en = 0 es el vector

d
r ()
= .
d =0

r () en el punto
r (0) = es
Por lo tanto, el vector tangente a la curva

r (0) = , como se ilustra en la figura.

Reglas de diferenciacin de curvas paramtricas

Sean
u : R Rn ,
v : R Rn y : R R funciones diferenciables de t.

Sean k R y c Rn constantes. Entonces se cumplen las siguientes propiedades:

d
c

1.
= 0
dt

d [k
u (t)]
d
u (t)
2.
=k
dt
dt

d [ u (t) + v (t)]
d
u (t)
d
v (t)
3.
=
+
dt
dt
dt

d [(t) u (t)]
d u (t) d(t)

4.
= (t)
+
u (t)
dt
dt
dt

d [
u (t)
v (t)]
d
v (t) d
u (t)
5.
=
u (t)
+

v (t)
dt
dt
dt

Como una consecuencia de la regla 5 se sigue que si


r (t) es una funcin

vectorial con norma constante, || r (t)|| = c (c constante), entonces

d
r

r
= 0.
dt
35

Captulo 1 El Espacio Rn
Demostracin:

Sea
r (t) una funcin vectorial tal que ||
r (t)|| = c, con c un real no negativo.
Por lo tanto,
2

||
r (t)|| = c2

r (t)
r (t) = c2

d [
r (t)
r (t)]
=0
dt

d
r (t)
d
r (t)

r (t)
+
r (t)
=0
dt
dt

d
r (t)

2
r (t)
=0
dt

d
r (t)

r (t)
= 0.
dt

En otras palabras, si la trayectoria


r (t) tiene norma constante, el vector de

r /dt, para cada t.


posicin
r es ortogonal al vector tangente d
As, por ejemplo, para el caso de una trayectoria circular

r (t) = (cos t) + (sent) ,


que siempre presenta norma constante

||
r (t)|| = cos2 t + sen2 t = 1,
se tiene

d
r (t)

= (cos t + sent ) (sent + cos t )


r (t)
dt
= sent cos t + sent cos t = 0.

36

1.3 Rectas en el espacio. Segmento de recta

1.3 Rectas en el espacio. Segmento de recta


Estamos acostumbrados a escribir la ecuacin de la recta como y = mx + b,
donde m representa la pendiente o direccin de la recta y b su ordenada al origen.
Sin embargo, esta forma para la ecuacin de la recta slo es vlida para rectas
en el plano R2 . En el caso general de rectas en Rn su ecuacin ya no puede
expresarse en trminos de una sola pendiente, sino que es necesario tomar en
cuenta la orientacin de la recta en relacin con cada uno de los n diferentes ejes
coordenados (cosenos directores). Una manera sencilla de introducir la orientacin
es utilizando vectores, lo que nos llevar a una representacin paramtrica para la
recta, como se expone a continuacin.
Para encontrar la ecuacin de una recta L en el espacio general Rn basta con

proporcionar algn punto conocido P0 de la recta y un vector


v que sea paralelo
al conjunto de puntos P de la recta.

La recta L es el lugar geomtrico de todos los puntos P en Rn tales que P0 P es

paralelo al vector de direccin


v Rn , es decir,

P0 P
v.
Esto que implica que ambos vectores son mltiplos entre s, de modo que existe
algn escalar t R, tal que

P0 P = t
v.
Esta ltima ecuacin puede expresarse de manera alternativa, introduciendo un
origen de coordenadas, O, a partir del cual los puntos P0 y P estn localizados por
los vectores de posicin

x 0 = OP0 y
x = OP .

37

Captulo 1 El Espacio Rn
De esta manera, se tiene

x
x 0,
P0 P =
de modo que la ecuacin de la recta se convierte en

v,
x
x = t
0

o, equivalentemente,

x =
x 0 + t
v.

Definicin. La ecuacin vectorial paramtrica de la recta en Rn que contiene

al punto
x 0 Rn y es paralela al vector no nulo
v Rn es

v,
x =
x + t
0

donde
x Rn y t R.

La ecuacin vectorial paramtrica de una recta tambin puede escribirse en


trminos de sus componentes escalares. En el caso particular de una recta en R3 , si

v = a + b
+ ck denota el vector de direccin,
x 0 = x0 + y0 + z0 k el punto

conocido y x = x + y
+ z k el punto libre de la recta, la ecuacin vectorial

x = x 0 + t v se convierte en

= (x0 + at) +(y0 + bt) +(z0 + ct) k.


x+y
+z k = (x0+y0 +z0 k)+t(
a+b
+ck)
Igualando trmino a trmino ambos lados de la ecuacin se obtienen tres
ecuaciones escalares, conocidas como las ecuaciones paramtricas de la recta.
Definicin. Las ecuaciones escalares paramtricas de la recta en R3 que

contiene al punto P0 (x0 , y0 , z0 ) y es paralela al vector no nulo


v = a + b
+ ck
son
x = x0 + at, y = y0 + bt, z = z0 + ct,
t R.
Similarmente, las ecuaciones escalares de una recta en R2 son
x = x0 + at, y = y0 + bt,

t R.

Ejemplos:
1. Escribe la ecuacin vectorial paramtrica de la recta en R2 que contiene al punto

x 0 = + 2
y es paralela al vector
v = + . Luego escribe las ecuaciones
escalares paramtricas de esta recta.

La ecuacin vectorial es
x =
x + t
v = ( + 2
) + t ( + ), esto es
0

x = ( + 2
) + t ( + ) ,
38

t R.

1.3 Rectas en el espacio. Segmento de recta


Las ecuaciones escalares son
x = 1 + t, y = 2 + t,

t R.

Observa que sta es la misma recta que la del ejemplo 1 de la seccin 1.2.
2. Halla las ecuaciones escalares paramtricas de la recta en R3 con la informacin
dada:

v = 5 + 3
k.
a) Contiene al punto P (1, 2, 7) y es paralela al vector
En este caso, se tiene simplemente
x = 1 + 5t, y = 2 + 3t, z = 7 t,
t R.

b) Contiene al origen y es paralela al vector


v = 4 3
.

Como el origen es el punto O(0, 0, 0), por lo tanto las ecuaciones son
x = 4t, y = 3t, z = 0,

t R.

c) Contiene al punto Q(1, 2, 3) y es paralela al eje y.

Podemos tomar
v = (o cualquier mltiplo de ste), de modo que
x = 1, y = 2 + t, z = 3,

t R.

3. Encuentra las ecuaciones escalares paramtricas de la recta que contiene los


puntos A(2, 1, 4) y B(1, 0, 3). Asimismo, proporciona algunos otros puntos
contenidos en esta recta.

y el punto conocido puede


Podemos tomar, por ejemplo,
v = AB = k,
ser tanto A como B. As, cualquiera de las siguientes respuestas es vlida
x = 2 + t, y = 1 t, z = 4 t,

t R,

x = 1 + t, y = t, z = 3 t,
t R.
Por otra parte, para obtener cualquiera de los puntos de esta recta basta con
asignar valores arbitrarios al parmetro t. As, por ejemplo, si en la primer
respuesta tomamos t = 2 obtenemos el punto P1 (0, 1, 2), o bien, si tomamos
t = 1 generamos el punto P2 (3, 2, 5), etc. Nota que el punto A se obtiene
cuando t = 0, y el punto B, cuando t = 1.
4. Encuentra las ecuaciones escalares paramtricas de la recta tangente a la curva

r () = + 2 en R2 , R, en el punto con = 1.

Primero notamos que un punto conocido


x 0 de la recta tangente es,

precisamente, su punto de tangencia con la curva


r () en = 1, es decir,

x0 =
r (1) = (1, 1).
39

Captulo 1 El Espacio Rn
Por otra parte, sabemos que un vector tangente a la curva

d
r ()/d = + 2 , para cada R. As, la direccin
tangente a la curva en = 1 puede tomarse como

d
r ()

v =
d

r () es

v de la recta

= (1, 2).
=1

As, las ecuaciones paramtricas de la recta tangente a


r () en = 1 son
x = 1+t
y = 1 + 2t, t R.

La siguiente figura muestra la curva


r () y su recta tangente L en = 1. En
este ejemplo, la curva paramtrica es la parbola y = x2 , como se deduce a
partir de x = y y = 2 .

5. Encuentra las ecuaciones paramtricas de los ejes de coordenadas en R3 .


Como lo muestra la figura, una posible representacin para las ecuaciones
paramtricas de los ejes coordenados est dada por:
i) Eje x: O(0, 0, 0), v =
x = t, y = 0, z = 0,

t R.

ii) Eje y: O(0, 0, 0), v =


x = 0, y = t, z = 0,

t R.

iii) Eje z: O(0, 0, 0), v = k


x = 0, y = 0, z = t,
40

t R.

1.3 Rectas en el espacio. Segmento de recta

Por ltimo, como sucede con cualquier representacin paramtrica, las


ecuaciones paramtricas de la recta no admiten una nica representacin. Esto se
debe a que cualquier punto de la recta puede seleccionarse como el punto conocido

P0 , y que cualquier mltiplo del vector de direccin


v es tambin paralelo a la
recta. As, por ejemplo, la recta representada por las ecuaciones
x=1+t
y = 1 t,

t R,

es la misma que la descrita por cualquiera de las siguientes ecuaciones:


x=2+s
y = s, s R,

x=u
y = 2 u, u R,

x = 1 3w
y = 1 + 3w, w R.

Una forma alternativa de la ecuacin de la recta, vlida en general para rectas


en Rn , es la llamada forma simtrica, que se discute a continuacin para el caso
de rectas en R3 . Para obtener la forma simtrica de la ecuacin de la recta, se
despeja el parmetro t en cada una de las tres ecuaciones x = x0 + at, y = y0 + bt,
z = z0 + ct, es decir,
x x0
y y0
z z0
, t=
t=
,
a
b
c
y luego se igualan entre s (claro est, suponiendo que a = 0, b = 0 y c = 0), como
se define a continuacin.
t=

Definicin. La forma simtrica de la ecuacin de la recta en R3 que contiene

con a = 0, b = 0 y
al punto P0 (x0 , y0 , z0 ) y es paralela al vector
v = a + b
+ ck,
c = 0, es
x x0
y y0
z z0
=
=
.
a
b
c
41

Captulo 1 El Espacio Rn
Por ejemplo, la forma simtrica de las ecuaciones

est dada por

x = 1 + 3t, y = 4t, z = 5 2t,

t R,

y
z+5
x1
= =
.
3
4
2
Nota que esta ltima no es una ecuacin, sino ms bien son tres ecuaciones, a
saber,
y
y
z+5
z+5
x1
x1
= ,
=
y
=
.
3
4
4
2
3
2

Cuando alguna de las componentes del vector


v es igual a cero, es posible an
contar con una forma simtrica para la ecuacin de la recta correspondiente, de la
siguiente manera:
caso:
a=0
b=0
c=0

forma simtrica:
y y0
z z0
, x = x0
=
b
c
x x0
z z0
=
, y = y0
a
c
x x0
y y0
=
, z = z0
a
b

Vale la pena sealar que en el caso particular de rectas en R2 la correspondiente


forma simtrica,
x x0
y y0
=
,
a
b
puede reescribirse como
b
y = (x x0 ) + y0 ,
a
que es precisamente la ecuacin punto-pendiente de la recta (m = b/a), con la que
seguramente ests familiarizado. No olvides, sin embargo, que este resultado slo
es vlido para rectas en R2 . As, por ejemplo, para la recta
x = 1 + 3t
y = 2 5t,

cuya ecuacin en su forma simtrica es

se obtiene la ecuacin cartesiana

t R,

x1
y+2
=
,
3
5
5
1
y = x .
3
3
42

1.4 Planos e hiperplanos


Segmento de recta
Hemos visto ya que las ecuaciones paramtricas de una recta en el espacio
contienen un parmetro libre, t R. Cada vez que t toma un valor diferente en los
reales, se genera un nuevo punto a lo largo de la recta infinita. Sin embargo, si en
lugar de tener la condicin t R, el parmetro t se limitara a tomar valores dentro
de un intervalo t1 t t2 en los reales, entonces ste ya no generara todos los
puntos de la recta infinita, sino tan slo un segmento de la recta.

x 0 Rn y es paralela
Definicin. Dada la recta L en Rn que contiene al punto

n
al vector no nulo v R , la ecuacin

x =
x + t
v,
t tt ,
0

con t1 y t2 fijos, determina un segmento de la recta L.

Ejemplo:
Halla la ecuacin del segmento de la recta que une los puntos P (3, 2, 3) y
Q(1, 1, 4).

Lo ms sencillo es definir el vector de direccin


v como

v = P Q = 4 3
+ 7k.
De esta manera, el segmento de recta que une a P y Q queda descrito por
x = 3 + 4t, y = 2 3t, z = 3 + 7t, 0 t 1.
En efecto, cuando t = 0 se obtiene el punto P , cuando t = 1 se obtiene el punto Q
y para 0 < t < 1 se generan todos los puntos intermedios entre P y Q.

1.4 Planos e hiperplanos


Se trata de encontrar la ecuacin del plano en el espacio R3 que contiene a un

punto conocido P0 y es perpendicular a un vector normal no nulo,


n . En ese caso,
es el conjunto de puntos P para los cuales se cumple que

P P
n.
0

43

Captulo 1 El Espacio Rn
En otras palabras,

n P0 P = 0.

Introduciendo un origen de coordenadas, O, se puede definir los vectores


x = OP

x 0 = OP0 , de modo que P0 P =


y
x
x 0 . As, la condicin anterior se convierte
en

n (
x
x 0 ) = 0.

Definicin. La ecuacin del plano que contiene al punto


x 0 R3 y es

3
perpendicular al vector no nulo n R es

n (
x
x ) = 0.
0

La forma
n (
x
x 0 ) = 0 para la ecuacin del plano puede reescribirse en

n y
x 0 . En
trminos ms simples si se conocen las componentes de los vectores

efecto, si se sabe que n = a + b


+ ck, x 0 = x0 + y0 + z0 k y x = x + y
+ z k,
entonces

x
x 0 = (x x0 ) + (y y0 )
+ (z z0 )k.
De esta manera, la ecuacin del plano est dada por

n (
x
x 0) =

a + b
+ ck (x x0 ) + (y y0 )
+ (z z0 )k

= a(x x0 ) + b(y y0 ) + c(z z0 ) = 0.


Definicin. La ecuacin cartesiana del plano en R3 que contiene al punto

P0 (x0 , y0 , z0 ) y es perpendicular al vector no nulo


n = a + b
+ ck es
a(x x0 ) + b(y y0 ) + c(z z0 ) = 0.
44

1.4 Planos e hiperplanos


Por ejemplo, la ecuacin del plano que contiene al punto P (1, 0, 3) y es

n = 5 + 2k se obtiene de
perpendicular al vector
(5)(x 1) + (1)(y 0) + (2)(z (3)) = 0.
Llevando a cabo las operaciones algebraicas correspondientes, esta ecuacin se
reduce a
5x + y 2z = 11.
De acuerdo con el resultado anterior, la ecuacin de un plano en R3 siempre
puede llevarse a la forma general
ax + by + cz = d,
donde a, b y c son las componentes del vector normal al plano, y d = ax0 +by0 +cz0
es una constante.
Ejemplos:
1. Proporciona tres puntos contenidos en el plano 3x + 2y + 4z = 12 en R3 .
Los puntos se obtienen simplemente al encontrar tres valores x, y y z que
satisfagan la ecuacin 3x + 2y + 4z = 12. Por ejemplo, estn los puntos
P1 (2, 3, 0), P2 (0, 0, 3) y P3 (0, 2, 4).
2. Encuentra la ecuacin cartesiana del plano que contiene a los puntos A(1, 1, 1),
B(2, 1, 3) y C(3, 2, 1).

El vector normal
n es perpendicular a cualesquiera dos vectores no paralelos en

el plano. Por ejemplo, si se consideran los vectores AB = + 2k y AC = 2 + ,

se tiene
y se define
n = x + y
+ z k,

AB
n = (1, 0, 2) (x, y, z) = 0

AC n = (2, 1, 0) (x, y, z) = 0
es decir,
x + 2z = 0
2x + y = 0.
Tomando, por ejemplo, z = 1, obtenemos
x = 2, y = 4, z = 1.
De esta manera,

o algn mltiplo de ste.


n = 2 + 4
+ k,
45

Captulo 1 El Espacio Rn
El punto conocido P0 (x0 , y0 , z0 ) puede ser cualquiera de los tres puntos dados.
Por ejemplo, si se considera el punto A(1, 1, 1) se llega a que la ecuacin
cartesiana del plano es
(2) (x 1) + (4) (y 1) + (1)(z 1) = 0,
o bien,
2x + 4y + z = 3.
Nota que el resultado es independiente de la seleccin del punto, o si tomaste

n.
cualquier otro mltiplo del vector normal
3. Encuentra la ecuacin cartesiana del plano que contiene al punto P0 (2, 3, 1) y a
la recta L : x = 1 + t, y = 1 t, z = t, t R.
Primero notamos que el punto P0 (2, 3, 1) no est contenido en la recta. Si lo
estuviera, existira una infinidad de planos que la contendran. El vector normal

n al plano es un vector perpendicular a cualesquiera dos vectores


v1y
v2

en el plano. As, por ejemplo, podemos escoger v 1 = P0 P = 2


k y

v 2 = + k (vector de direccin de la recta), como se muestra en la figura.

se tiene
Definiendo
n = x + y
+ z k,

n = (1, 2, 1) (x, y, z) = 0
v 1

v n = (1, 1, 1) (x, y, z) = 0
2

es decir,
x 2y z = 0
x y + z = 0.

Tomando, por ejemplo, z = 1, obtenemos


x = 1, y = 0, z = 1.
De esta manera,

o algn mltiplo de ste.


n = + k,
Por tanto, la ecuacin cartesiana del plano es
(1)(x 1) + (0) (y 1) + (1)(z 0) = 0,
o bien,
x z = 1.

4. Encuentra la ecuacin cartesiana del plano que contiene al punto P (1, 2, 3) y es


paralelo al plano 5x 3y + 2z = 11.

Como lo muestra la figura, si un plano 1 , con vector normal


n 1 , es paralelo

a otro plano , con vector normal n , entonces los vectores


n y
n son
2

46

1.4 Planos e hiperplanos


tambin paralelos entre s.

n al plano que buscamos puede escogerse


De este modo, el vector normal

que es el vector normal al plano


+ 2k,
simplemente como n = 5 3
5x 3y + 2z = 11. As, la ecuacin del plano es
o bien,

(5)(x 1) + (3) (y 2) + (2)(z 3) = 0,

5x 3y + 2z = 5.
5. Encuentra la ecuacin cartesiana del plano que contiene al punto P (1, 1, 1) y es
normal a la recta
x1
z
=y+1= .
2
2

Como lo muestra la figura, si un plano con vector normal


n es perpendicular

a una recta L con vector de direccin


v , entonces los vectores
n y
v son
paralelos entre s.

De este modo, el vector normal


n al plano que buscamos puede escogerse

que es el vector de direccin de la recta


simplemente como
n = 2 + 2k,
x1
z
= y + 1 = . As, la ecuacin del plano es
2
2
o bien,

(2)(x 1) + (1) (y 1) + (2)(z 1) = 0,

2x + y 2z = 1.
6. Un lindo ejemplo de planos en economa es el de una restriccin presupuestal,
de la forma
p1 q1 + p2 q2 + p3 q3 = I,

(p1 , p2 , p3 , I constantes)
47

Captulo 1 El Espacio Rn
que representa un plano en el espacio de cantidades q1 q2 q3 , con vector normal

dado por el vector de precios


p = (p1 , p2 , p3 ).

7. Otro ejemplo bonito es el de la ecuacin de costo lineal


C = wL + rK,
para cada nivel de trabajo L y de capital K, con precios unitarios dados por el
salario w y la tasa de inters r, respectivamente. Nota que la ecuacin para el
costo presenta la forma
wL + rK C = 0,

que representa un plano en el espacio LKC, con vector normal


n = (w, r, 1).
Por lo general, la grfica de un plano de la forma ax + by + cz = d en R3
se construye a partir de las intersecciones de ste con los ejes coordenados. Por
ejemplo, la siguiente figura muestra la grfica del plano 3x + 2y + 4z = 12.

Una grfica como la anterior presupone que los coeficientes a, b, c y d en la


ecuacin ax + by + cz = d son todos diferentes de cero. A continuacin se muestra
la grfica de algunos casos especiales, en donde uno o varios de los coeficientes
a, b o c pueda ser igual a cero.
48

1.4 Planos e hiperplanos

c=0

b=0

a=0

ax + by = d
(z libre)

ax + cz = d
(y libre)

by + cz = d
(x libre)

a=b=0

cz = d
(x, y libres)

a=c=0

by = d
(x, z libres)

49

Captulo 1 El Espacio Rn

b=c=0

ax = d
(y, z libres)

Ejemplos:
1. Dibuja los siguientes planos en R3 :
a) 2x + 3y = 6

b) x + z = 1

c) z = 4

d) y = 3

50

1.4 Planos e hiperplanos


2. Encuentra las ecuaciones de los planos coordenados en R3 .
En cada caso, podemos tomar como punto conocido el origen 0(0, 0, 0), y como
vector normal alguno de los vectores base, obteniendo
plano xy
plano yz
plano xz

vector normal
n = k
n =
n =

ecuacin del plano:


z=0
x=0
y=0

Ecuacin vectorial paramtrica del plano


Adems de la representacin cartesiana que ya vimos, la ecuacin del
plano tambin admite una representacin paramtrica, que presentaremos muy
brevemente.

Definicin. La ecuacin vectorial paramtrica del plano que contiene al punto

x 0 y a los vectores no nulos


u y
v que no son paralelos es

x =
x 0 + t
u + s
v,
donde s, t (, ).

51

Captulo 1 El Espacio Rn
Para pasar de la ecuacin cartesiana del plano a su ecuacin paramtrica, se
parametrizan dos de las tres variables, x, y o z, como se muestra a continuacin.
Ejemplo:
Encuentra la ecuacin paramtrica del plano x + 2y z = 3 en R3 .

Simplemente podemos proponer la parametrizacin y = t y z = s, de modo que


x = 3 2t + s
y=t
z = s,
t, s R.

Estas ecuaciones pueden expresarse en forma vectorial como



x
3
2
1
y = 0 +t 1 +s 0 ,
t, s R,
z
0
0
1

que es de la forma
u + s
v , con
x =
x 0 + t
x 0 = 3,
u = 2 + y
v = + k.

Es fcil demostrar que los vectores u y v son perpendiculares al vector normal

n = + 2
k del plano x + 2y z = 3.
Hiperplanos

La forma
n (
x
x 0 ) = 0 para la ecuacin del plano no se limita al espacio
3
tridimensional R , sino que es vlida para espacios Rm de dimensin mayor
(m > 3). En este caso, al plano se le denomina hiperplano.

Definicin. La ecuacin del hiperpano que contiene al punto


x 0 Rm y es

perpendicular al vector no nulo


n Rm es

n (
x
x 0 ) = 0.

En particular, si P0 (x01 , x02 , . . . , x0m ) y


n = (a1 , a2 , . . . , am ), la ecuacin
cartesiana del hiperplano es
a1 (x1 x01 ) + a2 (x2 x02 ) + + an (xm x0m ) = 0.

52

1.5 Conjuntos abiertos, cerrados, acotados, compactos, convexos


Ejemplos:
1. La ecuacin del hiperplano en R4 que contiene al punto P0 (1, 2, 0, 3) y es

n = (5, 2, 3, 1) est dada por


normal al vector
es decir,

5(x1 1) + 2(x2 (2)) + 3(x3 0) (x4 3) = 0,

5x1 + 2x2 + 3x3 x4 = 2.


2. Un ejemplo en economa est dado por el hiperplano presupuestal,
p1 x1 + p2 x2 + + pn xn = I,

o bien

p
x = I,

cuyo vector normal es el vector de precios,


p = (p1 , p2 , . . . , pn ).

1.5 Conjuntos abiertos, cerrados, acotados, compactos, convexos


Aqu presentaremos algunas nociones bsicas de topologa, necesarias para
comprender el significado de los teoremas y conceptos que veremos ms adelante
en el curso, particularmente en el tema de optimizacin de funciones en varias
variables.

Definicin. Dado un punto


x 0 Rn y un nmero real > 0 la vecindad

V (
x 0 ) con centro en
x 0 y radio es el conjunto de todos los puntos
x Rn

cuya distancia a x 0 es menor que , es decir,

V (
x )={
x Rn | ||
x
x || < } .

Ejemplos:
1. Una vecindad en R es el conjunto V (x0 ) = { x R | | x x0 | < }, que
representa un intervalo abierto en los reales, con radio y centro en x0 .
| x x0 | <
< x x0 <
x0 < x < x0 +
53

Captulo 1 El Espacio Rn

2. Una vecindad en R2 es el conjunto V (


x 0) = {
x R2 | ||
x
x 0 || < },

que representa los puntos dentro de un crculo de radio y centro en


x 0.

||
x
x 0 || <

(x x0 )2 + (y y0 )2 <
(x x0 )2 + (y y0 )2 < 2

3. Una vecindad en R3 es el conjunto V (


x 0) = {
x R3 | ||
x
x 0 || < },

que representa los puntos dentro de una esfera de radio y centro en


x 0.

||
x
x 0 || <

(x x0 )2 + (y y0 )2 + (z z0 )2 <
(x x0 )2 + (y y0 )2 + (z z0 )2 < 2

Con base en los ejemplos anteriores, es claro por qu a una vecindad tambin se
le llama bola abierta.

Definicin. Sea A Rn y sea


x 0 Rn . Decimos que:

a)
x 0 es un punto interior de A si existe un nmero > 0 tal que la vecindad

V ( x 0 ) est totalmente contenida en A.

b)
x 0 es un punto exterior de A si existe un nmero > 0 tal que la vecindad

V ( x 0 ) no contiene puntos de A.

c)
x es un punto frontera de A si para todo nmero > 0 la vecindad V (
x )

contiene puntos de A y puntos fuera de A. Los puntos frontera de A pueden, o no,


pertenecer a A.

54

1.5 Conjuntos abiertos, cerrados, acotados, compactos, convexos


Por ejemplo, si A = {(x, y) R2 | x2 + y 2 1 } , entonces el conjunto de
puntos interiores (PI), puntos exteriores (PE) y puntos frontera (PF) de A son los
conjuntos:

P I = {(x, y) R2 | x2 + y 2 < 1 }

P E = {(x, y) R2 | x2 + y 2 > 1 }
P F = {(x, y) R2 | x2 + y 2 = 1 }

Nota que los conjuntos P I, P E y P F anteriores se mantienen igual si en lugar


de A se considera el conjunto B = {(x, y) R2 | x2 + y 2 < 1 } .

Ejemplos:
1. A = R2+ = {(x, y) R2 | x 0 y y 0 }.

55

Captulo 1 El Espacio Rn
2. A = R2++ = {(x, y) R2 | x > 0 y y > 0 }.

3. A = {(x, y) R2 | xy = 0 }.

4. A = {(x, y) R2 | 1 x < 5 y 1 y < 3 }.

56

1.5 Conjuntos abiertos, cerrados, acotados, compactos, convexos


5. A = {(x, y) R2 | x2 + y 2 > 1 }.

6. A = {x R | a < x b } .

7. A = {(x, y) R2 | a < x b } .

8. A = {(x, y) R2 | a < x b, y = 0 }.

57

Captulo 1 El Espacio Rn
Definicin. Sea A Rn . Se dice que A es un conjunto abierto si A est

formado exclusivamente por puntos interiores, es decir, si para todo


x A existe

V ( x ) tal que V ( x ) A.
En otras palabras, se dice que A es un conjunto abierto cuando ninguno de sus
puntos frontera pertenece a A.

Ejemplos:
1. A = {x R | 1 < x < 2 } es abierto: sus puntos frontera son x = 1 y x = 2, y
ninguno de estos pertenece a A.

2. A = { (x, y) R2 | 1 < x < 2 } es abierto: sus puntos frontera son todos


aquellos sobre las rectas x = 1 y x = 2, y ninguno de estos pertenece a A.

3. A = { (x, y) R2 | 1 < x < 2, y = 0 } no es abierto: todos los puntos de A


son puntos frontera.

58

1.5 Conjuntos abiertos, cerrados, acotados, compactos, convexos


4. A = {(x, y) R2 | x2 + y 2 < 1 } {(2, 2)} no es abierto: A contiene un punto
frontera, que es el punto (2, 2).

Teorema. a) La unin de conjuntos abiertos es un conjunto abierto. b) La


interseccin finita de conjuntos abiertos es un conjunto abierto.
En relacin con el inciso b) de este ltimo teorema es importante entender por
qu se requiere que la interseccin sea finita, y no infinita, para garantizar que el
conjunto resultante de la unin sea un conjunto abierto. Para ello, considera como
ejemplo el conjunto de intervalos In definidos por
1 1
,
,
n n
para todo n N. Es claro que cada In es un conjunto abierto; sin embargo la
interseccin de todos los conjuntos In es el conjunto
In =

In = I1 I2 In = {0} ,

nN

que no es un conjunto abierto (el nico elemento del conjunto es 0, que es un punto
frontera).
Definicin. Sea A Rn . Se dice que A es un conjunto cerrado si para todo
punto que no pertenece a A es posible encontrar una vecindad que no contenga
puntos de A.

59

Captulo 1 El Espacio Rn
Teorema. Un conjunto es cerrado si y slo si contiene a todos sus puntos
frontera.
Ejemplos:
1. A = {x R | 1 x 2 } es cerrado: sus puntos frontera son x = 1 y x = 2,
y ambos pertenecen a A.

2. A = { (x, y) R2 |(x 2)2 + (y 2)2 1 } es cerrado: sus puntos frontera


son todos los puntos de la circunferencia, que pertenecen a A.

3. A = { (x, y) R2 |(x 2)2 + (y 2)2 = 1 } es cerrado: todos sus puntos son


frontera.

4. A = {(x, y) R2 | x2 + y 2 1 } {(2, 2)} es cerrado: A contiene toda su


frontera, que consiste en los puntos de la circunferencia, junto con el punto
(2, 2).

60

1.5 Conjuntos abiertos, cerrados, acotados, compactos, convexos


5. A = R2+ = {(x, y) R2 | x, y 0 } es cerrado: A contiene a toda su frontera,
que son los ejes coordenados, en su parte no negativa.

6. A = {x R | x 2 } es cerrado: A contiene a toda su frontera, que es el punto


x = 2.

No necesariamente un conjunto debe ser abierto o cerrado. Existen conjuntos que no son ni abiertos ni cerrados, como es el caso de
A = {(x, y) R2 | 1 x < 5 y 1 y < 3 }, ya que ste contiene algunos de sus puntos frontera (de modo que no es abierto), pero no los contiene a
todos ellos (de modo que no es cerrado).

Teorema. Un conjunto es cerrado si y slo si su complemento es abierto.


A partir de este teorema se puede demostrar que existen dos (y slo dos)
conjuntos que son abiertos y cerrados a la vez, que son el conjunto Rn y el conjunto
vaco, . Para ello, nota primero que Rn es el complemento de , y viceversa. El
argumento es el siguiente. Por una parte, Rn es abierto, ya que no contiene puntos
frontera. En consecuencia, es cerrado. Por otra parte, es abierto, ya que no
contiene puntos frontera (de hecho, no contiene ningn punto). En consecuencia,
Rn es cerrado.
61

Captulo 1 El Espacio Rn
Teorema. a) La interseccin de conjuntos cerrados es un conjunto cerrado.
b) La unin finita de conjuntos cerrados es un conjunto cerrado.

De acuerdo con el inciso b) de este teorema, slo se puede asegurar que la unin
de cerrados es un conjunto cerrado cuando el nmero de estos conjuntos es finito.
El siguiente ejemplo ilustra cmo la unin infinita de conjunto cerrados puede
resultar en un conjunto abierto. Considera el conjunto de intervalos In definidos
por
In = [n, n],
para todo n N . Es claro que cada In es un conjunto cerrado. La unin de todos
ellos es el conjunto
In = I1 I2 In = R,
nN

que es un conjunto abierto (el conjunto de los reales no contiene puntos frontera).

Definicin. Un conjunto A Rn es un conjunto acotado si existe una vecindad


con centro en el origen que contiene totalmente a A, es decir, si existe > 0 tal que
A V (0).
En otras palabras, un conjunto es acotado si no contiene puntos arbitrariamente
alejados del origen.

Ejemplos:
1. A = {(x, y) R2 |1 < x < 2 , 1 < y < 2 } es acotado: cualquier vecindad
V (0) de radio > 8 contiene totalmente los puntos de A.

62

1.5 Conjuntos abiertos, cerrados, acotados, compactos, convexos


2. A = {x R | 1 < x 2 } es acotado: cualquier vecindad V (0) de radio > 2
contiene totalmente los puntos de A.

3. A = R2+ = { (x, y) R2 | x 0, y 0 } no es un conjunto acotado, pero s es


cerrado.

Los ejemplos anteriores muestran que un conjunto puede, o no, ser acotado,
independientemente de si es abierto, cerrado o ninguno de estos.

Definicin. Un conjunto A Rn es un conjunto compacto si A es cerrado y


acotado.
Ejemplos:
1. A = {x R | 1 x 2 } es compacto, ya que es cerrado y acotado.

2. A = {x R | 1 < x 2 } no es compacto, ya que es acotado, pero no cerrado.

63

Captulo 1 El Espacio Rn
3. A = {(x, y) R2 | 1 x 2 , 1 y 2 } es compacto, ya que es cerrado y
acotado.

4. A = {(x, y) R2 | 1 x 2 } no es compacto, ya que es cerrado, pero no


acotado (la variable y es libre).

Definicin. Un conjunto A Rn es un conjunto convexo si para cualquier par

de puntos
x 1,
x 2 A el segmento de recta que los une tambin est en A, es
decir, si

t
x 1 + (1 t)
x 2 A,
para todo 0 t 1.

En esta definicin, nota que la expresin

t
x 1 + (1 t)
x2 =
x 2 + t(
x1
x 2 ),
64

1.5 Conjuntos abiertos, cerrados, acotados, compactos, convexos


conocida como combinacin convexa, es la ecuacin paramtrica de la recta que

x 2 y est en la direccin
x1
x 2 ; al limitar el dominio de t,
contiene al punto

entre 0 y 1, se obtiene el segmento de recta entre los puntos


x1y
x 2.

Ejemplos:
1. A = {x R | 1 x 2 } es convexo.

2. A = {x R | 1 < x 2 } es convexo.

3. A = {x R | 1 x 2 } {x R | 3 x 4 } no es convexo.

4. A = {(x, y) R2 | x + y = 1 } es convexo.

65

Captulo 1 El Espacio Rn
5. A = {(x, y) R2 | x2 +y 2 1 } es convexo.

6. A = {(x, y) R2 | x2 +y 2 = 1 } no es convexo.

Los conjuntos convexos son muy importantes en economa. Por ejemplo,


similarmente al ejemplo 4, tenemos que las canastas (x1 , x2 ) en R2+ que
satisfacen una restriccin presupuestal de la forma I = p1 x1 + p2 x2 , con
I, p1 y p2 fijos, forman un conjunto convexo. Como un segundo ejemplo
podemos considerar las preferencias de un consumidor, dadas por el conjunto
P = (x1 , x2 ) R2+ | u((x1 , x2 )) u0 de las canastas (x1 , x2 ) que dan
una utilidad u mayor o igual a un valor u0 . Si suponemos que P es convexo

x ,
x P , entonces cualquier canasta intermedia
z = t
x + (1 t)
x ,
y
0 t 1, tambin dar una utilidad mayor o igual a u0 .

u(
x ) u0 y u(
x ) u0

u(z) u0

66

1.5 Conjuntos abiertos, cerrados, acotados, compactos, convexos


En los siguientes ejemplos se presenta cmo demostrar formalmente que un
conjunto es convexo.
Ejemplos:
1. Demuestra que el conjunto A = { (x, y) R2 | x + y = 1 } es convexo.

Sean
x = (x , y ),
x = (x , y ) A. Por lo tanto,
1

x1 + y1 = 1 y x2 + y2 = 1.

z = t
x 1 + (1 t)
Sea
x 2 , con 0 t 1, de modo que

z = t(x , y ) + (1 t)(x , y )
1

= (tx1 + (1 t)x2 , ty1 + (1 t)y2 )


= (z1 , z2 ).

As,
z1 + z2 = tx1 + (1 t)x2 + ty1 + (1 t)y2
= t(x1 + y1 ) + (1 t)(x2 + y2 )
= t(1) + (1 t)(1) = 1,

de donde concluimos que


z = (z1 , z2 ) A. Por lo tanto, A es convexo.

2. Demuestra que el conjunto A = { (x, y) R2 | a x b } es convexo.

Sean
x = (x , y ),
x = (x , y ) A. Por lo tanto,
1

a x1 b y a x2 b.

Sea
z = t
x 1 + (1 t)
x 2 , con 0 t 1, de modo que

z = t(x , y ) + (1 t)(x , y )
1

= (tx1 + (1 t)x2 , ty1 + (1 t)y2 )


= (z1 , z2 ).

Como t 0 y 1 t 0, por lo tanto


ta tx1 tb y (1 t)a (1 t)x2 (1 t)b.
67

Captulo 1 El Espacio Rn
Sumando ambas expresiones tenemos
es decir,

ta + (1 t)a tx1 + (1 t)x2 tb + (1 t)b,

y, por lo tanto,

a tx1 + (1 t)x2 b,

a z1 b.

As, z = (z1 , z2 ) A, de modo que A es convexo.

Teorema. La interseccin de conjuntos convexos es un conjunto convexo.


Demostracin:
Sean A y B dos conjuntos convexos. Si A B = , entonces A B es
convexo (el vaco es un conjunto convexo). Supongamos que A B = y sean

x,
x A B. Por lo tanto,
x,
x Ay
x ,
x B. Sea
z = t
x + (1 t)
x ,

con 0 t 1. Como A es convexo y x , x A, por lo tanto

z = t
x + (1 t)
x A.

Como B es convexo y
x ,
x B, por lo tanto
x
Por lo tanto,

z = t
x + (1 t)
x B.

de modo que A B es convexo.

z A B,

Por ltimo, es importante sealar que la unin de conjuntos convexos no es un


conjunto convexo, en general.
68

Captulo 2
Funciones de varias variables
En este captulo extenderemos la definicin de funcin al caso de varias
variables, presentando diversos conceptos relacionados, tales como el de
conjuntos de nivel de la funcin. Posteriormente, presentaremos algunas
superficies cuadrticas de inters. Concluiremos estudiando los conceptos de
lmite y continuidad.

2.1 Dominio e imagen. Representacin geomtrica


Definicin. Sea S Rn . Una funcin real, o campo escalar, f : S R,
es una regla de correspondencia que a cada elemento (x1 , x2 , . . . , xn ) S
le asigna un nico nmero w = f(x1 , x2 , . . . , xn ) R. El conjunto S es el
dominio de f y R es el contradominio de f.
En la expresin w = f (x1 , x2 , . . . , xn ), los elementos (x1 , x2 , . . . , xn ) S
son las variables independientes, y w R es la variable dependiente. As,
por ejemplo, para la funcin f : R2 R, definida por f(x, y) = x2 + y 2 ,
las variables independientes son todas las parejas (x, y) R2 y la variable
dependiente es z R, que depende de las anteriores a travs de z = x2 + y 2 .
Cuando el dominio de una funcin f (x1 , x2 , . . . , xn ) no se especifica
a priori, debe entenderse como tal al conjunto ms grande de elementos
(x1 , x2 , . . . , xn ) Rn para los que f toma valores en R (por ejemplo, que no
se divida por cero o se extraiga la raz cuadrada de un nmero negativo). A
este conjunto se le conoce como el dominio natural Df de f, dado por
Df = { (x1 , x2 , . . . , xn ) Rn | f (x1 , x2 , . . . , xn ) R } .
Por otra parte, la imagen o rango If de la funcin f es el conjunto de valores
w en el contradominio, R, obtenidos al aplicar la regla f a los elementos de
Df , es decir,
If = { w R | w = f (x1 , x2 , . . . , xn ), para todo (x1 , x2 , . . . , xn ) Df } .
69

Captulo 2 Funciones de varias variables


Ejemplos:
1
una funcin en R3 . El dominio natural
2
2
x +y
Df se obtiene al pedir que el denominador sea diferente de cero (x2 + y 2 = 0).
As,
Df = (x, y) R2 x2 + y 2 = 0 = R2 \{(0, 0)}.
Como f slo puede tomar valores positivos, entonces su imagen If es el
conjunto
If = { z R | z > 0 } = R+ .
1
2. Sea z = f (x, y), con f (x, y) =
una funcin en R3 . Para
2
2
9x y
encontrar Df pedimos que el denominador sea diferente de cero (9x2 y 2 = 0)
y el radicando sea no negativo (9 x2 y 2 0), es decir, 9 x2 y 2 > 0. As,
1. Sea z = f (x, y), con f(x, y) =

Df =

(x, y) R2 x2 + y 2 < 9

Como f slo puede tomar valores negativos y no mayores que 1/3, entonces
su imagen If es el conjunto
If = { z R | z 1/3 } .
3. Sea z = f (x, y), con f (x, y) = ln(x + y) una funcin en R3 . En este caso,
Df =
(x, y) R2 | x + y > 0
If = { z R } = R.
4. Sea w = f (x, y, z), con f (x, y, z) =

x ln z
una funcin en R4 . En este caso,
y

Df =
(x, y, z) R3 | y = 0, z > 0
If = { w R } = R.
5. Sea w = f (x, y, z), con f (x, y, z) = 1
este caso,

1 x2 y 2 una funcin en R4 . En

Df =
(x, y, z) R3 x2 + y 2 1
If = { w R | 0 w 1 } .
En economa hay varios ejemplos de funciones, como las que se presentan a
continuacin.
70

2.1 Dominio e imagen. Representacin geomtrica


1. Las funciones de produccin Cobb-Douglas, P : R2+ R, dadas por
P (L, K) = AL K 1 ,

en donde P denota la produccin, L el trabajo y K el capital, y donde A > 0 y


0 < < 1 son constantes.
2. Una funcin de costo lineal, C : R2+ R, dada por
C(L, K) = wL + rK,
donde C denota el costo, L el trabajo y K el capital, y donde w > 0 y r > 0
denotan el salario y la tasa de inters, respectivamente.
3. Las funciones de utilidad, u : Rn++ R, dadas por
u(x1 , x2 , . . . , xn ) = 1 ln x1 + 2 ln x2 + + n ln xn
= ln(x1 1 x2 2 . . . xnn ),

en donde u denota la utilidad para una canasta (x1 , x2 , . . . , xn ) de n bienes, con


xi > 0, y donde cada i es constante, con 0 < i < 1 y 1 + 2 + . . . + n = 1.
Geomtricamente, la funcin f : S Rn R representa un objeto en
R . Si n = 1, la ecuacin y = f (x) representa una curva en R2 . Si n = 2,
la ecuacin z = f (x, y) representa una superficie en R3 . Si n 3, la ecuacin
w = f (x1 , x2 , . . . , xn representa una hipersuperficie en Rn+1 (sin representacin
grfica).
n+1

Ejemplos:
1. La ecuacin 2x + 3y + 6z = 12 puede pensarse como una funcin lineal
1
1
f : R2 R, dada por z = f (x, y) = 2 x y, cuya grfica corresponde a
3
2
un plano en R3 .
Df =
(x, y) R2 = R2
If = { z R } = R.

71

Captulo 2 Funciones de varias variables


2. La ecuacin x2 + y 2 + z 2 = 4, con z 0, puede pensarse como una funcin
f : Df R2 R, dada por z = f (x, y) = 4 x2 y 2 , cuya grfica
corresponde a la parte superior de una esfera en R3 .
Df =
(x, y) R2 x2 + y 2 4
If = { z R |0 z 2 } .

2.2 Conjuntos de nivel


Definicin. Un conjunto de nivel de una hipersuperficie w = f(x1 , x2 , . . . , xn ) en
Rn+1 es el conjunto de puntos (x1 , x2 , . . . , xn ) Df tales que w toma un valor
constante c, es decir,
f (x1 , x2 , . . . , xn ) = c.
En particular, si n = 2 el conjunto es una curva de nivel y si n = 3 es una superficie
de nivel.
Los conjuntos de nivel pertenecen al mismo espacio que el dominio de la
funcin. As, si f est en Rn+1 , sus conjuntos de nivel estn en Rn .

72

2.2 Conjuntos de nivel


Ejemplos:
1. Identifica los conjuntos de nivel de la funcin z = f(x, y), con f : R2 R
definida por f (x, y) = x2 + y 2 . Cul de estos contiene al punto P (3, 4)?
Como veremos en la seccin 2.3, la superficie z = x2 + y 2 es un paraboloide en
R3 , segn se ilustra en la figura de la izquierda. En la figura de la derecha se
2
muestran algunas de sus curvas de nivel en R
, dadas por las circunferencias

2
2
x + y = c, con centro en el origen y radio c, c 0.

La curva de nivel de f que contiene a P (3, 4) es tal que (3)2 +(4)2 = 25 = c.


As, la curva de nivel buscada es x2 + y 2 = 25.

2. Sea S = (x, y) R2+ | x + y 2 . Identifica los conjuntos de nivel de la


funcin z = f (x, y), con f : S R definida por f (x, y) = 2 x y.

La superficie z = 2 x y representa la porcin del plano x + y + z = 2


correspondiente al primer octante de R3 , como se muestra en la figura de la
izquierda. En la figura de la derecha se muestran algunas de sus curvas de nivel
en R2 , dadas por los segmentos de recta x + y = 2 c, con 0 c 2.

73

Captulo 2 Funciones de varias variables


3. Identifica los conjuntos de nivel de la funcin de produccin Cobb-Douglas
Q = P (L, K), con P : R2+ R definida por P (L, K) = L1/2 K 1/2 .
La superficie Q = L1/2 K 1/2 tiene la forma de una tienda de campaa en
R3 , como se ilustra en la figura de la izquierda. En la figura de la derecha se
muestran algunas de sus curvas de nivel en R2 , o isocuantas, que representan
hiprbolas de la forma K = c2 /L en R2+ , con c > 0.

4. Identifica los conjuntos de nivel de la funcin de utilidad u = u(x, y), con


1
1
u : R2++ R definida por u(x, y) = ln x + ln y.
2
2
Nota que u(x, y) = ln x1/2 y 1/2 , de modo que u es el logaritmo de una funcin
como la del ejemplo 3. Sus curvas de nivel en R2 , o curvas de indiferencia, son
hiprbolas de la forma y = d/x, con d = e2c , que son similares a las del ejemplo
anterior, pero estn en otra escala.
5. Identifica los conjuntos de nivel de la funcin y = f(x), con f : R R
definida por f (x) = x + 1.
La curva y = x + 1 representa una recta en R2 , como se muestra en la figura de
la izquierda. En la figura de la derecha se muestran algunos de sus conjuntos de
nivel en R, dados por los puntos x = c 1 en R.

74

2.3 Superficies cuadrticas


6. Identifica los conjuntos de nivel de la funcin w = f(x, y, z), con f : R3 R
definida por f (x, y, z) = x2 + y 2 + z 2 .
La funcin w = x2 + y 2 + z 2 representa una hipersuperficie en R4 , de modo
que no podemos representarla grficamente. Sus conjuntos de nivel son las
3
2
2
2
superficies
en R , dadas por las esferas x + y + z = c con centro en el origen
y radio c, c 0.

7. Determina la superficie de nivel de la funcin f (x, y, z) = ln(2 x y) en R4


que contiene al punto P (1, 0, 3).

Las superficies de nivel de f son los planos x + y = 2 ec en R3 . En particular,


el plano que contiene al punto P (1, 0, 3) es tal que 1 + 0 = 2 ec , es decir,
c = 0. As, la superficie de nivel buscada es x + y = 1 (con z libre).

2.3 Superficies cuadrticas


Definicin. Una superficie es un conjunto de puntos (x, y, z) R3 que satisfacen
una relacin de la forma F (x, y, z) = 0.
As, por ejemplo, la ecuacin x2 y 2 + z 2 = 1 representa una superficie en R3 .
Cabe sealar que no toda superficie es una funcin, como veremos a lo largo de
esta seccin.
75

Captulo 2 Funciones de varias variables


Definicin. Las trazas de una superficie en R3 son las curvas formadas por la
interseccin de la superficie con cada uno de los planos coordenados.
Por ejemplo, para el plano 2x + y + 3z = 12 en R3 , su traza xy es la curva
2x + y = 12,
obtenida de la interseccin esta superficie con el plano z = 0. Similarmente, su
traza yz es
y + 3z = 12,
obtenida a partir de la interseccin con el plano x = 0, y su traza xz es
2x + 3z = 12,
obtenida a partir de la interseccin con el plano y = 0.

Algunas superficies famosas en R3


A) Planos
Como ya vimos, un plano es cualquier conjunto de puntos de la forma
=

(x, y, z) R3 | ax + by + cz = d

donde a, b, c, d son constantes. En la siguiente figura se muestra la grfica del


plano, para a, b, c, d = 0.

76

2.3 Superficies cuadrticas


B) Esferas
Una esfera S de radio r y centro en (x0 , y0 , z0 ) es un conjunto de puntos de la
forma
S=

(x, y, z) R3 (x x0 )2 + (y y0 )2 + (z z0 )2 = r2

Claramente, si r = 0 el nico elemento de S sera el punto (x0 , y0 , z0 ).

Por ejemplo, la ecuacin (x 1)2 + y 2 + (z + 3)2 = 4 representa una esfera de


radio 2 y centro en el punto (1, 0, 3).

C) Cilindros
Definicin. Sea C una curva plana y sea L una recta que no est en el plano de
C. Un cilindro es la superficie formada por el conjunto de todas las rectas paralelas
a L que cortan a C. A C se le llama la curva generatriz, o directriz, del cilindro y a
las rectas paralelas se les llama rectas generatrices. Un cilindro recto es aquel tal
que L es perpendicular al plano de C.

En el caso particular de un cilindro paralelo a alguno de los ejes coordenados, la


ecuacin correspondiente al cilindro no contiene a la variable de ese eje.
Ejemplos:
1. Esboza la grfica de x2 + z 2 = 1 en R3 .
Como en esta ecuacin no aparece la variable y, se trata de una superficie en
donde esa variable es libre. La ecuacin representa un cilindro circular que
77

Captulo 2 Funciones de varias variables


se extiende a lo largo del eje y, cuya curva generatriz C es la circunferencia
x2 + z 2 = 1.

2. Esboza la grfica de z = y 2 en R3 .
Como en esta ecuacin no aparece la variable x, se trata de una superficie en
donde esa variable es libre. La ecuacin representa un cilindro parablico que
se extiende a lo largo del eje x, cuya curva generatriz C es la parbola z = y 2 .

3. Esboza la grfica de y = senx en R3 .


Como en esta ecuacin no aparece la variable z, se trata de una superficie en
donde esa variable es libre. La ecuacin representa un cilindro senoidal, cuya
curva generatriz C es la funcin y = senx, y que se extiende a lo largo del eje z:

78

2.3 Superficies cuadrticas


D) Superficies cuadrticas
Para estudiar las superficies cuadrticas se necesita conocer el tema de cnicas.
El lector puede encontrar una breve discusin sobre las ecuaciones y grficas de las
cnicas en el Apndice A.
Definicin. Una superficie cuadrtica es la grfica en R3 de una ecuacin de
segundo grado en las variables x, y, z, de la forma
Ax2 + By 2 + Cz 2 + Dxy + Eyz + F xz + Gx + Hy + Iz + J = 0,
con A, B, . . . , J constantes, y en donde A = 0, B = 0 o C = 0.
Las esferas y algunos tipos de cilindros son casos particulares de superficies
cuadrticas, como se muestra en los siguientes ejemplos.
Ejemplos:
1. La ecuacin y 2 + 4z 2 = 4 describe a un cilindro elptico, que corre a lo largo del
eje x.

2. La ecuacin x2 y 2 = 1 describe a un cilindro hiperblico, que corre a lo


largo del eje z.

A continuacin presentamos algunas de las superficies cuadrticas ms notables,


que en general no representan funciones en R3 . Se discutirn los casos ms
simples, en donde las superficies estn centradas en el origen, o bien, tendrn a
los ejes coordenados como eje de simetra. En todos los casos, supondremos que
a, b, c = 0.
79

Captulo 2 Funciones de varias variables


1. Elipsoide:
x2 y 2 z 2
+ 2 + 2 = 1.
a2
b
c
x2 y 2
+ 2 =1
a2
b
x2 z 2
Traza xz: Elipse 2 + 2 = 1
a
c
2
y
z2
Traza yz: Elipse 2 + 2 = 1
b
c
Traza xy: Elipse

Curvas de nivel (z = K, |K| < |c| ):


x2

Elipses
a2

K2
1 2
c

y2

+
b2

K2
1 2
c

=1

2. Paraboloide elptico:
z
x2 y 2
= 2 + 2.
c
a
b
Traza xy: El origen
Traza xz: Parbola z =

c
a2
c
Traza yz: Parbola z = 2
b

x2
y2

Curvas de nivel (z = K):


Elipses

x2
K
a2
c

y2
K
b2
c

=1

Cuando a = b se trata de un paraboloide circular o paraboloide de revolucin.

Otras representaciones estn dadas por las ecuaciones


con respecto al eje x) y

x
y2 z 2
= 2 + 2 (simetra
a
b
c

y
x2 z 2
= 2 + 2 (simetra con respecto al eje y).
b
a
c
80

2.3 Superficies cuadrticas


3. Hiperboloide de una hoja:
x2 y 2 z 2
+ 2 2 = 1.
a2
b
c
x2 y 2
+ 2 =1
a2
b
2
x
z2
Traza xz: Hiprbola 2 2 = 1
a
c
y2 z 2
Traza yz: Hiprbola 2 2 = 1
b
c
Traza xy: Elipse

Curvas de nivel (z = K):


x2

Elipses
a2

K2
1+ 2
c

y2

+
b2

Otras representaciones son

K2
1+ 2
c

=1

z 2 y 2 x2
x2 z 2 y 2
+

=
1
y
+
2 = 1.
c2
b2
a2
a2 c2
b

4. Hiperboloide de dos hojas:


z 2 x2 y 2
2 2 =1
c2
a
b

Traza xy: No existe


z 2 x2
2 =1
c2
a
2
z
y2
Traza yz: Hiprbola 2 2 = 1
c
b

Traza xz: Hiprbola

Curvas de nivel (z = K, |K| |c| ):


Elipses
a2

x2
K2
1
c2

+
b2

Otras representaciones son

y2
K2
1
c2

=1

x2 y 2 z 2
y 2 x2 z 2

=
1
y
2 2 = 1.
a2
b2
c2
b2
a
c
81

Captulo 2 Funciones de varias variables


5. Paraboloide hiperblico:
z
x2 y 2
= 2 2
c
a
b
Traza xy: Rectas

x
y
=
b
a

c
a2

Traza xz: Parbola z =

x2

c
b2

Traza yz: Parbola z =

y2

Curvas de nivel (z = K):


Hiprbolas

x2
K
a2
c

y2
K
b2
c

Otras representaciones son

=1

x
y2 z 2 y
x2 z 2
= 2 2 y = 2 2.
a
b
c
b
a
c

6. Cono elptico:
z2
x2 y 2
+ 2 = 2
a2
b
c
Traza xy: El origen
c
Traza xz: Rectas z =
x
a
c
Traza yz: Rectas z =
y
b
Curvas de nivel (z = K):
Elipses
a2

x2
K2
c2

+
b2

y2
K2
c2

=1

Cuando a = b se trata de un cono circular.


Otras representaciones son

y2 z2
x2 x2 z 2
y2
+
=
y
+
=
.
b2
c2
a2 a2
c2
b2
82

2.4 Lmites y continuidad

2.4 Lmites y continuidad


En esta seccin definiremos los conceptos de lmite y continuidad, necesarios para
establecer el significado de diferenciabilidad para funciones de varias variables,
que se presenta en el captulo 3. Aunque los resultados que aqu presentamos
son vlidos en general para funciones cuyo dominio est en Rn , los ejemplos y
mtodos discutidos se centrarn al caso de funciones con dominio en R2 .
El concepto de lmite para funciones de varias variables es una extensin al de
funciones de una variable. La siguiente figura ilustra el significado geomtrico de
que una funcin de dos variables, z = f (x, y), tenga un lmite L cuando el punto
(x, y) tiende a un punto dado (x0 , y0 ) en el dominio de f .

Cuando ese lmite L existe, utilizamos la notacin


lm

f (x, y) = L.

(x,y)(x0 ,y0 )

Desde el punto de vista formal, el lmite de f se define de la siguiente manera.

Definicin. Sea f una funcin definida en todo punto


x del interior de una

vecindad con centro en x 0 , excepto quiz en x 0 . Se dice que f tiene lmite L

cuando
x tiende a
x 0 , y se escribe

lm f (
x ) = L,

x
x0

si para cada nmero > 0 existe un correspondiente nmero () > 0 tal que para
todo x en el dominio de f

0 < ||
x
x 0 || <

83

|f(
x ) L| < .

Captulo 2 Funciones de varias variables

Cabe sealar que la definicin de lmite tambin se aplica al caso de puntos

frontera
x 0 que no estn en el dominio, siempre y cuando los puntos
x s lo estn.
Ejemplos:
1. Demuestra formalmente que

lm

x = 0.

(x,y)(0,0)

Para cada nmero > 0 arbitrario queremos encontrar un correspondiente


nmero () tal que

0<
x0 <

|x0| < ,

es decir,
0<

x2 + y 2 <

Para ello, nota que

|x| = x2
por lo que simplemente puedes tomar

|x| < .

x2 + y 2 < ,

() = .
2. Demuestra formalmente que

x2

lm

= 0.

x2 + y 2

(x,y)(0,0)

Para cada > 0 buscamos una () tal que

0<
x0 <

x2
x2 + y 2

es decir,
0<

x2 + y 2 <

0 < ,

x2

x2 + y 2

< .

Para ello, nota que


0<

x2
x2 + y 2

x2 + y 2
x2 + y 2
84

x2 + y 2 < ,

2.4 Lmites y continuidad


por lo que puedes tomar
() = .
2x2 y
3. Demuestra formalmente que lm
= 0.
(x,y)(0,0) x2 + y 2
Para cada > 0 buscamos una () tal que

0<
x0 <

2x2 y
0 < ,
x2 + y 2

es decir,
0<

x2 + y 2 <

2x2 y
< .
x2 + y 2

Como
por lo tanto,

y2

0 |y| =

x2 + y 2 < ,

2x2 y
2x2 y

= 2 |y| < 2.
x2 + y 2
x2
De esta manera, puedes tomar

() = .
2
Propiedades de los lmites

lm f(
x ) = L1 y
lm g(
x ) = L2 , entonces
Si


xx0

xx0

1. Regla de la suma:

lm [f (
x ) + g(
x )] = L1 + L2


xx0

2. Regla del mltiplo constante:

lm [k f(
x )] = kL1 , k R


xx0

3. Regla del producto:

lm [f (
x )g(
x )] = L1 L2


xx0

4. Regla del cociente:

f (
x)
L1
l
m
=
, L2 = 0

L2
x x 0 g( x )
5. Regla de la potencia:
m/n

lm [f (
x )]
= [L1 ]m/n , m, n Z, n = 0, si [L1 ]m/n R


xx0

85

Captulo 2 Funciones de varias variables


Ejemplos:
1.
2.
3.

lm

(x,y)(1,3)

lm

(x,y)(3,4)

lm

(x,y)(1,0)

(2x + y) = 2(1) + 3 = 1.
x2 + y 2 =

32 + 42 = 5.

x2 3xy
10
=
= 1.
2
3
xy 2x + x
02+1

x+ y
x2 xy
(x2 xy)

4.
lm

= lm

(x,y)(0,0)
x y (x,y)(0,0)
x y
x+ y

x (x y) x + y

= lm
= lm
x x+ y
(x,y)(0,0)
(x,y)(0,0)
(x y)

= 0.

Prueba de las dos trayectorias para demostrar la no existencia de un lmite

Si una funcin f (
x ) tiene lmites diferentes a lo largo de dos trayectorias

x tiende a
x 0 , entonces el lmite
lm
f (
x ) no existe.
distintas a medida que

xx0

En el caso de funciones f de una variable, la no existencia del lmite se prueba


simplemente el lmite de f por las nicas dos trayectorias posibles, a saber, x x
0
y x x+
0 , y mostrando que ambos lmites laterales son distintos:
lm f (x) = L1 = L2 = lm+ f (x)

xx
0

xx0

86

2.4 Lmites y continuidad


La prueba de las dos trayectorias para el caso de funciones f de dos variables
presenta una mayor dificultad que en el caso anterior, ya que en este caso existe
una infinidad de trayectorias posibles en el plano para llegar de (x, y) a (x0 , y0 ).

Ejemplos:
x2 3y 2
en el punto (0, 0).
x2 + 2y 2
i) Tomando el lmite a lo largo del eje x (y = 0):

1. Demuestra que no existe el lmite de f(x, y) =

lm

(x,y)(0,0)

f (x, y) = lm f (x, 0)
x0

x2 0
x0 x2 + 0
= lm 1 = 1.

= lm

x0

ii) Tomando el lmite a lo largo del eje y (x = 0):

lm

(x,y)(0,0)

f (x, y) = lm f(0, y)
y0

0 3y 2
y0 0 + 2y 2
3
3
= .
= lm
y0
2
2
= lm

Como los lmites son distintos, no existe


87

lm

(x,y)(0,0)

x2 3y 2
.
x2 + 2y 2

Captulo 2 Funciones de varias variables


xy
en el punto (0, 0).
+ y2
i) Tomando el lmite a lo largo de los ejes coordenados:

2. Demuestra que no existe el lmite de f (x, y) =

lm

(x,y)(0,0)

f (x, 0) = 0 y

lm

(x,y)(0,0)

x2

f(0, y) = 0.

ii) Tomando el lmite a lo largo de las rectas y = mx:

lm

(x,y)(0,0)

f(x, y) = lm f(x, mx)


x0

x(mx)
+ (mx)2
m
= lm
x0 1 + m2
m
=
= 0.
1 + m2
= lm

x0 x2

Como hay un lmite distinto para cada m, no existe

lm

(x,y)(0,0) x2

xy
.
+ y2

x3 y
en el punto (0, 0).
x6 + y 2
i) Tomando el lmite a lo largo de los ejes coordenados:

3. Demuestra que no existe el lmite de f (x, y) =

lm

(x,y)(0,0)

f(x, 0) = 0 y

lm

(x,y)(0,0)

f (0, y) = 0.

88

2.4 Lmites y continuidad


ii) Tomando el lmite a lo largo de las rectas y = mx:

lm

(x,y)(0,0)

f (x, y) = lm f (x, mx)


x0

x3 (mx)
x0 x6 + (mx)2
mx2
= lm 4
= 0.
x0 x + m2
= lm

iii) Tomando el lmite a lo largo de las parbolas y = kx2 :

lm

(x,y)(0,0)

f (x, y) = lm f (x, kx2 )


x0

x3 (kx2 )
x0 x6 + (kx2 )2
kx
= lm 2
= 0.
x0 x + k 2
= lm

iv) Tomando el lmite a lo largo de las cbicas y = x3 :

lm

(x,y)(0,0)

f (x, y) = lm f (x, x3 )
x0

x3 (x3 )
= lm 6
x0 x + (x3 )2

= lm
=
= 0.
2
x0 1 +
1 + 2
Como el lmite es distinto para cada , no existe

lm

(x,y)(0,0)

x3 y
.
x6 + y 2

Definicin. Una funcin f(


x ) es continua en un punto
x 0 , si

1. f est definida en x 0 ,

2. lm f (
x ) existe,

x
x0

3.
lm f (
x ) = f (
x 0 ).

xx0

La funcin es continua si lo es en cada punto de su dominio.


89

Captulo 2 Funciones de varias variables


Ejemplos:
1. Muestra que f (x, y) = 2xy 2 + 3x es continua en (2, 1).
La funcin es polinomial, de modo que est definida para todo punto de
R2 , y en particular en el punto (2, 1), con f(2, 1) = 10. Por otra parte,
lm
(2xy 2 + 3x) = 10, de modo que el lmite existe. Por ltimo, como
(x,y)(2,1)

lm

(x,y)(2,1)

(2xy 2 + 3x) = f (2, 1), por lo tanto f (x, y) = 2xy 2 + 3x es

continua en (2, 1).


2. Muestra que la siguiente funcin es continua en cada punto, excepto en el
origen:
x3 y
(x, y) = (0, 0)
x6 +y2 ,
f (x, y) =

0,
(x, y) = (0, 0).
La funcin es continua en cada punto (x, y) = (0, 0), ya que sus valores estn
dados por una funcin racional de x y y. Sin embargo, como ya mostramos en
un ejercicio anterior, la funcin no tiene lmite en el origen. Por lo tanto, la
funcin es continua en cada punto, excepto en el origen.

90

Captulo 3
Diferenciacin
En este captulo extendemos el concepto de diferenciacin para el caso de
funciones de varias variables.

3.1 Derivadas parciales. Interpretacin geomtrica


Por simplicidad, aqu nos restringiremos al caso de funciones z = f (x, y) con
dominio en R2 , aunque los resultados pueden ser fcilmente generalizados al
caso de funciones con dominio en Rn .
Definicin. La derivada parcial con respecto a x de la funcin continua
f(x, y) en un punto interior (x0 , y0 ) de su dominio est dada por
f
x

f (x0 + h, y0 ) f(x0 , y0 )
,
h0
h

= fx (x0 , y0 ) = lm
(x0 ,y0 )

cuando este lmite existe. Similarmente, la derivada parcial con respecto a y


de f en (x0 , y0 ) est dada por
f
y

f (x0 , y0 + k) f (x0 , y0 )
.
k0
k

= fy (x0 , y0 ) = lm
(x0 ,y0 )

91

Captulo 3 Diferenciacin
Las derivadas parciales fx y fy dan la razn de cambio instantnea de la
funcin f (x, y) en el punto (x0 , y0 ), en las direcciones de los vectores base y ,
respectivamente. En otras palabras, la derivada parcial fx es la pendiente de la recta
tangente a la curva z = f (x, y0 ) en el punto P (x0 , y0 , f (x0 , y0 )) del plano y = y0 .
Asimismo, la derivada parcial fy es la pendiente de la recta tangente a la curva
z = f(x0 , y) en el punto P (x0 , y0 , f (x0 , y0 )) del plano x = x0 .
A partir de la definicin, a continuacin determinamos la derivada parcial fx de
la funcin f(x, y) = x2 y 3 :
x2 y 3
(x + h)2 y 3 x2 y 3
= lm
h0
x
h
3
2xhy + h2 y 3
= lm
h0
h
= lm 2xy 3 + hy 3
h0

= 2xy 3 .
Nota que este resultado es equivalente a obtener directamente la derivada de f con
respecto a x, como si y estuviera fija:
x2 y 3
x2
= y3
= y 3 (2x) = 2xy 3 .
x
x
Es posible demostrar que esto es vlido en general, es decir, para determinar la
derivada parcial fx de una funcin z = f(x, y) simplemente se toma la derivada
de f con respecto a x, manteniendo fijo el valor de y. Similarmente, para obtener
la derivada parcial fy de la funcin, se toma la derivada de f con respecto a y,
manteniendo fijo el valor de x.
Ejemplos:
2y 2
. Determina las derivadas parciales fx y fy .
x
Las derivadas parciales fx y fy estn dadas por

1. Sea f (x, y) = x3 y +

fx =

fy =

2y 2
x3 y +
x
x

x3 y +

2y 2
x

=y

x3 + 2y 2
x
x

= x3

(y) +
y
92

1
x

1
x

= 3x2 y

2y 2
,
x2

4y
2y 2 = x3 + .
y
x

3.1 Derivadas parciales. Interpretacin geomtrica


2. Sea z = x sen(xy). Determina las derivadas parciales zx y zy .
Las derivadas parciales zx y zy estn dadas por
[x sen(xy)]
sen(xy)
x
=x
+
sen(xy)
x
x
x
= x (cos(xy) y) + 1 sen(xy) = xy cos(xy) + sen(xy),

zx =

[x sen(xy)]
sen(xy)
x
=x
+
sen(xy)
y
y
y
= x (cos(xy) x) + 0 sen(xy) = x2 cos(xy).

zy =

3. Encuentra la pendiente de la recta tangente a la superficie z = 9 x2 y 2 en el


punto P (2, 1, 4) del plano x = 2.
La pendiente de la recta tangente a la superficie en P (2, 1, 4) es

z
y

(2,1)

= 2y|(2,1) = 2.

4. Sea u(x1 , x2 ) = ln(x1 1 x2 2 ) la funcin de utilidad para una canasta de dos


bienes, con x1, x2, 1 , 2 > 0. Encuentra las utilidades marginales ux1 y ux2 .
Las utilidades marginales estn dadas por
ln(x1 1 x2 2 )
(1 ln x1 + 2 ln x2 )
1
=
= ,
x1
x1
x1
1 2
ln(x1 x2 )
(1 ln x1 + 2 ln x2 )
2
=
=
= .
x2
x2
x2

ux1 =
ux2

5. Sea P (L, K) = L1/2 K 1/2 una funcin de produccin Cobb-Douglas. Encuentra


los productos marginales PL y PK .
En este caso, se tiene simplemente
PL =

L1/2 K 1/2
1
1
= L1/2 K 1/2 =
L
2
2

K
L

1/2

1/2
L1/2 K 1/2
1 1/2 1/2 1 L
PK =
= L K
=
.
K
2
2 K
c1 1
6. Para la funcin de utilidad u(c, ) =
determina uc y u .
1

93

Captulo 3 Diferenciacin

c1 1
= c ,
c
1
c1 1
(1 ) c1 ln c + (c1 1)
=
=

1
(1 )2

uc =
u

7. Para la funcin de produccin P (L, K, 1 , 2 , ) = (1 L + 2 K )1/


determina: a) P/K, b) P/1 y c) P/.
a)La parcial P/K est dada directamente por
(1 L + 2 K )1/
P
=
K
K
1
(1 L + 2 K )
(1 L + 2 K )(1/)1
=

K
1
=
(1 L + 2 K )(1/)1 2 K 1

= 2 K 1 (1 L + 2 K )

b)Similarmente, la parcial P/1 es


P
(1 L + 2 K )1/
=
1
1
1
(1 L + 2 K )
(1 L + 2 K )(1/)1
=

1
1
=
(1 L + 2 K )(1/)1 (L )

1
L
=
(1 L + 2 K )

c)Para determinar P/ es necesario utilizar derivacin logartmica, ya que la


variable aparece tanto en la base como en la potencia. Para ello, partimos de
ln P (L, K) = ln(1 L + 2 K )1/ =

1
ln(1 L + 2 K ),

de modo que
1 P
P

1 (1 L + 2 K )/
1

ln(1 L + 2 K )
(1 L + 2 K )
2
1 1 L ln L + 2 K ln K
1
=
2 ln(1 L + 2 K ),

(1 L + 2 K )

94

3.1 Derivadas parciales. Interpretacin geomtrica


en donde se utiliz la derivada de un producto y la frmula de la derivada de ax
(para obtener L / y K /). Finalmente,
P

1 1 L ln L + 2 K ln K
1
2 ln(1 L + 2 K )

(1 L + 2 K )

1 1 L ln L + 2 K ln K
1
= (1 L + 2 K )1/
2 ln(1 L + 2 K ) .

(1 L + 2 K )

= P

Similarmente al caso de funciones de una variable, es posible definir derivadas


parciales de orden superior y mixtas para funciones de varias variables. En
particular, para una funcin f (x, y) de dos variables hay 4 posibles derivadas
parciales de orden 2, a saber
fxx =

f
x

2f
,
x2

fxy =

f
x

2f
,
yx

f
2f
f
2f
,
fyy =
=
= 2.
x y
xy
y y
y
Asimismo, hay 8 posibles derivadas parciales de orden 3, del tipo
fyx =

fxxx =

f
x

3f

, fxxy =
3
x
y

f
x

3f
, etc...
yx2

y habran 2n posibles derivadas parciales de orden n.


Ejemplos:
1. Verifica que z = ln(x2 + y 2 ) satisface la ecuacin de Laplace,
Como

2x
z
= 2
,
x
x + y2

2z 2z
+
= 0.
x2 y 2

z
2y
= 2
,
y
x + y2

por lo tanto
2z

=
x2
x
2z

=
2
y
y
As,

z
x
z
y

2x
x x2 + y 2

2y
=
2
y x + y 2
=

2(y 2 x2 )
(x2 + y 2 )2
2(x2 y 2 )
=
.
(x2 + y 2 )2
=

2z 2z
2(y 2 x2 ) 2(x2 y 2 )
+
=
+
= 0.
x2 y 2
(x2 + y 2 )2
(x2 + y 2 )2
95

Captulo 3 Diferenciacin
2. Encuentra todas las derivadas parciales de segundo orden de h(r, ) = r3 e/2 .
Como
hr (r, ) = 3r2 e/2
1
h (r, ) = r3 e/2 ,
2
por lo tanto,

(hr ) = 6re/2
r

3
hr (r, ) =
(hr ) = r2 e/2

3
hr (r, ) =
(h ) = r2 e/2
r
2

1 3 /2
(h ) = r e
h (r, ) =
.

4
hrr (r, ) =

3. Encuentra todas las derivadas parciales de segundo orden de f (x, y) = y ln


Conviene reescribir f como
f (x, y) = y (ln x ln y)

Como
fx (x, y) = y

1
x

y
x

fy (x, y) = (ln x ln y) + y

1
y

= ln x ln y 1,

por lo tanto,

y
(fx ) = 2
x
x

1
fxy (x, y) =
(fx ) =
y
x

1
fyx (x, y) =
(fy ) =
x
x

1
(fy ) = .
fyy (x, y) =
y
y
Observamos que en los ejemplos 2 y 3 las derivadas mixtas son iguales
(hr = hr y fxy = fyx ). Es ste un resultado general? El siguiente teorema
establece bajo qu condiciones se cumple esto.
fxx (x, y) =

96

x
.
y

3.1 Derivadas parciales. Interpretacin geomtrica


Teorema sobre derivadas parciales mixtas.1 Si f(x, y) es una funcin de
clase C 2 (dos veces diferenciable con continuidad) en una regin abierta que
contiene al punto (x0 , y0 ), entonces las derivadas parciales mixtas son iguales, esto
es,
fxy (x0 , y0 ) = fyx (x0 , y0 ).
Demostracin:
Sean x = x0 + x y y = y0 + y y considera la expresin
S(x, y) = f (x, y) f (x, y0 ) f (x0 , y) + f (x0 , y0 ) .

Manteniendo y0 y y fijos, definimos la funcin


de donde

g(x) = f (x, y) f (x, y0 ) ,

S(x, y) = g (x) g (x0 ) .


Por el teorema del valor medio para funciones de una variable, g (x) g (x0 ) = g (c) x,
para algn c entre x0 y x. Como g (x) = fx (x, y) fx (x, y0 ) , por lo tanto
S(x, y) = [fx (c, y) fx (c, y0 )] x.
Ahora definimos la funcin

h(y) = fx (c, y) fx (c, y0 ) ,


con h(y0 ) = 0. Aplicando otra vez el teorema del valor medio, h (y) h (y0 ) = h (d) y,
para algn d entre y0 y y. As,
S(x, y) = [h (d)y] x.
De la definicin de h(y) se sigue que h (y) = fxy (c, y) , de donde
Como fxy

S(x, y) = fxy (c, d) yx.


es continua, se sigue que

S(x, y)
.
(x,y)(0,0)
xy
Como S es simtrica en x y y, de forma similar se demuestra que fyx (x0 , y0 )
est dada por la misma frmula lmite, lo que prueba el resultado.
fxy (x0 , y0 ) =

lm

Este teorema se atribuye a diversos autores, tales como Euler, Young, Clairaut, Schwarz.

97

Captulo 3 Diferenciacin
Ejemplo:
2

Determina fyyyxx para la funcin f (x, y) = xey .


Para determinar fyyyxx hay que encontrar fy , luego fyy , etc... Sin embargo,
para esta funcin resulta menos laborioso utilizar la igualdad fyyyxx = fxxyyy .
2
Como fx = ey , por lo tanto fxx = 0, de modo que fxxyyy = 0. Concluimos que
fyyyxx = 0.
La mayora de las funciones de inters en economa satisfacen las hiptesis
del teorema de la igualdad de las derivadas parciales mixtas. En un problema
matemtico general, esto no necesariamente sucede. Un ejemplo de ello es la
funcin
xy(x2 y2 )

,
(x, y) = (0, 0)
x2 +y2
f (x, y) =

0,
(x, y) = (0, 0).

Es fcil demostrar que las segundas derivadas mixtas fxy y fyx son iguales en
todos los puntos del dominio, excepto en el origen. En este ltimo punto, se tiene
fxy (0, 0) = 1, mientras que fyx (0, 0) = 1.

3.2 Diferenciabilidad. Linealizacin y diferenciales


Para comprender el concepto de diferenciabilidad para funciones de varias
variables, recordemos primero el caso de funciones de una variable.
Sea f : D R R, con y = f (x). Sea x0 D y considera el cambio
y = f (x0 + x) f (x0 )
de f , al incrementarse x0 en un valor x = x x0 . Se dice que f es diferenciable
en x0 si y est dado por
y = f (x0 ) x + x,
donde 0 a medida que x 0. Geomtricamente, esto significa que podemos
aproximar el cambio y en la altura de la curva y = f (x) por el cambio f (x0 ) x
obtenido a partir de la pendiente f (x0 ) de la curva en x0 , con un error x que
decrece a medida que x se acerca a x0 .
98

3.2 Diferenciabilidad. Linealizacin y diferenciales

En ese caso, podemos aproximar


y
= f (x0 ) x,
de modo que

f (x0 + x)
= f (x0 ) + f (x0 ) x.
El trmino del lado derecho de esta expresin se conoce como la linealizacin
L(x) de f en x0 ,
L(x) = f (x0 ) + f (x0 ) x.
La ecuacin
y = L(x) = f(x0 ) + f (x0 ) x
es una ecuacin lineal de la forma y = y0 + m(x x0 ), con y0 = f (x0 ) y
m = f (x0 ), y representa la ecuacin de la recta tangente a la curva y = f (x) en
el punto (x0 , f (x0 )) de esa curva.

Concluimos que una funcin f (x) es diferenciable en un punto si existe una recta
tangente a la curva y = f (x) en ese punto.
Ejemplo:
Analiza la diferenciabilidad de la funcin f (x) = ln(1 + x) en el punto x = 0.
La linealizacin L(x) de la funcin f (x) = ln(1 + x) en x = 0 est dada por
L(x) = f (0) + f (0)(x 0) = ln(1 + 0) +
99

1
(x 0) = x,
1+0

Captulo 3 Diferenciacin
de donde
ln(1 + x) x, cuando x 0.
As, f es diferenciable en x = 0, ya que posee una recta tangente en el punto
(0, 0) dada por y = x.

Por ltimo, para valores muy pequeos de x los incrementos se convierten en


diferenciales, x dx, y dy, de modo que el resultado y
= f (x0 ) x
conduce a la expresin familiar para la diferencial de y, dada por
dy = f (x0 ) dx.
A continuacin generalizamos los resultados anteriores al caso de funciones de
dos variables.
Definicin. Sea f : D R2 R, con z = f (x, y). Sea (x0 , y0 ) un punto
interior de D y considere el cambio
z = f (x0 + x, y0 + y) f(x0 , y0 )
de f , al incrementarse x0 en un valor x = x x0 y y0 en un valor y = y y0 .
Se dice que f es diferenciable en (x0 , y0 ) si fx (x0 , y0 ) y fy (x0 , y0 ) existen y si el
cambio z satisface una ecuacin de la forma
z = fx (x0 , y0 )x + fy (x0 , y0 )y + 1 x + 2 y,
en donde 1 , 2 0 cuando x, y 0.
Esto significa que podemos aproximar el cambio z en la altura de la superficie
z = f (x, y) por la suma de los cambios fx (x0 , y0 )x + fy (x0 , y0 )y obtenidos a
partir de las derivadas parciales en (x0 , y0 ), con un error 1 x + 2 y que decrece
a medida que (x, y) se acerca a (x0 , y0 ).

100

3.2 Diferenciabilidad. Linealizacin y diferenciales


En ese caso, podemos aproximar
z
= fx (x0 , y0 )x + fy (x0 , y0 )y,
de modo que
f (x0 + x, y0 + y)
= f (x0 , y0 ) + fx (x0 , y0 )x + fy (x0 , y0 )y.
El trmino de la derecha se conoce como la linealizacin L(x, y) de f en (x0 , y0 ).
Definicin. La linealizacin L(x, y) de una funcin diferenciable f (x, y) en un
punto (x0 , y0 ) de su dominio es la funcin
L(x, y) = f (x0 , y0 ) + fx (x0 , y0 )(x x0 ) + fy (x0 , y0 )(y y0 ).
La ecuacin
z = L(x, y) = f (x0 , y0 ) + fx (x0 , y0 )(x x0 ) + fy (x0 , y0 )(y y0 )
es una ecuacin lineal de la forma z = z0 + a(x x0 ) + b(y y0 ), con
z0 = f(x0 , y0 ), a = fx (x0 , y0 ) y b = fy (x0 , y0 ), de modo que representa un
plano. Nota que la interseccin de este plano con el plano y = y0 es la recta
z = f(x0 , y0 ) + fx (x0 , y0 )(x x0 ), que es tangente a la superficie z = f (x, y) en
el punto (x0 , y0 , f (x0 , y0 )). Asimismo, la interseccin de este plano con el plano
x = x0 es la recta z = f (x0 , y0 ) + fy (x0 , y0 )(y y0 ), que tambin es tangente a la
superficie z = f (x, y) en el punto (x0 , y0 , f(x0 , y0 )). De esta manera, la ecuacin
z = f (x0 , y0 ) + fx (x0 , y0 )(x x0 ) + fy (x0 , y0 )(y y0 )
es la ecuacin del plano tangente a la superficie z = f (x, y) en el punto
(x0 , y0 , f (x0 , y0 )) de esa superficie.

Concluimos que una funcin f (x, y) es diferenciable en un punto si existe un plano


tangente a la superficie z = f (x, y) en ese punto.
Ejemplo:
Analiza la diferenciabilidad de la funcin f (x, y) = x2 xy + 12 y 2 + 3 en el
punto (x0 , y0 ) = (3, 2).
101

Captulo 3 Diferenciacin
Encontremos la linealizacin L(x, y) de la funcin f en (x, y) = (3, 2). Como
1
f (x, y) = x2 xy + y 2 + 3, fx (x, y) = 2x y, fy (x, y) = x + y,
2
por lo tanto f (3, 2) = 8, fx (3, 2) = 4, fy (3, 2) = 1, de modo que,
z = L(x, y) = f(3, 2) + fx (3, 2)(x 3) + fy (3, 2)(y 2)
= 8 + 4(x 3) 1(y 2) = 4x y 2.
As, f es diferenciable en (3, 2), ya que posee un plano tangente en el punto
(3, 2, 8), dado por su linealizacin, z = 4x y 2.
Por ltimo, para valores muy pequeos de x y y los incrementos se
convierten en diferenciales, x dx, y dy, z dz, de modo que
el resultado z
= fx (x0 , y0 )x + fy (x0 , y0 )y conduce a la expresin
dz = fx (x0 , y0 )dx + fy (x0 , y0 )dy,conocida como la diferencial total.
Definicin. La diferencial total dz de una funcin diferenciable z = f (x, y) en
un punto interior (x0 , y0 ) de su dominio est dada por
dz = fx (x0 , y0 )dx + fy (x0 , y0 )dy.
La diferencial total puede utilizarse para aproximar el cambio en el valor de f
cuando el punto (x0 , y0 ) cambia a un valor cercano (x0 + x, y0 + y), mediante
z fx (x0 , y0 )x + fy (x0 , y0 )y.
Ejemplos:
1. Sea z = f(x, y), con f (x, y) = x2 e3y . Encuentra la diferencial total dz en el
punto (1, 0). Utiliza sta para estimar el cambio en z cuando x disminuye, de
x = 1 a x = 0.99, y y se incrementa, de y = 0 a y = 0.02.
Como
fx (x, y) = 2xe3y y fy (x, y) = 3x2 e3y ,
por lo tanto, fx (1, 0) = 2 y fy (1, 0) = 3. De este modo, la diferencial total de f
est dada por
dz = 2dx + 3dy.
En el punto inicial la funcin tiene un valor z = f(1, 0) = 1. Al disminuir x en
x = 0.99 1 = 0.01 y al incrementarse y en y = 0.02 0 = 0.02, la
funcin cambia aproximadamente en
z 2 x + 3 y = 2(0.01) + 3(0.02) = 0.04.
102

3.3 Regla de la cadena


En otras palabras, z cambia de 1 a 1.04, aproximadamente. Nota que el cambio
exacto de z es
zexacto = (0.99)2 e3(0.02) (1)2 e3(0) = 0.0407.

2. Sea Q = P (L, K) la produccin, con P (L, K) = 4L1/4 K 3/4 . Aproxima el


efecto que tendra sobre la produccin que el trabajo disminuya, de L0 = 625 a
L = 623, y el capital se incremente, de K0 = 10 000 a K = 10 010.
La diferencial total dQ en los niveles iniciales (L0 ,K0 ) = (625, 10 000) es
dQ = PL (625, 10 000) dL + PK (625, 10 000) dK.
Los productos marginales estn dados por
PL (L, K) =

K
L

3/4

y PK (L, K) = 3

L
K

1/4

de modo que PL (625, 10 000) = 8 y PK (625, 10 000) = 1.5. As, la diferencial


total de Q en (625, 10 000) es
dQ = 8 dL 1.5 dK.

Esta expresin permite aproximar el cambio en Q ante un pequeo cambio en


los insumos (L, K) alrededor de (625, 10 000), mediante
Q 8 L 1.5 K.

Tomando en cuenta que L = 2 y K = 10, por lo tanto


Q 8(2) + 1.5(10) = 1.

As, Q decrece aproximadamente en 1. Nota que el cambio exacto es


Qexacto = P (623, 10 010) P (625, 10 000)
= 19 998.967 20 000 = 1.033.

3.3 Regla de la cadena


En esta seccin mostramos cmo se generaliza la regla de la cadena para la
derivada de la composicin de funciones de varias variables. Para tal fin, nos
ayudamos con los llamados diagramas de rbol, que son esquemas en los que
se especifica la dependencia que guardan entre s las variables involucradas. A
continuacin, ilustramos la regla de la cadena a travs de varios ejemplos. En cada
caso, la figura de la izquierda representa el diagrama de rbol correspondiente y la
figura de la derecha muestra la dependencia final de z, sin tomar en cuenta a las
variables intermedias.
103

Captulo 3 Diferenciacin
A) Sea z = f (x, y), con x = g(t), y = h(t).

dz
f dg f dh
=
+
dt
x dt
y dt

dz
f dx
f dy
=
+
, se denomina la
dt
x dt
y dt
derivada total de z con respecto a t. Compara sta con la diferencial total
f
f
dz
dz =
dx +
dy de la seccin 3.2. Nota que la derivada total
se puede
x
y
dt
expresar como un producto de matrices, de la forma
Esta expresin, o equivalentemente

dz
=
dt

f
x

f
y

dg
dt

.
dh
dt

B) Sea z = f (x, y, t), con x = g(t), y = h(t).

dz
f dg f dh f
=
+
+
dt
x dt
y dt
t

o bien

dz
=
dt

f
x

f
y

f
t

dg
dt
dh
dt
1

104

3.3 Regla de la cadena


C) Sea z = f (x, y), con x = g(t, s), y = h(t, s).

f g f h
z
=
+
t
x t
y t
z
f g f h
=
+
s
x s y s

o bien
z
t

z
s

f
x

f
y

g
t

h
t

g
s

h
s

D) Sea z = f(x, y), con x = g(t), y = h(t, s).

z
f dg f h
=
+
t
x dt
y t
z
f h
=
s
y s

o bien
z
t

z
s

f
x

f
y

dg
dt

h
t

0
h
s

E) Sea z = f(x), con x = g(t, s).

z
df g
=
t
dx t

z
df g
=
s
dx s
o bien
z
t

z
s

df
dx

g
t

g
s
105

Captulo 3 Diferenciacin
F) Sea z = f (x, t), con x = g(t, s).

f g f
z
=
+
t
x t
t

f g
z
=
s
x s
o bien
z
t

z
s

f
x

f
t

g
t
1

g
s
0

Con este procedimiento podemos obtener la regla de la cadena para cualquier


otro caso. Slo debes tener cuidado en el uso correcto de derivadas ordinarias
(d/dt) o de derivadas parciales (/t) en cada etapa del proceso de derivacin.
Ejemplos:
1. Sea z = f (x, y) = xy, donde x = g(t) = cos t y y = h(t) = sent. Encuentra
dz/dt.
Primero notamos que f/x = y y f /y = x, de modo que
dz
f dg f dh
dg
dh
=
+
=y +x .
dt
x dt
y dt
dt
dt
Por otra parte, como dg/dt = sent y dh/dt = cos t, por lo tanto,
dz
= (sent)(sent) + (cos t)(cos t) = sen2 t + cos2 t.
dt
Nota que hubieras obtenido el mismo resultado al sustituir x = cos t y y = sent
en z = xy y luego derivar el producto respecto a t.
2. Sea Q = P (L, K) una funcin de produccin, donde el trabajo L(t) y el capital
K(t) son funciones del tiempo t. Encuentra una expresin que establezca cmo
cambia la produccin en el tiempo, dQ/dt.
Este caso es similar al anterior. Sin embargo, aqu desconocemos la dependencia
explcita de las variables, de modo que slo se tiene el resultado general
dQ
P dL P dK
=
+
dt
L dt
K dt
dL
dK
= PL
+ PK
.
dt
dt
106

3.4 Diferenciacin implcita


3. Sea Q = P (L, K, t) una funcin de produccin que depende del tiempo, no
slo indirectamente, a travs del trabajo y el capital, L(t) y K(t), sino tambin
directamente (un ejemplo de esto sera Q = A(t)L1/2 K 1/2 ). Encuentra una
expresin para dQ/dt.
Aqu slo hay que agregar el trmino P/t al resultado anterior, quedando
dQ
P dL P dK P
=
+
+
dt
L dt
K dt
t
dL
dK P
= PL
+ PK
+
.
dt
dt
t
4. Determina xc /px , si
xc (px , py , u) = xM (px , py , I), con I = E(px , py , u).
En este caso, se tiene

xM
xM E
xc
=
+
,
px
px
I px
que es conocida como la ecuacin de Slutsky.

3.4 Diferenciacin implcita


Seguramente recuerdas cmo obtener la derivada dy/dx cuando y y x estn
relacionadas a travs de una funcin implcita F (x, y) = 0. Por ejemplo,
determinemos dy/dx en la ecuacin
xexy + y 1 = 0,

que define implcitamente a y como funcin de x. Para ello, derivas ambos lados
respecto a x, obteniendo
x exy x

dy
dy
+ y 1 + exy 1 +
=0
dx
dx

dy
x2 exy + 1 = xyexy exy
dx
dy
xyexy + exy

= 2 xy
.
dx
x e +1
107

Captulo 3 Diferenciacin
En el caso de una ecuacin implcita de la forma F (x, y, z) = 0, para obtener
las derivadas parciales z/x y z/y puedes seguir un procedimiento similar al
anterior Por ejemplo, consideremos la ecuacin
yz ln z = x + y,

que define a z como una funcin implcita, diferenciable, de x y y. Para encontrar


z/x derivamos la ecuacin respecto a x, tomando a y fija, con lo cual se obtiene
z 1 z

=1
x z x
1
z
y
=1
x
z
z
z
=
.
x
yz 1
La derivada z/y se obtendra de manera anloga, obteniendo
y

z
z(1 z)
=
.
y
yz 1
A continuacin presentamos una tcnica alternativa para obtener estas derivadas
parciales, de una manera ms simple, utilizando la regla de la cadena.
Caso 1. Queremos encontrar la derivada dy/dx, suponiendo que la ecuacin
F (x, y) = 0 define a y como una funcin implcita, diferenciable, de x. Para ello,
vamos a suponer que F (x, y) = 0 es la curva de nivel z = 0 de una funcin
z = F (x, y) en R3 . As,
z = F (x, y) = 0
dz
F
F dy
=
+
=0
dx
x
y dx
dy
Fx + Fy
=0
dx
dy
Fx

= .
dx
Fy

Teorema. Si F (x, y) es diferenciable, y la ecuacin F (x, y) = 0 define a y


como una funcin implcita, diferenciable, de x, entonces
dy
Fx
= ,
dx
Fy
en todos los puntos de la curva F (x, y) = 0 en donde Fy = 0.
108

3.4 Diferenciacin implcita


Ejemplos:
1. Determina bajo qu condiciones la relacin x2 + y 2 = 1 define a y como una
funcin diferenciable de x, y en ese caso encuentra dy/dx.
Sea F (x, y) = x2 + y 2 1. La relacin F (x, y) = x2 + y 2 1 = 0 define a y
como funcin implcita, diferenciable, de x cuando Fy = 2y = 0, es decir, en
todos los puntos de la circunferencia en donde y = 0. En ese caso,
dy
Fx
x
2x
=
=
= .
dx
Fy
2y
y

dy
en el punto P 1/ 2,1/ 2 es
dx

1/ 2
dy
= = 1.
dx P
1/ 2
Notamos que en los puntos con y = 0 la derivada se indetermina, de modo que
ah y no es funcin diferenciable de x.
As, por ejemplo, la derivada

2. Determina bajo qu condiciones la relacin xexy + y 1 = 0 define a y como


una funcin diferenciable de x, y en ese caso encuentra dy/dx.
Definimos F (x, y) = xexy + y 1, de modo que Fx = xyexy + exy y
Fy = x2 exy + 1. La relacin F (x, y) = xexy + y 1 = 0 define a y como
una funcin diferenciable de x en aquellos puntos sobre la curva tales que
Fy = x2 exy + 1 = 0 (que en este caso siempre se cumple). En ese caso,
dy
xyexy + exy
Fx
=
= 2 xy
.
dx
Fy
x e +1
3. Demuestra que, a lo largo de una isocuanta P (L, K) = Q0 (Q0 =const) de una
dK
PL
funcin de produccin Q = P (L, K) se cumple la relacin
=
(tasa
dL
PK
marginal de sustitucin tcnica).
109

Captulo 3 Diferenciacin
Sea F (L, K) = P (L, K) Q0 . La relacin F (L, K) = P (L, K) Q0 = 0
define a K como una funcin diferenciable de L, si FK = PK = 0. En ese caso,
dK
FL
PL
=
=
.
dL
FK
PK

Caso 2. Queremos encontrar las derivadas parciales z/x y z/y, si la


ecuacin F (x, y, z) = 0 define a z como una funcin implcita, diferenciable, de x
y y. Para ello, vamos a suponer que F (x, y, z) = 0 es la superficie de nivel w = 0
de una funcin w = F (x, y, z) en R4 . As,
w = F (x, y, z) = 0

w
F
F z
z
=
+
= Fx + Fz
=0
x
x
z x
x
w
F
F z
z
=
+
= Fy + Fz
=0
y
y
z y
y

z
Fx
= ,
x
Fz

z
Fy
= .
y
Fz

Teorema. Si F (x, y, z) es diferenciable, y la ecuacin F (x, y, z) = 0 define a z


como una funcin implcita, diferenciable, de x y y, entonces
z
Fx
= ,
x
Fz

z
Fy
= ,
y
Fz

en todos los puntos de la superficie F (x, y, z) = 0 en donde Fz = 0.

Este teorema permite determinar fcilmente las derivadas parciales z/x y


z/y en una relacin implcita de la forma F (x, y, z) = 0, siempre y cuando F
sea diferenciable y su derivada parcial Fz no se anule en el punto (x, y, z). Este
110

3.4 Diferenciacin implcita


resultado es muy til, ya que podemos encontrar las derivadas z/x y z/y sin
necesidad de conocer la funcin z(x, y).
Ejemplos:
1. Determina bajo qu condiciones la relacin yz ln z = x + y define a z como
una funcin diferenciable de x y y. En ese caso, encuentra z/x y z/y.
Definimos F (x, y, z) = yz ln z x y. As, F (x, y, z) = yz ln z = x + y
define a z como una funcin diferenciable de x y y en todos los puntos (x, y, z)
tales que Fz = y 1/z = 0, es decir, en todos los puntos de la superficie en
donde yz 1 = 0. En ese caso,
z
Fx
=
=
x
Fz

1
y 1/z

z
z1
Fy
=
=
y
Fz
y 1/z

=
=

z
,
yz 1

z(1 z)
.
yz 1

2. Determina si 3xeyz yexz 1 = 0 define a z como una funcin diferenciable


de x y y, en el punto P (1, 2, 0). De ser as, calcula z/x y z/y en P .
Definimos F (x, y, z) = 3xeyz yexz 1. Como Fz (x, y, z) = 3xyeyz xyexz ,
por lo tanto Fz (1, 2, 0) = 4 = 0, de modo que la relacin 3xeyz yexz 1 = 0
s define a z como una funcin diferenciable de x y y cerca del punto P (1, 2, 0).
Finalmente, como
z
3eyz yzexz
Fx
=
=
,
x
Fz
xy (3eyz exz )

por lo tanto

3xzeyz exz
z
Fy
=
=
,
y
Fz
xy (3eyz exz )
z
x

3
y
4

z
y

1
= .
4

3. Sean D(p, w) y S(p, t) las funciones de demanda (D) y de oferta (S) de un


bien, en trminos del precio p de ste en el mercado, el salario w y el impuesto
t sobre el producto, y en donde sus derivadas parciales satisfacen Dp < 0,
Dw > 0, Sp > 0 y St < 0. Si en el equilibrio se cumple D(p, w) = S(p, t),
determina bajo qu condiciones la relacin de equilibrio define a p como una
funcin diferenciable de las variables w y t, y en ese caso encuentra expresiones
para p/w y p/t.
111

Captulo 3 Diferenciacin
Podemos escribir la condicin de equilibrio como D(p, w) S(p, t) = 0,
de modo que definimos F (p, w, t) = D(p, w) S(p, t). As, la relacin
D(p, w) S(p, t) = 0 define a p como una funcin diferenciable de las variables
w y t, en los puntos tales que Fp (p, w, t) = Dp (p, w) Sp (p, t) = 0, es decir, en
todos los puntos en donde Dp (p, w) = Sp (p, t). En ese caso,
Fw
Dw
Dw
p
=
=
> 0,
=
w
Fp
Dp Sp
Sp Dp
p
Ft
(St )
St
=
=
> 0.
=
t
Fp
Dp Sp
Dp Sp
Es interesante notar cmo hemos podido deducir este resultado general, aun sin
conocer la forma explcita de las funciones de demanda y de oferta.

En el caso general de una ecuacin que relaciona a ms de tres variables el


teorema de la funcin implcita se generaliza de la siguiente manera.
Teorema. Si F (x1 , x2 , . . . , xn , w) es diferenciable, y la ecuacin
F (x1 , x2 , . . . , xn , w) = 0 define a w como una funcin implcita, diferenciable, de x1 , x2 , . . . , xn , entonces
Fx
w
= i,
xi
Fw

i = 1, 2, . . . , n,

en todos los puntos de la hipersuperficie F (x1 , x2 , . . . , xn , w) = 0 para los cuales


Fw = 0.

3.5 Derivada direccional y vector gradiente. Recta normal y plano


tangente
En la seccin 3.1 definimos el concepto de derivada parcial de una funcin
f como la razn de cambio instantnea de f con respecto a cada una de sus
variables independientes, manteniendo las otras fijas. Para una funcin f(x, y)
de dos variables, la derivada parcial f /x representa la derivada de f en la
direccin , mientras que f/y es la derivada de f en direccin . A continuacin
generalizamos el concepto de derivada de f, tomando en cuenta cambios
simultneos entre sus variables independientes, esto es, en cualquier direccin
arbitraria del plano xy. A esto se le conoce como la derivada direccional de f .
112

3.5

Derivada direccional y vector gradiente. Recta normal y plano tangente

La derivada direccional (Du f )P0 de una funcin z = f (x, y) en un punto


P0 (x0 , y0 ) de su dominio representa la razn de cambio de f a lo largo de una
direccin arbitraria u en el plano xy, a partir de P0 .

Para calcular (Du f )P0 es necesario determinar el cambio que experimenta la


funcin z = f (x, y) cuando el punto P0 (x0 , y0 ) se mueve en lnea recta en la
direccin u = u1 + u2 hacia otro punto cercano P (x, y), con
x = x0 + u1 s
y = y0 + u2 s,

s R.

Definicin. La derivada direccional (Du f)P0 de una funcin diferenciable


f en un punto P0 (x0 , y0 ) de su dominio, en la direccin del vector unitario
u = u1 + u2 , es el nmero
(Du f )P0 =

df
ds

f (x0 + su1 , y0 + su2 ) f (x0 , y0 )


,
s0
s

= lm
u
,P0

siempre que este lmite exista.


El clculo de la derivada direccional a partir de la definicin anterior no
resulta prctico en general (puedes ver un ejemplo en el Thomas-Finney). Para
reescribir la derivada (df /ds)u,P0 en trminos de una expresin ms fcil de
calcular utilizaremos la regla de la cadena. Tomando en cuenta que z = f (x, y),
113

Captulo 3 Diferenciacin
con x = x(s) = x0 + u1 s y y = y(s) = y0 + u2 s se tiene

(Du f )P0 =
=
=

df
ds

=
u
,P0

f
x

f
x

u1 +
P0

f
x

+
P0

P0

dx
+
ds

f
y

P0

f
y

P0

f
y

P0

dy
,
ds

u2
(u1 + u2 ) .

Esta ltima expresin puede simplificarse, introduciendo la definicin de vector


gradiente de f.
Definicin. El gradiente de una funcin diferenciable f (x, y) en cada punto
interior de su dominio es el vector
f (x, y) =

f (x, y)
f(x, y)
+
.
x
y

El smbolo se conoce como nabla y la notacin f se lee gradiente de f


o nabla de f. En trminos de este vector, la derivada direccional se simplifica
como lo establece el siguiente teorema.
Teorema. Si las derivadas parciales de f (x, y) estn definidas en el punto
P0 (x0 , y0 ), entonces
(Du f )P0 = f (x0 , y0 ) u .
Nota que en los casos particulares u = o u = la derivada direccional se
convierte en las derivadas parciales, es decir,
(D f)P0 =

f
x

(Df)P0 =

P0

114

f
y

.
P0

3.5

Derivada direccional y vector gradiente. Recta normal y plano tangente

Ejemplos:
1. Calcula el vector gradiente de la funcin f (x, y) = xey en el punto P0 (3, 0).
Como fx (x, y) = ey y fy (x, y) = xey , por lo tanto el vector gradiente f en
cada punto (x, y) est dado por
f(x, y) = ey + xey .
De esta manera, el vector gradiente de f en el punto P0 (3, 0) es
f (3, 0) = + 3
.
2. Calcula la derivada direccional de f (x, y) = xey en el punto P0 (3, 0), en la

direccin del vector A = 4 3


.

De acuerdo con el ejercicio anterior, f (3, 0) = + 3


. Por otra parte, el vector
unitario de A es
A
3
4
A =
= .
5
5
A
De esta manera, la derivada direccional de f en el punto P0 en la direccin del
vector A est dada por
4
3
4 9
= = 1.
5
5
5 5
Esto significa que, al cambiar el punto P0 hacia otro punto muy cercano en la
la funcin f decrece aproximadamente en 1 unidad.
direccin de A,
(DAf )P0 = f (3, 0) A = ( + 3
)

Significado geomtrico del gradiente


De acuerdo con su definicin, el gradiente de una funcin en R3 es un vector
en R2 , esto es, el gradiente de f es un vector que habita en el dominio de f . Este
vector tiene un significado geomtrico muy interesante, como se describe en los
dos teoremas enunciados a continuacin.
Teorema 1. Sea z = f (x, y) una superficie en R3 . En cada punto interior
P (x0 , y0 ) del dominio de f, el gradiente f(x0 , y0 ) es un vector perpendicular a la
curva de nivel de f que contiene a P .

115

Captulo 3 Diferenciacin
Demostracin:
Supongamos que cada curva de nivel f (x, y) = c0 de la funcin f puede
escribirse en forma paramtrica como

r (t) = g(t) + h(t) ,


en donde x = g(t) y y = h(t).

As, la curva de nivel f (x, y) = c0 obedece la ecuacin


f(g(t), h(t)) = c0 .
Derivando ambos lados de esta ecuacin con respecto al parmetro t, se tiene
d f (g(t), h(t))
d c0
=
=0
dt
dt
f dg f dh

+
=0
x dt
y dt
f
f
dg
dh

+

+ = 0
x
y
dt
dt
es decir,
dr
= 0.
dt
De esta manera, el gradiente f en cada punto r es perpendicular al vector dr/dt,
que es tangente a la curva de nivel en ese punto. En otras palabras, el gradiente
f(x0 , y0 ) es un vector perpendicular a la curva de nivel de f que contiene a P .
f

116

3.5

Derivada direccional y vector gradiente. Recta normal y plano tangente

Ejemplo:
Encuentra un vector perpendicular a la curva de
nivelz = 1 de la funcin
2
2
f (x, y) = x + y en los puntos P (1, 0), Q(1/ 2, 1/ 2) y R(0, 1).
El gradiente de la funcin en cada punto de su dominio es el vector
f (x, y) = 2x + 2y .

Por lo tanto, un vector perpendicular a la curva de nivel x2 + y 2 = 1 de f en los


puntos P , Q y R es, respectivamente,
f|P = 2 ,

2
2
f |Q = + ,
2
2

f |R = 2 .

Teorema 2. Sea z = f(x, y) una superficie en R3 , y sea f (x, y) = c0 la curva


de nivel de f que contiene al punto interior P (x0 , y0 ) del dominio de f . Entonces
el vector f |(x0 ,y0 ) apunta en la direccin en la que f crece ms rpidamente a
partir del punto P (x0 , y0 ).
Demostracin:
Reescribimos la derivada direccional Du f como
Du f = f u = ||f || ||
u|| cos = ||f || cos ,

en donde es el ngulo entre el vector f, que en cada punto es un vector fijo, y


el vector de direccin u, que es arbitrario. Como Du f est dado por un producto
escalar, su valor y su signo dependen del ngulo entre estos dos vectores. As, para
ngulos entre 0 y /2 la derivada direccional es positiva y para ngulos entre /2
y sta es negativa. Si el ngulo relativo es /2, la derivada direccional es cero;
esto significa que la funcin f no cambia en la direccin perpendicular al gradiente
f, es decir, a lo largo de una curva de nivel de f .
117

Captulo 3 Diferenciacin
De lo anterior se desprende que
||f || Du f ||f|| .
De esta manera, el valor mximo de Du f est dado por ||f||, y ste se alcanza
cuando u apunta en la misma direccin y sentido ( = 0) que el gradiente f.

Correspondientemente, el valor mnimo de Du f est dado por ||f ||, y ste se


alcanza cuando u apunta en el sentido opuesto ( = ) que el gradiente f .

As, el gradiente de una funcin f en un punto dado apunta hacia la direccin de


mximo crecimiento de f en ese punto.

Ejemplos:
1. Encuentra la direccin en la que la funcin f(x, y) = xey , en el punto P (3, 0):
i) crece ms rpidamente, ii) decrece ms rpidamente.
i) En el punto P (3, 0) la funcin crece ms rpidamente en la direccin del
vector f (3, 0) = + 3
, que est dada por u = 110 + 310 .
ii) En el punto P (3, 0) la funcin decrece ms rpidamente en la direccin del
vector f(3, 0) = 3
, que est dada por
u = 110 310 .
118

3.5

Derivada direccional y vector gradiente. Recta normal y plano tangente

2. Encuentra la direccin en la cual la funcin f (x, y) = 2 x2 y 2 crece ms


rpidamente en el punto P (1, 1). Ilustra tu resultado grficamente.
En el puntoP (1, 1) la funcin crece ms rpidamente en la direccin del vector
f (x, y)|(1,1) = 2x 2y |(1,1) = 2 2 , dada por

2
2
1
1
u = = .
8
8
2
2
2
2
Como P (1, 1) est en la curva de nivel x + y = 2 de la funcin
(correspondiente a z = 0), el resultado anterior muestra que en ese punto la
funcin crece ms rpidamente en la direccin perpendicular hacia adentro.

3. Encuentra la direccin en la cual la funcin f (x, y) = x2 + y 2 crece ms


rpidamente en el punto P (1, 1). Ilustra tu resultado grficamente.
En el punto P (1, 1) la funcin crece ms rpidamente en la direccin del vector
f (x, y)|(1,1) = 2x + 2y |(1,1) = 2 + 2 , dada por

2
2
1
1
u = + = + .
8
8
2
2
2
2
Como P (1, 1) est en la curva de nivel x + y = 2 de la funcin
(correspondiente a z = 2), el resultado anterior muestra que en ese punto la
funcin crece ms rpidamente en la direccin perpendicular hacia afuera.

119

Captulo 3 Diferenciacin
4. Encuentra la direccin de mximo crecimiento de una funcin de utilidad de la
forma u(x, y) = x1/2 y 1/2 , x, y > 0, en cada punto de sus curvas de indiferencia.
Ilustra tu resultado.
Para cada canasta (x, y), el gradiente de la funcin u est dado por el vector
1/2

1 y 1/2
1 x
+
,
2 x
2 y
cuyas componentes son ambas positivas. As, para cada curva de indiferencia
x1/2 y 1/2 = u0 el vector gradiente u en cada punto apunta en la direccin
perpendicular mostrada en la figura.
u(x, y) =

Recta normal y plano tangente


Generalizando los resultados anteriores, en el caso de una funcin diferenciable
f : S Rn R en Rn+1 , dada por w = f (x1 , . . . , xn ), el gradiente f en cada
punto (x1 , . . . , xn ) S es el vector
f
f
,...,
.
x1
xn
Este vector en Rn es perpendicular a los conjuntos de nivel de f , dados por
f(x1 , . . . , xn ) = c, que tambin habitan en Rn . En particular, en el tema anterior
vimos que para una superficie z = f (x, y) en R3 el vector f es perpendicular a
sus curvas de nivel, f (x, y) = c, en R2 .
Siguiendo con este razonamiento, para una hipersuperficie w = f (x, y, z) en R4
el vector f ser perpendicular a sus superficies de nivel, f (x, y, z) = c, en R3 .
Este hecho puede utilizarse para encontrar un vector normal a una superficie dada,
invirtiendo el argumento, de la siguiente manera. Nos interesa encontrar un vector
que sea perpendicular a una cierta superficie
f =

z = f (x, y).
120

3.5

Derivada direccional y vector gradiente. Recta normal y plano tangente

Para ello, basta con suponer que la superficie z = f (x, y) en R3 es el conjunto de


nivel w = 0 de la hipersuperficie
w = f(x, y) z

en R4 , de modo que un vector normal a la superficie original sera, precisamente,


w = (wx , wy , wz ) = (fx , fy , 1).
Teorema. Un vector normal a la superficie z = f(x, y) en R3 es el vector
(fx , fy 1).
A partir de este teorema podemos encontrar fcilmente las ecuaciones del plano
tangente y de la recta normal a cualquier superficie z = f (x, y) en R3 , en cualquier
punto P0 (x0 , y0 , z0 ) de la superficie.

As, si z = f (x, y) representa una superficie en R3 . Entonces:


i) La ecuacin del plano tangente a la superficie en el punto P0 (x0 , y0 , z0 ) es
fx (x0 , y0 )(x x0 ) + fy (x0 , y0 )(y y0 ) (z z0 ) = 0.
ii) La ecuacin de la recta normal a la superficie en el punto P0 (x0 , y0 , z0 ) es
x = x0 + fx (x0 , y0 ) t,
y = y0 + fy (x0 , y0 ) t,
z = z0 t ,
t R.

121

Captulo 3 Diferenciacin
Nota que la ecuacin del plano tangente en el inciso i) puede tambin escribirse
como
z = z0 + fx (x0 , y0 )(x x0 ) + fy (x0 , y0 )(y y0 )
o, equivalentemente, como
z = f(x0 , y0 ) + fx (x0 , y0 )(x x0 ) + fy (x0 , y0 )(y y0 ),

que es precisamente la linealizacin L(x, y) de la funcin z = f (x, y) en el punto


(x0 , y0 ), que estudiamos con anterioridad.
Ejemplo:
Encuentra las ecuaciones del plano tangente y la recta normal a la superficie
z = f(x, y), con f (x, y) = 9 x2 y 2 , en el punto (1, 2, 4).
En este caso, fx (x, y) = 2x y fy (x, y) = 2y, de modo que fx (1, 2) = 2
y fy (1, 2) = 4. Por lo tanto, el vector normal a la superficie en el punto
dado es (2, 4, 1). De esta manera, la ecuacin del plano tangente es
2(x 1) 4(y 2) (z 4) = 0,o bien
2x + 4y + z = 14.
Por otra parte, la ecuacin de la recta normal es
x = 1 2 t, y = 2 4 t, z = 4 t ,

t R.

Para finalizar esta seccin, cabe sealar que un razonamiento anlogo a este
ltimo puede aplicarse para encontrar las ecuaciones de la recta tangente y la recta
normal a una curva en R2 , as como las del hiperplano tangente y la recta normal a
una hipersuperficie en Rn+1 , con n 3.

3.6 Funciones homogneas. Teorema de Euler


Definicin. Se dice que una funcin f (x1 , x2 , . . . , xn ) es homognea de grado k si
satisface
f (x1 , x2 , . . . , xn ) = k f(x1 , x2 , . . . , xn ),

122

R+ .

3.6 Funciones homogneas. Teorema de Euler


Ejemplos:
1. La funcin f (x) = x2 es homognea de grado 2, ya que
f(x) = (x)2 = 2 x2 = 2 f (x).
2. La funcin f (x) = x1 es homognea de grado 1, ya que
f (x) = (x)1 = 1 x1 = 1 f (x).
3. La funcin f (x) = 2 es homognea de grado 0, ya que
f (x) = 2 = 0 2 = 0 f (x).

4. La funcin f (x) = x2 + 2x no es homognea, ya que

f (x) = (x)2 + 2(x) = 2 x2 + 2x = k f (x).


5. La funcin f (x, y) = x2 y es homognea de grado 3, ya que
f(x, y) = (x)2 (y) = 3 x2 y = 3 f(x, y).
6. La funcin f (x, y) =
f (x, y) =

x3
es homognea de grado 1, ya que
xy + y 2

(x)3
3 x3
x3
=
=

= f (x, y).
xy + y 2
2 xy + 2 y 2
(x) (y) + (y)2

7. La funcin f (x, y) = ex/y es homognea de grado 0, ya que


f(x, y) = e(x)/(y) = ex/y = 0 ex/y = 0 f(x, y).
8. La funcin f (x, y) =
f (x, y) =

x3
no es homognea, ya que
xy + y
(x)3
3 x 3
= 2
= k f (x, y).
(x) (y) + (y)
xy + y

9. Las funciones de produccin (utilidad) tipo Cobb-Douglas f (x, y) = x y son


homogneas de grado + , ya que
f (x, y) = (x) (y) = + x y = + f (x, y).
Si + > 1 se tiene rendimientos crecientes a escala, si + = 1 se tiene
rendimientos constantes a escala, y si + < 1 los rendimientos a escala son
decrecientes.
123

Captulo 3 Diferenciacin
10. El logaritmo de una funcin de produccin (utilidad) tipo Cobb-Douglas, a
saber, f (x, y) = ln x y = ln x + ln y, no es una funcin homognea, ya
que
!
f (x, y) = ln (x) (y) = ( + ) ln + ( ln x + ln y) = k f (x, y).
Para entender el significado de la homogeneidad de una funcin, supongamos
que f (x, y) es la funcin de produccin correspondiente a los insumos (x, y), y
preguntmonos cul sera la nueva produccin si ambos insumos se duplicaran, es
decir si fueran (2x, 2y). En ese caso:
i) Si f fuera homognea de grado 1, entonces f(2x, 2y) = 21 f(x, y) = 2f (x, y),
es decir, la nueva produccin sera el doble de la original.
ii) Si f fuera homognea de grado 2, entonces f(2x, 2y) = 22 f(x, y) = 4f (x, y),
es decir, la nueva produccin sera cuatro veces la original.
iii) Si f fuera homognea de grado 0, entonces f(2x, 2y) = 20 f (x, y) = f (x, y),
es decir, la nueva produccin sera igual a la original.
iv) Si f fuera homognea de grado 1, entonces f (2x, 2y) = 21 f (x, y) =
es decir, la nueva produccin sera la mitad de la original.

1
f(x, y),
2

v) Si f no fuera homognea, la nueva produccin no sera un mltiplo de la


original.

Teorema. Si f (x, y) es una funcin homognea de grado k, entonces


f (x, y) = xk f (1, y/x),
f (x, y) = y k f (x/y, 1).
Demostracin:
En el primer caso, considera que la variable x juega el papel del factor ,
de modo que f(x, y) = f ( x(1), x (y/x) ) = xk f (1, y/x). El segundo caso se
demuestra de manera similar, tomando a la variable y como el factor .

Este resultado es de particular inters en economa. As, por ejemplo, si


Q = P (L, K) representa la produccin en funcin del trabajo L y el capital K, y
124

3.6 Funciones homogneas. Teorema de Euler


si sta es una funcin homognea de grado 1, entonces la produccin per cpita
q = P (L,K)
puede expresarse simplemente en trminos del capital per cpita
L
k = K/L de acuerdo con
L P (1, K/L)
P (L, K)
=
= P (1, K/L) = p(k).
L
L
Como caso particular, si P (L, K) = L1/4 K 3/4 , entonces
q=

L1/4 K 3/4
q=
=
L

K
L

3/4

= k 3/4 .

Es decir, la produccin per cpita es la funcin p(k) = k 3/4 .

Definicin. Sea f(x) una funcin definida en un dominio D Rn . Se dice que

f es homottica si para todos


x 1,
x 2 D y para todo > 0 se cumple

f (
x ) = f (
x ) f(
x ) = f(
x ).
1

Por ejemplo, si la funcin de utilidad u(x, y) de un consumidor es una funcin


homottica, entonces si a un consumidor le es indiferente elegir entre dos canastas

x 1 = (x1 , y1 ) y
x 2 = (x2 , y2 ), es decir,
u(x1 , y1 ) = u(x2 , y2 ),
entonces le seguir siendo indiferente si en cualquiera de estas canastas los dos
bienes se aumentan en la misma proporcin, es decir,
u(x1 , y1 ) = u(x2 , y2 ).
En otras palabras, una funcin de utilidad homottica preserva las preferencias de
un consumidor.

125

Captulo 3 Diferenciacin
Teorema. Toda funcin homognea es homottica.
Demostracin:
Sea f homognea de grado k, y sean x y y tales que f (x) = f (y). Entonces
f (x) = k f (x) = k f (y) = f(y),
y por lo tanto f es homottica.
Es importante sealar que no toda funcin homottica es homognea. Por
ejemplo, dada una funcin homognea u (por ejemplo, la funcin de utilidad) su
logaritmo natural ln u no es una funcin homognea, pero es fcil demostrar que s
es una funcin homottica. La razn de ello ser evidente a la luz de las siguientes
consideraciones.
Definicin. Se dice que F (x) es una transformacin monotnica creciente de
una funcin homognea f(x), si existe una funcin creciente, H, tal que
F (x) = H(f (x)).

En otras palabras, una transformacin monotnica creciente es una composicin


de funciones de la forma H(f (x)), en donde H es una funcin creciente y f es una
funcin homognea. As, por ejemplo, dada una funcin de utilidad homognea
u(x, y), la funcin ln u es una transformacin monotnica creciente de u.
Teorema. Toda transformacin monotnica es una funcin homottica.
Demostracin:
Sea F (x) = H(f(x)) una transformacin monotnica creciente de una funcin
f homognea de grado k, y sean x y y tales que f (x) = f (y). De esta manera,
F (x) = F (y). Como
F (x) = H(f (x)) = H(k f (x)) = H(k f (y)) = H(f(y)) = F (y),
por lo tanto, F es homottica.
126

3.6 Funciones homogneas. Teorema de Euler


As, aunque ln u no es una funcin homognea, sino ms bien una
transformacin monotnica de una funcin homognea u, es claro que ln u ser
una funcin homottica, preservando la caracterstica de llevar canastas en una
misma curva de indiferencia hacia canastas en otra misma curva de indiferencia, al
aumentar los bienes en una misma proporcin.

Los resultados anteriores son vlidos para funciones en general, aunque stas no
sean diferenciables. En el caso particular de funciones homogneas diferenciables,
existen teoremas adicionales, que son de gran inters y utilidad en economa, como
se muestra a continuacin.
Teorema. Las primeras derivadas parciales f/x1 , . . . , f /xn de una
funcin homognea, diferenciable, f (x1 , . . . , xn ) de grado k, son homogneas de
grado k 1.
Demostracin:
Sea f (x1 , . . . , xn ) una funcin homognea de grado k. Por lo tanto, para todo
> 0,
f (x1 , x2 , . . . , xn ) = k f (x1 , x2 , . . . , xn ).
Derivando con respecto a xi ambos lados de la igualdad, i = 1, . . . , n, se tiene

f (x1 , x2 , . . . , xn ) =
f (x1 , x2 , . . . , xn )
xi
(xi )

= k
f (x1 , x2 , . . . , xn ),
xi
de modo que

f (x1 , x2 , . . . , xn ) = k1
f(x1 , x2 , . . . , xn ).
(xi )
xi
127

Captulo 3 Diferenciacin
Por lo tanto, cada derivada parcial f/xi es homognea de grado k 1.

Ejemplo:
Sea P (L, K) una funcin de produccin homognea de grado 1. Si se sabe
que P (150, 50) = 550, PL (150, 50) = 3 y PK (150, 50) = 2, calcula P (30, 10),
PL (30, 10) y PK (30, 10).
Como la produccin P es una funcin homognea de grado 1, por lo tanto
P (30, 10) = P

1
1
(150), (50)
5
5

1
5

1
P (150, 50) = (550) = 110.
5

Por otra parte, los productos marginales PL y PK son funciones homogneas de


grado 0, de modo que
PL (30, 10) = PL
=

1
5

PK (30, 10) = PK
=

1
5

1
1
(150), (50)
5
5
0

PL (150, 50) = PL (150, 50) = 3,

1
1
(150), (50)
5
5
0

PK (150, 50) = PK (150, 50) = 2.

Una consecuencia del teorema anterior es que las curvas de nivel de una funcin
homognea tienen la misma pendiente a lo largo de puntos que se encuentran en
rectas que pasan por el origen. Es decir, si f (x, y) = c representa una curva de
nivel de una funcin homognea z = f (x, y), entonces
dy
dx

=
(x,y)

128

dy
dx

.
(x,y)

3.6 Funciones homogneas. Teorema de Euler

Para demostrar este resultado, supongamos que z = f (x, y) es una funcin


homognea de grado k y consideremos la curva de nivel f (x, y) = c que contiene
al punto (x, y). Sea F (x, y) = f (x, y) c = 0, de modo que, de acuerdo con el
teorema de la funcin implcita, se tiene
dy
dx

(x,y)

fx (x, y)
k1 fx (x, y)
dy
fx (x, y)
= k1
=
=
fy (x, y)
fy (x, y)
dx
fy (x, y)

.
(x,y)

As, si una funcin de produccin P (L, K) es homognea, entonces la tasa


marginal de sustitucin tcnica, PL /PK = dK/dL, es constante a lo largo
de rayos que salen del origen. Este resultado es vlido para transformaciones
monotnicas en general, y no slo para funciones homogneas.
Teorema de Euler. Sea f (x1 , x2 , . . . , xn ) una funcin diferenciable. Si f es
homognea de grado k, entonces se cumple x f(x) = k f (x), es decir,
x1 f1 (x) + x2 f2 (x) + + xn fn (x) = k f (x),

en donde fi = f /xi , para todo 1 i n.


Demostracin:

Sea f(x1 , x2 , . . . , xn ) una funcin diferenciable. Si f es homognea de grado k,


entonces, para todo > 0,
f (x1 , x2 , . . . , xn ) = k f (x1 , x2 , . . . , xn ).
Derivando con respecto a ambos lados de la igualdad, se tiene
f (x1 )
f (xn )
+ +
= kk1 f (x1 , x2 , . . . , xn ).
(x1 )
(xn )
129

Captulo 3 Diferenciacin
Como (xi )/ = xi , para todo i = 1, . . . , n, por lo tanto
x1

f
f
+ + xn
= kk1 f.
(x1 )
(xn )

Evaluando esta expresin en = 1 se obtiene el resultado deseado.


Ejemplo:
Como f (x, y) = x y es homognea de grado + , por lo tanto
x

f
f
+y
= x x1 y + y x y 1 = ( + )x y = ( + )f.
x
y

130

Captulo 4
Funciones cncavas y cuasicncavas
4.1 Polinomio de Taylor de orden 2. Matriz hessiana
El objetivo de esta seccin es introducir el concepto de matriz hessiana, que
es una matriz de segundas derivadas parciales que se utiliza para establecer
la concavidad o convexidad de funciones diferenciables en varias variables.
A continuacin se motiva su definicin a partir de lo que se conoce como
aproximacin cuadrtica, o polinomio de Taylor de orden 2.
Comencemos con el caso de una funcin diferenciable en una variable,
f : S R, con S R un intervalo abierto. Como f es diferenciable en S,
existe una recta tangente a la curva y = f (x) en cada punto a S, dada por
y = f (a) + f (a)(x a).
Esto significa que para valores de x cercanos a a podemos aproximar la
funcin f por su linealizacin L, dada por

L(x) = f (a) + f (a)(x a),


que estudiamos en la seccin 3.2. Esta es una funcin polinomial de grado 1
en x, y es tal que satisface
L(a) = f (a) y L (a) = f (a),
es decir, en x = a las funciones L y f toman el mismo valor y adems tienen
la misma pendiente.

131

Captulo 4 Funciones cncavas y cuasicncavas


Cuando f es doblemente diferenciable en S se puede construir una mejor
aproximacin para f que, adems de contar con las caractersticas de la
aproximacin lineal, tenga la misma concavidad que f en x = a. En otras palabras,
se busca una funcin P2 (x) que satisfaga
P2 (a) = f (a),

P2 (a) = f (a) y

P2 (a) = f (a).

Es fcil verificar que una funcin que cumple estas condiciones es


1
P2 (x) = f(a) + f (a)(x a) + f (a)(x a)2 ,
2
conocida como el polinomio de Taylor de orden 2 generado por f(x) alrededor
de x = a. La funcin P2 representa una aproximacin cuadrtica de f cerca de
x = a. El factor 12 en el trmino cuadrtico es necesario para que se verifique la
igualdad de las segundas derivadas, P2 (a) = f (a). Nota que
1
P2 (x) = L(x) + f (a)(x a)2 .
2
Se puede demostrar que, por lo general, la funcin cuadrtica P2 es una mejor
aproximacin de f que la funcin lineal L.
Ejemplo:
Encuentra la linealizacin
L(x) y el polinomio de Taylor P2 (x) generados por

la funcin f(x) = x alrededor de x = 1. Utiliza estas funciones para aproximar


el valor de 1.1 y compara los resultados obtenidos con el valor exacto.
La linealizacin L(x) y el polinomio de Taylor P2 (x) generados por una funcin
doblemente diferenciable f (x) en x = 1 estn dados por
L(x) = f (1) + f (1)(x 1),

1
P2 (x) = f (1) + f (1)(x 1) + f (1)(x 1)2 .
2
132

4.1 Polinomio de Taylor de orden 2. Matriz hessiana

En particular, para la funcin f (x) = x se tiene

1
1
f (1) = 1, f (1) = y f (1) =
,
2 1
4 (1)3/2
de modo que
1
L(x) = 1 + (x 1),
2
1
1
1

(x 1)2 .
P2 (x) = 1 + (x 1) +
2
2
4

De esta manera, las aproximaciones lineal y cuadrtica de la funcin f (x) = x


alrededor de x = 1 son, respectivamente,

1
x lineal 1 + (x 1),
2

1
1
x cuad 1 + (x 1) (x 1)2 .
2
8
Se tiene, entonces,

1
1.1
1 + (1.1 1) = 1.05,
2
lineal

1
1
1.1
1 + (1.1 1) (1.1 1)2 = 1.04875 .
cuad
2
8
Compara estos resultados con el valor exacto de 1.1, dado por

1.1 = 1.048808848 . . . .

Es claro que la aproximacin cuadrtica


1.1 cuad obtenida de P2 (x) da un

resultado ms exacto que la aproximacin lineal


1.1 lineal obtenida de L(x). La
razn geomtrica de este hecho
se
ilustra
en
la
siguiente
figura, en donde estn

graficadas las funciones y = x, y = L(x) y y = P2 (x). Aunque las tres


funciones son tangentes en
el punto (1, 1), observa que slo P2 (x) preserva la
concavidad de la funcin x en ese punto.

133

Captulo 4 Funciones cncavas y cuasicncavas


La aproximacin cuadrtica P2 (x) para funciones f doblemente diferenciables
es muy importante en el tema de optimizacin, puesto que el signo de la segunda
derivada f en x = a determina la concavidad de f en ese punto. Para precisar esta
idea, supn que la funcin f posee un valor extremo local (mximo o mnimo) en
x = a, de modo que f (a) = 0. En ese caso, la aproximacin cuadrtica de f (x) se
reduce a
1
f (x) P2 (x) = f (a) + f (a)(x a)2 .
2
Introduciendo la notacin x = x a y f = f (x) f (a), se tiene
1
f f (a) (x)2 .
2

Si f (a) > 0 entonces f > 0, por lo que f se incrementa a partir de f (a).


Como se observa en la figura de la izquierda, esto implica que f tiene un mnimo
en x = a, de modo que f es convexa en ese punto. Por el contrario, si f (a) < 0
entonces f < 0, por lo que f disminuye a partir de f(a). De acuerdo con la
figura de la derecha, esto implica que f tiene un mximo en x = a, de modo que f
es cncava en ese punto.

El criterio de la segunda derivada para funciones f de una variable se resume,


entonces, de la siguiente manera:
i) f (a) > 0 f es convexa en x = a,
ii) f (a) < 0 f es cncava en x = a.
Los resultados anteriores pueden extenderse al caso de una funcin
diferenciable de dos variables, f : S R, con S R2 abierto y convexo. Como f
es diferenciable en S, existe un plano tangente a la superficie z = f (x, y) en cada
punto (a, b) S, dado por
z = f (a, b) + fx (a, b)(x a) + fy (a, b)(y b).
134

4.1 Polinomio de Taylor de orden 2. Matriz hessiana


Esto significa que para aquellos puntos (x, y) cercanos a (a, b) podemos aproximar
la funcin f por su linealizacin L, dada por
L(x, y) = f(a, b) + fx (a, b)(x a) + fy (a, b)(y b),

que estudiamos en la seccin 3.2. Esta es una funcin polinomial de grado 1, y es


tal que satisface
L(a, b) = f (a, b),

Lx (a, b) = fx (a, b) y

Ly (a, b) = fy (a, b),

es decir, en (x, y) = (a, b) las funciones L y f toman el mismo valor y adems

tienen el mismo vector normal,


n = (fx , fy , 1).

Cuando f es doblemente diferenciable en S es posible construir una


aproximacin cuadrtica, P2 (x, y),que presente la misma concavidad que f en
(x, y) = (a, b), estableciendo la igualdad de todas sus derivadas parciales de orden
2. Es fcil verificar que una funcin que satisface estas condiciones es
P2 (x, y) = f (a, b) + fx (a, b)(x a) + fy (a, b)(y b)
1
+ fxx (a, b)(x a)2 + 2fxy (a, b)(x a)(y b) + fyy (a, b)(y b)2 ,
2
conocida como el polinomio de Taylor de orden 2 generado por f (x, y) alrededor
de (x, y) = (a, b). Tomando como base esta aproximacin, a continuacin
desarrollaremos un criterio para establecer la concavidad local de f, dependiendo
del signo de las derivadas fxx , fyy y fxy en el punto (x, y) = (a, b).
Para ello, supongamos que la funcin f posee un valor extremo local en
(x, y) = (a, b), de modo que fx (a, b) = fy (a, b) = 0. En ese caso,
f(x, y) P2 (x, y)

1
fxx (a, b)(x a)2 + 2fxy (a, b)(x a)(y b) + fyy (a, b)(y b)2 .
2
Introduciendo la notacin x = x a, y = y b y f = f(x, y) f(a, b), se
tiene
= f (a, b) +

1
fxx (a, b) (x)2 + 2fxy (a, b)(x)(y) + fyy (a, b)(y)2 .
2
135

Captulo 4 Funciones cncavas y cuasicncavas


Claramente, el signo de f est determinado por el signo de las segundas derivadas
parciales, pero no de una manera directa como en el caso de funciones de una
variable.
Para encontrar condiciones suficientes sobre el signo de f partimos de
2f fxx (x)2 + 2fxy (x)(y) + fyy (y)2 ,

en donde, para simplificar la notacin, hemos omitido que las derivadas parciales
estn evaluadas en (a, b). Ahora multiplicamos ambos lados de esta ecuacin por
fxx (o bien, por fyy , si fxx = 0), obteniendo
2
2fxx f fxx
(x)2 + 2fxx fxy (x)(y) + fxx fyy (y)2 .

Luego completamos cuadrados en el lado derecho de la ecuacin,

2
2
2
2fxx f fxx
(x)2 + 2fxx fxy (x)(y) + fxy
(y)2 + fxx fyy (y)2 fxy
(y)2
2
= [fxx (x) + fxy (y)]2 + fxx fyy fxy
(y)2 .

Por ltimo, dividimos ambos lados de la ecuacin por 2fxx , obteniendo


f

2
fxx fyy fxy
(y)2
[fxx (x) + fxy (y)]2
+
.
2fxx
2fxx

2
Observamos que la condicin fxx > 0 y fxx fyy fxy
> 0 en (a, b) es suficiente
para garantizar que f > 0 a partir de ese punto; siguiendo un razonamiento
anlogo al caso de una funcin de una variable, se tiene entonces que f es convexa
2
> 0 en (a, b) es
en (a, b). Similarmente, la condicin fxx < 0 y fxx fyy fxy
suficiente para garantizar que f < 0 a partir de ese punto; de este modo, f es
cncava en (a, b). Se llega entonces a las siguientes condiciones de suficiencia:
2
> 0 en (a, b) f es convexa en (a, b),
i) fxx > 0 y fxx fyy fxy

2
ii) fxx < 0 y fxx fyy fxy
> 0 en (a, b) f es cncava en (a, b).

Los resultados anteriores pueden expresarse de una manera ms simple,


utilizando un lenguaje matricial. Para ello, primero reescribimos la expresin
1
fxx (a, b) (x)2 + 2fxy (a, b)(x)(y) + fyy (a, b)(y)2
2
como un producto de matrices, de la forma
f

1
fxx (a, b) fxy (a, b)
x y
fxy (a, b) fyy (a, b)
2
T

1
=
x H x ,
2

136

x
y

4.2 Funciones cncavas y funciones convexas

en donde x=

es el vector de incrementos, x

x
y

H=

fxx fxy
fxy fyy

es su transpuesta y

es la matriz de segundas derivadas de f evaluadas en el punto (a, b), conocida


como matriz Hessiana de f. Nota que el determinante |H| de H est dado por
2
|H| = fxx fyy fxy
,

que es precisamente uno de los trminos en las condiciones suficientes que


desarrollamos con anterioridad. De esta manera, dichas condiciones suficientes
pueden expresarse en trminos de la matriz hessiana H de f , como:
i) fxx > 0 y |H| > 0 en (a, b) f es convexa en (a, b),
ii) fxx < 0 y |H| > 0 en (a, b) f es cncava en (a, b).

4.2 Funciones cncavas y funciones convexas


En esta seccin formalizamos el concepto de concavidad o convexidad de una
funcin, que reviste de gran inters en el tema de optimizacin de funciones.
Iniciamos el tema presentando las definiciones de funcin cncava y de funcin
convexa, que son vlidas aun para el caso de funciones no diferenciables.
Definicin. Sea S Rn un conjunto convexo, y sea f : S R. Se dice que f

x 1,
es una funcin cncava si para todos
x 2 S se satisface

f (t
x + (1 t)
x ) tf (
x ) + (1 t)f (
x ),
1

para todo nmero t [0, 1]. La funcin es estrictamente cncava si la desigualdad

es estricta, para t (0, 1) y


x 2.
x1 =

137

Captulo 4 Funciones cncavas y cuasicncavas


En otras palabras, una funcin es cncava si la recta que une cualesquiera dos
puntos de su grfica queda por debajo de la grfica, o en la grfica, pero nunca
por encima de ella. Si la recta queda siempre por debajo de la grfica, la funcin
es estrictamente convexa. Nota que este argumento es vlido en general para
superficies o hipersuperficies, como se ilustra en la siguiente figura.

Definicin. Sea S Rn un conjunto convexo, y sea f : S R. Se dice que f

es una funcin convexa en S si para todos


x 1,
x 2 S se satisface

f (t
x + (1 t)
x ) tf (
x ) + (1 t)f (
x ),
1

para todo nmero t [0, 1]. La funcin es estrictamente convexa si la desigualdad

x 2.
es estricta, para t (0, 1) y
x1 =

Ejemplo:
Demuestra que la funcin f (x) = |x| es convexa no estricta.
Sean x1 , x2 R y sea t [0, 1]. Entonces

f (tx1 + (1 t)x2 ) =

=
=
=

|tx1 + (1 t)x2 |
|tx1 | + |(1 t)x2 |
(desigualdad del tringulo)
|t| |x1 | + |1 t| |x2 | (propiedades del valor absoluto)
t |x1 | + (1 t) |x2 |
(t 0 y 1 t 0)
tf (x1 ) + (1 t)f(x2 ).
138

4.2 Funciones cncavas y funciones convexas


De esta manera,
f (tx1 + (1 t)x2 ) tf (x1 ) + (1 t)f (x2 ).

Teorema. Sea S Rn un conjunto convexo. Sean f, g : S R funciones


cncavas en S y sea R.

a) Si > 0, entonces f es cncava.


b) Si < 0, entonces f es convexa.
c) f + g es cncava.
d) Si h : S R es una funcin lineal, entonces f + h es cncava.
e) Sea h : Y R una funcin cncava y creciente, tal que f (S) Y R.
Entonces h f es cncava.

Por ejemplo, si P (L, K) es una funcin de produccin cncava y p > 0 es el


precio del bien, entonces el ingreso pP (L, K) es una funcin cncava (inciso a).
A su vez, si C(L, K) = wL + rK es una funcin de costos lineal, tambin C es
lineal; as, la funcin de beneficio = pP (L, K) C(L, K) es cncava (inciso d).
Por otra parte, si u es una funcin de utilidad cncava, la composicin ln u tambin
lo es, ya que ln x es una funcin cncava y creciente (inciso e).
Claramente, hay funciones que no son cncavas ni son convexas, tales como
f(x) = x3 , mientras que hay funciones que son tanto cncavas como convexas (no
estrictas), como ocurre con las funciones lineales (rectas o planos):

139

Captulo 4 Funciones cncavas y cuasicncavas


En el caso particular de que la funcin f sea diferenciable, o de clase C 1 , se

puede demostrar que f (


x ) es una funcin cncava en su dominio si y slo si su

grfica nunca est por encima de su linealizacin L(


x ) (recta o plano tangente).

Anlogamente, f (
x ) es una funcin convexa si y slo si su grfica nunca est por

debajo de su linealizacin L(
x ).

Para enunciar estos resultados de una manera formal, reescribimos la linealizacin


L(x, y) de una funcin de dos variables, f (x, y), alrededor del punto (x0 , y0 ), como
L(x, y) = f (x0 , y0 ) + fx (x0 , y0 )(x x0 ) + fy (x0 , y0 )(y y0 )
= f (x0 , y0 ) + (fx (x0 , y0 ), fy (x0 , y0 )) (x x0 , y y0 )
= f (x0 , y0 ) + f (x0 , y0 ) (x x0 , y y0 ) ,

en donde f (x0 , y0 ) denota el gradiente de f evaluado en el punto (x0 , y0 ) . Por

ltimo, introduciendo la notacin


x = (x, y) y
x 0 = (x0 , y0 ), se obtiene

L(
x ) = f (
x 0 ) + f (
x 0 ) (
x
x 0) .
La ventaja de esta ltima expresin es que no est limitada a vectores en R2 , sino
que es vlida para vectores en el espacio general Rn .
Teorema. Sea S Rn un conjunto abierto y convexo, y sea f : S R, con
f C 1 (S). Entonces,

a) f es cncava en S para todos


x,
x S
0

f (
x ) f (
x 0 ) + f (
x 0 ) (
x
x 0) .

b) f es convexa en S para todos


x ,
x 0 S

f (
x ) f (
x 0 ) + f (
x 0 ) (
x
x 0) .

Si las desigualdades son estrictas, entonces f es estrictamente cncava o


estrictamente convexa en S.
140

4.2 Funciones cncavas y funciones convexas


Ms particularmente, en el caso de una funcin f doblemente diferenciable, o
de clase C 2 , existe un criterio aun ms simple para establecer su concavidad o
convexidad. Este criterio se enuncia en el siguiente teorema, y est basado en el
signo de los elementos de su matriz hessiana H, o matriz de las segundas derivadas
de f, como se justific en la seccin 4.1.
Teorema. Sea S R2 un conjunto abierto y convexo, y sea f : S R, con
f C 2 (S). Entonces
2
a) fxx < 0 y fxx fyy fxy
> 0 en S f es estrictamente cncava en S,
2
b) fxx > 0 y fxx fyy fxy > 0 en S f es estrictamente convexa en S,
2
c) fxx fyy fxy
< 0 en S f no es cncava ni es convexa en S.

Ejemplos:
1. Analiza la concavidad de f (x, y) = 2x2 3y 2 en cada punto (x, y) R2 .
La matriz Hessiana de f en cada punto (x, y) es
H(x, y) =

fxx fxy
fxy fyy

4 0
0 6

2
Como fxx = 4 < 0 y |H| = fxx fyy fxy
= 24 > 0, por lo tanto f es
2
estrictamente cncava, para todos (x, y) R .

2. Analiza la concavidad de f (x, y) = x2 + y 2 + xy en cada punto (x, y) R2 .


La matriz Hessiana de f en cada punto (x, y) es
H(x, y) =

fxx fxy
fxy fyy

2 1
1 2

2
Como fxx = 2 > 0 y |H| = fxx fyy fxy
= 3 > 0, por lo tanto f es
estrictamente convexa, para todos (x, y) R2 .

3. Analiza la concavidad de f (x, y) = x2 y 2 en cada punto (x, y) R2 .


La matriz Hessiana de f en cada punto (x, y) es
H(x, y) =

fxx fxy
fxy fyy

2 0
0 2

2
Como fxx = 2 > 0 y |H| = fxx fyy fxy
= 4 < 0, por lo tanto f no es ni
2
cncava ni convexa en R .

141

Captulo 4 Funciones cncavas y cuasicncavas


4. Analiza la concavidad f (x, y) = x3 + y 3 en cada punto (x, y) R2 .
La matriz Hessiana de f en cada punto (x, y) es
H(x, y) =

fxx fxy
fxy fyy

6x 0
0 6y

2
Como fxx = 6x y |H| = fxx fyy fxy
= 36xy, se tiene que f es estrictamente
convexa en el cuadrante I (x > 0, xy > 0), estrictamente cncava en el
cuadrante III (x < 0, xy > 0), y ni cncava ni convexa en los cuadrantes II y IV.
De manera global, decimos que f no es cncava ni convexa en R2 .

Un hecho interesante sobre el teorema anterior es que es de la forma =


y no de la forma . Esto es, hay funciones estrictamente cncavas o
convexas que no satisfacen las desigualdades estrictas del teorema. Por ejemplo,
f(x, y) = x4 + y 4 es estrictamente convexa en R2 , como puede demostrarse a partir
2
de la definicin. Sin embargo, fxx = 0 y fxx fyy fxy
= 0 evaluadas en (0, 0) . El
siguiente teorema establece condiciones necesarias y suficientes en relacin con la
concavidad/convexidad y los signos de las segundas derivadas, aun en el caso con
2
fxx = 0 o fxx fyy fxy
= 0.
Teorema. Sea S R2 un conjunto abierto y convexo, y sea f : S R, con
f C 2 (S). Entonces
2
a) fxx 0, fyy 0 y fxx fyy fxy
0 en S f es cncava en S,
2
b) fxx 0, fyy 0 y fxx fyy fxy 0 en S f es convexa en S.

Compara cuidadosamente este teorema con el anterior (nota que aqu entra en
escena el signo de fyy , la implicacin es del tipo en lugar de , y adems ya no
se trata de concavidad/convexidad estricta.
Ejemplos:
1. Analiza la concavidad de la funcin f (x, y) = y 2 .
Nota que la funcin f (x, y) = y 2 describe un cilindro parablico que corre a lo
largo del eje x, de modo que la funcin es convexa, pero no estricta, en R2 .
142

4.3 Funciones cuasicncavas y funciones cuasiconvexas

Este resultado es consistente con las condiciones necesarias de segundo orden


para la matriz hessiana correspondiente,
H(x, y) =

fxx fxy
fxy fyy

0 0
0 2

2
en donde fxx = 0 0, fyy = 2 0 y fxx fyy fxy
= 0 0.

2. Analiza la concavidad de la funcin f (x, y) = 2x + y.


Nota que la funcin f(x, y) = 2x + y describe un plano, de modo que la funcin
es cncava y convexa a la vez (obviamente, no estricta) en en R2 . Este resultado
es consistente con las condiciones necesarias de segundo orden para la matriz
hessiana correspondiente,
H(x, y) =

fxx fxy
fxy fyy

0 0
0 0

2
ya que al ser fxx = fyy = fxx fyy fxy
= 0 entonces se cumplen las dos
condiciones del teorema anterior.

La generalizacin de los dos teoremas anteriores para el caso de funciones de


tres o ms variables puede consultarse en el Apndice B.

4.3 Funciones cuasicncavas y funciones cuasiconvexas


Adems de las funciones cncavas y convexas, existe otro tipo de funciones
denominadas cuasicncavas y cuasiconvexas, que tambin revisten de gran
importancia en el tema de optimizacin. Antes de presentar estas ltimas, es til
introducir primero la siguiente definicin.
143

Captulo 4 Funciones cncavas y cuasicncavas


Definicin. Sea S Rn un conjunto convexo. Sean f : S R y k R.
a) El contorno de f en k es el conjunto

C (k) = {
x S |f (
x ) = k}.
f

b) El contorno superior de f en k es el conjunto

CS (k) = {
x S |f (
x ) k}.
f

c) El contorno inferior de f en k es el conjunto

CI (k) = {
x S |f (
x ) k}.
f

El contorno Cf (k) es lo que denominamos en la seccin 2.2 como conjunto de


nivel, o curva de nivel en el caso de funciones f : R2 R. As, por ejemplo, en el
caso de una funcin de utilidad u(x, y) correspondiente a la canasta de dos bienes
(x, y), el contorno Cu (u0 ) es la curva de indiferencia
Cu (u0 ) = (x, y) R2+ | u(x, y) = u0 ,
mientras que el contorno superior CSu (u0 ) representa las preferencias del
consumidor,
CSu (u0 ) = (x, y) R2+ | u(x, y) u0 ,
dadas por las canastas que le generan una utilidad mayor o igual que u0 .

Nota que los contornos CSf (k) y CIf (k) son subconjuntos del dominio de f y
ambas regiones contienen al contorno.Cf (k). Para determinar las regiones CSf (k)
y CIf (k) basta con resolver la desigualdad correspondiente a su definicin. Existe
una manera alternativa, que consiste en identificar solamente el contorno Cf (k)
y graficar en l el vector gradiente f, que necesariamente apuntar hacia el
contorno superior CSf (k).

144

4.3 Funciones cuasicncavas y funciones cuasiconvexas


Ejemplos:
1. Sea f : R2 R, definida por f (x, y) = x2 + y 2 . Encuentra los contornos Cf ,
CSf y CIf correspondientes a k = 1.
En este caso, se tiene directamente
Cf (1) = (x, y) R2 x2 + y 2 = 1 ,

CSf (1) = (x, y) R2 x2 + y 2 1 ,


CIf (1) = (x, y) R2 x2 + y 2 1 .

2. Sea f : R2 R, definida por f (x, y) = 2 x2 y 2 . Encuentra los contornos


Cf , CSf y CIf correspondientes a k = 1.
En este caso se tiene Cf (1) = {(x, y) R2 |2 x2 y 2 = 1 }, es decir,
Cf (1) = (x, y) R2 x2 + y 2 = 1 .
Asimismo, CSf (1) = {(x, y) R2 |2 x2 y 2 1 } , es decir,
CSf (1) = (x, y) R2 x2 + y 2 1
y CIf (1) = {(x, y) R2 |2 x2 y 2 1 } , es decir,

CIf (1) = (x, y) R2 x2 + y 2 1 .

145

Captulo 4 Funciones cncavas y cuasicncavas


3. Sea u : R2+ R una funcin de utilidad tipo Cobb-Douglas, definida
por u(x, y) = x y , , > 0. Encuentra los contornos Cu , CSu y CIu
correspondientes a k = 1.
Procediendo de manera anloga a los dos ejemplos anteriores, se tiene
Cu (1) =
CSu (1) =
CIu (1) =

(x, y) R2+ x y = 1 ,

(x, y) R2+ x y 1 ,
(x, y) R2+ x y 1 ,

que representan las canastas con una utilidad u = 1, u 1 y u 1,


respectivamente.

4. Sea f : R R, definida por f(x) = 2 x2 . Encuentra los contornos Cf , CSf


y CIf correspondientes a k = 1.
En este caso se tiene Cf (1) = {x R |2 x2 = 1 }, es decir,
Cf (1) = {x R | |x| = 1 } .

Asimismo, CSf (1) = {x R |2 x2 1 } , es decir,


CSf (1) = {x R | |x| 1}

y CIf (1) = {x R |2 x2 1 } , es decir,

CIf (1) = {x R | |x| 1 } .

146

4.3 Funciones cuasicncavas y funciones cuasiconvexas


5. Sea f : R R, definida por f (x) = x2 . Encuentra los contornos Cf , CSf y
CIf correspondientes a k = 1.
En este caso, se tiene
Cf (1) = {x R | |x| = 1} ,

CSf (1) = {x R | |x| 1 } ,


CIf (1) = {x R | |x| 1 } .

6. Para la funcin f (x) = ln(2 x), encuentra los contornos Cf , CSf y CIf
correspondientes a k = 0.
Primero notamos que el dominio Df de la funcin f es el conjunto
En este caso, se tiene

Df = {x R | < x < 2 } .

Cf (0) = {x Df | x = 1 } = {1} ,

CSf (0) = {x Df | x 1 } = {x R | < x 1} ,


CIf (0) = {x Df | x 1 } = {x R | 1 x < 2 } .

147

Captulo 4 Funciones cncavas y cuasicncavas


Los ejemplos anteriores ilustran cmo en el caso de funciones f en R3 los
contornos Cf , CSf y CIf estn en R2 , mientras que para funciones f en R2 los
contornos estn en R. En todos los casos, los contornos son subconjuntos del
dominio, como se muestra muy especialmente en el ejemplo 6. A la luz de esos
ejemplos debe resultar claro el contenido del siguiente teorema.
Teorema.
a) f es cncava CSf (k) es convexo, para todo k en la imagen de f.
b) f es convexa CIf (k) es convexo, para todo k en la imagen de f .
Uno podra preguntarse ahora si las implicaciones anteriores pueden ser
invertidas. En otras palabras, ser cierto que CSf convexo implica que f
es cncava? La respuesta es negativa, como lo ilustra la siguiente grfica,
correspondiente a la funcin f (x) = x3 .

En este ejemplo es claro que tanto CSf (k) como CIf (k) son convexos para todo
k R, pero la funcin f (x) = x3 no es cncava ni es convexa en su dominio.
Una funcin como sta es un ejemplo de funcin cuasicncava y cuasiconvexa, a
la vez, como se define a continuacin.
Definicin. Sea S Rn un conjunto convexo. Se dice que una funcin
f : S R es cuasicncava, si para todo k en la imagen de f el conjunto CSf (k)
es convexo. La funcin es cuasiconvexa, si para todo k en la imagen de f el
conjunto CIf (k) es convexo.

148

4.3 Funciones cuasicncavas y funciones cuasiconvexas


La figura de la izquierda representa una funcin cuasicncava, ya que para todo
k el contorno superior CSf (k) es convexo. La figura de la derecha muestra una
funcin que no es cuasicncava, ya que su contorno superior CSf (k) no siempre es
convexo (depende del valor de k). Nota que esta ltima tampoco es cuasiconvexa,
puesto que su contorno inferior CIf (k) tampoco es convexo en general. Las
siguientes figuras muestran otras funciones cuasicncavas en R2 .

Anlogamente, las siguientes figuras muestran ejemplos de funciones cuasiconvexas en R2 .

Tambin observa que una funcin puede ser convexa y cuasicncava a la vez, como
es el caso de la funcin ex , que tambin es cuasiconvexa, y que todas las funciones
lineales (rectas, planos e hiperplanos) son cuasicncavas y cuasiconvexas, adems
de ser cncavas y convexas (no estrictas).

Por ltimo, nota que toda funcin cncava (convexa) es tambin cuasicncava
(cuasiconvexa), pero no viceversa.
149

Captulo 4 Funciones cncavas y cuasicncavas

Teorema
a) f cncava f cuasicncava.
b) f convexa f cuasiconvexa.
Tambin es posible demostrar que las implicaciones CSf convexo
f cuasicncava y CIf convexo f cuasiconvexa de la definicin de
cuasiconcavidad/cuasiconvexidad son ms bien del tipo . En resumen,
podemos concluir que
f cncava = f cuasicncava CSf convexo,
f convexa = f cuasiconvexa CIf convexo.
Este resultado es muy importante en economa. As, por ejemplo, si suponemos
que una funcin de utilidad u es cuasicncava, entonces el conjunto de canastas

x) k
x del espacio de bienes que producen al consumidor una utilidad u(
(o sea, CSu (k)) es convexo. De esta manera, cualquier combinacin convexa,

x 1 + (1 )
x 2 , 0 < < 1, de dos canastas
x 1,
x 2 con u k tambin genera
una utilidad mayor o igual a k.

Se puede demostrar que la convexidad del contorno superior CSu (k) garantiza que
se preserve el orden en las relaciones de preferencia del consumidor. Si CSu es
convexo, las curvas de nivel de u son funciones convexas, como en la figura de la
150

4.3 Funciones cuasicncavas y funciones cuasiconvexas


izquierda, y no como en las otras dos figuras.

Esto equivale a la condicin de que la funcin u, que representa el orden de las


preferencias del consumidor, sea cuasicncava. Observa que no tiene sentido
imponer la condicin ms restrictiva de que u sea una funcin cncava, ya que la
nica propiedad significativa de esta funcin es el carcter de sus curvas de nivel.
En economa es muy frecuente el uso de una transformacin del tipo ln u, en
lugar de utilizar la funcin de utilidad u. El siguiente teorema establece que una
transformacin monotnica creciente de este tipo no afecta el argumento anterior
en relacin con las canastas correspondientes a ln u k.
Teorema. Sea S Rn un conjunto convexo y sea g : S R una funcin
cuasicncava. Sea h : Y R R una funcin creciente, donde g(S) Y .
Entonces la composicin h g es una funcin cuasicncava, y adems
CSg (y) CShg (h(y)).

Es importante sealar que la suma de funciones cuasicncavas (cuasiconvexas)


no necesariamente es una funcin cuasicncava (cuasiconvexa), a diferencia de lo
que sucede con la suma de funciones cncavas (convexas) que s te da una funcin
cncava (convexa). Por ejemplo, sabemos que f (x) = x3 y g(x) = x son ambas
funciones cuasicncavas (y cuasiconvexas), pero h(x) = x3 x no es cuasicncava
151

Captulo 4 Funciones cncavas y cuasicncavas


ni cuasiconvexa.

Por ltimo, existen otras maneras de caracterizar la cuasiconcavidad o


cuasiconvexidad de funciones sin utilizar el concepto de contorno. La primera de
ellas representa una definicin alternativa, utilizada frecuentemente en textos de
microeconoma. Aqu la presentamos como un teorema, ya que puede deducirse
a partir de nuestra previa definicin. Observa que no involucra el concepto de
diferenciabilidad, por lo que es vlida para funciones continuas en general.
Teorema. Sea f : S R, con S Rn convexo. Entonces, f es cuasicncava

x 2 S y para todo t [0, 1], se cumple:


en S si y slo si, para todos
x 1,

a) f (
x ) f (
x ) = f (t
x + (1 t)
x ) f (
x ).
1

b) f (t
x 1 + (1 t)
x 2 ) mn{f (
x 1 ) , f (
x 2 )}.

Para comprender el significado geomtrico de este teorema, considera las

preferencias de un consumidor. Si u(
x ) es la utilidad correspondiente a la canasta

x de dos bienes (u crece al alejarse del origen), y si para cualesquiera dos canastas

x 1,
x 2 se cumple.u (
x 1 ) u (
x 2 ), entonces para cualquier canasta intermedia

t x 1 + (1 t) x 2 , t [0, 1] se tendr u (t
x 1 + (1 t)
x 2 ) u (
x 2 ).

Por otra parte, para funciones f doblemente diferenciables en su dominio S


existe un criterio simple para determinar su cuasiconcavidad o cuasiconvexidad.
ste se refiere al signo de la matriz que se obtiene al aadir al hessiano H una
columna y un rengln conteniendo el gradiente de la funcin f. Esa matriz
152

4.3 Funciones cuasicncavas y funciones cuasiconvexas


ampliada se conoce como hessiano orlado, H, que en el caso de funciones
f : S R2 , f C 2 (S) se define como la matriz

0 fx fy
H = fx fxx fxy .
fy fxy fyy

En ese caso, es posible demostrar que el criterio de signos correspondiente es


H
H

> 0 f es cuasicncava,

< 0 f es cuasiconvexa.

Utilizando este resultado, es fcil verificar que las funciones tipo Cobb-Douglas,
f(x, y) = x y , , > 0, son cuasicncavas en general; de stas, slo son
cncavas las que satisfacen + 1.

153

Captulo 5
Optimizacin
En este captulo aplicaremos los resultados sobre concavidad del captulo
4 para encontrar los mximos y mnimos de una funcin f definida en un
dominio convexo S. Este dominio puede ser simplemente el dominio natural
de la funcin, o bien, la regin que resulte al imponer una coleccin de
restricciones. En el primer caso, hablaremos de problemas de optimizacin
libre, que estudiaremos en la seccin 5.1. En el segundo caso, hablaremos de
problemas de optimizacin restringida, que presentaremos en las secciones
5.2 y 5.3. Por simplicidad, gran parte de la discusin se limitar al caso de
funciones de dos variables, f (x, y).

5.1 Optimizacin libre. Criterio del Hessiano


A los valores mximos o mnimos de una funcin tambin se les denomina
valores extremos.de la funcin. Su definicin en el caso de una funcin de
varias variables es una generalizacin directa de las correspondientes a una
funcin de una variable.

Definicin. Sea f : S Rn R y sea


x 0 S. Se dice que

a) f presenta un mximo local o relativo en


x 0 , si existe una vecindad V

de x 0 tal que f ( x 0 ) f ( x ), para todo x V S.

b) f presenta un mximo global o absoluto en


x 0 , si f(
x 0 ) f (
x)

para todo x S.
Cuando las desigualdades se cambian por > se dice que el mximo
(local o global) es estricto o nico.

x 0 se le llama el punto mximo de f y a f (


x 0 ) el valor mximo de
A

f. Decimos que x 0 es un mximo local de f si no existen puntos cercanos


en los que f alcance un valor mayor (puede ser igual); ste es estricto, si

los puntos cercanos dan un valor menor que f (


x 0 ). Asimismo,
x 0 es un
mximo global de f si en todo el dominio S no existe otro punto en el que f
alcance un valor mayor; ste es estricto, si cualquier otro punto del dominio

da un valor menor que f(


x 0 ).
154

5.1 Optimizacin libre. Criterio del Hessiano


Invirtiendo las desigualdades anteriores se llega al concepto de punto mnimo,
como se define a continuacin.

x 0 S. Entonces,
Definicin. Sea f : S Rn R y sea

a) f presenta un mnimo local o relativo en


x 0 , si existe una vecindad V de
x0

tal que f ( x 0 ) f( x ), para todo x V S.

b) f presenta un mnimo global o absoluto en


x 0 ) f (
x ) para todo
x 0 , si f (

x S.

Cuando las desigualdades se cambian por < se dice que el mnimo (local o
global) es estricto o nico.

Nota que todo extremo global es tambin un extremo local, pero no viceversa.
No toda funcin alcanza sus valores extremos globales (mximo o mnimo)
en su dominio. Demostrar la existencia de esos extremos globables puede
resultar bastante complejo en general, especialmente si la funcin no es continua,
diferenciable, o su dominio no es convexo. El siguiente teorema establece una
condicin suficiente para garantizar su existencia.
Teorema de Weierstrass. Sea S Rn un conjunto compacto y sea f : S R.
Si f es continua en S, entonces f alcanza sus valores mximo global y mnimo
global en S.

155

Captulo 5 Optimizacin
Por ejemplo, sea S = (x1 , x2 ) R2+ | p1 x1 + p2 x2 I el conjunto de
canastas compatibles con un ingreso menor o igual a I, para dos bienes con precios
unitarios p1 , p2 . Este conjunto es cerrado y acotado, y por tanto, compacto. Si las
preferencias del consumidor estn dadas por una funcin continua u(x1 , x2 ), el
teorema garantiza la existencia de una canasta que maximiza su utilidad.

Si el dominio de f no fuera compacto (es decir, si no fuera cerrado y acotado) o


si f no fuera una funcin continua en su dominio, entonces no se garantiza que f
alcanza sus valores extremos globales en su dominio. Para ilustrar esta afirmacin,
considera la funcin discontinua f : [1, 1] R, dada por

1 x < 0
x + 1,
0,
x=0
f(x) =

x 1,
0 < x 1.
En la figura se observa que esta funcin no alcanza sus valores mximo global
(fmax = 1) y mnimo global (fmn = 1) en el intervalo 1 x 1.

Para encontrar los puntos extremos locales y globales de una funcin diferenciable
es importante analizar sus propiedades de primer y segundo orden, dadas por su
gradiente y su concavidad, como se discute en las siguientes subsecciones.

5.1.1

Condiciones necesarias de primer orden

Antes de iniciar la bsqueda de los valores extremos (locales y globales) de una


funcin de varias variables, conviene recordar el procedimiento correspondiente a
una funcin continua f : S R R de una variable, con y = f (x).
156

5.1 Optimizacin libre. Criterio del Hessiano


Como se ilustra en la siguiente figura, en este caso los candidatos a extremos
son:
1. Los puntos interiores en donde f = 0 (puntos x2 , x3 y x4 ),
2. Los puntos interiores en donde f no existe (puntos x5 y x6 ),
3. Los puntos frontera del dominio S (puntos x1 y x7 ).

Los puntos interiores del tipo 1 y 2 se conocen como los puntos crticos de f .
En particular, cuando el dominio S es un conjunto abierto no existen puntos
frontera, de modo que los nicos candidatos a ptimos son los puntos crticos.
Adicionalmente, si f es diferenciable los nicos puntos crticos son los del tipo 1,
que son aquellos en donde la derivada es cero, es decir, en donde la recta tangente
a la curva y = f(x) es horizontal. Nota que los puntos crticos son slo candidatos
a ptimos, ya que no todos ellos dan origen a un extremo local, como es el caso de
los puntos x4 y x6 en la figura. A continuacin presentamos la generalizacin de
estos resultados para funciones de varias variables.
Definicin. Sea f : S Rn R una funcin continua. Un punto interior

x 0 S se llama punto crtico de f si f (


x 0 ) = 0 o f (
x 0 ) no existe.

En otras palabras, los puntos crticos de una funcin continua f son aquellos

puntos interiores en donde el plano tangente a su grfica es horizontal (f = 0 )


o en donde ese plano tangente no existe (picos o cspides, en donde f no est
definido).
Cuando la funcin continua f est definida en un conjunto abierto S, la frontera
de S no pertenece al dominio de la funcin, de modo que los nicos candidatos a
mximos y mnimos de f son sus puntos crticos, como establece a continuacin.
157

Captulo 5 Optimizacin
Teorema (condiciones necesarias para un extremo local de funciones
continuas). Sea S Rn un conjunto abierto y sea f : S R continua. Si f posee

un extremo local en
x 0 S, entonces
x 0 es un punto crtico de f.

En el caso particular de que f sea diferenciable en el abierto S, los candidatos

a mximos y mnimos de f se reducen slo a aquellos puntos en donde f = 0 ,


como se establece a continuacin.
Teorema (condiciones necesarias de primer orden para un extremo local de

funciones diferenciables). Si f es diferenciable en un punto interior


x 0 de su

dominio y f alcanza un extremo local en x 0 , entonces f ( x 0 ) = 0 .

Es importante sealar que no todo punto crtico


x 0 de f tal que f (
x 0) = 0
es un extremo local, como es el caso de los puntos de inflexin para funciones de
una variable. Estos ltimos se denominan puntos silla en el caso multidimensional,
como se define a continuacin.

Definicin. Una funcin f tiene un punto silla en un punto crtico


x 0 de

su dominio si para toda vecindad V de


x 0 existen puntos
x V tales que

f(
x ) > f (
x 0 ) y puntos
x V tales que f (
x ) < f (
x 0 ). En otras palabras, un
punto silla es un punto crtico que no es un punto de extremo local.
158

5.1 Optimizacin libre. Criterio del Hessiano

5.1.2

Condiciones suficientes de segundo orden

La condicin f = 0 para funciones diferenciables es una condicin necesaria


de primer orden para obtener los puntos crticos en la optimizacin libre de f .
Para clasificar cada punto crtico como mximo, mnimo o punto silla, se debe
analizar la concavidad o convexidad local de la funcin f en cada uno de ellos.
En el caso particular de funciones doblemente diferenciables, el procedimiento
correspondiente se simplifica considerablemente analizando el signo de la matriz
hessiana H, definida en la seccin 4.1. Este criterio constituye una condicin
suficiente de segundo orden para la optimizacin libre de una funcin, como se
presenta a continuacin.
Valores extremos locales
El criterio para clasificar los extremos locales de una funcin doblemente
diferenciable es muy simple. La idea consiste en analizar la concavidad o

convexidad local de la funcin f en cada punto crtico


x 0 : si f es convexa en
x 0,

se trata de un mnimo local; si f es cncava en x 0 , se trata de un mximo local; si

f no es cncava ni convexa en
x 0 se trata de un punto silla.

La concavidad de la funcin puede determinarse analizando el signo de la matriz


hessiana H de f , cuyos elementos de matriz son las segundas derivadas parciales
de la funcin f con respecto a sus variables independientes. En el caso simple de
una funcin z = f (x, y) con dominio en R2 , la matriz hessiana correspondiente
est dada por
fxx fxy
H(x, y) =
,
fxy fyy
para la que se establecen las siguientes condiciones suficientes de segundo orden.
159

Captulo 5 Optimizacin
Teorema (condiciones suficientes de segundo orden). Sea S R2 un

conjunto abierto y convexo, y sea f : S R, con f C 2 (S). Sea


x 0 S un
punto crtico de f . Entonces

2
a) fxx > 0 y fxx fyy fxy
> 0 en
x0

f tiene un mnimo local estricto en


x 0,

2
b) fxx < 0 y fxx fyy fxy > 0 en x 0

f tiene un mximo local estricto en


x 0,

2
c) f f f < 0 en x f tiene un punto silla en x .
xx yy

xy

Nota que las condiciones a) y b) se refieren al caso de mximos o mnimos


estrictos, es decir, en donde el valor extremo local es nico. Ms adelante
discutiremos el caso de una matriz hessiana semidefinida, en donde los extremos
locales no necesariamente son nicos.
Ejemplos:
1. Encuentra y clasifica los puntos crticos de f (x, y) = 6x2 2x3 + 3y 2 + 6xy.
Las condiciones de primer orden para f son

fx (x, y) = 12x 6x2 + 6y = 0,


fy (x, y) = 6y + 6x = 0.
Resolviendo este sistema de ecuaciones se obtiene que los puntos crticos son
(0, 0) y (1, 1). Para clasificarlos, establecemos las condiciones de segundo
orden, a travs del hessiano
12 12x 6
6
6

H(x, y) =

Para el punto (0, 0) se tiene


H(0, 0) =

12 6
6 6

Como fxx = 12 > 0 y |H| = 36 > 0, por lo tanto f tiene un mnimo local
estricto en (0, 0). A su vez, para el punto (1, 1) se tiene
H(1, 1) =

0 6
6 6

Como |H| = 36 < 0, por lo tanto f tiene un punto silla en (1, 1).

160

5.1 Optimizacin libre. Criterio del Hessiano


2. Encuentra y clasifica los puntos crticos de f(x, y) = xy x2 y 2 2x 2y + 4.
Las condiciones de primer orden para f son

fx (x, y) = y 2x 2 = 0,
fy (x, y) = x 2y 2 = 0.

Resolviendo el sistema de ecuaciones se obtiene que el nico punto crtico es


(2, 2). El hessiano correspondiente es
H(x, y) =

2 1
1 2

= H(2, 2).

Como fxx = 2 < 0 y |H| = 3 > 0, por lo tanto f tiene un mximo local
estricto en (2, 2).Como veremos ms adelante, este mximo local tambin
es un mximo global de la funcin.
3. Encuentra y clasifica los puntos crticos de f(x, y) = x5 y + xy 5 + xy.
Las condiciones de primer orden para f son
fx (x, y) = 5x4 y + y 5 + y = y(5x4 + y 4 + 1) = 0,
fy (x, y) = x5 + 5xy 4 + x = x(x4 + 5y 4 + 1) = 0.
Resolviendo el sistema de ecuaciones se obtiene que el nico punto crtico es
(0, 0). El hessiano correspondiente es
H(x, y) =

20x3 y
5x4 + 5y 4 + 1
20xy 3
5x4 + 5y 4 + 1

de modo que en el punto (0, 0) se tiene


H(0, 0) =

0 1
1 0

Como |H| = 1 < 0, por lo tanto f tiene un punto silla en (0, 0).

En el teorema anterior se ha excluido el caso en donde fxx = 0 con


2
2
fxx fyy fxy
0, o bien fxx fyy fxy
= 0. En este ltimo caso no es posible
garantizar de que el extremo sea estricto, sino que puede (o no) corresponder a un
problema de solucin mltiple. Por esa razn, las anteriores condiciones suficientes
de segundo orden deben reemplazarse por un conjunto de condiciones necesarias,
como se enuncia en el siguiente teorema.

161

Captulo 5 Optimizacin
Teorema (condiciones necesarias de segundo orden). Sea S R2 un

conjunto abierto y convexo, y sea f : S R, con f C 2 (S). Sea


x 0 S un
punto crtico de f . Entonces

a) f tiene un mnimo local en


x0

2
x 0,
fxx 0, fyy 0 y fxx fyy fxy
0 en

x0
b) f tiene un mximo local en

2
fxx 0, fyy 0 y fxx fyy fxy
0 en
x 0.
Ejemplo:
Encuentra y clasifica los puntos crticos de f (x, y) = y 2 .
Para la funcin f (x, y) = y 2 las condiciones de primer orden son
fx (x, y) = 0
fy (x, y) = 2y = 0,
de modo que los puntos crticos son todos los puntos del eje x, es decir,
{(x, y) R2 | y = 0 } . La siguiente figura muestra la grfica de la superficie
z = y 2 , que corresponde a un cilindro parablico que corre a lo largo del eje x. Ah
se observa que la funcin f (x, y) = y 2 alcanza su valor mnimo (no nico) a lo
largo de todos los puntos del eje x.

Este resultado es consistente con las condiciones necesarias de segundo orden para
la matriz hessiana correspondiente,
H=

0 0
0 2

2
en donde fxx = 0 0, fyy = 2 0 y fxx fyy fxy
= 0 0.

Valores extremos globales


La bsqueda de los valores extremos globales de una funcin puede resultar
bastante complicada en general, aun en el caso de funciones diferenciables. Una
de esas dificultades puede surgir al tratar de determinar los extremos globales de
una funcin cuyo dominio S sea un conjunto cerrado, ya que adems de los puntos
crticos interiores se tiene que considerar el valor de la funcin a lo largo de todos
sus puntos frontera. Omitiremos aqu un ejemplo de este tipo, aunque en la seccin
162

5.1 Optimizacin libre. Criterio del Hessiano


5.3 resolveremos problemas de optimizacin en regiones cerradas utilizando
tcnicas de optimizacin restringida (condiciones de Kuhn-Tucker). De este modo,
en esta seccin consideraremos slo funciones definidas en conjuntos abiertos.

Otra dificultad surge cuando el nmero de extremos locales de una funcin es tan
grande que puede resultar bastante engorroso, o incluso imposible, determinar
cules de estos corresponden a sus valores extremos globales.

Para este caso no se cuenta con condiciones necesarias de segundo orden para
encontrar los extremos globales. Sin embargo, si t sabes de antemano que una
funcin es cncava (convexa) a lo largo de todo su dominio, y que sta posee un
punto crtico, este solo hecho es suficiente para garantizar que la funcin posee un
mximo (mnimo) global.
Teorema (condiciones suficientes). Sea S Rn un conjunto abierto y

convexo, y sea f : S R. Sea


x 0 S un punto crtico de f . Entonces

a) f convexa en S f tiene un mnimo global en


x 0,

b) f estrictamente convexa en S f tiene un mnimo global estricto en


x 0,

c) f cncava en S f tiene un mximo global en


x 0,

d) f estrictamente cncava en S f tiene un mximo global estricto en


x 0.

163

Captulo 5 Optimizacin
Este teorema es vlido aun el caso general de funciones no diferenciables. Si
la funcin es doblemente diferenciable, entonces su concavidad o convexidad
puede determinarse directamente a partir de la matriz hessiana, como se muestra a
continuacin.
Ejemplos:
1. Demuestra que la funcin f (x, y) = x2 xy y 2 3y presenta un mximo
global estricto en el punto (1, 2).
Las condiciones de primer orden para f son

fx (x, y) = 2x y = 0
fy (x, y) = x 2y 3 = 0,

que se satisfacen cuando x = 1 y y = 2. As, el nico punto crtico de f es el


(1, 2). La matriz Hessiana de f es
fxx fxy
fxy fyy

H(x, y) =

2 1
1 2

Como fxx = 2 < 0 y |H| = 3 > 0, para todo (x, y), por lo tanto f es
estrictamente cncava en R2 . As, f tiene un mximo global nico en (1, 2).
2. Encuentra los extremos globales de la funcin f (x, y) = x4 + y 4 .
Las condiciones de primer orden para f son
fx (x, y) = 4x3 = 0
fy (x, y) = 4y 3 = 0,
que se satisfacen cuando x = y = 0. As, el nico punto crtico de f es el (0, 0).
La matriz Hessiana de f est dada por
12x2
0
0
12y 2

H(x, y) =

En el punto crtico, se tiene


H(0, 0) =

0 0
0 0

que no presenta un signo definido, ni viola los criterios de concavidad/convexidad. De esta manera, para clasificar el punto crtico podemos utilizar
argumentos alternativos, tales como:
i) Antes de evaluar la matriz Hessiana H(x, y) en (0, 0) notamos que
fxx (x, y) = 12x2 0 y |H| = 144x2 y 2 0, de modo que f es convexa no
estricta en R2 .
164

5.2 Optimizacin con restricciones de igualdad. Multiplicadores de Lagrange


ii) Sabemos que f (0, 0) = 0 y observamos que la imagen de f son los valores
z 0.
De acuerdo con cualquiera de estos dos argumentos, concluimos que f tiene un
mnimo global estricto en (0, 0).
Por ltimo, en el apndice B se presenta la generalizacin de los resultados de
esta seccin para funciones de varias variables.

5.2 Optimizacin con restricciones de igualdad. Multiplicadores de


Lagrange
En muchas aplicaciones de inters la optimizacin de una funcin objetivo est
sujeta a restricciones sobre las variables independientes o variables de decisin,
como es el caso de restricciones presupuestales, laborales u operativas. Estas
restricciones son un subconjunto del dominio de la funcin, conocido como la
regin factible F.
En el caso de restricciones de igualdad, la regin factible F est formada
solamente por puntos frontera, mientras que en el caso de restricciones de
desigualdad, F est constituida tanto por puntos frontera como por puntos
interiores, como se ilustra en las siguientes figuras para restricciones en R2 . La
figura de la izquierda muestra la restriccin de igualdad x + y = 1, en donde la
recta F est formada slo por puntos frontera (PF); la figura de la derecha muestra
la restriccin de desigualdad x + y 1, en donde el semiplano F est constituido
por puntos frontera (PF) y puntos interiores (PI).

El mtodo para encontrar la solucin ptima es distinto en cada caso. En esta


seccin nos dedicaremos solamente al problema de optimizacin con restricciones
de igualdad, conocido como el mtodo de multiplicadores de Lagrange. El caso
correspondiente a restricciones de desigualdad se tratar en la seccin 5.3, en donde
se incorporarn al mtodo de Lagrange las llamadas condiciones de Kuhn-Tucker.

165

Captulo 5 Optimizacin

5.2.1 Condiciones necesarias de primer orden. Significado del


multiplicador de Lagrange
Primero consideremos el caso simple de maximizacin de una funcin diferenciable
de dos variables, f(x, y), sujeto a una restriccin de igualdad, g(x, y) = c, con g
diferenciable y c constante, dado por
mx.

f(x, y)

s.a. g(x, y) = c.
Debido a la restriccin, la solucin ptima P (x , y ) no necesariamente ocurre
en los puntos en donde la superficie z = f(x, y) alcanza su altura mxima

(f = 0 ), sino en los puntos de la curva g(x, y) = c sobre los que f alcanza


su mximo valor restringido. Para ilustrar esta idea, la siguiente figura muestra la
maximizacin de una funcin cncava z = f (x, y) en R3 sujeta a una restriccin
lineal g(x, y) = ax + by = c en R2 .

En la figura de la izquierda se observa que el mximo restringido f de la funcin


f ocurre en el punto P (x , y ) de la recta ax + by = c, y no en el punto Q en donde
f se maximiza libremente. Nota que P pertenece a la curva de nivel f(x, y) = f
correspondiente a z = f . En la figura de la derecha se muestra que el ptimo P es
el punto de la restriccin ax + by = c que est ms cercano a Q. Esto ocurre en el
punto de tangencia de la curva de restriccin y la curva de nivel f (x, y) = f .
En general pueden existir varios candidatos a ptimos (locales o globales) para
una funcin f, dados por los puntos donde la restriccin g(x, y) = c es tangente a
las curvas de nivel de f. Esta condicin de tangencia puede expresarse formalmente
en trminos de los vectores gradiente de las funciones f y g, como se explica a
continuacin.
Para este fin, recordemos que el gradiente de una funcin diferenciable es
un vector perpendicular a sus curvas de nivel y apunta en la direccin de su
166

5.2 Optimizacin con restricciones de igualdad. Multiplicadores de Lagrange


mayor crecimiento en cada punto. La siguiente figura muestra una posible funcin
objetivo z = f (x, y) en R3 . La figura de la derecha muestra algunas de sus curvas
de nivel, en R2 , y la direccin de los vectores gradiente f .

Por otra parte, la curva de restriccin g(x, y) = c en R2 puede considerarse como


la curva de nivel z = c de una funcin z = g(x, y) en R3 , como se ilustra en las
siguientes figuras. En este ejemplo, el vector gradiente g apunta hacia afuera de
la curva de nivel.

As, el problema de maximizacin de f (x, y) sujeto a la restriccin g(x, y) = c se


representa grficamente de la siguiente manera:

Aqu existen dos candidatos a ptimo, que son los puntos de tangencia denotados
por A y B. La condicin de tangencia implica que, en esos puntos, los vectores
gradiente f y g son paralelos entre s, es decir,
f g.
167

Captulo 5 Optimizacin
Por lo tanto, en los puntos en donde f alcanza sus valores extremos debe existir un
nmero R tal que
f = g.
El nmero se denomina el multiplicador de Lagrange asociado con la restriccin
g(x, y) = c. Aunque aqu juega el papel de una constante de proporcionalidad
entre f y g en el ptimo, tambin presenta una interpretacin muy interesante
y til, como discutiremos en breve.

Por lo general, en el ptimo restringido P de f se tiene g = 0 , con = 0.


Como f = g en P , en ese punto se tiene

f = 0 .

As, la condicin f = 0 para optimizacin libre, aqu deber reemplazarse por


las siguientes dos condiciones:
f = g
g(x, y) = c.
Estas dos ecuaciones pueden conjuntarse dentro de un formalismo ms elegante, de
la siguiente manera. Para ello, reescribimos los gradientes de la primera ecuacin
en trminos de sus componentes x y y, obteniendo
fx (x, y) = gx (x, y)
fy (x, y) = gy (x, y)
g(x, y) = c.
ste es un sistema de 3 ecuaciones con 3 incgnitas, con solucin x , y y .
Nota que esta solucin no es el punto crtico de la funcin objetivo f (x, y), ya que

f = g = 0 . Sin embargo, (x , y , ) puede interpretarse como el punto


crtico de una cierta funcin de las variables (x, y, ), a la que denominaremos la
funcin lagrangeana, L(x, y, ), definida como
L(x, y, ) = f(x, y) + (c g(x, y)).

Nota que la funcin L habita en un espacio de dimensin mayor que f , ya que no


slo tiene como variables independientes a x y y, sino tambin a . De esta manera,
en lugar de considerar la optimizacin restringida de f , el mtodo de Lagrange
se basa en la optimizacin libre de la funcin lagrangeana, cuyas condiciones de
primer orden son:
Lx = fx (x, y) gx (x, y) = 0
Ly = fy (x, y) gy (x, y) = 0
L = c g(x, y) = 0.
168

5.2 Optimizacin con restricciones de igualdad. Multiplicadores de Lagrange


Estas tres ecuaciones representan la condicin de tangencia, f = g, y el
cumplimiento de la restriccin, g(x, y) = c, antes discutidas.
Teorema de Lagrange (condiciones necesarias de primer orden). Sean
f, g : S R diferenciables en S R2 y sea (x , y ) S una solucin del
problema
mx./mn. f (x, y)
s.a. g(x, y) = c.


Si g(x , y ) = 0 , entonces existe R tal que (x , y , ) es un punto crtico
de la funcin lagrangeana
L(x, y, ) = f (x, y) + (c g(x, y)),

es decir, en ese punto Lx = Ly = L = 0.

La condicin g(x , y ) = 0 establece que (x , y ) no debe ser un punto


crtico de g, con el fin de que se cumpla la condicin de tangencia f = g con

f(x , y ) = 0 . Cuando (x , y ) es un punto crtico de g el mtodo de Lagrange


puede fallar, como se discute en la seccin 5.2.4.
Significado del multiplicador
A cada valor del parmetro c le corresponde un punto ptimo, P (x (c), y (c)).
En consecuencia, el valor ptimo f de la funcin f,
f (c) = f (x (c), y (c)) ,
tambin depende de c, como se muestra en la siguiente figura.

Tiene sentido, entonces, preguntarse cmo cambia el ptimo f cuando el


parmetro c se incrementa en c. Si c es suficientemente pequeo, el cambio en
f puede aproximarse por la derivada
df (c)
f (c + c) f (c)
= lm
.
c0
dc
c
169

Captulo 5 Optimizacin
Para encontrar esta derivada utilizamos la regla de la cadena, de acuerdo al
siguiente diagrama:

As, se tiene
df (c)
df (x (c), y (c))
=
dc
dc
f dx
f dy
=
+
........................(regla de la cadena)
x dc
y dc
g dx
g dy
=

....(en el ptimo,fx = gx , fy = gy )
+
x
dc
y
dc
g dx
g dy
+
=
x dc
y dc
dg (x (c), y (c))
....................(regla de la cadena, al revs)
=
dc
= (1) ................................................(en el ptimo, g(x, y) = c)
= .
Concluimos entonces que
df (c)
.
dc
De acuerdo con este resultado, el multiplicador de Lagrange representa la
razn de cambio instantnea del valor ptimo f (mximo o mnimo) de la funcin
f al cambiar el parmetro c. ste es un caso particular del llamado Teorema de la
Envolvente, que estudiaremos en la seccin 5.4.
=

Es importante sealar que, para el caso de optimizacin con restricciones de


igualdad, el multiplicador puede tomar cualquier signo, independientemente de
que se trate de un problema de maximizacin o minimizacin. Ante un pequeo
incremento de c, si > 0 se tiene que el valor ptimo de f (ya sea el mximo, o
el mnimo) se incrementa, y si < 0 ste decrece. Este resultado contrasta con el
correspondiente al caso de optimizacin sujeta a restricciones de desigualdad, en
donde no puede ser negativo, como veremos en la seccin 5.3 correspondiente a
restricciones de desigualdad.
170

5.2 Optimizacin con restricciones de igualdad. Multiplicadores de Lagrange


Ejemplos:
1. Resuelve el problema
mx. f (x, y) = 9 x2 y 2

s.a. x + y = 4.
Luego estima el valor mximo de f si se utilizara x + y = 4.01 como nueva
restriccin.
La funcin lagrangeana en este caso est dada por
L(x, y, ) = 9 x2 y 2 + (4 x y),

y las condiciones de primer orden correspondientes son


Lx = 2x = 0

Ly = 2y = 0
L = 4 x y = 0.
Al resolver este sistema de ecuaciones se obtiene que f alcanza su valor
mximo, f = 1, en el punto (x , y ) = (2, 2), con = 4.
Para estimar el nuevo valor mximo de f si la restriccin se modifica a
x + y = 4.01, utilizamos
=

df (c)
f

,
dc
c

de donde
f c.
Tomamos el multiplicador = 4 evaluado en el ptimo inicial, y notamos
que c = 4.01 4 = 0.01, obteniendo f (4)(0.01) = 0.04.
As, al incrementarse c, de 4 a 4.01, el mximo de f disminuye ( < 0)
aproximadamente en 0.04. De esta manera, el nuevo mximo sera
f 1 + f = 1 0.04 = 0.96, aproximadamente.
2. Resuelve el siguiente problema de maximizacin de la produccin P (L, K)
sujeto a una restriccin presupuestal,

mx. P (L, K) = 50L2/3 K 1/3


s.a. 100L + 300K = 45 000,
donde L denota el trabajo y K el capital. Cmo afectara a la produccin
mxima un ligero incremento presupuestal a partir de 45 000?
La funcin lagrangeana en este caso est dada por
L(L, K, ) = 50L2/3 K 1/3 + (45 000 100L 300K),
171

Captulo 5 Optimizacin
y las condiciones de primer orden correspondientes son
LL =

100
3

K
L

1/3

100 = 0
2/3

50 L
LK =
300 = 0
3 K
L = 45 000 100L 300K = 0.
Estas ecuaciones se conocen en economa como condiciones de equimarginalidad, que expresan que en el ptimo se da la tangencia de la ecuacin de
restriccin presupuestal con alguna curva de nivel de la funcin de produccin.

Al resolver este sistema de ecuaciones se obtiene que la produccin mxima,


P = 8254.8, se alcanza en el punto (L , K ) = (300, 50), con = 0.183 44.
Como > 0, un ligero incremento presupuestal a partir de 45 000 generara un
incremento en la produccin mxima.
3. Resuelve el siguiente problema de minimizacin del costo C(L, K) sujeto a una
restriccin de produccin,
mn. C(L, K) = wL + rK
s.a. L1/2 K 1/2 = Q,
donde L denota el trabajo, K el capital, w el salario, r la tasa de inters y Q el
nivel de produccin (w, r y Q constantes positivas). Cmo afectara al costo
mnimo un ligero incremento en la produccin a partir de Q?
La funcin lagrangeana en este caso est dada por
L(L, K, ) = wL + rK + (Q L1/2 K 1/2 ),
y las condiciones de primer orden correspondientes son
1
LL = w
2

K
L

1/2

=0
1/2

1
L
LK = r
=0
2
K
L = Q L1/2 K 1/2 = 0.
172

5.2 Optimizacin con restricciones de igualdad. Multiplicadores de Lagrange


Al resolvereste sistema de ecuaciones se obtiene que el costo mnimo,
C = 2Q wr, se alcanza en el punto (L , K ) = (Q wr , Q wr ), con

= 2 wr. Como > 0, un ligero incremento en la produccin a partir de Q


generara un incremento en el costo mnimo.

5.2.2

Condiciones suficientes de segundo orden

Las condiciones Lx = 0, Ly = 0 y L = 0, son condiciones necesarias de


primer orden para los niveles ptimos de una funcin sujeta a una restriccin de
igualdad. Existen ciertas condiciones bajo las cuales es posible asegurar que esos
ptimos dan origen a un mximo o un mnimo de la funcin, conocidas como
condiciones suficientes de segundo orden. Como se describe a continuacin, los
criterios correspondientes se basan en un anlisis de la concavidad o convexidad de
la funcin lagrangeana L (no de f!), con respecto a las variables x, y y .
Como se discuti en la seccin 5.2.1, resolver el problema de optimizacin
restringida de f,
mx. f(x, y)
s.a. g(x, y) = c
es equivalente a resolver el problema de optimizacin libre de la funcin
lagrangeana asociada,
L(x, y, ) = f (x, y) + (c g(x, y)).
En vista de ello, para utilizar los criterios de concavidad o convexidad inherentes
a problemas de optimizacin libre, es claro que estos deben aplicarse a la funcin
lagrangeana L y no a la funcin objetivo f .
La bsqueda de extremos locales es un problema sencillo cuando f y g son
doblemente diferenciables. En ese caso, es posible definir una matriz hessiana HL
para la lagrangeana L con respecto a , x y y,

L Lx Ly
0 gx gy
HL = Lx Lxx Lxy = gx Lxx Lxy .
Ly Lyx Lyy
gy Lyx Lyy

Como se establece en el siguiente teorema, la clasificacin de los puntos crticos de


L se basa en el signo del determinante |HL | ,
|HL | =

0 gx gy
gx Lxx Lxy
gy Lyx Lyy

evaluado en cada nivel ptimo (x , y , ).


173

0 gx gy
gx Lxx Lxy ,
gy Lyx Lyy

Captulo 5 Optimizacin
Teorema (condiciones suficientes para extremo local). Considera el problema
de optimizacin de f (x, y) sobre la restriccin Cg = {(x, y) |g(x, y) = c}, con f y
g funciones doblemente diferenciables en R2 . Sea (x , y , ) el punto crtico de la
lagrangeana correspondiente, L(x, y, ) = f(x, y) + (c g(x, y)), y sea

|HL (x , y , )| =

0 gx gy
gx Lxx Lxy
gy Lyx Lyy

el determinante de la matriz hessiana de L en (x , y , ). Entonces

a) |HL (x , y , )| > 0 (x , y ) es un mximo local de f en Cg .


b) |HL (x , y , )| < 0 (x , y ) es un mnimo local de f en Cg .
Ejemplo:
Clasifica los puntos crticos del problema de optimizacin
optim. f (x, y) = x2 + y 2
s.a. x2 + xy + y 2 = 3.
La funcin lagrangeana en este caso es
L(x, y, ) = x2 + y 2 + (3 x2 xy y 2 ).

A partir de las condiciones de primer orden se obtienen 4


puntoscrticos,
a saber,

los puntos (1, 1) y (1, 1), con = 2/3, y los puntos ( 3, 3) y ( 3, 3),
con = 2. Como
|HL (1, 1, 2/3)| = |HL (1, 1, 2/3)| = 24,


HL ( 3, 3, 2) = HL ( 3, 3, 2) = 24,

concluimos
que (1, 1) y (1, 1) son mnimos locales, mientras que ( 3, 3) y
( 3, 3) son mximos locales.
Al igual que en el caso de optimizacin libre, la bsqueda de extremos globales
puede resultar bastante ms compleja en general. Sin embargo, si se sabe que la
funcin lagrangeana es siempre cncava o convexa en todo su dominio, se puede
asegurar que el ptimo restringido es un mximo o un mnimo global, como
establece el siguiente teorema.

174

5.2 Optimizacin con restricciones de igualdad. Multiplicadores de Lagrange


Teorema (condiciones suficientes para extremo global). Sea (x , y , ) un
punto crtico de la lagrangeana L(x, y, ). Entonces
a) L es cncava con respecta a (x, y) f tiene un mximo global en (x , y ).
b) L es convexa con respecto a (x, y) f tiene un mnimo global en (x , y ).
Ejemplos:
1. En el ejemplo de maximizacin de f(x, y) = 9 x2 y 2 sujeto a x + y = 4, la
lagrangeana
L(x, y, ) = 9 x2 y 2 + (4 x y)
es una funcin cncava, ya que es la suma de la funcin cncava 9 x2 y 2
con la funcin lineal (4 x y). Por lo tanto, en el punto ptimo f presenta
un mximo global.
2. En el ejemplo de maximizacin de la produccin P (L, K) = 50L2/3 K 1/3 sujeto
a 100L + 300K = 45000, la lagrangeana
L(L, K, ) = 50L2/3 K 1/3 + (45 000 100L 300K)

es una funcin cncava, ya que es la suma de la funcin cncava 50L2/3 K 1/3


con la funcin lineal (45 000 100L 300K). Por lo tanto, en el punto
ptimo la produccin P presenta un mximo global.
3. En el ejemplo de minimizacin del costo C(L, K) = wL + rK sujeto a
L1/2 K 1/2 = Q, la lagrangeana
L(L, K, ) = wL + rK + (Q L1/2 K 1/2 )

es una funcin cncava, ya que es la suma de la funcin lineal wL + rK con la


funcin convexa (Q L1/2 K 1/2 ) (observa que esta ltima es convexa, ya que
L1/2 K 1/2 es cncava y > 0) . Por lo tanto, en el punto ptimo el costo C
presenta un mnimo global.

5.2.3

El caso multidimensional

Es fcil generalizar los resultados anteriores al caso multidimensional,


correspondiente a la optimizacin de una funcin de n variables sujeta a m < n
restricciones de igualdad,
mx./mn. f (x1 , . . . , xn )
s.a. g1 (x1 , . . . , xn ) = c1
..
.
gm (x1 , . . . , xn ) = cm ,
175

m < n.

Captulo 5 Optimizacin
Es importante sealar que el nmero m de restricciones debe ser estrictamente
menor al nmero n de variables. De otra manera, si m = n el sistema de ecuaciones
podra tener una solucin nica, por lo que no habra grados de libertad para llevar
a cabo la optimizacin, o bien, si m > n habran ms ecuaciones que incgnitas y
el sistema podra ser inconsistente (no existira solucin posible).
La anterior condicin de tangencia en el punto ptimo, f = g, se
generaliza ahora requiriendo que, en ese punto, el gradiente f de la funcin f
sea una combinacin lineal del conjunto de gradientes {g1 , . . . , gm } de todas
las restricciones. En otras palabras, en el ptimo debe verificarse
f = 1 g1 + + m gm ,
en donde 1 , . . . , m R son los multiplicadores de Lagrange correspondientes
a las restricciones g1 , . . . , gm . La existencia de estos multiplicadores slo est
garantizada cuando el conjunto de gradientes {gj } en el ptimo es linealmente
independiente, lo que se conoce como la cualificacin de las restricciones. Cuando
esta condicin no se cumple el mtodo de Lagrange puede fallar, como se discute
en la seccin 5.2.4.
Teorema de Lagrange (condiciones necesarias de primer orden). Sean
f : S R y g1 , . . . , gm : S R funciones diferenciables en S Rn , con

m < n. Sea
x S una solucin del problema

mx./mn.
f(
x)

s.a. gj ( x ) = cj ,

con j = 1, . . . , m. Si el conjunto de gradientes {gj (


x )} en el ptimo es

x , )
linealmente independiente, entonces existen , . . . , R tales que (
1

es un punto crtico de la funcin lagrangeana

L(
x , ) = f (
x)+

m
"
j=1

j (cj gj (
x )).

En este caso, las n + m condiciones de primer orden para la funcin lagrangeana


son
L
f
g1
gm

x1 = x1 1 x1 m x1 = 0
..
(n ecuaciones)
.

L
f
g1
gm
= xn 1 xn m xn = 0
n
xL

1 = c1 g1 (x1 , . . . , xn ) = 0
..
(m ecuaciones)
.

L = c g (x , . . . , x ) = 0.
m
m 1
n
m
176

5.2 Optimizacin con restricciones de igualdad. Multiplicadores de Lagrange


$
Las primeras n ecuaciones equivalen a la condicin f = m
j=1 j gj , y las

restantes son las m ecuaciones de restriccin, gj ( x ) = cj . Al resolver el sistema


de n + m ecuaciones se obtienen las n coordenadas del punto ptimo, x1 , . . . , xn ,
y los m multiplicadores de Lagrange, 1 , . . . , m .
El significado de los multiplicadores 1 , . . . , m es similar al del caso
con una sola restriccin. En el caso multidimensional, a cada valor del

conjunto de parmetros
c = (c1 , . . . , cm ) le corresponde un punto ptimo,



P ( x ( c ), y ( c )). En consecuencia, el valor ptimo f de la funcin f,

c ) = f (
x (
c ),
y (
c )) ,
f (

tambin depende de
c . Utilizando las n + m condiciones de primer orden
anteriores, es posible demostrar que
j

f (
c)
=
,
cj

para cada j = 1, . . . , m. As, j representa la razn de cambio instantnea del


valor ptimo f de la funcin f al cambiar el parmetro cj .
Por ltimo, para clasificar los extremos locales y globales del problema puede
utilizarse un criterio de signos para la matriz hessiana de L, que es una matriz de
(n + m) (n + m). Debido al tamao de esa matriz, este mtodo de clasificacin
suele resultar bastante complejo. Sin embargo, en muchas de las aplicaciones de
inters es fcil identificar un extremo global, simplemente argumentando sobre la
concavidad o convexidad de L, de acuerdo al siguiente teorema.

Teorema (condiciones suficientes para extremo global). Sea (


x , ) un

x , ). Entonces
punto crtico de la funcin lagrangeana L(

a) L es cncava con respecto a


x f tiene un mximo global en (
x ).

b) L es convexa con respecto a


x f tiene un mnimo global en (
x ).
Ejemplo:
Resuelve el problema
mx. F (c1 , c2 , l1 , l2 ) = ln c1 l1 + (ln c2 l2 )
1/2

s.a. 4l1 c1 = b1
1/2

c2 4l2 = b1 (1 + r),
donde (1 + r) = 1, con , r > 0 parmetros del modelo.
177

Captulo 5 Optimizacin
Para simplificar nuestros desarrollos, multiplicamos la segunda restriccin por
y utilizamos la condicin (1 + r) = 1, obteniendo
1/2

c2 4l2

= b1 .

La lagrangeana en este caso est dada por

1/2

1/2

L = ln c1 l1 + (ln c2 l2 ) + 1 b1 4l1 + c1 + 2 b1 c2 + 4l2

que es funcin de las variables c1 , c2 , l1 , l2 , b1 , 1 y 2 . Las 7 condiciones de primer


orden son
L
1
L

=
+ 1 = 0,
=
2 = 0,
c1
c1
c2
c2
1
L
2
L
= 1 2 1/2 = 0,
= + 2 1/2 = 0,
l1
l2
l1
l2
L
= 1 + 2 = 0,
b1
L
L
1/2
1/2
= b1 4l1 + c1 = 0,
= b1 c2 + 4l2 = 0.
1
2
Resolviendo este sistema de ecuaciones se obtiene que el ptimo ocurre en
l1 = l2 = 12 , c1 = c2 = 23/2 , b1 = 0, 1 = 23/2 = 2 . Por ltimo, tomando
el cuenta los signos de los multiplicadores 1 y 2 se tiene que L es una funcin
cncava, de modo que se trata efectivamente de un mximo.

5.2.4 Cualificacin de las restricciones: cundo falla el


mtodo de los multiplicadores de Lagrange?
El mtodo de los multiplicadores de Lagrange para el problema de optimizacin
restringida de f (x1 , . . . , xn ) sujeto a gj (x1 , . . . , xn ) = cj , j = 1, . . . , m, se basa en
el cumplimiento de la llamada cualificacin de las restricciones,

f = 1 g1 + + m gm
.

Para que esta condicin se cumpla es necesario que el conjunto de gradientes

en el ptimo {g1 , . . . , gm
} sea linealmente independiente. Cuando esto no
sucede es posible que el mtodo de Lagrange no te permita obtener ninguno de los
candidatos a ptimo, o bien, que no te d todos los candidatos posibles. En ese
caso, es necesario complementar el mtodo de Lagrange con otro tipo de bsqueda
de ptimos, como discutiremos a continuacin.
En el caso particular de la optimizacin de una funcin de dos variables f (x, y)
sujeto a una sola restriccin g(x, y) = c, la cualificacin de las restricciones se
178

5.2 Optimizacin con restricciones de igualdad. Multiplicadores de Lagrange


reduce a la condicin de tangencia
f = g .

Esta condicin no se cumple cuando el ptimo restringido (x , y ) del problema

coincide con un punto crtico de g (g = 0 ), a menos que este ptimo tambin

sea un punto crtico de f (f = 0 ), como se ilustra en los siguientes ejemplos.


Ejemplos:
1. Encuentra la solucin al problema
mx.

f (x, y) = y

s.a. y 3 x2 = 0.
En este caso, la lagrangeana est dada por
L(x, y, ) = y + x2 y 3 ,

cuyas condiciones de primer orden son

Lx = 2x = 0

Ly = 1 3y 2 = 0
L = x2 y 3 = 0.
Es fcil verificar que no existe solucin a este sistema de ecuaciones, por lo que
errneamente podramos concluir que en este problema f no se maximiza. Sin
embargo, si graficamos algunas curvas de nivel de f , dadas por y =const., y la
curva de restriccin y = x2/3 , observamos que la funcin f alcanza su mximo
en el punto (0, 0).

El mtodo de Lagrange falla aqu, ya que no se verifica la condicin


f = g . En efecto, como f(x, y) = j y g(x, y) = 2xi + 3y 2 j,
por lo tanto en el ptimo se tiene

f = f(0, 0) = j, g = g(0, 0) = 0 ,

es decir, el ptimo (0, 0) es un punto crtico de g, pero no de f . Como en el

ptimo f = 0 y g = 0 , por lo tanto no existe tal que f = g .


179

Captulo 5 Optimizacin
2. Encuentra la solucin al problema
mx.

f(x, y) = x2 y 2

s.a. y 3 x2 = 0.
En este caso, la lagrangeana est dada por

L(x, y, ) = x2 y 2 + x2 y 3 ,
cuyas condiciones de primer orden son
Lx = 2x + 2x = 2x( 1) = 0,

Ly = 2y 3y 2 = y(2 3y) = 0,
L = x2 y 3 = 0.
Es fcil verificar que este sistema de ecuaciones s tiene solucin, y sta ocurre
en el punto (0, 0), que es la misma que se obtiene a partir de un anlisis grfico.

Aqu no falla el mtodo, ya que s se verifica la condicin f = g . En


efecto, como f (x, y) = 2xi 2y j y g(x, y) = 2xi + 3y 2 j, por lo tanto
en el ptimo se tiene

f = f (0, 0) = 0 ,

g = g(0, 0) = 0 ,

es decir, el ptimo (0, 0) es un punto crtico tanto de g como de f. Como en el

ptimo f = g = 0 , por lo tanto se cumple la condicin f = g


para todo valor de .

Este tipo de dificultades suele ocurrir cuando el ptimo restringido (x , y ) de f


coincide con algn punto cspide de la curva de restriccin g(x, y) = c, en donde
no est definida la derivada dy/dx. La cspide se origina en el hecho de la funcin
z = g(x, y) tiene un punto crtico a lo largo de la curva de nivel g(x, y) = c. En
efecto, a lo largo de la curva de nivel g(x, y) = c por el Teorema de la Funcin
implcita se tiene
dy
gx (x, y)
=
.
dx
gy (x, y)
180

5.2 Optimizacin con restricciones de igualdad. Multiplicadores de Lagrange


Cuando el ptimo (x , y ) es un punto crtico de la funcin z = g(x, y), entonces

g(x , y ) = 0 . Por lo tanto,


gx (x , y ) = gy (x , y ) = 0.
Como (x , y ) est en la curva g(x, y) = c, se tiene g(x , y ) = c, de modo que
gx (x , y )
0
dy
=
= .

dx
gy (x , y )
0
Por lo tanto, la derivada dy/dx no est definida en (x , y ) y la curva g(x, y) = c
tiene una cspide en (x , y ).

En resumen, los candidatos a ptimo para el problema de optimizacin


restringida son los puntos crticos de la funcin lagrangeana L(x, y, ), as como
los puntos crticos de la funcin de restriccin g(x, y), en donde posiblemente se
viole la cualificacin de la restriccin, f = g .
La extensin de los resultados anteriores para el caso multidimensional es
ms compleja. Solamente mencionaremos aqu que si se tiene m ecuaciones

x ) = cj , la cualificacin de las restricciones


de restriccin,
de la forma gj (
$
m

f = j=1 j gj se viola cuando el rango de la matriz

Dg(
x ) =

g1
x1

..
.

gm
x1

...

g1
xn

..
.

gm
xn

es menor que m (ver, por ejemplo, el libro de Simon y Blume). En este caso, los
candidatos a ptimo para el problema de optimizacin restringida son los puntos

crticos de la funcin lagrangeana L(


x , ), as como los puntos crticos de las

funciones de restriccin g$
j ( x ), en donde posiblemente se viole la cualificacin de

las restricciones, f = m
j=1 j gj .
181

Captulo 5 Optimizacin

5.3 Optimizacin con restricciones de desigualdad. Condiciones de


Kuhn-Tucker
En esta seccin estudiaremos cmo resolver un problema de optimizacin para una
funcin sujeta a restricciones de desigualdad, en donde no todas las funciones son
lineales, lo que se conoce como Programacin No Lineal.
La solucin a un problema de optimizacin depende de la geometra de la regin
factible F . Diferentes tipos de restricciones dan origen a diferentes soluciones
ptimas, como se muestra en los siguientes casos. En ellos se considera la
maximizacin de una funcin cncava f : R2+ R, representada por la superficie
z = f(x, y) generada por los puntos (x, y) R2+ .
Caso 1. Primero consideremos el problema de maximizacin libre
mx. f (x, y).
Aqu la regin factible F es simplemente R2+ . La siguiente figura muestra la regin
F, algunas curvas de nivel de f y el vector gradiente f , que indica la direccin
de crecimiento de f . En este caso, la solucin ptima P corresponde al mximo no
restringido de f. Como P est fuera de la frontera de F (los ejes), se tiene que P
es un punto interior de la regin factible F.

Caso 2. Ahora consideremos la maximizacin de f sujeta a una restriccin de


igualdad, tal como
mx. f (x, y)
s.a. x + y = 2.
Aqu la regin factible F es el segmento de recta x + y = 2 en R2+ . La solucin
ptima ocurre en el punto P de la curva F . Como una curva en el plano est
formada slo de puntos frontera, P es un punto frontera de la regin factible F.

182

5.3 Optimizacin con restricciones de desigualdad. Condiciones de Kuhn-Tucker


Caso 3. Por ltimo, consideremos la maximizacin de f sujeta a una restriccin
de desigualdad, tal como
mx. f (x, y)
s.a. x + y 2.
Aqu, la regin factible F es el tringulo definido por x + y 2, x 0 y y 0.
Dependiendo de la posicin del mximo no restringido de f con respecto a la
regin F, la solucin ptima P puede ocurrir ya sea en un punto interior o en un
punto frontera de F .

Esto es lo que se conoce como un problema de Kuhn-Tucker, y en las siguientes


secciones deduciremos las condiciones de optimalidad correspondientes.

5.3.1

Problemas de maximizacin

El siguiente ejemplo proporciona una idea intuitiva del problema de Kuhn-Tucker


para una funcin de una variable. Sea f : R R una funcin cncava,
representada grficamente por la curva y = f (x) en R2 . Buscamos el mximo
global del problema
mx. f(x)
s.a. x 0.
La siguiente figura muestra diferentes posibilidades para la funcin y = f (x) en
R2 . Dependiendo de la ubicacin del mximo no restringido de f con respecto a la
regin factible F , dada por x 0, la solucin ptima P puede ocurrir en un punto
interior o un punto frontera de F .

183

Captulo 5 Optimizacin
En la figura de la izquierda, la solucin P coincide con el mximo no restringido
de f , que es el punto x > 0 en donde f (x ) = 0. En este caso, P es un punto
interior de F. En la figura central, el mximo no restringido de f cae fuera de la
regin factible, de modo que la mejor solucin P ocurre en x = 0, con f (x ) < 0.
As, P es un punto frontera de F . Por ltimo, en la figura de la derecha el mximo
no restringido de f ocurre exactamente en x = 0, con f (x ) = 0. Nuevamente, P
es un punto frontera de F . Del anlisis grfico podemos concluir que en el ptimo
se verifican las siguientes tres condiciones
x 0,

f (x ) 0

y x f (x ) = 0.

Ahora consideremos el caso de una funcin de dos variables. Sea f : R2 R


una funcin cncava, representada por la superficie z = f (x, y) en R3 , que deber
maximizarse sujeto a una restriccin de desigualdad, g(x, y) c, con c una
constante. Como se justificar ms adelante, la restriccin correspondiente a un
problema de maximizacin deber escribirse siempre en el formato dado (). De
esta manera, considera el problema
mx. f(x, y)
s.a. g(x, y) c.
La siguiente figura muestra diferentes posibilidades para la funcin z = f (x, y) en
R3 . Dependiendo de la ubicacin del mximo no restringido de f con respecto a la
regin factible F, dada por g(x, y) c, la solucin ptima P puede ocurrir en un
punto interior o un punto frontera de F.

En la figura de la izquierda, el mximo no restringido de f ocurre en el interior


de la regin factible, g(x, y) < c; la solucin ptima P es un punto interior de F .
En la figura central, el mximo no restringido de f cae fuera de la regin factible
y la mejor opcin es el punto P de la curva g(x, y) = c que se encuentra lo ms
cercano posible a ese mximo; la solucin ptima P es un punto frontera de F. En
la figura de la derecha, el mximo no restringido de f ocurre exactamente sobre la
curva g(x, y) = c, nuevamente, la solucin ptima P es un punto frontera de F . A
184

5.3 Optimizacin con restricciones de desigualdad. Condiciones de Kuhn-Tucker


continuacin se muestran las proyecciones en el plano R2 correspondientes a los
tres escenarios anteriores. En ellas se puede observar la regin factible F y algunas
curvas de nivel de cada una de las funciones f .

En el primer caso, la existencia de la restriccin resulta irrelevante, y el problema


puede resolverse a partir de la maximizacin libre de f . En el segundo caso,
la restriccin g(x, y) c puede reemplazarse por la restriccin de igualdad
g(x, y) = c, y la solucin del problema puede obtenerse con el mtodo de los
multiplicadores de Lagrange. El ltimo caso es una combinacin de los otros dos.
Con el fin de desarrollar un mtodo general de solucin que abarque los
tres casos anteriores, partimos de una descripcin basada en el mtodo de los
multiplicadores de Lagrange, pero que sea capaz de reducirse a un problema de
optimizacin libre cuando se sea el caso. Al tratarse de una descripcin tipo
Lagrange, pediremos que en el ptimo se verifique la condicin de tangencia
f = g.
La diferencia con el mtodo original de Lagrange consiste en que ahora el problema
de optimizacin est sujeto a una restriccin de desigualdad, g(x, y) c. Por esa
razn, debemos reemplazar la condicin g(x, y) = c de solucin frontera por algn
otro criterio que permita la existencia de una solucin interior, como se discuti
en los ejemplos anteriores. Como se justifica a continuacin, este nuevo criterio
requiere el cumplimiento de las siguientes tres condiciones,
g(x, y) c,

(g(x, y) c) = 0.

La condicin g(x, y) c establece que en el ptimo se debe satisfacer la


restriccin impuesta. Para entender la condicin 0, o condicin de no
negatividad del multiplicador , es necesario hacer la siguiente consideracin.
Primero observa que la restriccin de desigualdad g(x, y) c puede interpretarse
como el contorno inferior CIg (c) de la funcin z = g(x, y) correspondiente a
z = c. Dado que el gradiente g apunta hacia el contorno superior CSg (c) de
185

Captulo 5 Optimizacin
g, por lo tanto g debe apuntar hacia afuera de la regin factible F , dada por
g(x, y) c, como se ilustra en la siguiente figura.

Imponer que 0 en la condicin de tangencia f = g implica que, en el


ptimo P, los gradientes f y g deben apuntar en el mismo sentido. As, un
pequeo incremento c en c har que el nuevo ptimo P est en una curva de
nivel con mayor valor de f, como se muestra en la figura de la izquierda. Si < 0,
entonces f apuntara en el sentido contrario a g, por lo que habra una curva de
nivel con un mayor valor de f dentro de la regin de restriccin; en consecuencia,
P no podra ser el punto que maximiza a f, ya que habra un mejor punto P dentro
de la regin, como se muestra en la figura de la derecha.

Nota que la no negatividad de en el problema de Kuhn-Tucker contrasta con el


caso de una restriccin de igualdad. En ese caso, poda tomar cualquier signo,
ya que la optimizacin se lleva a cabo en la curva g(x, y) = c, sin posibilidad de
desplazamiento hacia las regiones alrededor de la misma.

Para explicar la ltima condicin, (g(x, y) c) = 0, conviene analizar por


separado los tres casos anteriores. Cuando el mximo no restringido de f ocurre
en el interior de la regin de restriccin, el ptimo P satisface g(x, y) < c. Ah

f = 0 y g = 0 , por lo que la condicin f = g implica que = 0 en P.


186

5.3 Optimizacin con restricciones de desigualdad. Condiciones de Kuhn-Tucker

Por otra parte, cuando el mximo no restringido de f cae fuera de la regin de

restriccin, el ptimo P satisface g(x, y) = c. Ah f = 0 y g = 0 , por lo que


la condicin f = g implica que > 0 en P .

Por ltimo, cuando el mximo no restringido de f ocurre exactamente en la

frontera de la restriccin, el ptimo P satisface g(x, y) = c. Como ah f = 0 y

g = 0 , la condicin f = g implica que = 0 en P .

187

Captulo 5 Optimizacin
Concluimos que en los tres casos se verifica la condicin (g(x, y) c) = 0,
que establece que en el ptimo P debe cumplirse al menos una de las siguientes
igualdades,
= 0 o g(x, y) = c.
5.3.1.1

Condiciones de Kuhn-Tucker para problemas de maximizacin

Los resultados de la discusin anterior para resolver el problema de Kuhn-Tucker


mx. f(x, y)
s.a. g(x, y) c,
se pueden formalizar en trminos del mtodo de Lagrange, de la siguiente manera.
Primeramente, se plantea la funcin lagrangeana
L(x, y, ) = f(x, y) + (c g(x, y)).

En lugar de pedir Lx = Ly = L = 0 como en el mtodo de Lagrange, ahora las


condiciones necesarias de primer orden son
Lx = fx (x, y) gx (x, y) = 0
Ly = fy (x, y) gy (x, y) = 0,

que representan la tangencia (f = g) en el ptimo. La tercera igualdad,


L = 0, equivalente a g(x, y) = c, debe sustituirse por las llamadas condiciones de
holgura complementaria,
L 0, 0 y L = 0,
o equivalentemente,
g(x, y) c, 0 y (g(x, y) c) = 0.
La primera condicin impone el cumplimiento de la restriccin en el ptimo. La
condicin 0 garantiza que al ampliar la regin factible se obtendr un valor
mayor para el ptimo de f. La ltima condicin establece que = 0 (optimizacin
libre) o g(x, y) = c (problema de Lagrange) en el ptimo.
Por ltimo, como se justificar en la seccin 5.3.1.5 sobre condiciones
suficientes, la restriccin en un problema de maximizacin siempre deber estar
expresada en el formato g(x, y) c, con el fin de garantizar de que el ptimo
obtenido se trate efectivamente de un mximo (para 0).

188

5.3 Optimizacin con restricciones de desigualdad. Condiciones de Kuhn-Tucker


Condiciones de Kuhn-Tucker para el problema de maximizacin
mx. f (x, y), s.a. g(x, y) c.
1. Se construye la funcin lagrangeana correspondiente,
L(x, y, ) = f (x, y) + (c g(x, y)).

2. Se establecen las condiciones de primer orden para L, con respecto a las


variables x y y solamente,
Lx = fx gx = 0
Ly = fy gy = 0.
3. Se establece las condiciones de holgura complementaria
L 0,

L = 0,

o equivalentemente,
g(x, y) c,

(g(x, y) c) = 0.

4. Se resuelve, consistentemente, el sistema de ecuaciones y desigualdades.

Ejemplos:
1. Encuentra la solucin al problema
mx. f (x, y) = x + y
s.a. x2 + y 2 1.
En este caso, la lagrangeana correspondiente est dada por
L(x, y, ) = x + y + (1 x2 y 2 ).

Las condiciones de primer orden en x y y son


Lx = 1 2x = 0

(1)

Ly = 1 2y = 0, (2)
que debern resolverse junto con las condiciones de holgura complementaria
x2 + y 2 1, (3)

0, (4)

(x2 + y 2 1) = 0. (5)

Para resolver el sistema (1)-(5) conviene comenzar por la igualdad (5), que
establece que el ptimo debe cumplir al menos una de las condiciones = 0 o
x2 + y 2 = 1. Analicemos cada caso por separado. i) Si = 0, las ecuaciones
189

Captulo 5 Optimizacin
(1)-(2) conducen a una inconsistencia (1 = 0!) , por lo que esta opcin se
descarta. ii) Si x2 + y 2 = 1, se obtiene el sistema de ecuaciones
1 2x = 0

(1)

1 2y = 0
(2)
x2 + y 2 = 1,
(6)
2
2
correspondiente a un punto frontera (x + y = 1) de la restriccin. El sistema
tiene dos soluciones posibles,
(x1 , y1 ) =

1
1
,
2
2

y (x2 , y2 ) =

1 1
, .
2 2

Sustituyendo (x1 , y1 ) en (1) se obtiene

1
2
1 =
=
< 0.
2x1
2
Esto viola la condicin (4) , por lo que esta opcin se descarta. Por otra parte,
sustituyendo (x2 , y2 ) en (1) se obtiene

1
2
2 =
=
> 0,
2x2
2
que satisface la condicin (4). As, slo los valores x2 , y2 , 2 , satisfacen las
condiciones (1)-(5) en su totalidad. Concluimos que el valor mximo de f

ocurre en el punto frontera P 12 , 12 , con 2 = 2/2 y f = 22 .


La siguiente figura muestra la regin factible F, x2 + y 2 1, y algunas curvas
de nivel de f , dadas por x + y =const. Tomando en cuenta la direccin de
crecimiento de f , dada por el vector gradiente f, es claro que la solucin
ptima ocurre en el punto frontera P 12 , 12 de la restriccin, en donde f
toma su mximo valor posible.

190

5.3 Optimizacin con restricciones de desigualdad. Condiciones de Kuhn-Tucker


Nota que, al ser la solucin un punto frontera de F, este problema de
Kuhn-Tucker es enteramente equivalente al problema de Lagrange
mx. f (x, y) = x + y
s.a. x2 + y 2 = 1.
2. Encuentra la solucin al problema
mx. f (x, y) = 9 (x 2)2 (y 2)2

s.a. 2x + 3y 12.
En este caso, la lagrangeana correspondiente es

L(x, y, ) = 9 (x 2)2 (y 2)2 + (12 2x 3y)

Las condiciones de primer orden en x y y son

Lx = 2(x 2) 2 = 0

(1)

Ly = 2(y 2) 3 = 0, (2)
que debern resolverse junto con las condiciones de holgura complementaria
2x + 3y 12, (3)

0, (4)

(2x + 3y 12) = 0. (5)

De la igualdad (5) se sigue que = 0 o 2x + 3y = 12. i) Si = 0, las


ecuaciones (1)-(2) implican
x = y = 2,

(6)

en donde todas las condiciones (1)-(5) se satisfacen. Nota que (6) constituye un
punto interior de la restriccin, ya que
2x + 3y = 2(2) + 3(2) = 10 < 12. (7)
ii) Si 2x + 3y = 12, se obtiene el sistema de ecuaciones
2(x 2) 2 = 0

(1)

2(y 2) 3 = 0
(2)
2x + 3y = 12,
(9)
que correspondera a un punto frontera. Al resolver el sistema obtenemos el
4
punto (x, y) = 30
, 32 , con = 13
< 0, que viola la condicin (4). As, esta
13 13
opcin se descarta. Concluimos que el valor mximo de f ocurre en el punto
P (2, 2) , con = 0 y f = 9.
La siguiente figura muestra la regin factible F, 2x + 3y 12, y algunas curvas
de f , dadas por 9 (x 2)2 (y 2)2 =const. Tomando en cuenta la direccin
del vector gradiente f, el mximo restringido de f coincide con su punto de
191

Captulo 5 Optimizacin
optimizacin libre, P (2, 2) . Como en ese punto 2x + 3y < 12, P es un punto
interior de la restriccin, y por tanto = 0 ah.

5.3.1.2

El caso multidimensional

Los resultados anteriores pueden generalizarse fcilmente para el caso de la


optimizacin de una funcin f de varias variables, sujeta a una coleccin de
restricciones de desigualdad, de la forma
mx. f(x1 , . . . , xn )
s.a gj (x1 , . . . , xn ) cj , j = 1, . . . , m.
Aqu el nmero m de restricciones puede ser mayor, menor o igual al nmero n
de variables, debido a que la regin factible F es la interseccin de desigualdades
(por ejemplo, un polgono en R2 ) y no de igualdades, como en el caso de Lagrange

(en donde m < n). Para cada restriccin gj (


x ) cj se introduce un multiplicador
de Lagrange j , y se establecen las condiciones que se enuncian a continuacin.

Condiciones de Kuhn-Tucker para el problema mx. f (


x ) s.a. gj (
x ) cj ,

n
j = 1, . . . , m, x R .
1. Se construye la funcin lagrangeana correspondiente

L(
x , ) = f (
x)+

m
"
j=1

j (cj gj (
x )).

2. Se establecen n condiciones de primer orden para L, en xi , i = 1, . . . , n


Lxi = 0,

i = 1, . . . , n.

3. Se establecen m condiciones de holgura complementaria

g j (
x ) cj ,

j 0

o equivalentemente,

Lj 0,

j (gj (
x ) cj ) = 0,
j 0

j = 1, . . . , m,

j Lj = 0.

4. Se resuelve consistentemente el sistema de ecuaciones y desigualdades.


192

5.3 Optimizacin con restricciones de desigualdad. Condiciones de Kuhn-Tucker


Ejemplos:
1. Encuentra la solucin al problema
mx. f (x, y) = x1/2 y 1/2
s.a. x + y 2 (I)
x + 2y 2 (II)
x 0. (III)

Primeramente, escribimos las restricciones en el formato gj (


x ) cj , es decir,
mx. f (x, y) = x1/2 y 1/2
x+y 2
x 2y 2
x0
La lagrangeana correspondiente est dada por
s.a.

L(x, y, 1 , 2 , 3 ) = x1/2 y 1/2 + 1 (2 x y) + 2 (2 + x + 2y) + 3 x,

que en el ptimo satisface las condiciones de igualdad


Lx =

y 1/2
2x1/2

1 + 2 + 3 = 0, (1)

x1/2

Ly = 2y1/2 1 + 22 = 0, (2)
junto con las condiciones de holgura complementaria
x + y 2, 1 0, 1 (x + y 2) = 0, (3)
x + 2y 2, 2 0, 2 (x + 2y 2) = 0, (4)
x 0,
3 0,
3 x = 0.
(5)

De las igualdades en (3), (4) y (5) se siguen 23 = 8 casos, i) 1 = 2 = 3 = 0,


ii) 1 = 2 = x = 0, etc, cuyo anlisis puede resultar engorroso. En lugar
de esto, conviene utilizar un anlisis grfico para reducir el nmero de casos.
Para ello, dibujamos la regin factible F (interseccin de las tres restricciones
de desigualdad), algunas curvas de nivel de f , as como el gradiente f, para
determinar la direccin de crecimiento de f.

193

Captulo 5 Optimizacin
En la grfica se observa que el punto P que maximiza a f ocurre en donde la
restriccin I est activa,
x + y = 2, (6)
mientras que las restricciones II y III no lo estn (x + 2y > 2 y x > 0). De
acuerdo con las igualdades en (4) y (5), esta ltima afirmacin implica que
2 = 0 y 3 = 0.

(7)

Por ltimo, resolvemos el sistema de igualdades (1), (2), (6) y (7) para
x, y, 1 , 2 y 3 , y verificamos el cumplimiento de la condicin 1 0. Con
esto, se tiene que el valor mximo de f sucede en el punto P (1, 1) , con
1 = 12 > 0, 2 = 3 = 0 y f = 1.
Geomtricamente, 2 = 0 significa que si la restriccin II se modificara
ligeramente, digamos a x + 2y 2.01, esto no afectara la posicin actual
del ptimo, (x , y ) = (1, 1). Lo mismo sucede con la restriccin III, ya que
3 = 0. En contraste, 1 = 0 implica que un pequeo cambio en la restriccin
I s producira una nueva solucin ptima. Por esta razn, a los multiplicadores
de Lagrange j se les denomina variables de sensibilidad ante cambios en los
parmetros cj .

Aqu la solucin ptima es un punto frontera de la restriccin I, y no es sensible


a cambios infinitesimales en las restricciones II y III. En consecuencia, este
problema de Kuhn-Tucker es enteramente equivalente al problema de Lagrange
mx. f(x, y) = x1/2 y 1/2
s.a. x + y = 2.
2. Resuelve el siguiente problema de maximizacin de la utilidad de un individuo,
u(x, y), en donde p, m > 0:
mx. u(x, y) = x + ln(1 + y)
s.a. px + y m
x0
y 0.
194

(I)
(II)
(III)

5.3 Optimizacin con restricciones de desigualdad. Condiciones de Kuhn-Tucker

Primeramente, escribimos las restricciones en el formato gj (


x ) cj , es decir,
mx. u(x, y) = x + ln(1 + y)
px + y m
x0
y 0.
La lagrangeana correspondiente est dada por
s.a.

L(x, y, 1 , 2 , 3 ) = x + ln(1 + y) + 1 (m px y) + 2 x + 3 y,

que en el ptimo satisface las condiciones de igualdad


Lx = 1 p1 + 2 = 0, (1)

1
Ly = 1+y
1 + 3 = 0, (2)
junto con las condiciones de holgura complementaria

px + y m, 1 0, 1 (px + y m) = 0, (3)
x 0,
2 0,
2 x = 0,
(4)
y 0,
3 0,
3 y = 0.
(5)

Es claro de (1) que 1 = 0, ya que en ese caso 2,3 < 0. En consecuencia,


1 > 0 y la condicin (3) implica
px + y = m. (6)
Nos quedan, entonces, slo 22 = 4 casos:
i) Si x = 0 y y = 0, se viola la condicin (6), ya que m > 0.
ii) Si x > 0 y y = 0, de (6) se sigue que x = m/p. De (4) y (1) se obtiene
2 = 0, 1 = 1/p. De (2) y (5), se tiene 3 = (1/p) 1 0, de donde
0 < p 1.

iii) Si x = 0 y y > 0, de (6) se sigue que y = m. De (5) y (2) se obtiene


3 = 0, 1 = 1/(1 + m) > 0. De (1) y (4) se tiene 2 = p/(1 + m) 1 0,
de donde p m + 1.
iv) Si x > 0 y y > 0, de (4) y (5) se tiene 2 = 3 = 0. De (1) y(2) se obtiene
1 = 1, y = p 1. De (4), (5) y (6) se tiene x = (m + 1 p)/p > 0,
y = p 1 > 0, de donde 1 < p < m + 1.

En resumen, la solucin del problema es la siguiente:


A. Si 0 < p 1, entonces (x , y ) = (m/p, 0), con 1 = 1/p, 2 = 0,
3 = (1 p) /p.
B. Si 1 < p < m + 1, entonces (x , y ) = ((m + 1 p)/p, p 1), con
1 = 1/(1 + m), 2 = (p 1 m) /(1 + m), 3 = 0.
195

Captulo 5 Optimizacin
C. Si p m + 1, entonces (x , y ) = (0, m), con 1 = 1, 2 = 3 = 0.

3. Encuentra la solucin al siguiente problema de maximizacin de la utilidad de


un individuo, u(x, y), en donde A (40, 120) es un parmetro:
1
1
ln x + ln y
3
3
s.a. 3x + y A (I)
x + y 40 (II)
x 0 (III)
y 0. (IV)
Para entender por qu se impone la condicin A (40, 120), considera las
siguientes figuras. De acuerdo con la figura de la izquierda, si A 40, entonces
la restriccin I sera irrelevante (F es la interseccin de I-IV). De acuerdo con
la figura de la derecha, si A 120, entonces sera irrelevante la restriccin II.
mx. u(x, y) =

Por otra parte, observa que en este ejemplo podemos ignorar las restricciones III
y IV, ya que el dominio de la funcin objetivo est en R++ , por lo que no puede
existir solucin a lo largo de los ejes coordenados. De esta manera, la funcin
lagrangeana correspondiente est dada por
1
1
ln x + ln y + 1 (A 3x y) + 2 (40 x y),
3
3
que en el ptimo debe satisfacer las condiciones de igualdad
L=

Lx =

1
31 2 = 0 (1)
3x
196

5.3 Optimizacin con restricciones de desigualdad. Condiciones de Kuhn-Tucker


1
1 2 = 0 (2)
3y
junto con las condiciones de holgura complementaria
Ly =

3x + y A, 1 0, 1 (3x + y A) = 0, (3)
x + y 40, 2 0, 2 (x + y 40) = 0. (4)

De las igualdades en (3) y (4) se siguen 22 = 4 casos:

i)Si 1 = 0 y 2 = 0, se violan las condiciones (1) y (2), ya que u = 0 .

ii) Si en el ptimo est activa la restriccin I (3x + y = A) e inactiva la


restriccin II (x + y < 40), entonces ah se cumple
3x + y = A
2 = 0
1
31 2 = 0
3x
1
1 2 = 0.
3y
La solucin de este sistema es
A
A
2
, y = , 1 =
, 2 = 0.
6
2
3A
Adicionalmente, como en este caso x + y < 40, por lo tanto
x =

40 < A < 60.


iii) Si en el ptimo estn activas la restriccin I (3x + y = A) y la restriccin II
(x + y = 40), entonces ah se cumple
3x + y = A
x + y = 40
1
31 2 = 0
3x
1
1 2 = 0.
3y
La solucin de este sistema es
x =

A 40
,
2

y =

120 A
2(80 A)
4(A 60)
, 1 =
, 2 =
.
2
3(A 40)(120 A)
3(A 40)(120 A)

Adicionalmente, como 1 0 y 2 0, por lo tanto


60 A 80.
197

Captulo 5 Optimizacin
iv) Por ltimo, si en el ptimo est inactiva la restriccin I (3x + y < A) y activa
la restriccin II (x + y = 40), entonces ah se cumple
1 = 0
x + y = 40
1
31 2 = 0
3x
1
1 2 = 0.
3y
La solucin de este sistema es
1
.
60
Adicionalmente, como en este caso 3x + y < A, por lo tanto
x = 20,

y = 20, 1 = 0, 2 =

80 < A < 120.

En resumen, la solucin del problema es la siguiente:


A A
2
A. Si 40 < A < 60, entonces (x , y ) =
,
, con 1 =
, 2 = 0.
6 2
3A
A 40 120 A
,
, con
2
2
2(80 A)
4(A 60)
, 2 =
1 =
.
3(A 40)(120 A)
3(A 40)(120 A)

B. Si 60 A 80, entonces (x , y ) =

C. Si 80 < A < 120, entonces (x , y ) = (20, 20), con 1 = 0, 2 =

198

1
.
60

5.3 Optimizacin con restricciones de desigualdad. Condiciones de Kuhn-Tucker


5.3.1.3

No negatividad de las variables xi

En economa, las variables independientes x1 , . . . , xn , suelen representar


cantidades, precios y otras variables que no pueden tomar valores negativos. En
consecuencia, en los problemas de optimizacin aparecer una o varias restricciones
del tipo xi 0, adems de las restricciones econmicas (presupuestales, de
produccin, etc.).
Una manera de incorporar este tipo de restriccin al mtodo de Kuhn-Tucker
consiste en introducir un multiplicador de Lagrange adicional, digamos i , por
cada restriccin xi 0, tal y como lo hicimos en el ejemplo 1, para la restriccin
x 0. As, por ejemplo, para un problema del tipo
mx f (x, y)
s.a. g(x, y) c,
x 0, (es decir, x 0)
y 0, (es decir, y 0)
se puede plantear una lagrangeana de la forma
L(x, y, , ) = f (x, y) + (c g(x, y)) + 1 x + 2 y,
que en el ptimo satisface las condiciones
Lx = fx gx + 1 = 0
Ly = fy gy + 2 = 0

g(x, y) c, 0, (g(x, y) c) = 0
x 0, 1 0, 1 x = 0
y 0, 2 0, 2 y = 0
Existe una manera alternativa de incorporar las condiciones x 0, y 0. Para
ello, nota que la condicin Lx = 0 implica 1 = (fx gx ) . Adems, como
1 0 se tiene que (fx gx ) 0, es decir,
fx gx 0.

Esto equivale a reemplazar la condicin Lx = 0 por las condiciones


Lx 0,

x0

xLx = 0.

Un argumento similar se sigue para la condicin de no negatividad en la variable y.


De hecho, si suponemos que la lagrangeana L es una funcin cncava en todas
sus variables, nota que una condicin de la forma
Lxi 0,

xi 0

xi Lxi = 0,
199

i = 1, . . . , n

Captulo 5 Optimizacin
simplemente garantiza la existencia de un mximo global para L en la regin
xi 0.

De esta manera, este segundo planteamiento consiste en proponer una


lagrangeana de la siguiente forma (sin los multiplicadores 1 y 2 )
L(x, y, ) = f (x, y) + (c g(x, y)),
que en el ptimo satisface las condiciones modificadas
Lx = fx gx 0,
Ly = fy gy 0,

x 0,
y 0,

g(x, y) c, 0,
como se resume a continuacin.

xLx = 0
yLy = 0

(g(x, y) c) = 0,

Condiciones de Kuhn-Tucker para el problema de variables no negativas:

mx. f (
x ) s.a. gj (
x ) cj , xi 0, j = 1, . . . , m,
x Rn .
1. Se construye la funcin lagrangeana correspondiente

L(
x , ) = f (
x)+

m
"
j=1

j (cj gj (
x )).

2. Se establecen n condiciones de holgura complementaria para las variables no


negativas xi :
Lxi 0,

xi 0

xi Lxi = 0,

i = 1, . . . , n

3. Se establecen m condiciones de holgura complementaria para las restricciones

gj (
x ) cj :

g (
x)c ,
0 y (g (
x ) c ) = 0, j = 1, . . . , m.
j

o, equivalentemente,
Lj 0,

j 0

j Lj = 0,

j = 1, . . . , m.

4. Se resuelve consistentemente el sistema de ecuaciones y desigualdades.

200

5.3 Optimizacin con restricciones de desigualdad. Condiciones de Kuhn-Tucker


Ejemplo:
Encuentra la solucin del problema
mx. f (x, y) = 9 x2 (y 2)2
s.a.

x+y 1
x0

La lagrangeana correspondiente es

y 0.

(I)
(II)
(III)

L(x, y, ) = 9 x2 (y 2)2 + (1 x y) ,
que en el ptimo satisface las condiciones de no negatividad
Lx = 2x 0,
x 0,
x (2x + ) = 0,
(1)
Ly = 2(y 2) 0, y 0, y (2(y 2) + ) = 0, (2)
x + y 1,
0, (x + y 1) = 0. (3)
De las tres igualdades en (1)-(3) se siguen 23 = 8 casos. Como se observa en la
figura, de esos casos el nico que nos interesa es aqul en donde la solucin ptima
ocurre simultneamente en las fronteras de las restricciones I y II, es decir,
x + y = 1, x = 0.
Sustituyendo esto en el sistema de desigualdades, se obtiene que la solucin ptima
es (x , y ) = (0, 1), con = 2 y f = 8.

Por ltimo, debes tener mucho cuidado en el manejo de la condicin de no


negatividad de las variables, xi 0, en problemas de economa. sta puede ser
ignorada, slo si sabes a priori que existe la restriccin xi > 0 en el dominio de
la funcin objetivo f, o bien, cuando la derivada parcial fxi diverge en xi = 0.
En cualquiera de estos casos, la solucin ptima ocurrir en xi > 0. Si esto no
sucede, al ignorar la restriccin xi 0 puedes obtener resultados errneos cuando
201

Captulo 5 Optimizacin
el ptimo ocurre precisamente en xi = 0 (soluciones de esquina).

5.3.1.4 Restricciones mixtas


En algunos problemas de optimizacin se
tiene un conjunto de restricciones mixtas, en el sentido de que existen tanto
restricciones de igualdad, del tipo gj = cj , como restricciones de desigualdad,
del tipo gl cl . Es posible demostrar (ver Simon & Blume) que en este caso el
problema de optimizacin es una combinacin de un problema de Lagrange y uno
de Kuhn-Tucker, como se muestra en el siguiente ejemplo.
Ejemplo:
Plantea el siguiente problema de optimizacin:
mx. f (x, y, z)
s.a. g(x, y, z) = c
h(x, y, z) d.
En este caso, podemos plantear una lagrangeana de la forma
L(x, y, z, 1 , 2 ) = f(x, y, z) + 1 (c g(x, y, z)) + 2 (d h(x, y, z)),
con condiciones de primer orden

h(x, y, z) d,
5.3.1.5

Lx = 0
Ly = 0
Lz = 0
g(x, y, z) = c
2 0 y 2 (h(x, y, z) d) = 0.

Condiciones suficientes para un mximo global

Una vez establecidas las condiciones necesarias de optimalidad en el problema


de Kuhn-Tucker, buscamos condiciones que garanticen que el ptimo es un
mximo global. Al igual que en un problema de Lagrange (seccin 5.2), se puede
demostrar que una condicin suficiente para mximo es que sea cncava la funcin

lagrangeana L = f (
x ) + j j (cj gj (
x )). Dado que en este caso j > 0, esto
202

5.3 Optimizacin con restricciones de desigualdad. Condiciones de Kuhn-Tucker

se satisface si la funcin objetivo f es cncava y cada funcin de restriccin gj (


x)
es convexa, como se establece el siguiente teorema.

Teorema de suficiencia para un mximo global. Si el punto


x satisface las
condiciones de Kuhn-Tucker para el problema

mx. f(
x)

s.a. gj ( x ) cj , j = 1, . . . , m,
donde f C 1 es cncava y cada funcin gj C 1 es convexa, entonces el mximo

global de f se alcanza en
x .
El requisito de concavidad para la funcin objetivo f es claro en un problema
de maximizacin. La convexidad de las funciones gj se explica de la siguiente

manera. Cuando hay una sola restriccin de desigualdad, g(


x ) c, pedir que

z = g( x ) sea una funcin convexa te garantiza que su contorno inferior o regin

factible g(
x ) c sea una regin convexa.

Cuando hay varias restricciones de desigualdad, la regin factible es la interseccin

x ) sea convexa
de todas las restricciones gj cj . Pedir que cada funcin z = gj (

garantiza que sus contornos inferiores gj (


x ) cj son conjuntos convexos, de
modo que su interseccin tambin ser una regin convexa.

Por ltimo, sabemos que muchos problemas de optimizacin en economa se


consideran funciones objetivo cuasicncavas, en lugar de cncavas. En vista de
ello, a continuacin presentamos un teorema de suficiencia alternativo, debido a
K.J. Arrow y A.C. Enthoven, que constituye una versin menos restrictiva que la
del teorema anterior.
203

Captulo 5 Optimizacin

x
Teorema de Arrow-Enthoven para un mximo global. Si el punto
satisface las condiciones de Kuhn-Tucker para el problema

mx. f (
x)

s.a. gj ( x ) cj , j = 1, . . . , m,
donde f C 1 es cuasicncava y cada funcin gj C 1 es cuasiconvexa, entonces

el mximo global de f se alcanza en


x .
Nota que la condicin de cuasiconvexidad para las funciones de restriccin gj

garantiza que sus contornos inferiores gj (


x ) cj sean regiones convexas, como
ocurre con las funciones de restriccin convexas.

5.3.2

Problemas de minimizacin

A diferencia de un problema de Lagrange, en un problema de Kuhn-Tucker


el planteamiento para un caso de maximizacin difiere del de un caso de
minimizacin. Por razones de claridad, en la discusin anterior nos enfocamos
exclusivamente en problemas de maximizacin. A continuacin presentamos cmo
adaptar esos resultados para el caso de problemas de minimizacin.
Las condiciones de Kuhn-Tucker para el problema de minimizacin se basan
en un razonamiento similar al del problema de maximizacin. En ambos casos, un
aspecto importante se refiere al formato en el que debe expresarse la restriccin
de desigualdad. En el caso de maximizacin, el formato g(x, y) c para la
restriccin, junto con la condicin 0, garantizan que al ampliarse la regin
factible se obtendr el mejor mximo posible para el problema. Para que esto
mismo ocurra en un problema de minimizacin, pero an conservando la condicin
0, ser necesario expresar la restriccin en la forma g(x, y) c, como se
justificar ms adelante, con las condiciones de segundo orden.
Nos interesa, entonces, resolver un problema de minimizacin, de la forma
mn. f (x, y)
s.a. g(x, y) c.
Para ello, se parte de la funcin lagrangeana
L(x, y, ) = f(x, y) + (c g(x, y)),
que presenta la misma forma funcional que en el caso de maximizacin. Para esta
funcin, se establecen las condiciones necesarias de primer orden,
Lx = fx (x, y) gx (x, y) = 0
Ly = fy (x, y) gy (x, y) = 0,
204

5.3 Optimizacin con restricciones de desigualdad. Condiciones de Kuhn-Tucker


que nuevamente representan la condicin de tangencia (f = g) en el
ptimo. En relacin con las condiciones de holgura complementaria, ahora deber
verificarse
L 0, 0 y L = 0,
o equivalentemente,
g(x, y) c, 0 y (g(x, y) c) = 0.
La primera condicin de holgura impone el cumplimiento de la restriccin en el
ptimo. La condicin 0 garantiza que un pequeo incremento en c generar
un menor valor para el ptimo de f . La ltima condicin establece que = 0
(optimizacin libre) o g(x, y) = c (problema de Lagrange) en el ptimo. Estas son
las condiciones de Kuhn-Tucker para el problema de minimizacin.
Condiciones de Kuhn-Tucker para el problema de minimizacin
mn. f(x, y), s.a. g(x, y) c.
1. Se construye la funcin lagrangeana correspondiente
L(x, y, ) = f (x, y) + (c g(x, y)).

2. Se establecen las condiciones de primer orden para L, con respecto a las


variables x y y solamente,
Lx = fx gx = 0,

Ly = fy gy = 0.
3. Se establece las condiciones de holgura complementaria
L 0,

(g(x, y) c) = 0,

o equivalentemente,
g(x, y) c,

(g(x, y) c) = 0.

4. Se resuelve, consistentemente, el sistema de ecuaciones y desigualdades.

Ejemplo:
Encuentra la solucin al problema
mn. f(x, y) = y
s.a.

x2 + y 2 1.

205

Captulo 5 Optimizacin
Primeramente escribimos el problema en un formato adecuado, es decir,
mn. f (x, y) = y

s.a. x2 y 2 1.
As, la lagrangeana correspondiente est dada por
L(x, y, ) = y + (1 + x2 + y 2 ).

Las condiciones de primer orden en x y y son

Lx = 2x = 0

(1)

Ly = 1 + 2y = 0, (2)
que debern resolverse junto con las condiciones de holgura complementaria
x2 + y 2 1, (3)

0, (4)

(x2 + y 2 1) = 0. (5)

2x = 0

(1)

Nota que la desigualdad en (3) est escrita en el formato original, sin que esto
afecte el resultado; el formato es importante slo en las ecuaciones (1) y (2). De
acuerdo con la igualdad (5), se tienen dos casos, = 0 o x2 + y 2 = 1. i) Si = 0,
la ecuacin (2) conduce a una inconsistencia ( 1 = 0!) , por lo que esta opcin
se descarta. ii) Si x2 + y 2 = 1, se obtiene el sistema de ecuaciones
1 + 2y = 0
(2)
x2 + y 2 = 1,
(6)
correspondiente a un punto frontera (x2 + y 2 = 1) de la restriccin. El sistema
tiene dos soluciones posibles,
(x1 , y1 ) = (0, 1)

(x2 , y2 ) = (0, 1) .

Sustituyendo (x1 , y1 ) en (2) se obtiene

1
1
= < 0.
2y1
2
Esto viola la condicin (4) , por lo que esta opcin se descarta. Por otra parte,
sustituyendo (x2 , y2 ) en (2) se obtiene
1 =

1
1
= > 0,
2y2
2
que satisface la condicin (4). As, slo los valores x2 , y2 , 2 , satisfacen las
condiciones (1)-(5) en su totalidad. Concluimos que el valor mnimo de f ocurre
en el punto frontera P (0, 1) , con 2 = 1/2 y f = 1.
2 =

La siguiente figura muestra la regin factible F, x2 + y 2 1, y algunas


curvas de nivel de f, dadas por y =const. Tomando en cuenta la direccin de
206

5.3 Optimizacin con restricciones de desigualdad. Condiciones de Kuhn-Tucker


crecimiento de f , dada por el vector gradiente f, es claro que la solucin ptima
ocurre en el punto frontera P (0, 1) de la restriccin, en donde f toma su mnimo
valor posible.

Para el caso con varias restricciones, el mtodo de Kuhn-Tucker se generaliza


de la siguiente manera.

Condiciones de Kuhn-Tucker para el problema mn. f(


x ) s.a. gj (
x ) cj ,

n
j = 1, . . . , m, x R .
1. Se construye la funcin lagrangeana correspondiente
m

"

L(
x , ) = f (
x)+
j (cj gj (
x )).
j=1

2. Se establecen n condiciones de primer orden para L, en xi , i = 1, . . . , n


Lxi = 0,

i = 1, . . . , n.

3. Se establecen m condiciones de holgura complementaria

g j (
x ) cj ,

j 0

j (gj (
x ) cj ) = 0,

j = 1, . . . , m,

o equivalentemente,
Lj 0,

j 0

j Lj = 0.

4. Se resuelve consistentemente el sistema de ecuaciones y desigualdades.


Ejemplo:
Encuentra la solucin al problema
mn. f(x, y) = x2 + y 2
s.a. x + y 2 (I)
x + 2y 2 (II)
x 0. (III)
207

Captulo 5 Optimizacin
Primeramente, escribimos las restricciones en el formato adecuado,
mn. f (x, y) = x2 + y 2
s.a.
x y 2
x + 2y 2
x 0.
La lagrangeana correspondiente est dada por
L(x, y, 1 , 2 , 3 ) = x2 + y 2 + 1 (2 + x + y) + 2 (2 x 2y) + 3 (x),
que satisface las condiciones de igualdad
Lx = 2x + 1 2 3 = 0, (1)
Ly = 2y + 1 22 = 0,
(2)
junto con las condiciones de holgura complementaria
x + y 2, 1 0, 1 (x + y 2) = 0, (3)
x + 2y 2, 2 0, 2 (x + 2y 2) = 0, (4)
x 0,
3 0,
3 x = 0.
(5)

De las igualdades en (3), (4) y (5) se siguen 23 = 8 casos, algunos de los cuales
pueden eliminarse mediante un anlisis grfico del problema. Para ello, dibujamos
la regin factible F , algunas curvas de nivel de f , as como el gradiente f, para
determinar la direccin de crecimiento de f.

En la grfica se observa que el punto P que minimiza a f ocurre en donde la


restriccin II est activa,
x + 2y = 2, (6)
mientras que las restricciones I y III no lo estn (x + y < 2 y x > 0). De acuerdo
con las igualdades en (3) y (5), esta ltima afirmacin implica que
1 = 0 y 3 = 0.

(7)

Resolvemos el sistema de igualdades (1), (2), (6) y (7) para x, y, 1 , 2 y 3 , y


verificamos el cumplimiento de la condicin 2 0. Con esto, se tiene que el
208

5.3 Optimizacin con restricciones de desigualdad. Condiciones de Kuhn-Tucker


2 4
,
5 5

valor mnimo de f sucede en el punto P


f = 20
.
25

, con 2 =

4
5

> 0, 1 = 3 = 0 y

Condiciones de Kuhn-Tucker para el problema de variables no negativas:

mn. f(
x ) s.a. gj (
x ) cj , xi 0, j = 1, . . . , m,
x Rn .
1. Se construye la funcin lagrangeana correspondiente

L(
x , ) = f (
x)+

m
"
j=1

j (cj gj (
x )).

2. Se establecen n condiciones de holgura complementaria para las variables no


negativas xi :
Lxi 0,

xi 0

xi Lxi = 0,

i = 1, . . . , n

3. Se establecen m condiciones de holgura complementaria para las restricciones


gj cj :
Lj 0,

j 0

j Lj = 0,

j = 1, . . . , m,

o equivalentemente,

g j (
x ) cj ,

j 0

j (gj (
x ) cj ) = 0,

j = 1, . . . , m.

4. Se resuelve consistentemente el sistema de igualdades y desigualdades.

Por ltimo, las condiciones de suficiencia para un mnimo global son las
siguientes.

Teorema de suficiencia para un mnimo global. Si el punto


x satisface las
condiciones de Kuhn-Tucker para el problema

mn. f (
x)

s.a. gj ( x ) cj , j = 1, . . . , m,
1
donde f C es convexa y cada funcin gj C 1 es cncava, entonces el mnimo

global de f se alcanza en
x .
Es claro el requisito de convexidad para la funcin objetivo f en un problema de

minimizacin. En el caso de una sola restriccin de desigualdad, g(


x ) c, pedir
209

Captulo 5 Optimizacin

que z = g(
x ) sea una funcin cncava te garantiza que su contorno superior o

regin factible g(
x ) c sea una regin convexa.

Cuando hay varias restricciones de desigualdad, pedir que cada funcin z = gj (


x)

sea cncava garantiza que sus contornos superiores gj ( x ) cj son conjuntos


convexos, de modo que su interseccin tambin ser una regin convexa.

La generalizacin de este teorema para funciones cuasiconvexas es la siguiente.

Teorema de Arrow-Enthoven para un mnimo global. Si el punto


x
satisface las condiciones de Kuhn-Tucker para el problema

mn. f (
x)

s.a. gj (
x ) cj , j = 1, . . . , m,
1
donde f C es cuasiconvexa y cada funcin gj C 1 es cuasicncava, entonces

el mnimo global de f se alcanza en


x .

5.3.3 Cualificacin de las restricciones: cundo fallan las


condiciones de Kuhn-Tucker?
Similarmente al caso de Lagrange, las condiciones de Kuhn-Tucker pueden fallar
al ocurrir ciertas irregularidades
de frontera, en las que se viola la cualificacin de
$

las restricciones f = m

j=1 j gj en el ptimo, que en el caso particular de


una nica restriccin se reduce a f = g . Esto se ilustra en los ejemplos
que presentaremos a continuacin.
210

5.3 Optimizacin con restricciones de desigualdad. Condiciones de Kuhn-Tucker


Ejemplos:
1. Encuentra la solucin al problema
mx.

f (x, y) = y

s.a. x2 y 3 0.
La lagrangeana correspondiente es la funcin
L(x, y, ) = y + y 3 x2 ,
cuyas condiciones de Kuhn-Tucker son
Lx = 2x = 0,

Ly = 1 + 3y 2 = 0,
x2 y 3 0, 0, x2 y 3 = 0.
Es fcil verificar que no existe solucin a este sistema de ecuaciones y
desigualdades. Sin embargo, el mtodo grfico s nos permite obtener que la
funcin f alcanza su mximo global, f = 0, en el punto (0, 0).

Nuevamente, aqu la dificultad consiste en que en el ptimo f = j = 0 ,

mientras que g = 0 , de modo que no se verifica la condicin f = g .


Esto se debe a que la funcin z = g(x, y) = x2 y 3 alcanza su ptimo en un
punto frontera de su contorno inferior CIg (0), x2 y 3 0, que precisamente
coincide con el ptimo de f sujeto a esa restriccin.
2. Encuentra la solucin al problema
mx.

f (x, y) = x

y (1 x)3 0,
x, y 0.
La lagrangeana correspondiente es la funcin
s.a.

L(x, y, 1 , 2 , 3 ) = x + 1 (1 x)3 y + 2 x + 3 y,
211

Captulo 5 Optimizacin
cuyas condiciones de Kuhn-Tucker son
Lx = 1 31 (1 x)2 + 2 = 0
L y = 1 + 3 = 0
y (1 x) 0, 1 0, 1 y (1 x)3 = 0
x 0, 2 0, 2 x = 0,
y 0, 3 0, 3 y = 0.
Con un poco de paciencia puedes verificar que no existe solucin que satisfaga
estas condiciones. Sin embargo, el mtodo grfico s nos permite obtener que la
funcin f alcanza su mximo global, f = 1, en el punto (1, 0).
3

La dificultad se debe a que en el ptimo no se satisface la condicin


f = 1 g1 + 2 g2 + 3 g3 , para las condiciones que estn activas en ese
punto, que son g1 y g3 . En efecto, es fcil comprobar que f = i, g1 = j y
g3 = j, de modo que no existen multiplicadores 1 , 3 0 tales que
i = 1 j + 3 j
= (1 3 ) j.

Esto se debe a que al ser g3 = g1 el conjunto de gradientes gj en el


ptimo no es linealmente independiente. Para una presentacin ms detallada de
este tema te recomiendo consultar el libro de Simon & Blume.

5.4 Teorema de la envolvente


En muchas aplicaciones a economa, tanto la funcin objetivo f como el conjunto
de restricciones {gj } dependen no slo de las variables independientes x1 , . . . , xn,
o variables de decisin, sino tambin de una coleccin de parmetros a1 , . . . , ak ,
o variables exgenas. Una vez que se optimiza respecto a las primeras, el ptimo
obtenido depende del valor de los parmetros. Tiene sentido entonces preguntarse
qu efecto tiene sobre el valor ptimo de la funcin algn posible cambio en los
212

5.4 Teorema de la envolvente


parmetros. El teorema de la envolvente proporciona una respuesta a esta pregunta,
y es vlido en general para cualquier problema de optimizacin que involucre
parmetros, ya sea en optimizacin libre, como en optimizacin restringida.

5.4.1

Optimizacin libre

Considera primero el caso ms simple de maximizacin de una funcin


diferenciable f(x; a) de la variable independiente, x, cuya forma funcional
contiene un parmetro a. Aqu la notacin para f indica que la optimizacin se
lleva a cabo con respecto a la variable que est a la izquierda del punto y coma.

Se trata, entonces, de resolver el problema


maxx f(x; a).
El punto x que maximiza f se obtiene de la condicin de primer orden
f(x; a)
x

= 0,
x=x

de modo que ste depende del parmetro a, es decir,


x = x (a).
Al sustituir x en la funcin f (x; a) se obtiene su valor mximo V (a), dado por
V (a) = f (x (a); a),
que es una funcin del parmetro a. La funcin V (a) se conoce como la funcin
valor, y describe el comportamiento de los valores mximos de f al cambiar el
parmetro a. De acuerdo con la figura anterior, en la figura de la izquierda se
muestra las grficas de y = f (x; a) como funcin de x, evaluada en dos valores
arbitrarios a2 > a1 del parmetro a. Podra suceder, por ejemplo, que el valor
213

Captulo 5 Optimizacin
mximo V (a) de f inicialmente se incremente y luego disminuya, al incrementarse
a, como se muestra en la figura de la derecha.

Suponiendo que la funcin valor V (a) es diferenciable, entonces el cambio


en V al incrementarse el valor de a est dado por la derivada dV (a)/da. Como
V (a) = f(x (a); a), el clculo de esta derivada involucra el efecto directo dado
por la dependencia explcita f ( ; a) de f con a, as como el efecto indirecto dado
por la dependencia implcita f (x (a); ) a travs de x (a). De acuerdo con la regla
de la cadena se tiene, entonces,
dV (a)
df(x (a); a)
=
da
da
=

f dx f
+
x da
a

=0+

f
,
a

en donde se utiliz la condicin de primer orden, f /x = 0. Nota que el


trmino igual a 0 corresponde precisamente al efecto indirecto sobre V causado
por el cambio en x al variar a, de modo que slo sobrevive el efecto directo de a
en f , dado por f /a, es decir,
dV (a)
f (x ; a)
=
.
da
a
As, la condicin de primer orden garantiza que en el ptimo se puede ignorar la
dependencia implcita de f(x ; a) con a a travs de x (a), considerando slo la
dependencia explcita de f (x ; a) con a, como si x estuviera fijo. Esta igualdad
constituye la versin ms simple del teorema de la envolvente para optimizacin
no restringida para el caso general de varios parmetros, que enunciaremos ms
adelante en esta seccin. Antes de hacerlo, discutamos primero el significado
geomtrico del resultado obtenido para el caso de un solo parmetro a.
214

5.4 Teorema de la envolvente


El teorema de la envolvente se refiere a dos funciones diferentes de a, dadas por
V (a) y f(x ; a). La funcin valor V (a) resulta de la maximizacin con respecto
a x de la funcin f (x; a), para cada valor de a. Su forma funcional se obtiene
al sustituir el nivel ptimo x = x (a) en f (x; a), por lo que V depende de a
solamente. En contraste, la funcin f (x ; a) no proviene de una maximizacin.
Su forma funcional se obtiene al evaluar x en un valor fijo x , por lo que f (x ; a)
queda expresada en trminos de la constante x y el parmetro a. De acuerdo
con el teorema de la envolvente, para cada valor del parmetro a se satisfacen las
siguientes dos condiciones:
V (a) = f(x; a)|x=x
f(x; a)
dV (a)
=
(2)
,
da
a
x=x
que establecen la tangencia de estas dos funciones en ese punto.
(1)

La siguiente figura ilustra las condiciones de tangencia (1) y (2) para un


problema de maximizacin. La curva superior representa la funcin V (a), mientras
que la curva inferior representa la funcin f (x1 ; a) evaluada en un valor fijo
x = x1 . Ambas son tangentes precisamente en aquel valor a = a1 que corresponde
al ptimo x1 = x (a1 ).

Para cada seleccin x = xi se obtiene una curva distinta f(xi ; a), como se ilustra
en la siguiente figura. En ella se muestra una coleccin de curvitas, envueltas
superiormente por la funcin V (a) de los valores mximos de f , conocida tambin
como la curva envolvente. El punto de tangencia de la envolvente con cada f (xi ; a)
ocurre precisamente en aquel valor ai que satisface la condicin xi = x (ai ).

215

Captulo 5 Optimizacin
En problemas de maximizacin la envolvente V (a) nunca estar por debajo de
las curvitas y = f (xi ; a), siendo adems menos cncava que stas. Esto significa
que V (a) representa el mejor mximo posible de la funcin f con respecto
al parmetro a, y ste ocurre cuando se relaja la variable x de tal modo que se
maximice f. En contraste, un mximo menos bueno se obtiene al evaluar la
funcin f (x; a) en un valor fijo x = xi , quedando sta como funcin de a. Las
curvas coinciden slo cuando a satisface la condicin de ptimo xi = x (ai ).
Para problemas de minimizacin se sigue un razonamiento similar, pero ahora
las curvitas son envueltas inferiormente por V (a). En ese caso, la curva envolvente
V (a) nunca estar por encima de las curvitas f (xi ; a), y adems ser menos
convexa que stas, como se muestra en la siguiente figura.

En este caso, V (a) representa el mejor mnimo posible de la funcin f con


respecto al parmetro a, comparado con el obtenido al evaluar la funcin f(x; a)
en un valor fijo x = xi , con excepcin de aquellos valores ai correspondientes a la
seleccin xi = x (ai ), en donde la i-sima curva es tangente a V (a).
Ejemplos:
1. Considera el problema de maximizacin
x2
maxx f(x; a) = 8x 2 ,
a
con a > 0. En este caso, la condicin de primer orden correspondiente es
f
2x
= 8 2
x x=x
a
cuya solucin est dada por

= 0,
x=x

x (a) = 4a2 .
De este modo, el valor mximo de f es V (a) = 8(4a2 )
V (a) = 16a2 .
216

(4a2 )2
, es decir,
a2

5.4 Teorema de la envolvente


La siguiente figura muestra las grficas de f (x; a) = 8xx2 /a2 en funcin de x,
para a = 1, 2, 3. En cada caso, el mximo ocurre en (x (a), V (a)) = (4a2 , 16a2 ).

Para ilustrar el teorema de la envolvente notamos que la funcin f(x ; a) est


dada simplemente por
(x )2
.
a2
La siguiente figura muestra las grficas de la funcin V (a) = 16a2 , as como las
curvas f (x ; a) = 8x (x )2 /a2 en funcin de a, para x = 4, 16, 36.
f (x ; a) = 8x

Ah se observa que las curvas f(x ; a) son tangentes a la envolvente V (a) en


aquellos valores de a que satisfacen la condicin de ptimo
a=

x
.
4

En efecto, en esos puntos se cumple


(1)
(2)

(4a2 )2
= 16a2 = V (a)
2
a

2
x =4a
2(x )2
2(4a2 )2
dV (a)
=
= 32a =
.
3
3
a
a
da
x =4a2

f (x ; a)|x =4a2 = 8x
f(x ; a)
a

=
x =4a2

(x )2
a2

217

= 8(4a2 )

Captulo 5 Optimizacin

2. Considera el problema de minimizacin


minx f(x; a) = a2 x ln x 1,
con a > 0. La siguiente figura muestra la grfica de f (x; a) = a2 x ln x 1 en
funcin de x, para a = 2.

La condicin de primer orden correspondiente est dada por


f
x

x=x

= a2

1
x

x (a) =

1
.
a2

= 0,
x=x

cuya solucin es

De este modo el valor mnimo de f es V (a) = a2

1
a2

ln

1
a2

1, es

decir,
V (a) = 2 ln a,
que representa la curva envolvente en este problema. Por otra parte, las curvitas
f(x ; a) se obtienen al evaluar f (x; a) en el punto ptimo x , es decir,
f (x ; a) = a2 x ln x 1.
La siguiente figura muestra las grficas de la funcin V (a) = 2 ln a, as como
218

5.4 Teorema de la envolvente


1
las curvas f (x ; a) = a2 x ln x 1 en funcin de a, para x = 1, .
4

Ah se observa que las curvas f(x ; a) son tangentes a la envolvente V (a) en


aquellos valores de a que satisfacen la condicin de ptimo
1
a = .
x
En efecto, en esos puntos se cumple
(1)
(2)

f(x ; a)|x =1/a2 = a2 x ln x 1


f (x ; a)
a

x =1/a2

x =1/a2

= 2ax |x =1/a2 = 2a

1
a2

1
1
ln
2
a
a2
2
dV (a)
= =
.
a
da

= a2

1 = 2 ln a = V (a)

Por lo general, puede resultar ms complicado encontrar directamente la


derivada dV (a)/da a partir de la funcin V (a), que utilizando el teorema de la
envolvente con f (x ; a), como se ilustra en el siguiente ejemplo.
Ejemplo:
Considera el problema de maximizacin
maxx f (x; a) = 1 + (a2 + 1)x ex ,
con a R. La condicin de primer orden correspondiente es
f
x

x=x

= (a2 + 1) 1 + (a2 + 1)x


219

ex

x=x

= 0,

Captulo 5 Optimizacin
cuya solucin es
a2
.
1 + a2

x (a) =
De este modo, el valor mximo de f es

2
2
a2
a 2
a 2
2
1+a
1+a .
e
=
1
+
a
e
1 + a2
Para encontrar la derivada dV (a)/da puedes proceder de dos maneras diferentes.
La primera consiste en hacer caso omiso de toda la discusin anterior, y encontrar
directamente la derivada de V (a), es decir,

V (a) = 1 + (a2 + 1)

dV (a)
d
=
da
da

1 + a2 e

a2
1+a2

a2
1+a2

= 2ae

= 2ae

= 2a 1

a2
1+a2

d
a2
da 1 + a2
2
2a
a
e 1+a2
(1 + a2 )2

1 + a2 e
1 + a2
1
1 + a2

a2
1+a2

a2
1+a2

2
2a3
a 2
1+a .
e
1 + a2
La segunda consiste en utilizar el teorema de la envolvente, dado por la igualdad
dV (a)
f (x ; a)
=
. Para ello, observa que f (x ; a) es la funcin
da
a

f (x ; a) = 1 + (a2 + 1)x ex ,
de modo que

f(x ; a)

= 2ax ex .
a
Sustituyendo la forma explcita de x en esta expresin obtenemos
a2
f(x ; a)
= 2a
a
1 + a2
Nota entonces que, efectivamente,

a2
1+a2

2
dV (a)
f(x ; a)
2a3
a 2
1+a ,
=
=
e
da
a
1 + a2
pero la derivada dV /da se obtuvo de una manera ms simple y directa con
f (x ; a)/a.

220

5.4 Teorema de la envolvente


Los resultados anteriores se pueden extender al caso de funciones diferenciables
f : S Rn R con k parmetros {a1 , . . . , ak } , de la siguiente manera.
Considera el problema de maximizacin (o minimizacin)

max
f (
x;
a ),
x1 ,...,xn

con
x = (x1 , . . . , xn ). En este caso, el ptimo no restringido de esta funcin se
obtiene de las condiciones de primer orden,
f
xi
cuya solucin es el vector

x =
x

= 0,

i = 1, . . . , n,

x =
x (
a ).
En consecuencia, el valor mximo fmax V de la funcin f tambin depender de

a , a travs de la relacin

V (
a ) f(
x (
a );
a ).

Cuando alguno de los parmetros se modifica, digamos al , l = 1, . . . , k, el ptimo

V (
a ) de f cambia de acuerdo con

V (
a)
f (x1 (
a ), . . . , xn (
a );
a)
=
al
al
f x1
f xn f
f
=
+

+
+
=
,
x1 al
xn al
al
al
en donde se han cancelado los primeros n trminos por las n condiciones de primer
orden, f /xi = 0. Cada trmino cancelado, f /xi xi /al , corresponde
al efecto indirecto sobre V causado por el cambio en xi al cambiar al . El trmino
sobreviviente, f /al , corresponde al efecto directo del cambio en al sobre el
valor ptimo V. Se concluye entonces que

f (
x (
V (
a)
a );
a)
=
,
l = 1, . . . , k.
al
al

Teorema de la envolvente para optimizacin no restringida. Sea f (


x;
a)

una funcin diferenciable de


x Rn con parmetros
a Rk . Para cada seleccin

de
a considera el problema

optimizar
f (
x;
a ).
x1 ,...,xn

Sea
x (
a ) una solucin del problema, con
x (
a ) una funcin diferenciable. Si


V ( a ) f( x ( a ); a ) denota el valor ptimo de f, entonces

V (
a)
f (
x (
a );
a)
=
, l = 1, . . . , k.
al
al
221

Captulo 5 Optimizacin

Aqu la derivada parcial en el lado izquierdo se realiza sobre el valor ptimo


V (a) de la funcin f , mientras que la derivada parcial en el lado derecho se realiza

sobre la funcin f (
x (
a );
a ), obtenida al evaluar f (
x;
a ) en
a ), sin
x =
x (
que f haya sido optimizada. En este ltimo caso, slo se considera la dependencia

explcita de f (
x (
a );
a ) con al , ignorando la dependencia implcita de f con


al a travs de x ( a ), como si
x se mantuviera fijo, como se ilustra en los
siguientes ejemplos.
Ejemplos:
1. Considera el problema
maxx f (x; r1 , r2 ) = xr1 r2 x,

con 0 < r1 < 1. La condicin de primer orden correspondiente est dada por
f
x

x=x

= r1 xr1 1 r2

x=x

= 0,

cuya solucin es
1

r2 r1 1
x (r1 , r2 ) =
.
r1
De esta manera, el valor mximo de f est dado por

r1

r2 r1 1
r2 r1 1
V (r1 , r2 ) =
r2
.
r1
r1
El clculo directo de las derivadas parciales de esta funcin resulta bastante
dxx
.
complejo, particularmente V /r1 , que involucra derivadas del tipo
dx
En contraste, el clculo va el teorema de la envolvente es directo. Para ello,
primero evala f en x ,
f (x ; r1 , r2 ) = (x )r1 r2 x ,

cuyas derivadas parciales, bastante simples, quedan expresadas en trminos de


1
r2 r1 1

x (r1 , r2 ) =
,
r1
V
f (x ; r1 , r2 )
=
= (x )r1 ln(x )
r1
r1
V
f (x ; r1 , r2 )
=
= x .
r2
r2
222

5.4 Teorema de la envolvente


2. Considera el problema de minimizar el costo C(L, K) = wL + rK como
funcin del trabajo L y el capital K, sujeto a una produccin fija L1/2 K 1/2 = Q.
Los parmetros del sistema son el salario w, la tasa de inters r y el nivel
de produccin Q. Si despejamos la variable L de la ecuacin de restriccin,
L = Q2 /K, y la sustituimos en la funcin de costos, el problema puede
escribirse como el problema de optimizacin no restringida
wQ2
+ rK.
K
La condicin de primer orden correspondiente est dada por
minK C(K; r, w, Q) =

C
K

K=K

wQ2
+r
K2

= 0,
K=K

cuya solucin es
K (w, r, Q) = Q

w
.
r

El costo mnimo es, por tanto, Cmn (w, r, Q) =


decir,

wQ2
+r Q
Q wr

w
r

, es

Cmn (w, r, Q) = 2Q wr,


conocida como la funcin de gasto. Para encontrar sus derivadas parciales
con respecto a los parmetros w, r y Q, podemos utilizar el teorema de la
envolvente, de la siguiente manera. Primeramente evaluamos la funcin de costo
en K ,
wQ2
C(K ; r, w, Q) =
+ rK ,
K
de modo que
Q2
Cmn
C(K ; r, w, Q)
Q2
=
= =
=Q
w
w
K
Q wr

r
w

Cmn
C(K ; r, w, Q)
w
=
= K = Q
r
r
r

Cmn
C(K ; r, w, Q)
2wQ
2wQ
=
=
=
= 2 wr.
w

Q
Q
K
Q r
La funcin C(K ; r, w, Q) se conoce como la funcin de costo de corto plazo
SRC (Short-Run Cost), puesto que en el corto plazo es de esperarse que el
capital no cambie, manteniendo un valor fijo K . A su vez, la funcin de gasto
Cmn (w, r, Q) se denomina la funcin de costo de largo plazo LRC (Long-Run
Cost), ya que se obtiene permitiendo que el capital K vare hasta que el costo
223

Captulo 5 Optimizacin
adquiera su valor mnimo. Esta ltima constituye, por tanto, el mejor mnimo
posible, o curva envolvente en el problema de minimizacin de costos. De esta
manera, para cada valor fijo K i del capital, se puede definir una familia de
funciones de corto plazo, dadas por
wQ2
+ rK i ,
Ki
que estn envueltas inferiormente por la funcin de costo mnimo de largo plazo

LRC = 2Q wr.
SRCi =

Equivalentemente, si en lugar del costo C consideramos en su lugar al costo


promedio C/Q, o costo por unidad del bien, podemos definir las funciones de
costo promedio de corto plazo SRAC (Short-Run Average Cost)
SRCi
wQ rK i
=
+
Q
Q
Ki
y de costo promedio de largo plazo LRAC (Long-Run Average Cost)
SRACi =

LRC
= 2 wr.
Q
Como funciones del parmetro Q, las curvas SRACi y LRAC son distintas
entre s. Sin embargo, nota que cuando SRACi es evaluada en aquel valor Qi
que satisface la condicin del punto ptimo K (w, r, Qi ) = Qi wr = K i , es
decir
r
,
Qi = K i
w
se obtiene
LRAC =

1.
2.

SRAC|Qi =
d SRAC
dQ

=
Qi

w Ki

r
w

Ki
w
rK i
2
Q
Ki

rK i
= 2 wr = LRAC|Qi
r
Ki w

=0=
Qi

d LRAC
dQ

.
Qi

Estas condiciones expresan la condicin de tangencia entre la curva de costo


medio de largo plazo LRAC y las curvas de corto plazo SRACi , en aquellos
niveles de produccin Qi que corresponden a los correspondientes capitales
fijos K i , de acuerdo con la condicin de optimalidad
r
.
w
Para ilustrar este concepto, la siguiente figura muestra las curvas SRACi y
LRAC como funciones de Q, suponiendo que w = 1, r = 4. La funcin
Qi = K i

224

5.4 Teorema de la envolvente


SRACi fue evaluada en K = 1, de modo que el punto de tangencia ocurre en
Q = (1)

5.4.2

4
1

= 2.

Optimizacin restringida

El teorema de la envolvente se aplica asimismo en problemas de optimizacin


restringida, como se expone a continuacin para el caso de optimizacin sujeta a
restricciones de igualdad (mtodo de los multiplicadores de Lagrange). Aunque no
se demostrar aqu, los resultados que obtendremos son igualmente vlidos para el
caso correspondiente a restricciones de desigualdad (mtodo de Kuhn-Tucker),
Considera el problema de maximizacin (o minimizacin) de una funcin

diferenciable f : S Rn R con k parmetros


a = (a1 , . . . , ak ) , sujeto a un
conjunto de m < n restricciones {g1 , . . . , gm } de igualdad, es decir,

maxx1 ,...,xn f (
x;
a ),

s.a. gj (
x;
a ) = 0, j = 1, . . . , m

con x = (x1 , . . . , xn ). Aqu la notacin gj = 0 indica que todos los parmetros


estn contenidos en el lado izquierdo de la igualdad.
Para encontrar el ptimo restringido en este problema primero construimos la
funcin lagrangeana correspondiente,

L(
x, ;
a ) = f (
x;
a)
225

m
"
j=1

j g j (
x ;
a ),

Captulo 5 Optimizacin

con = (1 , . . . , m ). En este caso, el ptimo restringido de f se obtiene de las


n + m condiciones de primer orden,
L
xi
L
j

(
x , )=(
x , )

(
x , )=(
x , )

= 0,

i = 1, . . . , n

= 0,

j = 1, . . . , m

cuya solucin est dada por

x =
x (
a)


= (
a ).
En consecuencia, el valor mximo fmax V de la funcin f tambin depender de

a , a travs de la relacin

V (
a ) f(
x (
a );
a ).
Cuando alguno de los parmetros se modifica, digamos al , l = 1, . . . , k, el ptimo

V (
a ) de f cambia de acuerdo con

V (
a)
f(
x (
a );
a)
=
.
al
al

Como en el punto ptimo se satisfacen todas las restricciones gj (


x ;
a ) = 0, ah
se satisface

f (
x (
a );
a ) = L(
x (
a ), (
a );
a ),
es decir, la funcin objetivo toma el mismo valor que la lagrangeana ptima

L L(
x (
a ), (
a );
a ) = f (
x ;
a)

m
"

j gj (
x ;
a ).

j=1

As,

V (
a)
L x1
L xn
=
+

+
al
x1 al
xn al
L
L
L
L
+ 1 + + n +
=
,
1 al
n al
al
al
en donde se han utilizado las condiciones de primer orden, L /xi = L /j = 0,
en los primeros n + m trminos. Los trminos cancelados, L /xi xi /al y
L /j j /al , corresponden al efecto indirecto sobre V causado por el cambio en cada xi y cada j , al cambiar al . El nico trmino sobreviviente, L /al ,
226

5.4 Teorema de la envolvente


corresponde al efecto directo del cambio en al sobre el valor ptimo V. De esta
manera, se tiene

V (
a)
L
=
,
l = 1, . . . , k.
al
al

Teorema de la envolvente para restricciones de igualdad. Sea f (


x ;
a ) una

n
k
funcin diferenciable de x R , con parmetros a R , y sea Rm un
conjunto de multiplicadores de Lagrange correspondiente a m < n restricciones de
igualdad. Considera el problema

optimizarx1 ,...,xn f(
x ;
a)

s.a. gj (
x ;
a ) = 0, j = 1, . . . , m.

Sea
x (
a ) una solucin del problema, con
x (
a ) una funcin diferenciable.



Si L( x ( a ), ( a ); a ) = V ( a ) denota el valor ptimo de la lagrangeana,
entonces

V (
a)
L(
x (
a ), (
a );
a)
=
, l = 1, . . . , k.
al
al

En este teorema, la derivada parcial en el lado izquierdo se realiza sobre


el valor ptimo restringido V (a) de la funcin f ya optimizada. En contraste,
la derivada parcial en el lado derecho se realiza sobre la funcin lagrangeana

L(
x (
a ), (
a );
a ), obtenida al evaluar L(
x, ;
a ) en el punto ptimo


x = x ( a ), = ( a ), sin que L haya sido optimizada. Esta derivada parcial

slo toma en cuenta la dependencia explcita de L(


x (
a ), (
a );
a ) con el

parmetro al , manteniendo fijos x y , es decir, ignorando la dependencia

a ) y (
a ), como se muestra en los
implcita de f con a a travs de
x (
l

siguientes ejemplos.
Ejemplos:

1. Considera el problema
optim. f(x, y) = yex
s.a. a2 x + y = 1,
con a = 0. En este caso, la lagrangeana est dada por
L(x, y, ; a) = yex + 1 a2 x y .
227

Captulo 5 Optimizacin
Las condiciones de primer orden correspondientes son
Lx = yex a2 = 0
Ly = ex = 0
L = 1 a2 x y = 0,

de donde es fcil verificar que el punto ptimo es


x (a) = a2 1
y (a) = a2
(a) = ea

2 1

De esta manera, el valor ptimo de f es


2 1

V (a) = a2 ea

En ese caso,
dV (a)
2
2
= a2 ea 1 2a3 + 2aea 1
da
a2 1 a2 1
= 2
.
e
a
Este mismo resultado puede obtenerse de una manera ms simple con el teorema
de la envolvente, dV /da = L /a. Para ello, nota que en el ptimo

de modo que

L = y ex + 1 a2 x y ,
L
2
= 2a x = 2aea 1
a

1 a2
a2

As,

dV (a)
L
a2 1 a2 1
=
=2
e
.
da
a
a
2. Considera el problema de minimizar el costo sujeto a una produccin dada,
min C(L, K) = wL + rK
L,K

s.a. P (L, K) = Q,
en donde el trabajo L y el capital K son las variables independientes, y el salario
w, la tasa de inters r y el nivel de produccin Q son los parmetros del sistema.
La lagrangeana correspondiente es
L(L, K, ; w, r, Q) = wL + rK + (Q P (L, K)) .
228

5.4 Teorema de la envolvente


De las condiciones de primer orden LL = LK = L = 0 se obtienen los valores
ptimos
L = L (w, r, Q)
K = K (w, r, Q)
= (w, r, Q).
De esta manera, el costo mnimo est dado por
Cmn (w, r, Q) = wL (w, r, Q) + rK (w, r, Q).
Aparentemente, si no se tiene una forma explcita para la funcin de produccin
P (L, K) no se puede determinar la forma funcional de Cmn (w, r, Q) y, por
lo tanto, tampoco se pueden encontrar sus derivadas Cmn /w, Cmn /r
y Cmn /Q. Sin embargo, el teorema de la envolvente permite obtener
expresiones generales para estas derivadas. Para ello, se evala la lagrangeana
en el ptimo
de modo que

L = wL + rK + (Q P (L , K )) ,

Cmn
L
=
= L
w
w
Cmn
L
=
= K
r
r
Cmn
L
=
= .
Q
Q
As, en el ptimo, el costo marginal del salario es el trabajo L , el costo marginal
de la tasa de inters es el capital K y el costo marginal de la produccin es
el multiplicador , en donde L , K y son los valores de L, K y que
minimizan la funcin de costo bajo la restriccin dada. Este resultado general se
conoce como el Lema de Shephard.
Como caso particular de este lema, considera una funcin de produccin
Cobb-Douglas de la forma
P (L, K) = L1/2 K 1/2 .
En ese caso, el ptimo ocurre en el punto
r
w
w
K (w, r, Q) = Q
r

(w, r, Q) = 2 wr,
L (w, r, Q) = Q

229

Captulo 5 Optimizacin
de modo que el costo mnimo Cmn = wL + rK est dado por

Cmn (w, r, Q) = 2Q wr.


Se tiene, entonces,
Cmn (w, r, Q)
r
= Q
= L
w
w
Cmn (w, r, Q)
w
= Q
= K
r
r

Cmn (w, r, Q)
= 2 wr = .
Q

230

Captulo 6
Temas selectos de clculo avanzado
6.1 Funciones de Rn en Rm
Supongamos que una empresa produce m bienes utilizando n insumos,
x1 , x2 , . . . , xn , y hay una funcin de produccin diferente fj para la
produccin de cada una de las cantidades Qj , con j = 1, . . . , m. En ese caso,
se tiene
Q1 = f1 (x1 , x2 , . . . , xn )
Q2 = f2 (x1 , x2 , . . . , xn )
..
.
Qm = fm (x1 , x2 , . . . , xn ).
Desde un punto de vista formal, resulta ms conveniente considerar
este conjunto de m funciones con n variables como una sola funcin,
F : Rn Rm , dada por

F (
x ) = (f1 (x1 , x2 , . . . , xn ), f 2 (x1 , x2 , . . . , xn ), . . . , f m (x1 , x2 , . . . , xn )).
Si denotamos por

Q = (Q1 , Q2 , . . . , Qm )
al vector de produccin, decimos entonces que

Q = F (
x ).
Definicin. Sea S Rn . Una funcin F : S Rm es una regla de

correspondencia que a cada elemento


x = (x1 , x2 , . . . , xn ) del dominio, S,

le asigna un nico elemento w = (w1 , ..., wm ) del contradominio, Rm .


Aqu usaremos una letra mayscula (tal como F ) para denotar una
funcin con m > 1 reglas de correspondencia, y conservaremos la notacin
usual de letra minscula (tal como f ) para funciones con una sola regla de
correspondencia. As, por ejemplo, escribimos F = (f1 , ..., fm ).
231

Captulo 6 Temas selectos de clculo avanzado

Si denominamos por F (
x ) al elemento de Rm que F le asigna al

elemento x de S, entonces decimos que

w = F (
x)

es la imagen de
x bajo F. Asimismo, decimos que la imagen de la funcin F ,
denotada por IF , es el conjunto de elementos del contradominio obtenidos al
aplicar la regla mltiple F a los elementos del dominio, es decir,

IF = {
w Rm |
w = F (x1 , x2 , . . . , xn ), para todo
x = (x1 , x2 , . . . , xn ) S } .

Una funcin F : R Rm (con n = 1)

w1
f1 (x)
w2 f2 (x)
. =

..
..

.
wm
fm (x)
se denomina funcin vectorial de variable escalar, ya que los elementos del
dominio son escalares, x R, y los elementos del contradominio son m-vectores,
(w1 , w2 , ..., wm ) Rm . Geomtricamente, las funciones de este tipo se representan
mediante curvas paramtricas en Rm , como las que estudiamos en la seccin 1.2
(aqu x juega el papel del parmetro que antes llamamos t). Por otra parte, una
funcin f : Rn R (con m = 1)
w = f (x1 , x2, ..., xn )
es una funcin escalar de variable vectorial, ya que los elementos del dominio son
n-vectores, (x1 , x2 , ..., xn ) Rn , y los elementos del contradominio son escalares,
w R. Geomtricamente, las funciones de este tipo se representan mediante
hipersuperficies en Rn+1 , como las que estudiamos en los captulos 2 al 5. Por
232

6.1 Funciones de Rn en Rm
ltimo, una funcin F : Rn Rm (con n, m > 1)


w1
f1 (x1 , x2, ..., xn )
w2 f2 (x1 , x2, ..., xn )
. =
..
..
.
wm
fm (x1 , x2, ..., xn )

es una funcin vectorial de variable vectorial, ya que los elementos del dominio
son n-vectores, (x1 , x2 , ..., xn ) Rn , y los elementos del contradominio son
m-vectores, (w1 , w2 , ..., wm ) Rm . En general, no existe una representacin
geomtrica simple para este tipo de funciones. Desde el punto de vista conceptual,
sin embargo, es claro que una funcin de este tipo transforma vectores de Rn en
vectores de Rm .
Para todos los casos anteriores, puede resultarnos til visualizar la funcin
F como una caja negra con n valores de entrada o variables independientes
x1 , x2 , ..., xn y m valores de salida o variables dependientes, w1 , w2 , ..., wm , como
se muestra en el siguiente diagrama.
F

x1
x2
..
.
xn

f1
f2
..
.
fm

..
.

w1
w2
..
.
wm

Ejemplos:
1. La funcin F = (f1 , f2 , f3 ) : R R3 dada por


x
cos t
f1 (t)
y = f2 (t) = sen t
z
f3 (t)
t

asigna a cada valor de t R un nico punto (x, y, z) del espacio. El conjunto de


puntos correspondientes en R3 es la curva conocida como hlice.
F

f1
t f2
f3

x
y
z

233

Captulo 6 Temas selectos de clculo avanzado


2. La funcin f : R2+ R dada por
Q = f(L, K)
asigna a cada pareja de insumos (L, K) R2+ una nica produccin Q R. El
conjunto de puntos correspondientes es una superficie de produccin.

L
K

3. La funcin F = (f1 , f2 , f3 ) : R2 R3 , dada por



w1
f1 (x1 , x2 )
5x1 + 4x2
w2 = f2 (x1 , x2 ) = 2x1 + x2 ,
w3
f3 (x1 , x2 )
x1 + 3x2

transforma cada vector


x = (x1 , x2 ) R2 en otro vector
w = (w1 , w2 , w3 ) R3 .
F

x1
x2

f1
f2
f3

w1
w2
w3

Nota que, en este caso particular, se trata de un sistema lineal, de modo que
puede escribirse como el producto de matrices

w1
5 4
w2 = 2 1 x1 .
x2
w3
1 3
En otras palabras, se tiene

w = A
x,
en donde A es la matriz de 3 2, dada por

5 4
A = 2 1 .
1 3

En este caso, identificamos la funcin vectorial lineal F como una


transformacin lineal, de la forma

F (
x ) = A
x.
234

6.1 Funciones de Rn en Rm
4. En un problema de maximizacin de utilidad para dos bienes, la funcin
F = (f1 , f2 ) : R3+ R2+ dada por
x
y

f1 (I, p1 , p2 )
f2 (I, p1 , p2 )

asigna a cada tro (I, p1 , p2 ) de ingreso, precio del bien 1 y precio del bien 2,
una nica canasta ptima (x , y ).
I
p1
p2

f1
f2

x
y

El anlisis de la diferenciabilidad de una funcin F de Rn en Rm se facilita


si observamos que cada componente de F = (f1 , ..., fm ) es una funcin
fj : S Rn R, como las funciones que estudiamos en los captulos anteriores.
En consecuencia, podemos aplicar la teora ya vista a cada componente fj por
separado, y luego escribir la informacin obtenida en un lenguaje matricial.
De acuerdo con la observacin anterior, para estudiar la diferenciabilidad de la
funcin
F = (f1 , ..., fm ) : S Rn Rm

x 0 S, podemos aplicar la aproximacin por diferenciales


en un punto especfico
de la seccin 3.2 a cada componente fj , obteniendo

f1 (
x 0)
f1 (
x 0)

f1 ( x 0 + x ) f1 ( x 0 )
x1 + +
xn
x1
xn

f2 (
x 0)
f2 (
x 0)

f2 ( x 0 + x ) f2 ( x 0 )
x1 + +
xn
x1
xn
..
.

fm (
x 0)
fm (
x 0)

fm (
x 0 +
x ) fm (
x 0)
x1 + +
xn .
x1
xn
Estos resultados pueden combinarse en una notacin matricial, como

f1 (
x 0)
f1 (
x 0)
f1 (
x 0)

x1
x1
x2
xn

f2 ( x 0 ) f2 ( x 0 )
f2 ( x 0 )

x1
x2
xn
. 2
F (
x 0 +
x ) F (
x 0)
..
..
..
..

...
.
.
.

fm ( x 0 )
fm ( x 0 )
fm ( x 0 )
xn

x1

x2

235

xn

Captulo 6 Temas selectos de clculo avanzado

x 0 . En notacin
Esta ltima expresin describe la aproximacin lineal de F en
compacta, esta ltima expresin se escribe como

F (
x 0 +
x ) F (
x 0 ) DF (
x 0 )
x,

en donde
x es el n-vector de incrementos, y en donde DF (
x 0 ) es la matriz de
m n que est compuesta por las primeras derivadas parciales de primer orden de
las funciones fj s con respecto a las variables xi s, como se define a continuacin.
Definicin. Sea F = (f1 , ..., fm ) : S Rn Rm una funcin vectorial
cuyas derivadas parciales fj /xi existan en una regin R S, para cada
j = 1, . . . , m, i = 1, . . . , n. La derivada o matriz jacobiana de F con respecto al

x ) de m n dada por
vector
x = (x1 , x2, ..., xn ) es la matriz DF (

f1 (
x)
f1 (
x)
f1 (
x)

x2
xn
1

fx
f2 (
x)
f2 (
x)
2( x )

x
x
x
n
1
2
.
DF ( x ) =
.
.
.
...

.
.
.
.
.
.

fm ( x )
fm ( x )
fm ( x )

x1
x2
xn
A la derivada tambin se le conoce como gradiente generalizado de f1 , ..., fm
con respecto a x1 , x2, ..., xn . Para denotarla se usan cualesquiera de los siguientes

x ), ddF
o F.
smbolos DF (

x
Ejemplo:
Para las siguientes funciones de demanda para dos bienes identifica la funcin
vectorial F y determina su derivada DF :
3/2

2
q2 = 4p1 p1
2 y .

q1 = 6p2
1 p2 y,

Se trata de la funcin F : R3+ R2+ , dada por


F (p1 , p2 , y) =

f1 (p1 , p2 , y)
f2 (p1 , p2 , y)

3/2

6p2
1 p2 y
2
4p1 p1
2 y

F
p1

f1 q1
p2

f2 q2
y

De esta manera, su derivada DF es la siguiente matriz de 2 3:

DF (p1 , p2 , y) =

f1
p1
f2
p1

f1
p2
f2
p2

f1
y
f2
y

3/2

=
236

1/2

3/2

12p3
9p2
6p2
1 p2 y
1 p2 y
1 p2
1 2
2 2
4p2 y
4p1 p2 y 8p1 p1
2 y

6.1 Funciones de Rn en Rm
En el caso particular de una funcin F = (f1 , f2 , . . . , fm ) : S R Rm , con

w = F (t), la derivada est dada por el m-vector columna


df1 (t)

DF (t) =

dt
df2 (t)
dt

..
.

dfm (t)
dt

que representa el vector tangente a la curva


w = F (t) en cada t R (ver seccin

1.2). Asimismo, en el caso de una funcin f : S Rn R, con w = f(


x ), la
derivada es el n-vector rengln

f (
x ) f (
x)
f(
x)

Df (
x ) = f(
x)=
,
,...,
,
x1
x2
xn
que coincide con el vector gradiente de f . En consecuencia, la derivada representa

un vector perpendicular al conjunto de nivel de la hipersuperficie w = f (


x ) que

contiene al punto x = (x1 , x2 , . . . , xm ) S (ver seccin 3.5).


Por ltimo, para el caso especial en que n = m, la matriz jacobiana es cuadrada
y se puede calcular su determinante.

Definicin. Sea F : S Rn Rn , definida por F (


x ) = (f1 (
x ), f2 (
x ), ..., fn (
x )),

donde x = (x1 , x2, ..., xn ). Entonces, al determinante de su matriz jacobiana se


le denomina jacobiano o determinante jacobiano de f1 , f2 , ..., fn con respecto a
x1 , x2, ..., xn , y se representa por J(f1 , f2 , ..., fn /x1 , x2, ..., xn ), es decir,

f1 , f2 , ..., fn
x1 , x2, ..., xn

f1
x1

..
.

fn
x1

...

f1
xn

fn
xn

..
.

Nota: En algunos textos el determinante jacobiano J(f1 , f2 , ..., fn /x1 , x2, ..., xn )
tambin se denota por
(f1 , f2 , ..., fn )
.
(x1 , x2, ..., xn )
El jacobiano tiene varias aplicaciones en clculo, una de las cuales se discutir en
la seccin 6.3.

237

Captulo 6 Temas selectos de clculo avanzado

6.2 Regla de la cadena en el caso general


La regla de la cadena tiene una extensin natural para funciones de Rn en Rm ,
como se establece en el siguiente teorema.
Teorema. Sean F : Rn Rm y G : Rk Rn funciones diferenciables. Sean

x Rn. Considera la funcin compuesta


t Rk y
H = F G : Rk Rm .

Sea DF (
x ) la matriz jacobiana de m n de las derivadas parciales de F en
x

y sea DG( t ) la matriz jacobiana de n k de las derivadas parciales de G en t .

Entonces, la matriz jacobiana DH( t ) es la matriz de m k dada por el producto


de las matrices jacobianas:

DH( t ) = DF (
x ) DG( t ).

Ms especficamente, sean t = (t1 , . . . , tk ),


x = (x1 , . . . , xn ) y

w = (w1 , . . . , wm ), tales que x = G( t ), w = F (


x ). Entonces, podemos

representar la composicin de funciones w = F (G( t )) = H( t ) mediante el


siguiente diagrama:
t1
t2
..
.
tk

H=F G

g1
g2
..
.
gn

..
.

x1
x2
..
.
xn

f1
f2
..
.

..
.

fm

w1
w2
..
.
wm

De esta manera, la regla de la cadena DH( t ) = DF (


x ) DG( t ) establece que
w1 w1
f1 f1
g1
f1 g1
1
1
g
w
x
t1
t2
tk
t1
t2
tk
x1
x2
n
w2 w2 w2 f2 f2 f2 g2 g2 g2
t1
x
t2
tk
t2
tk
x2
xn t1
..
= .. 1
.
.
.
.
.
.
..
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. .
.
. .
.
.
wm
t1

wm
t2

wm
tk

fm
x1

fm
x2

fm
xn

gn
t1

gn
t2

gn
tk

Nota que este producto matricial es consistente con los resultados de la seccin
3.3.
238

6.3 Teorema general de la funcin implcita

6.3 Teorema general de la funcin implcita


En la seccin 3.4 presentamos el teorema de la funcin implcita para una ecuacin
f(x1 , x2 , . . . , xn , w) = 0 que relaciona a varias variables de manera implcita. En
esta seccin extenderemos el teorema de la funcin implcita al caso general,
f1 (x1 , . . . , xn , w1 , . . . , wm ) = 0
f2 (x1 , . . . , xn , w1 , . . . , wm ) = 0
..
.
fm (x1 , . . . , xn , w1 , . . . , wm ) = 0,
en donde hay varias funciones relacionando implcitamente a varias variables.
Este tipo de sistemas aparece frecuentemente en economa. Por ejemplo, se
sabe que en el problema de minimacin del costo C = wL + rK sujeto a una
produccin fija P (L, K) = Q, las condiciones de primer orden estn dadas por
w PL (L, K) = 0
r PK (L, K) = 0
P (L, K) Q = 0.

Este es un sistema de 3 ecuaciones para 6 incgnitas: 3 variables endgenas, dadas


por los niveles ptimos de trabajo L, capital K y el multiplicador , y 3 variables
exgenas, dadas por el salario w, la tasa de inters r y la produccin Q. Nos
interesa determinar bajo qu condiciones este sistema define los niveles ptimos
en funcin de las variables exgenas, y en ese caso, cmo se veran afectados
esos niveles ptimos ante un pequeo cambio en las ltimas. Sin embargo, por lo
general no es posible determinar explcitamente esos niveles, ya que no se conoce
la forma funcional de la funcin P , o bien, P puede ser una funcin compleja y
esto no permite encontrar la solucin deseada. El teorema de la funcin implcita
establece bajo qu condiciones un sistema de ecuaciones de este tipo define las
variables endgenas como funciones implcitas de las variables exgenas y, en ese
caso, permite determinar cmo cambian las primeras ante un pequeo cambio en
las ltimas.
Por simplicidad, comenzaremos con un caso simple, dado por un sistema de 2
ecuaciones con 4 variables, de la forma
f (x, y, u, v) = 0
g(x, y, u, v) = 0.
Como se trata de 2 ecuaciones, a lo ms podemos tener 2 variables dependientes
o endgenas, en trminos de las 2 variables restantes, que son las variables
239

Captulo 6 Temas selectos de clculo avanzado


independientes o exgenas. Por ejemplo, supongamos que el sistema define a las
variables u y v como funciones implcitas de x y y, es decir,
u = u(x, y)
v = v(x, y),
y nos preguntamos cunto valen las derivadas parciales ux , uy , vx y vy . Para ello,
primero obtenemos las diferenciales totales de f y g, a saber,
df = fx dx + fy dy + fu du + fv dv = 0
dg = gx dx + gy dy + gu du + gv dv = 0.
A su vez, como u = u(x, y) y v = v(x, y), por lo tanto,
du = ux dx + uy dy
dv = vx dx + vy dy.
De esta manera,
df = fx dx + fy dy + fu (ux dx + uy dy) + fv (vx dx + vy dy) = 0
dg = gx dx + gy dy + gu (ux dx + uy dy) + gv (vx dx + vy dy) = 0.
Ahora agrupamos trminos con dx y trminos con dy, es decir,
(fx + fu ux + fv vx ) dx + (fy + fu uy + fv vy ) dy = 0
(gx + gu ux + gv vx ) dx + (gy + gu uy + gv vy ) dy = 0.
Como x y y son independientes, cada una de estas sumas es igual a cero slo si sus
sumandos se anulan por separado, es decir, slo si
fx + fu ux + fv vx = 0
gx + gu ux + gv vx = 0

fy + fu uy + fv vy = 0
gy + gu uy + gv vyy = 0.

Para encontar de aqu los valores de las derivadas parciales ux , uy , vx y vy es


conveniente agrupar estas ecuaciones por pares. Un par est dado por
fu ux + fv vx = fx
gu ux + gv vx = gx ,
que es un sistema de dos ecuaciones para las incgnitas, ux y vx . De acuerdo con
240

6.3 Teorema general de la funcin implcita


la regla de Cramer y las propiedades del determinante, su solucin es

ux =

vx =

fx fv
gx gv

u
=
x

fu fv
gu gv

fu fx
gu gx

v
=
x

fu fv
gu gv

fx fv
gx gv
fu fv
gu gv
fu fx
gu gx
fu fv
gu gv

El otro par est dado por


fu uy + fv vy = fy
gu uy + gv vy = gy ,
que es un sistema de dos ecuaciones para las incgnitas, uy y vy , cuya solucin es

uy =

vy =

fy fv
gy gv

u
=
y

fu fv
gu gv

fu fy
gu gy

v
=
y

fu fv
gu gv

fy fv
gy gv
fu fv
gu gv
fu fy
gu gy
fu fv
gu gv

Observa que las cuatro derivadas parciales son el cociente de dos determinantes.
Todas ellas poseen el mismo denominador, dado por el jacobiano de la funcin
vectorial F = (f, g) : R4 R2 ,
J

f, g
u, v

= |DF (u, v)| =

fu fv
,
gu gv

con respecto a las variables dependientes u y v. Como J


denominador, es claro que debe imponerse la condicin
J

f, g
u, v

f,g
u,v

est en el

= 0.

Ahora observa que cada numerador est dado tambin por un determinante
jacobiano, de la misma funcin F , pero con respecto a una de las variables
241

Captulo 6 Temas selectos de clculo avanzado


dependientes, u o v, mezclada con una de las independientes, x o y. As, por
ejemplo, se tiene
f,g
J x,v
u
=
,
f,g
x
J u,v
en donde el determinante en el numerador intercambia la variable dependiente u
del determinante en el denominador por la variable independiente x.
Teorema. Sean f (x, y, u, v) y g(x, y, u, v) funciones diferenciables. El sistema
de ecuaciones
f (x, y, u, v) = 0
g(x, y, u, v) = 0
define a las variables u y v como funciones implcitas, diferenciables de x y y, en
todos los puntos en donde
f, g
J
= 0.
u, v
En ese caso,
J
u
=
x
J
J
u
=
y
J

dy
dx

f,g
x,v
f,g
u,v
f,g
y,v
f,g
u,v

J
v
=
x
J

f,g
u,x

J
v
=
y
J

f,g
u,y

f,g
u,v

f,g
u,v

Este teorema constituye una generalizacin de nuestro tiernsimo resultado


= FFxy de la seccin 3.4, en donde F era una funcin de x y y.
Ejemplo:
Determina si el sistema de ecuaciones
u2 v x3 + 3y 3 = 0
u + v 2x y 3 + 3 = 0

define a las variables u y v como funciones implcitas, diferenciables de x y y,


alrededor del punto P (x, y, u, v) = P (0, 2, 1, 4). De ser as, calcula las derivadas
v
parciales u
, u , x
y u
.
x P y
x P
P
P

242

6.3 Teorema general de la funcin implcita


Primero definimos las funciones f (x, y, u, v) = u2 v x3 + 3y 3 y
g(x, y, u, v) = u + v 2x y 3 + 3, de modo que el determinante jacobiano
f,g
J u,v
en el punto P est dado por
f, g
fu fv
2u 1
=
=
= 2u + 1|P = 2(1) + 1 = 0.
gu gv P
1 1 P
u, v P
Concluimos entonces que el sistema s define a las variables u y v como funciones
implcitas, diferenciables de x y y, alrededor del punto P. Determinemos ahora la
derivada parcial u
:
x
J

J
u
=
x
J
=

f,g
x,v
f,g
u,v

fx fv
gx gv
fu fv
gu gv

3x2 1
2
1
2u 1
1 1

(3x2 2)
3x2 + 2
=
.
(2u + 1)
2u + 1

De esta manera,

3(0)2 + 2
u
2
=
= .
x P
2(1) + 1
3
El clculo de las otras tres derivadas parciales queda como ejercicio para ti,
entusiasta lector.
Concluimos esta seccin enunciando el teorema general de la funcin implcita,
correspondiente a m > 1 ecuaciones con n + m variables.
Teorema general de la funcin implcita
Sean f1 (x1 , . . . , xn , w1 , . . . , wm ), . . . , fm (x1 , . . . , xn , w1 , . . . , wm ) funciones
diferenciables. El sistema de ecuaciones
f1 (x1 , . . . , xn , w1 , . . . , wm ) = 0
f2 (x1 , . . . , xn , w1 , . . . , wm ) = 0
..
.
fm (x1 , . . . , xn , w1 , . . . , wm ) = 0.
define a las variables w1 , . . . , wm como funciones implcitas, diferenciables de las
variables x1 , . . . , xn en todos los puntos en donde
J

f1 , f2 , . . ., fm
w1 , w2 , . . ., wm
243

= 0.

Captulo 6 Temas selectos de clculo avanzado


En ese caso,
J
wj
=
xi
J

f1 ,f2 ,..., fj ,...,fm


w1 ,w2 ,...,xi ,...,wm
f1 ,f2 ,..., fj ,...,fm
w1 ,w2 ,...,wj ,...,wm

para todos j = 1, . . . m, i = 1, . . . n.

6.4 Teorema del punto fijo


Este teorema se aplica para funciones de un conjunto compacto y convexo K Rn
hacia el mismo compacto K Rn , y se utiliza en microeconoma, por ejemplo,
para demostrar la existencia del equilibrio de Walras (equilibrios competitivos en
una economa de intercambio).
Teorema del punto fijo o teorema de Brouwer. Sea K Rn un conjunto
compacto y convexo y sea f : K K una funcin continua. Entonces f tiene un

punto fijo, es decir, existe un punto


x K para el cual

f (
x ) =
x .

Ejemplo:
Sea f : [0, 1] [0, 1] una funcin continua. Demuestra que existe x [0, 1] tal
que f (x ) = x .
Como la imagen de la funcin est en el intervalo [0, 1], por lo tanto, para todo
x [0, 1] se tiene
0 f (x) 1.

Sea
h(x) = f (x) x.
244

6.4 Teorema del punto fijo


Como f es continua, por lo tanto h es continua. Por otra parte, es claro que
h(0) = f (0) 0 0 y h(1) = f (1) 1 0. As, por el teorema del valor
intermedio sabemos que existe c [0, 1] tal que
h(c) = 0.
Por lo tanto, f(c) c = 0, es decir,
f(c) = c.
De modo que c es un punto fijo de f.

Si alguna de las condiciones del teorema no se satisfacieran, entonces ya no


necesariamente existira un punto fijo, como se ilustra en los siguientes casos.
i) Si f no fuera continua:

ii) Si K fuera abierto y, por tanto, no fuera compacto:

245

Captulo 6 Temas selectos de clculo avanzado


iii) Si K no fuera convexo:

Por ejemplo, a partir de este teorema se puede demostrar la existencia de niveles


de insumos (x1 , x2 ) que maximizan una funcin de beneficio (x1 , x2 ), siempre y
cuando el beneficio est representado por una funcin continua y el conjunto de
insumos factibles sea cerrado y acotado. El teorema no proporciona el valor de los
insumos ptimos, pero s garantiza su existencia.

246

ApndiceA
Cnicas
Las cnicas son las curvas (no necesariamente funciones) que se obtienen al
rebanar un cono doble con un plano.

La ecuacin general de una cnica es una ecuacin de segundo grado, de la forma


Ax2 + Bxy + Cy 2 + Dx + Ey = F.
A partir de esta ecuacin es posible decidir de qu curva se trata, dependiendo del
signo del discriminante B 2 4AC:
i) Cuando B 2 4AC < 0 se trata de una elipse (o circunferencia).
ii) Cuando B 2 4AC = 0 se trata de una parbola.
iii) Cuando B 2 4AC > 0 se trata de una hiprbola.

En los casos que consideraremos a continuacin supondremos que no aparece


el trmino Bxy, lo cual implica que la cnica est alineada con los ejes de
coordenadas, es decir, no est girada. As, slo consideraremos ecuaciones
cuadrticas de la forma
Ax2 + Cy 2 + Dx + Ey = F.
El objetivo es que puedas distinguir las cnicas ms o menos a ojo, tomando en
cuenta el tipo particular de ecuacin.
1. Elipse:
Est descrita por una ecuacin cuadrtica con A = 0, C = 0 y F = 0, en
donde A, C y F tienen todas el mismo signo. Por simplicidad, supondremos que
247

ApndiceA Cnicas
D = E = 0, obteniendo. Ax2 + Cy 2 = F. Al dividir por F ambos lados de la
ecuacin, se obtiene la forma cannica de la ecuacin de la elipse,
x2 y 2
+ 2 = 1.
a2
b
A continuacin se muestran las grficas de la elipse, en los casos a > b y b > a.

Nota que cuando a = b la elipse se convierte en la circunferencia x2 + y 2 = a2 .


2. Hiprbola:
Est descrita por una ecuacin cuadrtica con A = 0, C = 0 y F = 0, en donde
A y C tienen signos opuestos. Nuevamente tomamos D = E = 0. Expresadas
en su forma cannica, las dos posibles ecuaciones de la hiprbola estn dadas
por
x2 y 2
y 2 x2

=
1
y
2 = 1.
a2
b2
b2
a
A continuacin se muestran las grficas de las hiprbolas correspondientes a
cada una de estas ecuaciones.

3. Parbola:
Est descrita por una ecuacin cuadrtica tal que A = 0 o C = 0, pero
no ambos cero. En su forma ms simple, las ecuaciones cannicas de la
parbola son
y = ax2 y x = ay 2 .
248

A continuacin se muestran las grficas de las parbola correspondiente a la


primer ecuacin, para los casos a > 0 y a < 0.

A continuacin se muestran las grficas de las parbola correspondiente a la


segunda ecuacin, para los casos a > 0 y a < 0.

Ejemplos:
x2 y 2
1. La ecuacin 4x + 9y = 36 describe a la elipse
+
= 1.
9
4
2

2. La ecuacin 4x2 + 4y 2 = 36 describe a la circunferencia x2 + y 2 = 9.

249

ApndiceA Cnicas
3. La ecuacin 4x2 9y 2 = 36 describe a la hiprbola

y 2 x2

= 1.
4
9

4. La ecuacin 4x + y 2 = 0 describe a la parbola x = 14 y 2 .

Por ltimo, es importante sealar que existen algunos casos degenerados de


cnicas, como se muestra a continuacin.
Ejemplos:
1. La ecuacin 4x2 + 9y 2 = 0 no define una elipse, sino ms bien un punto en el
plano R2 , a saber, el origen.
2. La ecuacin 4x2 9y 2 = 0 no define una hiprbola, sino ms bien dos rectas en
2x
el plano, a saber, las rectas y = .
3

250

ApndiceB
Teoremas de concavidad para funciones en Rn
Aqu se presenta la generalizacin de algunos de los teoremas de optimizacin para
el caso de funciones diferenciables en Rn . Para ello, es necesario introducir antes
algunas definiciones importantes.
Definicin. Dada una matriz A de n n, una submatriz principal dominante
de orden k, con k = 1, . . . , n, es la matriz Ak de k k que se obtiene al eliminar
en A los ltimos n k renglones y las ltimas n k columnas. El determinante
|Ak | de la submatriz principal dominante Ak de orden k se conoce como el menor
principal dominante de orden k.
Ejemplos:
a b
de 2 2 se puede construir una submatriz principal
c d
dominante de orden k = 1:
A1 = (a) ,
obtenida al eliminar en A el rengln 2 y la columna 2, y una submatriz principal
dominante de orden k = 2:

1. De la matriz A =

A2 = A =

a b
c d

en donde no se ha eliminado rengln ni columna alguna. Los menores


principales dominantes correspondientes son
|A1 | = a y |A2 | =

a b
c d

= ad cb.

a b c
2. De la matriz A = d e f de 3 3 se puede construir una submatriz
g h i
principal dominante de orden k = 1:
A1 = (a) ,
251

ApndiceB Teoremas de concavidad para funciones en Rn


obtenida al eliminar en A los renglones 2 y 3, y sus correspondientes columnas,
una submatriz principal dominante de orden k = 2:
a b
d e

A2 =

obtenida al eliminar el rengln 3 y la columna 3, y una submatriz principal


dominante de orden k = 3 :

a b c
A3 = A = d e f ,
g h i
en donde no se ha eliminado rengln ni columna alguna. Los menores
principales dominantes correspondientes son los determinantes
|A1 | = a,

|A2 | =

a b
d e

y |A3 | =

a b c
d e f .
g h i

Definicin. Dada una matriz A de n n, las submatrices principales de orden


k, con k = 1, . . . , n, son todas las matrices de k k que se obtienen al eliminar
en A cualesquiera n k renglones y sus correspondientes n k columnas. El
determinante de cada submatriz principal de orden k se conoce como menor
principal de orden k.
Ejemplos:
a b
c d
principales de orden k = 1:

1. De la matriz A =

de 2 2 se puede construir dos submatrices


(a) y (d) ,

obtenidas al eliminar en A el rengln 2 y la columna 2, o bien, el rengln 1 y la


columna 1. Hay una sola una submatriz principal de orden k = 2:
a b
c d

en donde no se ha eliminado rengln ni columna alguna.

a b c
2. De la matriz A = d e f de 3 3 se puede construir tres submatrices
g h i
principales de orden k = 1:
(a) , (e) y (i),
252

obtenidas al eliminar en A los renglones 2 y 3 y sus correspondientes columnas,


los renglones 1 y 3 y sus correspondientes columnas, o bien, los renglones 1 y
2 y sus correspondientes columnas. Hay tres submatrices principales de orden
k = 2:
a b
a c
e f
,
y
,
d e
g i
h i
obtenidas al eliminar el rengln 3 y la columna 3, el rengln 2 y la columna 2,
o bien, el rengln 1 y la columna 1. Hay una sola submatriz principal de orden
k=3:

a b c
d e f ,
g h i
en donde no se ha eliminado rengln ni columna alguna.
Definicin. Sea A una matriz simtrica de n n. Se dice que:
a) A es definida positiva todos los menores principales dominantes de A son
estrictamente positivos (> 0) .
b) A es semidefinida positiva todos los menores principales de A son no
negativos ( 0) .
c) A es definida negativa todos los menores principales dominantes de A de
orden impar son negativos (< 0) y todos los de orden par son estrictamente
positivos (> 0).
d) A es semidefinida negativa todos los menores principales de A de orden
impar son no positivos ( 0) y todos los de orden par son no negativos ( 0) .
e) A es indefinida, si no se satisfacen los patrones de signo anteriores.
Ejemplo:
La matriz

1 0 1
A= 0 0 0
1 0 0
es indefinida, ya que sus menores principales violan los patrones de signo a)-d).
En efecto, los menores principales de orden 2 (par) de A son
1 0
0 0

= 0,

1 1
1 0

= 1 y

uno de los cuales es negativo.


253

0 0
0 0

= 0,

ApndiceB Teoremas de concavidad para funciones en Rn


Con esta ltima definicin podemos extender los conceptos de concavidad y
convexidad para una funcin general f(x1 , x2 . . . , xn ) doblemente diferenciable.
En ese caso, la matriz hessiana H de f es la matriz simtrica

f11 f12 f1n


f21 f22 f2n
H=
,
..
..
..
...
.
.
.
en donde fij

2f
.
xj xi

fn1 fn2 fnn

Comenzamos con el caso correspondiente a concavidad o convexidad estricta,


en donde todos los menores principales dominantes son distintos de cero, es decir,
|Hk | = 0.
Teorema. Sea S Rn un conjunto abierto y convexo, y sea f : S R, con
f C 2 (S). Sea H la matriz hessiana de f . Entonces
a) H es definida positiva f es estrictamente convexa en S,
b) H es definida negativa f es estrictamente cncava en S,
c) H es indefinida f no es ni cncava ni convexa en S.
Los resultados de este teorema se resumen en la siguiente tabla:
|H1 |
|H2 |
|H3 |
|H4 |
..
.
|Hn |

f estric. convexa f estric. cncava


+

+
+
+

+
+
..
..
.
.
+
+, si n es par
, si n es impar

Ejemplos:
1. La funcin f (x, y, z) = x2 + y 2 + z 2 es estrictamente convexa, ya que la matriz
hessiana de f,

2 0 0
H = 0 2 0 ,
0 0 2
254

es definida positiva. En efecto, sus menores principales dominantes son


|H1 | = 2,

|H2 | =

2 0
0 2

= 4 y |H3 | =

2 0 0
0 2 0
0 0 2

= 8,

que satisfacen el patrn de signos |H1 | > 0, |H2 | > 0 y |H3 | > 0.
2. La funcin f(x, y, z) = x2 y 2 z 2 es
matriz hessiana de f,

2 0

0 2
H=
0
0

estrictamente cncava, ya que la

0
0 ,
2

es definida negativa. En efecto, sus menores principales dominantes son


|H1 | = 2,

|H2 | =

2 0
0 2

= 4 y |H3 | =

2 0
0
0 2 0
0
0 2

= 8,

que satisfacen el patrn de signos |H1 | < 0, |H2 | > 0 y |H3 | < 0.
Teorema (condiciones suficientes de segundo orden)

Sea S Rn un conjunto abierto y convexo, y sea f : S R, con f C 2 (S).

Sea
x 0 ) la matriz hessiana de f evaluada en
x 0 S un punto crtico de f. Sea H(

x 0 , con menores principales dominantes |H1 | , |H2 | , . . . , |Hn | . Entonces


a) |Hk | > 0, para toda k = 1, . . . , n

f tiene un mnimo local estricto en


x 0,
k
b) (1) |Hk | > 0, para toda k = 1, . . . , n

f tiene un mximo local estricto en


x 0,
c) Si {|H1 | , |H2 | , . . . , |Hn |} viola la secuencia anterior de signos

f tiene un punto silla en


x 0.
El valor mnimo o mximo local es un extremo global de f, cuando los patrones
de signo a) y b) se satisfacen en todo el dominio de f .
Ejemplos:
1. La funcin f (x, y, z) = x2 + y 2 + z 2 tiene un nico punto crtico en
(x, y, z) = (0, 0, 0). Como se demostr anteriormente, los menores principales
dominantes de f satisfacen |H1 | > 0, |H2 | > 0 y |H3 | > 0, de modo que f es
estrictamente convexa en R3 . Concluimos que f tiene un mnimo global estricto
en (0, 0, 0).
255

ApndiceB Teoremas de concavidad para funciones en Rn


2. La funcin f (x, y, z) = x2 y 2 z 2 tiene un nico punto crtico en
(x, y, z) = (0, 0, 0). Como se demostr anteriormente, los menores principales
dominantes de f satisfacen |H1 | < 0, |H2 | > 0 y |H3 | < 0, de modo que f es
estrictamente cncava en R3 . Concluimos que f tiene un mximo global estricto
en (0, 0, 0).

A continuacin se enuncian los teoremas correspondientes al caso en donde


alguno(s) de los menores principales dominantes |Hk | de la funcin f es igual a
cero.
Teorema. Sea S Rn un conjunto abierto y convexo, y sea f : S R, con
f C 2 (S). Sea H la matriz hessiana de f . Entonces
a) H es semidefinida positiva f es convexa en S,
b) H es semidefinida negativa f es cncava en S,

Nota las implicaciones del tipo en este ltimo teorema, que contrastan con
las del tipo para funciones estrictamente convexas (cncavas).
Ejemplo:
La funcin f (x, y, z) = x2 + y + z 2 es convexa no estricta, ya que la matriz
hessiana de f,

2 0 0
H = 0 0 0 ,
0 0 2
es semidefinida positiva. En efecto, sus menores principales de orden 1 son
2, 0 y 2,
sus menores principales de orden 2 son
2 0
0 0

= 0,

2 0
0 2

=4 y

y su menor principal de orden 3 es


2 0 0
0 0 0
0 0 2

256

= 0.

0 0
0 2

= 2,

Teorema (condiciones necesarias de segundo orden)


Sea S Rn un conjunto abierto y convexo, y sea f : S R, con f C 2 (S).

Sea
x 0 S un punto crtico de f. Sea H(
x 0 ) la matriz hessiana de f evaluada en

x 0 . Entonces

a) f tiene un mnimo local en


x0

todos los menores principales de H son no negativos ( 0) en


x 0,

b) f tiene un mximo local en x 0


todos los menores principales de H de orden impar son

no positivos ( 0) en
x 0 y todos los de orden par son

no negativos ( 0) en
x 0.
El valor mnimo o mximo local es un extremo global de f, cuando los patrones
de signo a) y b) se satisfacen en todo el dominio de f .
Nota que aqu la concavidad o convexidad de f es una condicin necesaria, mas
no suficiente, para un extremo local. En otras palabras, no basta con demostrar la
concavidad o convexidad de la funcin para garantizar la existencia de un mximo
o un mnimo.

257

ApndiceB Teoremas de concavidad para funciones en Rn

Bibliografa
1. B.R. Binger, E. Hoffman, Microeconomics with Calculus, 2nd. edition, Addison
Wesley, 1997.
2. A.C. Chiang, Mtodos Fundamentales de Economa Matemtica, 3a. edicin,
McGraw-Hill Interamericana de Mxico, 1987.
3. O. Estrada, P. Garca y Colom, G. Monsivais, Clculo Vectorial y Aplicaciones,
Grupo Editorial Iberoamrica, 2003.
4. D.S. Kaplan, A Practical Guide to Lagrangeans, Centro de Investigacin
Econmica, ITAM, 2005.
5. H. Lomel, B. Rumbos, Mtodos Dinmicos en Economa: Otra Bsqueda del
Tiempo Perdido, 2a. edicin, Jit Press, 2010.
6. J. E. Marsden, A.J. Tromba, Clculo Vectorial, 5a. edicin, Pearson, 2004.
7. M.J. Osborne, Mathematical Methods for Economic Theory: A Tutorial,
http://www.economics.utoronto.ca/osborne/MathTutorial, 2007.
8. G. Pastor, Matemticas IV, ITAM, 1993.
9. E. Silberberg, W. Suen, The Estructure of Economics: A Mathematical Analysis,
3rd. edition, McGraw-Hill, 2001.
10. C.P. Simon, L. Blume, Mathematics for Economists, Norton, 1994.
11. K. Sydsaeter, P.J. Hammond, A. Carvajal, Matemticas para el Anlisis
Econmico, Pearson, 2a. edicin, 2012.
12. K. Sydsaeter, P.J. Hammond, Essential Mathematics for Economic Analysis,
2nd. edition, Prentice Hall, 2006.
13. K. Sydsaeter, P.J. Hammond, A. Seierstad, A. Strom, Further Mathematics for
Economic Analysis, 2nd. edition, Prentice Hall, 2008.
14. G.B. Thomas, R.L. Finney, Clculo, Vols. I y II, 12a. edicin, Adisson Wesley,
2004.

258

You might also like