You are on page 1of 40

Calculo en varias variables

Asignatura Analisis Matematico de 1


o
I.T.O.P.
Memoria de la segunda parte - segundo parcial- de la asignatura.
Departamento de Matematicas de la Escuela Politecnica.
Ricardo del Campo Acosta y Ricardo Garca Gonzalez.
A mis alumnos,
por querer aprender algo nuevo

Indice
Introduccion v
Captulo 1. TOPOLOG

IA DE R
N
1
1.1. Producto escalar, norma y distancia eucldeas 1
1.2. Bolas, entornos, abiertos y cerrados de R
N
2
1.3. Convergencia de sucesiones en R
N
5
Captulo 2. L

IMITES Y CONTINUIDAD DE FUNCIONES DE


VARIAS VARIABLES 7
2.1. Lmite de una funcion de varias variables 8
2.2. Algunas tecnicas y metodos para el calculo de lmites 9
2.3. Lmites en el innito y funciones divergentes 11
2.4. Continuidad de una funcion de varias variables 11
Captulo 3. DIFERENCIACI

ON DE FUNCIONES DE VARIAS
VARIABLES 15
3.1. Derivadas parciales y derivadas direccionales 15
3.2. Diferencial y gradiente de una funcion real de varias
variables. Relacion e interpretacion geometrica 17
3.3. Diferencial y matriz jacobiana de una funcion vectorial de
varias variables. Regla de la cadena 21
3.4. Funciones denidas de forma implcita. El teorema de la
funcion implcita 24
3.5. Derivadas parciales y diferencial de orden superior. Matriz
hessiana de una funcion real de varias variables 26
3.6. El teorema de Taylor en varias variables 28
3.7. Extremos relativos de una funcion real de varias variables 30
3.8. Extremos condicionados de una funcion real de varias
variables. El teorema de los multiplicadores de Lagrange 32
3.9. Extremos absolutos de una funcion real de varias variables 34
iii
Introduccion
El estudio de las aplicaciones o funciones de varias variables es uno
de los objetivos fundamentales de las matematicas, ya que la mayora
de los fenomenos de cualquier tipo (fsicos, qumicos, economicos, etc.)
se pueden modelizar mediante una funcion de este tipo.
Cuando la aplicacion es lineal, conocemos tecnicas algebraicas que
me permiten manejarla y estudiarla facilmente, pues tales aplicaciones
se pueden caracterizar mediante una matriz de coecientes y as tra-
bajar con aplicaciones lineales se reduce a trabajar con matrices:
f(x, y, z) = (8x + y z, x + 2y + 3z) =
_
8 1 1
1 2 3
_
_
_
x
y
z
_
_
f(x, y, z) = (x z, 4y + 6z, x y z) =
_
_
1 0 1
0 4 6
1 1 1
_
_
_
_
x
y
z
_
_
Obviamente la cantidad de aplicaciones con las que podemos tra-
bajar as es bastante limitada, pues cuando la aplicacion no es lineal ya
no podemos estudiar su comportamiento global a traves de una matriz,
pero a menudo si vamos a poder estudiar su comportamiento local a
traves de ciertas matrices.
De hecho, en esencia, el objetivo del calculo diferencial que vamos
a presentar en esta memoria es ese: Estudiar una clase de funciones
(las funciones diferenciables) que se parecen mucho a una aplicacion
afn (esto es, su incremento se parece mucho a una aplicacion lineal)
en un entorno de cada punto. De este modo las tecnicas algebraicas
que ya conocemos nos permitiran obtener consecuencias locales sobre
tales funciones a partir de las propiedades (globales) de las aplicaciones
lineales a las que se parecen en cada punto.
Se trata por tanto de explotar tanto como podamos las tecnicas
algebraicas para estudiar funciones que no tienen por que ser lineales.
De este modo estamos ampliando enormemente la cantidad de fun-
ciones con las que podemos trabajar, pues disponemos de herramientas
matematicas para extraer informacion util sobre ellas.
v
CAPTULO 1
TOPOLOG

IA DE R
N
En el estudio de las funciones reales de variable real los intervalos de-
sempe nan un papel crucial pues algunas propiedades de tales funciones
solo se dan en un determinado tipo de intervalos. La importancia de
los intervalos se debe a que nos permiten manejar (de un modo sencillo
y riguroso) los n umeros reales que se encuentran entorno a un n umero
real dado a, en concreto, los n umeros reales que estan a una distancia
menor (o menor o igual) que de a, pues
]a , a + [= x R : [x a[ <
[a , a + ] = x R : [x a[
Si ahora pretendemos estudiar funciones de varias variables nece-
sitaremos una nocion que generalice la idea del valor absoluto como
herramienta para medir distancias entre puntos y unos conjuntos que
hagan el papel de los intervalos como conjuntos de puntos entorno a
un punto dado a.
1.1. Producto escalar, norma y distancia eucldeas
Vamos a comenzar presentando de forma abstracta las nociones
basicas con las que vamos a trabajar. Si X es un espacio vectorial
sobre R se llama distancia a toda aplicacion d : X X R que
x, y, z X verica las siguientes propiedades:
d(x, y) 0 y d(x, y) = 0 x = y
d(x, y) = d(y, x)
d(x, y) d(x, z) + d(z, y)
Se llama norma a toda aplicacion | | : X R que x, y, z X
y R cumple lo siguiente:
|x| 0 y |x| = 0 x = 0
|x| = [[|x|
|x + y| |x| +|y|
Por ultimo, se llama producto escalar a toda forma bilineal simetrica
denida positiva de X, esto es a toda aplicacion < , >: XX R
tal que x, x

, y X y , R verica que:
1
2 1. TOPOLOG

IA DE R
N
< x + x

, y >= < x, y > + < x

y >
< x, y >=< y, x >
< x, x > 0 y < x, x >= 0 x = 0
Intuitivamente una distancia es una funcion que mide el grado de
proximidad entre los puntos, una norma es una funcion que mide las
longitudes de los vectores y un producto escalar es una funcion que me
permite medir angulos y hablar de ortogonalidad entre vectores.
Ademas estas nociones no son independientes entre si, pues todo
producto escalar induce una norma, denida mediante la expresion
|x| :=

< x, x >, x X
y toda norma induce una distancia del siguiente modo:
d(x, y) := |x y|, x, y X
es decir, que si tengo un producto escalar en un espacio vectorial puedo
medir longitudes de vectores sin mas que hacer la raz cuadrada del
producto escalar de cada vector consigo mismo, y si tengo una nor-
ma puedo medir distancias entre dos puntos cualesquiera midiendo la
longitud de su diferencia como vectores.
Como R
N
es un espacio vectorial con un producto escalar canonica-
mente asociado, el producto escalar eucldeo, dado por
x y = < x, y > := x
1
y
1
+ + x
N
y
N
para todo x = (x
1
, . . . , x
N
) e y = (y
1
, . . . , y
N
) de R
N
, en particular
tenemos una norma y una distancia inducidas, que reciben el nombre
de norma y distancia eucldeas y vienen dadas por
|x| =
_
x
2
1
+ + x
2
N
d(x, y) =
_
(x
1
y
1
)
2
+ + (x
N
y
N
)
2

Estas son las nociones de producto escalar, norma y distancia que


vamos a consideras canonicamente asociadas a R
N
. Notese que para
N = 1 la norma eucldea no es otra cosa que el valor absoluto de un
n umero real.
1.2. Bolas, entornos, abiertos y cerrados de R
N
Definici

on 1.2.1. Sea a R
N
y > 0. Se dene la bola (abierta)
de centro a y radio como el siguiente conjunto:
B

(a) := x R
N
: |x a| <
Analogamente, se dene la bola cerrada de centro a y radio como
B

(a) := x R
N
: |x a|
1.2. BOLAS, ENTORNOS, ABIERTOS Y CERRADOS DE R
N
3
Observese que para N = 1 las bolas vuelven a ser intervalos, pues
B

(a) =]a, a+[ y B

(a) = [a, a+], para N = 2 lo que quedan


son crculos (con o sin su circunferencia) y para N = 3 las bolas son
esferas.
Podemos considerar a las bolas centradas en un punto a como los
entornos del punto a, pero conviene mas pensar en los entornos de a
como cualquier conjunto que contenga una bola centrada en a.
Definici on 1.2.2. Un conjunto V de R
N
se dice que es un entorno
del punto a si existe > 0 tal que B

(a) V .
Ya tenemos unos conjuntos, las bolas, que extienden la denicion
de los intervalos a R
N
. Sin embargo, dada la riqueza de conjuntos que
hay en R
N
, las bolas son unos conjuntos demasiados restrictivos para
nuestros nes: En R es suciente con limitarnos a estudiar las funciones
denidas en un intervalo ya que la mayora de las funciones suelen estar
denidas de un modo natural sobre uno (o varios) intervalos, pero en
R
N
los conjuntos en los que estan denidas las funciones pueden tener
una geometra muy diversa y no sera muy interesante limitarnos solo
a estudiar las funciones denidas en una (o varias) bolas.
Por este motivo vamos a usar las bolas para introducir un par de
familias de conjuntos de R
N
muchos mas amplia que las propias bolas,
que seran la familia de los conjuntos abiertos y la de los conjuntos
cerrados de R
N
.
Definici

on 1.2.3. Sea A R
N
y x R
N
. Se dice que
x es un punto interior de A si > 0 tal que B

(x) A
x es un punto adherente de A si > 0, B

(x) A ,=
Al conjunto A

de todos los puntos interiores de A lo llamaremos


interior de A y al conjunto A de todos los puntos adherentes de A lo
llamaremos clausura, cierre o adherencia de A.
Es claro que todo punto interior de un conjunto A es forzosamente
un punto de A y que todo punto de A es un punto adherente de A.
En smbolos, para todo A R
N
se tiene que A

A A. Pongamos
nombre a los conjuntos que de hecho coinciden con su interior o con su
adherencia:
Definici on 1.2.4. Sea A un conjunto cualquiera de R
N
.
Se dice que A es abierto si A = A

(todos los puntos de A son


interiores o, expresado de otro modo, A es entorno de todos sus puntos).
Se dice que A es cerrado si A = A (todos los puntos adherentes de
A estan de hecho en A).
4 1. TOPOLOG

IA DE R
N
Ejemplo 1.2.5. Las bolas abiertas son conjuntos abiertos y las
bolas cerradas son conjuntos cerrados de R
N
.
Intuitivamente, los conjuntos abiertos son aquellos que no tienen
frontera o borde alguno y los conjuntos cerrados son lo que contienen a
toda su frontera o borde. Esto se puede expresar de un modo riguroso
deniendo la frontera de un conjunto del siguiente modo:
Definici on 1.2.6. Se dice que x es un punto frontera de A si
> 0, B

(x) A ,= y B

(x) (R
N
A) ,=
Denotaremos por Fr(A) al conjunto de todos los puntos frontera de A.
Como Fr(A) = AA

, es evidente que un conjunto A es abierto


si y solo si no contiene ning un punto frontera y es cerrado si y solo si
contiene a toda su frontera. En la practica no se suele trabajar mucho
con la frontera de un conjunto: Es mejor trabajar directamente con los
conjuntos abiertos y cerrados ya que verican unas propiedades faciles
de formular como vemos a continuacion.
Proposici

on 1.2.7. Los abiertos de R


N
cumplen estas propiedades:
(i) y R
N
son abiertos
(ii) La union arbitraria de abiertos es un abierto
(ii) La interseccion nita de abiertos es un abierto
Ademas, un conjunto A es cerrado si y solo si R
N
A es abierto.
Por tanto, los cerrados de R
N
verican las siguientes propiedades:
(i) y R
N
son cerrados
(ii) La union nita de cerrados es un cerrado
(ii) La interseccion nita de cerrados es un cerrado
Definici

on 1.2.8. La familia T de todos los conjuntos abiertos de


R
N
recibe el nombre de topologa (usual ) de R
N
.
Muchas de las propiedades de los conjuntos y de las funciones de
R
N
dependen en gran medida de la topologa de R
N
. Por este motivo,
la topologa de R
N
estara presente de uno u otro modo en la mayora de
los resultados que vamos a obtener para funciones de varias variables.
En este sentido, hay un tipo particular de cerrados que merecen especial
atencion, pues (como veremos posteriormente) van a conservar alguna
de las propiedades que posean los intervalos cerrados y acotados de R.
Definici

on 1.2.9. Sea A un conjunto cualquiera de R


N
Se dice que A esta acotado si M > 0 tal que |x| M, x A.
Se dice que A es compacto si es cerrado y acotado.
1.3. CONVERGENCIA DE SUCESIONES EN R
N
5
Para terminar esta seccion vamos a presentar dos tipos distintos de
puntos adherentes que es interesante distinguir.
Definici on 1.2.10. Sea A R
N
y x R
N
. Se dice que
x es un punto aislado de A si > 0 tal que B

(x) A = x
x es un punto de acumulacion de Asi > 0 B

(x)Ax ,=
El conjunto de todos los puntos de acumulacion de A se llama conjunto
derivado de A y se denota por A

.
1.3. Convergencia de sucesiones en R
N
Definici

on 1.3.1 (Convergencia de una sucesion en R


N
). Se dice
que una sucesion x
n
R
N
converge a l R
N
, y notaremos x
n
l
si > 0, m N : n m, |x
n
l| < .
Pero una sucesion x
n
de R
N
esta formada realmente por N suce-
siones de n umeros reales, pues cada termino x
n
es un vector con N com-
ponentes, x
n
= (x
1
n
, . . . , x
N
n
), por lo que cabe preguntarse si podemos
caracterizar su convergencia mediante la convergencia tales sucesiones
de n umeros reales x
i
n
, i = 1, . . . , N. La respuesta es armativa: la con-
vergencia en R
N
se puede calcular coordenada a coordenada, como pone
de maniesto el siguiente resultado:
Proposici on 1.3.2. x
n
l x
i
n
l
i
, i = 1, . . . , N.
Esto simplica mucho la situacion ya que reduce la nueva nocion
de convergencia a la ya conocida y ampliamente estudiada convergen-
cia de sucesiones de n umeros reales (luego no necesitamos introducir
ninguna tecnica nueva para estudiar la convergencia de las sucesiones
de vectores).
Ejemplo 1.3.3. (
1
n
,
n
n+1
) (0, 1) en R
2
porque
1
n
0 y
n
n+1
1.
La principal utilidad de la nocion de convergencia de sucesiones
es que permite caracterizar la topologa de R
N
y por tanto todos los
conceptos que se pueden denir a partir de ella. A modo de ejemplo,
veamos como podemos caracterizar (de un modo sencillo y elegante)
los puntos adherentes y los puntos de acumulaci on mediante sucesiones
convergentes:
Proposici

on 1.3.4. Dados A R
N
y x R
N
, se cumple que:
(i) x A x
n
A, x
n
x.
(ii) x A

x
n
A, x
n
,= x, n N, x
n
x.
En particular, A es cerrado si y solo si contiene el lmite de cualquier
sucesion convergente de elementos de A.
CAPTULO 2
L

IMITES Y CONTINUIDAD DE FUNCIONES


DE VARIAS VARIABLES
El objetivo de los dos proximos captulos consiste en denir y estu-
diar las principales propiedades de las funciones f : A R
N
R
M
.
Para ello, procederemos del siguiente modo:
Vamos a trabajar principalmente con funciones f : A R
N
R,
deniendo los distintos conceptos o propiedades para ellas, ya que las
funciones F : A R
N
R
M
estan caracterizadas por sus M fun-
ciones coordenadas o componentes f
i
: A R
N
R, i = 1, . . . , M
que verican que F(x) = (f
1
(x), . . . , f
M
(x)), x R
N
, por lo que no-
taremos F = (f
1
, . . . , f
M
).
Por lo tanto, podremos extender la mayora de los conceptos y
propiedades a funciones F : A R
N
R
M
a traves de sus fun-
ciones coordenadas o componentes: Diremos que F presenta una cierta
condicion o propiedad si y solo si todas sus funciones coordenadas f
i
,
con i = 1, . . . , M, la cumplen.
Observaci

on 2.0.5. El dominio de una funcion f : A R


N

R
M
es el conjunto A donde esta denida la funcion. Siempre podremos
restringirnos a un dominio B mas peque no (en el sentido de contenido
en A) sin mas que considerar que la funcion f act ua tan solo sobre
los puntos de B (en tal caso, se suele decir que trabajamos con la
restriccion de f a B o que f esta restringida al conjunto B y se denota
por f[
B
).
Ahora bien, si no se expresa un dominio A de manera explcita, se
entiende que este es el mas grande posible, esto es, el conjunto A de
R
N
donde la expresion f(x) tiene sentido
Ejemplo 2.0.6. Calcular el dominio de f(x, y) =
ln(xy)
_
1 x
2
y
2
Observaci

on 2.0.7. El rango o la imagen de una funcion f : A


R
N
R
M
es el conjunto f(A) de los valores que toma la funcion,
esto es, los puntos del espacio de llegada, y R
M
, que son la imagen
y = f(x) de alg un x A.
7
8 2. L

IMITES Y CONTINUIDAD DE FUNCIONES DE VARIAS VARIABLES


2.1. Lmite de una funcion de varias variables
Definici on 2.1.1. Sean A R
N
, a A

, l R, L = (l
1
, . . . , l
M
),
f : A R
N
R y F : A R
N
R
M
con F = (f
1
, . . . , f
M
).
Se dice que f tiene lmite l en el punto a, y se nota lm
xa
f(x) = l, si
> 0, > 0 : 0 < |x a| < [f(x) l[ < .
Se dice que F tiene lmite L en el punto a, y notaremos igualmente
lm
xa
F(x) = L, si f
i
tiene lmite l
i
en el punto a, o sea, que el lmite de
una funcion vectorial se calcula componente a componente:
lm
xa
F(x) =
_
lm
xa
f
1
(x), . . . , lm
xa
f
M
(x)
_
.
Observaci

on 2.1.2. Para hablar de lmite de una funcion f en un


punto a no es necesario que la funcion f este denida en tal punto:
basta con que a sea un punto de acumulacion del dominio A de f (es
decir que podamos acercarnos al punto mediante una sucesion de otros
puntos de A que no sean el propio a).
De hecho se puede dar una denicion equivalente del concepto de
lmite de una funcion f en a mediante sucesiones del siguiente modo:
lm
xa
f(x) = l x
n
A con x
n
,= a, n N y x
n
a, f(x
n
) l.
la cual deja mucho mas claro la necesidad de que a sea un punto de
acumulaci on de A para que la denicion de lmite no sea vaca.
Observaci on 2.1.3. La notacion lm
xa
f(x) = l encierra realmente
dos armaciones: que ese lmite realmente existe, o sea, que es un
n umero real, y que tal lmite es, en concreto, el valor l. Para enfatizar
este hecho a menudo escribiremos lm
xa
f(x) = l, o solo lm
xa
f(x) si
no sabemos o no los interesa el valor de ese lmite.
Observaci

on 2.1.4 (unicidad del l

mite). Se puede probar


facilmente que, el lmite de una funcion en un punto a, si existe, es
unico. En smbolos: Si lm
xa
f(x) = l y lm
xa
f(x) = l

entonces l = l

.
Proposici

on 2.1.5 (

algebra de l

mites). Sean f y g dos fun-


ciones de A R
N
en R
M
y a A

.
(i) lm
xa
(f +g)(x) = lm
xa
f(x)+lm
xa
g(x), si lm
xa
f(x) y lm
x

a
g(x)
(ii) lm
xa
(fg)(x) = lm
xa
f(x) lm
xa
g(x), si lm
xa
f(x) y lm
x

a
g(x)
(iii) lm
xa
f
g
(x)
lm
xa
f(x)
lm
xa
g(x)
, si lm
xa
f(x) y lm
x

a
g(x) ,= 0
2.2. ALGUNAS T

ECNICAS Y M

ETODOS PARA EL C

ALCULO DE L

IMITES 9
2.2. Algunas tecnicas y metodos para el calculo de lmites
2.2.1. Lmites por caminos y lmites direccionales: En R,
para acercarnos a un punto a podemos hacerlo de tres maneras: Pode-
mos movernos solo por puntos situados a la izquierda de a, hacerlo solo
por puntos situados a la derecha de a o hacerlo por ambos lados del
punto a. Cuando calculamos el lmite de una funcion real de variable
real, estas distintas formas de acercarse a un punto conducen a los con-
ceptos de lmite por la izquierda, por la derecha y lmite (global) de la
funcion en a y sabemos que la existencia del lmite de la funcion en un
punto a es equivalente a que ambos lmites laterales existan y tomen
el mismo valor real.
En R
N
podemos acercarnos a un punto a de muchas mas formas.
En general, si f : A R
N
R
M
y a A, podemos acercarnos al
punto a a traves de cualquier subconjunto B A tal que a B

. En
estas condiciones vamos a denotar por
lm
xa
xB
f(x) := lm
xa
f[
B
(x)
esto es, al lmite de f cuando x tiende a a pero moviendonos solo a
traves de los puntos de B. Con esta notacion es claro que
lm
xa
f(x) = l lm
xa
xB
f(x) = l
o sea, que si existe el lmite de f cuando x tiende a a existe entonces
existe el lmite de f cuando x tiende a a a traves de cualquier subcon-
junto suyo y ademas coincide con el.
Esta ingenua armacion es una herramienta muy util para compro-
bar que ciertas funciones no tienen lmite en un punto o para obtener
el unico candidato a lmite posible.
Los lmites a traves de subconjuntos se usan sobre todo tomando
como conjunto B ciertos caminos en R
N
que conducen hacia el punto a,
como por ejemplo las rectas que pasan por a. Estos ultimos reciben el
nombre de lmites direccionales de f en a y para funciones de dos vari-
ables son especialmente faciles de calcular ya que se reducen a lmites
de funciones reales de variable real. Su doble uso se resume brevemente
de la siguiente manera:
(1
o
) Si existen los lmites direccionales de f en a y no son todos
iguales, entonces f no tiene lmite en a
(2
o
) Si todos los lmites direccionales de f en a son iguales a l,
entonces l es el unico candidato admisible a lmite (o sea, el
lmite de f en a, si existe, es a la fuerza l)
10 2. L

IMITES Y CONTINUIDAD DE FUNCIONES DE VARIAS VARIABLES


El siguiente ejemplo muestra la utilidad de los lmites direccionales
para probar la no existencia de lmite de una funcion en un punto.
Ejemplo 2.2.1. La funcion f(x, y) :=
xy
x
2
+y
2
no tiene lmite en (0, 0)
Sin embargo, el que todos los lmites direccionales de f en un punto
a sean iguales no signica que la funcion tenga lmite (global) como
pone de maniesto el siguiente ejemplo
Ejemplo 2.2.2. Todos los lmites direccionales en (0, 0) de la fun-
cion f(x, y) =
x
3
x
2
y
valen 0 y sin embargo f no tiene lmite en (0, 0).
2.2.2. Lmites reiterados: Se llaman lmites reiterados de una
funcion f de dos variables en un punto (a, b) a los limites dobles
lm
xa
_
lm
xb
f(x, y)
_
y lm
xb
_
lm
xa
f(x, y)
_
donde se entiende que en el lmite interior solo se mueve una variable
y la otra se trata como si fuese constante.
Cabe preguntarse que relacion existe entre el lmite (global) de
la funcion f en (a, b) y sus lmites reiterados? El siguiente resultado
establece la unica relacion general entre esos valores.
Proposici on 2.2.3. Si existe lm
(x,y)(a,b)
f(x, y) = l y existen los
lmites reiterados, entonces lm
xa
lm
xb
f(x, y) = lm
xb
lm
xa
f(x, y) = l.
Por tanto, podemos usar los lmites reiterados de este modo:
(1
o
) Si lm
xa
lm
xb
f(x, y) ,= lm
xb
lm
xa
f(x, y) f no tiene lmite en a
(2
o
) Si lm
xa
lm
xb
f(x, y) = lm
xb
lm
xa
f(x, y) = l l es el unico can-
didato admisible a lmite
Un ejemplo de uso tpico del primer caso es el siguiente:
Ejemplo 2.2.4. La funcion f(x, y) :=
x
2
y
2
x
2
+y
2
no tiene lmite en (0, 0)
No obstante, ejemplos sencillos ponen de maniesto que la igualdad
de los lmites reiterados no garantiza la existencia de lmite (global) de
la funcion:
Ejemplo 2.2.5. La funcion f(x, y) :=
xy
x
2
+y
2
no tiene lmite en (0, 0)
como ya sabemos y sin embargo sus limites reiterados valen ambos 0.
Por otra parte tambien es importante se nalar que si no existe alguno
(o ninguno) de los lmites reiterados tampoco podemos asegurar nada:
Ejemplo 2.2.6. La funcion f(x, y) :=
_
y x 0
y x < 0
tiene lmite 0
cuando (x, y) (0, 0) pero no existe el lm
x0
f(x, y) para ning un y ,= 0.
2.4. CONTINUIDAD DE UNA FUNCI

ON DE VARIAS VARIABLES 11
Ejemplo 2.2.7. La funcion f(x, y) := x sen(
1
y
) + y cos(
1
x
) tiene
lmite 0 cuando (x, y) (0, 0) y sin embargo no existen ninguno de los
dos lmites reiterados en (0, 0).
2.2.3. Lmites en polares: Podemos calcular el lmite de una
funcion f(x, y) de dos variables en el punto (0, 0) haciendo el cambio a
coordenadas a polares
_
x = r cos
y = r sen
Teniendo en cuenta que (x, y) (0, 0) equivale a r 0, ]0, 2[,
lm
(x,y)(0,0)
f(x, y) = lm
r0
f(r cos , r sen ), ]0, 2[
luego para que ese lmite exista no puede depender de .
Ejemplo 2.2.8. Calcular mediante el cambio a coordenadas polares
lm
(x,y)(0,0)
xy
x
2
+ y
2
y lm
(x,y)(0,0)
x
2
y
x
2
+ y
2
2.3. Lmites en el innito y funciones divergentes
Si f : R
N
R, a R
N
y l R tambien se pueden denir los
lmites en el innito y las funciones divergentes en un punto a o el
innito del siguiente modo:
lm
x
f(x) = l > 0, M > 0 : |x| > M [f(x) l[ < .
lm
xa
f(x) = K > 0, > 0 : |x a| < [f(x)[ > K.
lm
x
f(x) = K > 0, M > 0 : |x| > M [f(x)[ > K.
Observaci on 2.3.1. Notese que para x R
N
, la expresion x
signica realmente que [[x[[ (o sea que cubrimos todas las
direcciones posibles de R
N
).
2.4. Continuidad de una funcion de varias variables
Definici

on 2.4.1. Sean A R
N
, a A, f : A R
N
R y
F : A R
N
R
M
con F = (f
1
, . . . , f
M
).
Se dice que f es continua en el punto a si verica lo siguiente:
> 0, > 0 : |x a| < [f(x) f(a)[ <
Se dice que F es continua en el punto a si f
i
es continua en el punto
a, i = 1, . . . , M (equivalentemente: > 0, > 0 : |x a| <
|f(x) f(a)| < ).
Ademas, diremos que f (o F) es continua en A si y solo si lo es
para todo punto a A.
12 2. L

IMITES Y CONTINUIDAD DE FUNCIONES DE VARIAS VARIABLES


Observaci

on 2.4.2. La continuidad de f (y de F) se puede denir


tambien equivalentemente mediante sucesiones del siguiente modo:
f es continua en a x
n
A con x
n
a, f(x
n
) f(a).
Ejemplo 2.4.3. Demuestre, haciendo uso de la denicion de con-
tinuidad, que la norma es una aplicacion continua de R
N
en R (pruebe
que [ |x| |y| [ |x y|, x, y R
N
) y que toda aplicacion lineal
de R
N
en R
M
es continua.
A la vista de esta denicion, la relacion entre los conceptos de con-
tinuidad y lmite es casi inmediata:
Proposici on 2.4.4. Sean A R
N
, a A y f : A R
N
R
M
.
(i) Si a es un punto aislado de A entonces f es continua en a.
(ii) Si a A

, f es continua en a si y solo si lm
xa
f(x) = f(a).
Puesto que ya sabemos que los lmites (cuando existen) se compor-
tan bien con las operaciones algebraicas tenemos, en particular que las
sumas, productos y cocientes (por funciones no nulas) de funciones
continuas son funciones continuas. Ademas la composicion de fun-
ciones continuas es tambien una funcion continua. Por tanto, todas las
sumas, productos, exponenciales y logaritmos de funciones polinomi-
cas en varias variables (por ejemplo, x, xy, x
3
y + 2x
2
, cos x, sin(x +
y), exp(2x + y), ln(x
2
+ y
2
), . . .) son funciones continuas.
El unico problema que se nos puede presentar es cuando una funcion
f esta denida de distinta forma en distintas regiones del dominio.
En esta situacion f puede coincidir con una continua en una de tales
regiones, pero eso solo nos dice que f, restringida a ese subconjunto
del dominio, es continua. El siguiente resultado puede sernos muy util
para garantizar la continuidad de f en esa situacion, pues arma que
la continuidad de una funcion en un punto es una propiedad local: la
continuidad en un punto a solo depende de los puntos que hay en un
entorno de a.
Proposici

on 2.4.5 (car

acter local de la continuidad).


Sean A R
N
, a A

y f : A R
N
R
M
.
(i) Si f[
B
a
()
es continua en a, entonces f es continua en a.
(ii) Si B A, B abierto, f[
B
es continua en B, entonces f es
continua en B.
Ejemplo 2.4.6. f(x, y) :=
_
x
2
y
x
2
+y
2
(x, y) ,= (0, 0)
0 (x, y) = (0, 0)
es continua
2.4. CONTINUIDAD DE UNA FUNCI

ON DE VARIAS VARIABLES 13
Recordemos que para funciones f reales de variable real sabemos
que la imagen mediante una funcion continua de un intervalo com-
pacto es un intervalo compacto. Para funciones de varias variables la
propiedad que se verica, en general, es que la imagen mediante una
funcion continua de una conjunto compacto es un compacto, esto es,
Teorema 2.4.7 (propiedad de compacidad). Sea A R
N
. Si
f : A R
M
es una funcion continua y A es compacto, entonces f(A)
es compacto.
Este resultado nos dice, en particular, que las funciones reales de
varias variables sobre compactos siguen teniendo maximo y mnimo
absoluto.
Corolario 2.4.8 (teorema de Weierstrass). Sea A R
N
.
Si f : A R es continua y A es compacto, entonces f alcanza su
maximo y su mnimo en A.
Acabamos de asegurar que las funciones continuas transforman
compactos en compactos. No ocurre lo mismo con los abiertos ni con los
cerrados: Una funcion continua puede trasformar abiertos en conjun-
tos que no sean abiertos y cerrados en conjuntos que no sean cerrados
(incluso una funcion real de variable real).
Lo que ocurre en realidad es que es la imagen inversa de una funcion
continua la que se comporta bien con los abiertos y con los cerrados.
De hecho podemos caracterizar las funciones continuas mediante esa
propiedad del siguiente modo:
Teorema 2.4.9. Sea f : A R
N
R
M
.
(i) f es continua si y solo si f
1
(E) es un abierto de R
N
cortado
con A para todo E abierto de R
M
.
(ii) f es continua si y solo si f
1
(F) es un cerrado de R
N
cortado
con A para todo F cerrado de R
M
.
Sin embargo esta caracterizacion de la continuidad se suele usar mas
en el sentido contrario que para estudiar la continuidad de una funcion
dada: Se suele emplear para probar que ciertos conjuntos (denidos
mediante una funcion continua de sus coordenadas) son abiertos o cer-
rados. Por ejemplo, se puede ver de este modo que las bolas abiertas
son conjuntos abiertos, pues se pueden expresar como
B
a
() = x R
M
: |x a| < = f
1
( ] , [ ),
siendo f la funcion f : R
N
R dada por f(x) := |x a| que es
claramente continua.
CAPTULO 3
DIFERENCIACI

ON DE FUNCIONES DE
VARIAS VARIABLES
3.1. Derivadas parciales y derivadas direccionales
Pretendemos extender la nocion de derivabilidad de una funcion f :
R R a funciones de varias variables. Recordemos que f es derivable
en un punto a si existe el siguiente lmite (expresado de cualquiera de
estas dos formas equivalentes):
f

(a) = lm
h0
f(a + h) f(a)
h
= lm
xa
f(x) f(a)
x a
.
Si tenemos ahora una funcion f : A R
N
R, el modo mas
sencillo de proceder es intentar reducirnos al caso unidimensional, con-
siderando la funcion f como si fuese una funcion de una unica variable,
es decir, manteniendo jas todas las variables menos una. Esto nos con-
duce al concepto de derivada parcial de una funcion de varias variables
Definici on 3.1.1. Sea f : A R
N
R, a A

, a = (a
1
, . . . , a
N
).
Se dice que f es derivable (parcialmente) en a con respecto a la
variable x
i
, para i = 1, . . . , N, si existe el siguiente lmite
f
x
i
(a) := lm
h0
f(a
1
, . . . , a
i
+ h, . . . , a
N
) f(a
1
, . . . , a
2
)
h
que llamaremos derivada parcial de f en a respecto a x
i
.
Si no se expresa un punto a concreto se entiende que
f
x
i
es la
funcion de varias variables
f
x
i
(x) denida en todos los puntos x R
en los cuales f es derivable con respecto a x
i
.
Para N = 2, las derivadas parciales de f en a = (a
1
, a
2
) quedan as:
f
x
(a
1
, a
2
) = lm
h0
f(a
1
+ h, a
2
) f(a
1
, a
2
)
h
f
y
(a
1
, a
2
) = lm
h0
f(a
1
, a
2
+ h) f(a
1
, a
2
)
h
Observaci

on 3.1.2. Si denimos las funciones reales de variable


real u y v como u(x) := f(x, a
2
) y v(y) := f(a
1
, y), es claro que las
15
16 3. DIFERENCIACI

ON DE FUNCIONES DE VARIAS VARIABLES


parciales de f no son otra cosa que las derivadas de u y v en a
2
y a
1
,
respectivamente, pues
f
x
(a
1
, a
2
) = lm
h0
u(a
1
+ h) u(a
1
)
h
= u

(a
1
)
f
x
(a
1
, a
2
) = lm
h0
v(a
2
+ h) v(a
2
)
h
= v

(a
2
)
Por lo tanto, podemos calcular las derivadas parciales de f derivan-
do las funciones reales de variable real u y v. Pero u y v no son otra
cosa que f cuando se ja una de sus variables, luego lo que estamos
diciendo es que podemos calcular las parciales de f derivando f como
si solo dependiese de una variable y la otra fuese constante. Lo bueno
de este procedimiento es que nos permite usar todos las tecnicas que
ya conocemos para derivar funciones reales de variable real a la hora
de calcular derivadas parciales, lo que facilita enormemente su calculo.
Ejemplo 3.1.3. Para f(x, y) = x
2
y + 2xy
3
+ 4x, se tiene que
f
x
(x, y) = 2xy + 2y
3
+ 4 y
f
y
(x, y) = x
2
+ 6xy
2
, (x, y) R
2
El problema que presenta el concepto de derivada parcial es que
la existencia de todas las derivadas parciales de una funcion f en un
punto no garantiza la continuidad de f en tal punto, luego el concepto
de derivada parcial no generaliza adecuadamente al de derivabilidad
de funciones reales de variable real ya que no conserva una de sus
principales propiedades.
Ejemplo 3.1.4. f(x, y) :=
_
1 si x = 0 o y = 0
0 si x ,= 0 e y ,= 0
en (0, 0).
Este mal comportamiento de las derivadas parciales de una fun-
cion f se debe a que las derivadas parciales nos dan solo una vision
parcial de la funcion. En concreto, las derivadas parciales de f en a
nos proporcionan la pendiente de la recta tangente a la graca de f en
las direcciones de las variables y eso, en general, no nos dice nada del
comportamiento global de la funcion en un entorno del punto a.
Esta idea de derivar en la direccion de las variables se puede gen-
eralizar a cualquier vector de R
N
del siguiente modo:
Definici

on 3.1.5. f : A R
N
R, a A

, v R
N
(|v| = 1).
Se dice que f es derivable en a seg un el vector v si existe el siguiente
lmite
D
v
f(a) =
f
v
(a) := lm
h0
f(a + hv) f(a)
h
que llamaremos derivada (direccional) de f en a seg un (la direccion del
vector) v.
3.2. DIFERENCIAL Y GRADIENTE 17
3.2. Diferencial y gradiente de una funcion real de varias
variables. Relacion e interpretacion geometrica
Como la existencia de todas las derivadas direccionales de una fun-
cion en un punto no implica la continuidad de la funcion en dicho pun-
to, el concepto de derivada direccional no extiende satisfactoriamente
el caso real.
Por ello vamos a introducir un nuevo concepto, el de diferencial de
una funcion de varias variables, que si extiende el concepto de derivada
adecuadamente, esto es, conservando sus principales propiedades.
La nocion de diferenciabilidad surge de manera natural a partir de
la siguiente reformulaci on de la derivabilidad de funciones de reales
de variable real f : A R R: f es derivable en a f

(a) =
lm
h0
f(a + h) f(a)
h
lm
h0
f(a + h) f(a) f

(a)h
h
= 0 existe
una aplicacion lineal D : R R, dada por D(h) = f

(a)h, tal que


lm
h0
f(a + h) f(a) D(h)
h
0.
Definici

on 3.2.1. Sea A R
N
abierto, f : A R
N
R, a A.
Se dice que f es diferenciable en el punto a si existe una aplicacion
lineal (necesariamente unica por ser A abierto) que denotaremos por
df(a) o Df(a) y llamaremos diferencial de f en a , tal que
lm
h0
f(a + h) f(a) df(a)(h)
|h|
= 0.
Observaci

on 3.2.2. Notese que aqu h = (h


1
, h
2
, . . . , h
N
) es un
incremento para cada una de las variables de f, es decir, que estamos
moviendo todas las variables de f (a diferencia de lo que hemos estado
haciendo hasta ahora, donde la h era un n umero real).
En primer lugar veamos que la diferenciabilidad es un concepto mas
fuerte, mas restrictivo, que el de la derivabilidad seg un cualquier vector
y por tanto que la derivabilidad parcial.
Teorema 3.2.3 (conds. necesarias de diferenciabilidad).
Si f es diferenciable en a entonces f es derivable en a seg un cualquier
vector v R
N
con
D
v
f(a) = df(a)(v).
En particular, si f es diferenciable en a entonces existen todas las
derivadas parciales de f en a y
f
x
i
(a) = df(a)(e
i
), i = 1, . . . , N,
siendo e
1
, . . . , e
N
la base canonica de R
N
.
18 3. DIFERENCIACI

ON DE FUNCIONES DE VARIAS VARIABLES


El resultado anterior nos dice en particular que la existencia de
derivadas parciales (y en general, de cualquier derivada direccional) de
una funcion en un punto es una condicion necesaria para que la funcion
pueda ser diferenciable en ese punto.
Pero a un podemos extraer mas informacion del resultado anterior:
Como la diferencial de una funcion f sobre la base canonica este dada
por las parciales de de f se deduce inmediatamente que las derivadas
parciales de f determinan a la diferencial de f de la siguiente manera
Corolario 3.2.4. Si f es diferenciable en a entonces la diferencial
de f en a es la aplicacion lineal de R
N
en R dada por
df(a)(x
1
, . . . , x
N
) =
f
x
1
(a) x
1
+ +
f
x
N
(a) x
N
.
Observaci

on 3.2.5. A menudo (sobre todo, cuando la diferencial


se calcula en un punto arbitrario x de R
N
) se usa como variable de
df(x) el vector dx = (dx
1
, . . . , dx
N
) pues se entiende que la diferencial
de f en x act ua sobre un incremento dx de la variable x. Con esta
notacion la diferencial quedara expresada del siguiente modo:
df(x)(dx
1
, . . . , dx
N
) =
f
x
1
(x) dx
1
+ +
f
x
N
(x) dx
N
o mas abreviadamente (omitiendo todas las variables para simplicar
la notacion),
df =
f
x
1
dx
1
+ +
f
x
N
dx
N
.
Definici

on 3.2.6. Sea A R
N
abierto, a A

y f : A R
N
R
parcialmente derivable en a con respecto a x
i
, i = 1, . . . , N.
Se llama vector gradiente de f en a al siguiente vector de R
N
f(a) :=
_
f
x
1
(a), . . . ,
f
x
N
(a)
_
Corolario 3.2.7. El vector gradiente de una funcion f diferen-
ciable en un punto a es la matriz asociada a la diferencial de f en a
respecto de las bases canonicas de R
N
y R. Por tanto, la diferencial de
f en a act ua as
df(a)(x
1
, . . . , x
N
) =
_
f
x
1
(a), . . . ,
f
x
N
(a)
_
_
_
x
1
.
.
.
x
N
_
_
lo cual tambien se puede interpretar como el producto escalar del vector
gradiente f(a) por el vector (x
1
, . . . , x
N
), esto es
df(a)(x) = f(a) x, x R
N
.
3.2. DIFERENCIAL Y GRADIENTE 19
Por tanto, las derivadas parciales de una funcion f me dan toda
la informacion que necesito para poder estudiar la diferenciabilidad de
tal funcion, ya que
(1
o
) Si no existe alguna derivada parcial de f en un punto a en-
tonces f no es diferenciable en ese punto.
(2
o
) Si existen todas las derivadas parciales de f en a entonces
tenemos la unica aplicacion lineal D candidata a ser la df(a):
la dada por D(x
1
, . . . , x
N
) =
f
x
1
(a) x
1
+ +
f
x
N
(a) x
N
.
Ademas, las derivadas direccionales permiten dar una interesante
interpretaci on geometrica del vector gradiente: Como
D
v
f(a) = df(a)(v) = f(a) v, v R
N
,
tenemos que
D
v
f(a) = |f(a)||v| cos ,
siendo el angulo entre f(a) y v, de lo que se deducen las siguientes
consecuencias:
Corolario 3.2.8. Sea A R
N
abierto, f : A R
N
R, a A.
v R
N
con |v| = 1 se tiene que |f(a)| D
v
f(a) |f(a)|
(las derivadas direccionales de la funcion estan acotadas por la norma
del gradiente). Ademas,
(i) D
v
f(a) = |f(a)| v =
f(a)
|f(a)|
(La derivada direccional
maxima se alcanza solo en la direccion del gradiente).
(ii) D
v
f(a) = |f(a)| v
f(a)
|f(a)|
(La derivada direc-
cional mnima se alcanza solo en la direccion opuesta).
(iii) D
v
f(a) = 0 v f(a) (La derivada direccional se anula
unicamente en la direccion perpendicular a la del gradiente).
Por lo tanto,
(1
o
) El vector gradiente los proporciona la direccion de maximo
crecimiento del la funcion.
(2
o
) La direccion opuesta a la del gradiente es la direccion de maxi-
mo decrecimiento de la funcion.
(3
o
) La direccion perpendicular a la del gradiente es la de mnima
variacion de la funcion. (De hecho, el gradiente es un vector
perpendicular a las curvas de nivel de la funcion).
Ejemplo 3.2.9. Sea T(x, y) = 100 x
2
y
2
la temperatura de
una placa con un foco de calor en el punto (0, 0) y supongamos que
una partcula se encuentra en le punto (1, 1). En que direccion debe
20 3. DIFERENCIACI

ON DE FUNCIONES DE VARIAS VARIABLES


moverse la partcula sobra la placa para hacerlo sobre la mayor tem-
peratura posible?, y la menor?, y para que su temperatura vara lo
menos posible?
Por otra parte, la diferenciabilidad de una funcion si conserva una
propiedad fundamental de la derivabilidad de funciones reales de vari-
able real, pues la continuidad de una funcion es tambien una condicion
necesaria para la diferenciabilidad de tal funcion.
Teorema 3.2.10 (2
a
cond. necesaria de diferenciabilidad).
Si una funcion f es diferenciable en a entonces f es continua en a.
De hecho, lo unico que le falta a una funcion continua en un punto
a para ser diferenciable es que se pueda aproximar en un entorno del
punto a mediante una funcion afn. Esto es lo que arma el siguiente
resultado, el cual nos proporciona la interpretacion geometrica de la
diferenciacion de funciones de varias variables.
Teorema 3.2.11. Las siguientes armaciones son equivalentes:
(i) f es diferenciable en a.
(ii) f es continua en a y existe una aplicacion afn g : R
N
R
tal que lm
xa
f(x) f(a)
x a
= 0.
Ademas, en tal caso, g es forzosamente la aplicacion dada por
g(x) := f(a) +f(a) (x a), x R
N
.
Corolario 3.2.12 (interpretaci

on geom

etrica de la dif.).
Sea A R
N
abierto, f : A R y a A con a = (a
1
, . . . , a
N
).
La graca de la aplicacion g del teorema anterior, esto es el conjunto
(x
1
, . . . , x
N
, x
N+1
) : x
N+1
= g(x
1
, . . . , x
N
), es el hiperplano de R
N+1
dado por la ecuacion
x
N+1
= f(a) +
f
x
1
(a) (x
1
a
1
) + +
f
x
N
(a) (x
N
a
N
)
que, evidentemente, pasa por el punto (a
1
, . . . , a
n
, f(a)) de R
N+1
.
Si f es diferenciable en a este hiperplano recibe el nombre de hiper-
plano tangente a la graca de f en a, ya que es el que mejor aproxima
a la graca de f en un entorno de a.
Para N = 1, se trata de la (ya conocida) recta tangente a la graca
y = f(x) en a:
y = f(a) + f

(a)(x a)
3.3. DIFERENCIAL Y MATRIZ JACOBIANA 21
Para N = 2, lo que nos queda es la ecuacion del plano tangente a
la graca z = f(x, y) en (a
1
, a
2
):
z = f(a) +
f
x
(a) (x a
1
) +
f
y
(a) (y a
2
)
Ejemplo 3.2.13. Determinar el plano tangente a la graca de
f(x, y) = x
2
+ y
2
en el punto (1, 1).
Hasta ahora hemos estado viendo condiciones necesarias para la
diferenciabilidad de una funcion que se pueden usar para probar que
una funcion no es diferenciable en un punto pero no para comprobar
que sea diferenciable.
A continuaci on vamos a presentar una sencilla condicion suciente
para la diferenciabilidad que evita tener que recurrir a la denicion de
diferenciabilidad en muchos casos.
Definici on 3.2.14. Sea A R
N
abierto y f : A R. Se dice
que f es de clase C
1
en A, y se nota f C
1
(A), si existen todas las
derivadas parciales de f en A y son continuas.
Teorema 3.2.15 (cond. suficiente de diferenciabilidad).
Si f es de clase C
1
en A entonces f es diferenciable en A.
Sin embargo el recproco del teorema anterior no es cierto en gen-
eral, es decir que no todas las funciones diferenciables son de clase C
1
,
como pone de maniesto el siguiente ejemplo.
Ejemplo 3.2.16. La funcion f denida por
f(x, y) =
_
(x
2
+ y
2
) sin
1

x
2
+y
2
(x, y) ,= (0, 0)
0 (x, y) = (0, 0)
es diferenciable en todo R
2
y sin embargo sus derivadas parciales no
son continuas en el punto (0, 0).
3.3. Diferencial y matriz jacobiana de una funcion vectorial
de varias variables. Regla de la cadena
Definici

on 3.3.1. Sea A R
N
abierto, a A y F : A R
M
,
F = (f
1
, . . . , f
M
). Se dice que F es diferenciable en a si todas sus
funciones coordenadas f
i
lo son y, en tal caso, la diferencial de F en a
es la aplicacion lineal dF(a) : (df
1
, . . . , df
M
).
22 3. DIFERENCIACI

ON DE FUNCIONES DE VARIAS VARIABLES


Definici

on 3.3.2. Sea A R
N
abierto, a A y F : A R
M
,
F = (f
1
, . . . , f
M
). Se llama matriz jacobiana de f en a a la matriz
JF(a) :=
_
_
_
F
1
x
1
(a)
F
1
x
N
(a)
.
.
.
.
.
.
F
M
x
1
(a)
F
M
x
N
(a)
_
_
_
y su determinante se denomina determinante jacobiano de f en a.
Observaci

on 3.3.3. Tambien se emplea la notacion F

(a) para la
matriz jacobiana de F en a, ya que si f es una funcion real de variable
real (esto es M = N = 1) la matriz jacobiana f

(a) queda la matriz de


orden 1, (f

(a)).
Teorema 3.3.4. La matriz Jacobiana de F en a es la matriz aso-
ciada a la diferencial de F en a respecto de las bases canonicas de R
N
y R
M
. Por tanto, dF(a)(x) = F

(a) x, esto es, la dF(a) act ua as:


dF(a)(x
1
, . . . , x
M
) =
_
_
_
F
1
x
1
(a)
F
1
x
N
(a)
.
.
.
.
.
.
F
M
x
1
(a)
F
M
x
N
(a)
_
_
_
_
_
x
1
.
.
.
x
N
_
_
Ejemplo 3.3.5. La matriz jacobiana de F(x, y) = (x
2
+ y, e
xy
) es
JF(x, y) =
_
2x 1
ye
xy
xe
xy
_
Teorema 3.3.6 (regla de la cadena). Sean A R
N
, B R
M
abiertos, f : A R
M
, g : B R
P
con f(A) B y a A.
Si f es diferenciable en a y g es diferenciable en f(a) entonces
h := g f es diferenciable en a con dh(a)dg(f(a)) df(a).
Por tanto, matricialmente, Jh(a) = Jg(f(a)) Jf(a), esto es
_
_
_
h
1
x
1

h
1
x
N
.
.
.
.
.
.
h
P
x
1

h
P
x
N
_
_
_
=
_
_
_
g
1
y
1

g
1
y
M
.
.
.
.
.
.
g
P
y
1

g
P
y
M
_
_
_
_
_
_
f
1
x
1

f
1
x
N
.
.
.
.
.
.
f
M
x
1

f
M
x
N
_
_
_
donde la primera y la ultima de esas matrices estan evaluadas en el
punto a mientras que la de en medio se eval ua en f(a).
As pues, para todo i = 1, . . . , P y para todo j = 1, . . . , N, se tiene
la siguiente relacion entre las derivadas parciales de la composicion y
las de las funciones que se componen:
h
i
x
j
(a) =
M

k=1
g
i
y
k
(f(a))
f
k
x
j
(a)
3.3. DIFERENCIAL Y MATRIZ JACOBIANA 23
Cuando la regla de la cadena se aplica en todo el dominio de las fun-
ciones involucradas se puede interpretar del siguiente modo: Estamos
realizando un cambio de variables y = f(x), esto es
_
_
_
y
1
= f
1
(x
1
, . . . , x
N
)
.
.
.
.
.
.
y
M
= f
M
(x
1
, . . . , x
N
)
en la funcion g(y
1
, . . . y
M
), de manera que al sustituir se obtiene una
nueva funcion g(f
1
(x), . . . , f
M
(x)) que ya solo depende de las variables
x = (x
1
, . . . , x
N
), y queremos calcular las derivadas parciales de esta
ultima funcion a partir de las parciales de la funcion original g y las
parciales de la funcion del cambio de variable f.
Por este motivo se suelen hacer las siguientes simplicaciones que
facilitan mucho su expresion y comprension:
(1
o
) Se omiten los puntos a y f(a) donde se aplican las parciales.
(2
o
) Las funciones coordenadas f
k
del cambio de variable f se de-
notan igual que las variables de g, esto es se entiende que f es
el cambio de variables
_
_
_
y
1
= y
1
(x
1
, . . . , x
N
)
.
.
.
.
.
.
y
M
= y
M
(x
1
, . . . , x
N
)
(3
o
) La composicion h se sigue denotando como la funcion g pero
ahora directamente como funcion de las variables (x
1
, . . . , x
N
)
despues de haber realizado el cambio de variables. Es decir
que la funcion g(y) de las variables y = (y
1
, . . . , y
M
) (antes
del cambio de variables) se puede ver tambien como funcion
g(x) de las variables x = (x
1
, . . . , x
N
) directamente (despues
de cambio de variables) entendiendo que
g(x) := g (y
1
(x
1
, . . . , x
N
), . . . , y
M
(x
1
, . . . , x
N
))
Con esta nueva notacion la regla de la cadena queda as:
g
i
x
j
= x
j
+ +
g
i
y
M
y
M
x
j
y se puede interpretar de la siguiente manera: cuando en una funcion
g(y
1
. . . , y
M
) se realiza un cambio de variables, y
k
= y
k
(x
1
, . . . , x
N
),
k = 1, . . . M, podemos calcular la derivada de la componente g
i
de
la funcion resultante con respecto de una de las variables x
j
sumando
todas las derivadas de g
i
con respecto a todas sus variables y
k
pero,
como a su vez estas variables son funciones de x
j
, hay que multiplicar
cada una de ellas por su derivada con respecto a x
j
.
24 3. DIFERENCIACI

ON DE FUNCIONES DE VARIAS VARIABLES


3.4. Funciones denidas de forma implcita. El teorema de
la funcion implcita
Hasta ahora hemos tratado con funciones dadas forma explcita,
esto es, denidas por medio de una expresion explcita f : R
N
R
M
de la funcion que me permite calcular directamente su vector ima-
gen y = (y
1
, . . . , y
M
) en cualquier punto x = (x
1
, . . . , x
N
) mediante la
formula y = f(x).
Sin embargo, a menudo encontraremos funciones denidas de forma
implcita por medio de una ecuacion F(x, y) = 0 siendo F : D
R
N+M
R
M
, en el sentido de que existe una unica funcion f : A
R
N
R
M
tal que F(x, y) = 0 y = f(x), (x, y) D.
Ejemplo 3.4.1. 2x
3
+ y + yx
2
+ 3 = 0 y =
2x
3
3
1 + x
2
Obviamente toda funcion dada de forma explcita y = f(x) se
puede dar tambien de forma implcita F(x, y) = 0, sin mas que denir
F(x, y) := y f(x), pero no siempre podremos obtener la forma ex-
plcita a partir de una ecuacion implcita F(x, y) = 0 ya que para ello
tendramos que poder despejar las variables y = (y
1
, . . . , y
M
) en fun-
cion de las variables x = (x
1
, . . . , x
N
) y eso no siempre sera posible o
sencillo
Ejemplo 3.4.2. y
3
+ y
2
5y x
2
+ 4 = 0 y = f(x) ?
Ademas, a un en el caso de que tal despeje se pudiese realizar, no
siempre se va a poder hacer de forma unica, como se pone de maniesto
con este sencillo ejemplo.
Ejemplo 3.4.3. x
2
+ y
2
= 1 y =

1 x
2
o y =

1 x
2
No obstante, si planteamos el problema de despejar ciertas variables
de la ecuacion F(x, y) = 0 desde un punto de vista local (es decir, en
un entorno de cada punto que verica esa ecuacion) la situacion mejora
notablemente. El Teorema de la Funci on Implcita (T.F.I.) proporciona
unas condiciones que garantizan que, localmente, se pueden despejar
las variables y de una ecuacion F(x, y) = 0 en funcion de las x.
Comencemos analizando los casos mas sencillos en los que se puede
plantear este problema, que es cuando x e y representan unicamente un
par de variables reales o cuando queremos despejar una variable real z
en funcion de otras dos (x, y). En ambos casos la regla de la cadena nos
proporciona una sencilla formula para calcular las derivadas parciales
de la funcion explcita f a partir de las derivadas parciales de la funcion
implcita F de la que partimos, F : D : R
N
R.
3.4. FUNCIONES DEFINIDAS DE FORMA IMPL

ICITA 25
Teorema 3.4.4 (N=2). Sea F : D : R
2
R, F C
1
(D), D
abierto, a = (a
1
, a
2
) D con F(a
1
, a
2
) = 0 y
F
y
(a
1
, a
2
) ,= 0.
Entonces F dene a y implcitamente como funcion de x en un
entorno de (a
1
, a
2
), esto es, existen A
1
, A
2
R, abiertos con a
1
A
1
y a
2
A
2
y existe una unica funcion f : A
1
A
2
tal que F(x, y) =
0 y = f(x), (x, y) A
1
A
2
.
Ademas f C
1
(A
1
) y
f
x
=
F
x
F
y
en todo A
1
.
Teorema 3.4.5 (N=3). Sea F : D : R
3
R, F C
1
(D), D
abierto, a = (a
1
, a
2
, a
3
) D con F(a
1
, a
2
, a
3
) = 0 y
F
z
(a
1
, a
2
, a
3
) ,= 0.
Entonces F dene a y implcitamente como funcion de (x, y) en
un entorno de a, esto es, existen A
1
R
2
, A
2
R abiertos con
(a
1
, a
2
) A
1
y a
3
A
2
y existe una unica funcion f : A
1
A
2
tal que F(x, y, z) = 0 z = f(x, y), (x, y, z) A
1
A
2
.
Ademas f C
1
(A
1
) y
f
x
=
F
x
F
z
y
f
y
=
F
y
F
z
en A
1
.
Por tanto la ecuacion del plano tangente a la supercie dada por la
ecuacion F(x, y, z) = 0 en el punto a es
F
x
(a)(x a
1
) +
F
y
(a)(y a
2
) +
F
z
(a)(z a
3
) = 0
esto es, F(a) es el vector normal tal supercie.
En su forma mas general, esto es cuando tenemos una funcion F con
N + M variables igualada a cero y queremos despejar de esa ecuacion
M de tales variables, el teorema quedara de la siguiente manera:
Teorema 3.4.6 (el teorema de la funci

on impl

cita). Sea
F : D : R
N+M
R
M
, F C
1
(D), D abierto, (a, b) R
N+M
(a R
N
, b R
M
) con F(a, b) = 0 y det J(F, y
1
, . . . , y
M
) ,= 0, siendo
J(F, y
1
, . . . , y
M
) :=
_
_
_
F
1
y
1
(a, b)
F
1
y
M
(a, b)
.
.
.
.
.
.
F
M
y
1
(a, b)
F
M
y
M
(a, b)
_
_
_
Entonces F dene a y = (y
1
, . . . , y
M
) implcitamente como funcion
de x = (x
1
, . . . , x
N
) en un entorno de (a, b), esto es, existen A R
N
,
B R
M
abiertos con a A y b B y existe una unica funcion
f : A B tal que F(x, y) = 0 y = f(x), (x, y) A B.
Ademas f C
1
(A) y sus derivadas parciales se pueden calcular
resolviendo el sistema lineal
J(F, y
1
, . . . , y
M
) Jf(a, b) = J(F, x
1
, . . . , y
N
)
26 3. DIFERENCIACI

ON DE FUNCIONES DE VARIAS VARIABLES


3.5. Derivadas parciales y diferencial de orden superior.
Matriz hessiana de una funcion real de varias variables
Si tenemos una funcion f : A R la funciones
f
x
i
, i = 1, . . . , N
reciben el nombre generico de derivadas parciales de orden 1 de f (y
se notan tambien por f
x
i
).
Al igual que para funciones reales de variable real, el proceso de
derivaci on parcial tambien se puede reiterar solo que ahora cada una
de las derivadas parciales de f la podremos derivar de nuevo (donde se
pueda) con respecto a cada una de las N variables que tiene. De este
modo se obtienen las N
2
derivadas parciales de orden 2 de f:
Definici on 3.5.1. Sea f : A R, A abierto, a A. Se llama
derivada parcial segunda (o de orden 2) de f en a respecto de x
i
y x
j
al valor

2
f
x
i
x
j
(a) :

_
f
x
i
_
x
j
(a) ( o bien, f
x
i
x
j
= (f
x
i
)
x
j
)
En particular, una funcion f de dos variables tiene 4 funciones
derivadas parciales segundas,

2
f
x
2
,

2
f
xy
,

2
f
yx
,

2
f
y
2
A las parciales de en medio se les llama derivadas parciales cruzadas
de f.
Ejemplo 3.5.2. Si f(x, y) = 3xy
2
2y + 5x
2
y
2
se tiene que
f
x
(x, y) = 3y
2
+ 10xy
2
f
y
(x, y) = 6xy 2 + 10x
2
y
f
xx
(x, y) = 20y
2
f
xy
(x, y) = 6y + 20xy
f
yx
(x, y) = 6y + 20xy f
yy
(x, y) = 6 + 20x
2
Se observa en el ejemplo anterior que las parciales cruzadas de f
coinciden. Aunque esto se verica frecuentemente no ocurre en general
como pone de manifesto el siguiente ejemplo
Ejemplo 3.5.3. La funcion f dada por
f(x, y) =
_
xy
x
2
y
2
x
2
+y
2
(x, y) ,= (0, 0)
0 (x, y) = (0, 0)
verica que f
xy
(0, 0) = 1 y f
yx
(0, 0) = 1.
El siguiente teorema proporciona una condicion suciente para que
las derivadas parciales cruzadas coincidan.
3.5. DERIVADAS PARCIALES Y DIFERENCIAL DE ORDEN SUPERIOR 27
Teorema 3.5.4 (de schwartz). Si f
x
, f
y
, f
xy
, f
yx
son continuas
en un abierto R de R
2
entonces f
xy
= f
yx
en todo R.
Las deniciones anteriores se pueden extender por recurrencia a un
orden cualquiera n + 1. As pues, supuestas ya denidas las derivadas
parciales de orden n de f, se dene la derivada parcial de orden n + 1
de f en a respecto de las variables x
i
1
, . . . , x
i
n+1
(con i
1
,. . . , i
n+1

1, . . . , N) del siguiente modo:

(n+1)
f
x
i
1
x
i
n+1
(a) :=

_

n
f
x
i
1
x
i
n
_
x
i
n+1
(a)
Definici

on 3.5.5. Se dice que f es de clase C


n
en A, y se nota
f C
n
(A), si todas las derivadas parciales de orden n existen y son
continuas en A
Corolario 3.5.6. Si f es de clase C
n
en A las derivadas parciales
de cualquier orden r n no dependen del orden en que derivemos
Del mismo modo que hemos introducido las derivadas parciales de
orden n se puede hacer algo similar con el concepto de diferencial, pues
podemos denir el diferencial de orden n de una funcion real de varias
variables. Empecemos con el caso n = 2, que es el mas importante.
Observemos que el diferencial de una funcion f : A R
N
R
se puede ver como una aplicacion df que depende tanto del punto x
donde la calculamos como del vector h donde se eval ua:
df(x)(h) =
N

j=1
f
x
j
(x)h
j
,
_
x = (x
1
, . . . , x
N
) R
N
h = (h
1
, . . . , h
N
) R
N
Si variamos solo el vector h, h df(x)(h) es una aplicacion lineal
de R
N
en R, pero si variamos solo el punto x tenemos una aplicacion
x df(x)(h) (continua, si f es de clase C
1
en A) de R
N
en R a la que
podemos calcular de nuevo su diferencial, y que denotaremos por df(h)
(la diferencial de f pero como funcion de x)
Definici on 3.5.7. Se dene el diferencial de orden 2 como la apli-
cacion d
2
f que a cada punto a (tal que df(h) exista en un entorno
suyo para todo h) le hace corresponder la aplicacion d
2
f(a) dada por
d
2
f(a)(h) = d(df(h))(a) (abreviadamente d
2
f = d(df)).
Definici on 3.5.8. Se llama matriz hessiana de f en a a la matriz
Hf(a) =
_
_
_
_

2
f
x
2
1
(a)

2
f
x
1
x
N
(a)
.
.
.
.
.
.

2
f
x
N
x
1
(a)

2
f
x
2
N
(a)
_
_
_
_
28 3. DIFERENCIACI

ON DE FUNCIONES DE VARIAS VARIABLES


Teorema 3.5.9. El diferencial de orden dos d
2
f en un punto a es
una forma cuadratica cuya matriz asociada respecto de la base canonica
de R
N
es la matriz hessiana Hf en el punto a, o sea que, para cada
h = (h
1
, . . . , h
N
) R
N
, d
2
f act ua as:
d
2
f(a)(h) = (h
1
, . . . , h
N
) Hf(a)
_
_
h
1
.
.
.
h
N
_
_
En particular, para N = 2 tenemos que
d
2
f(a)(h
1
, h
2
) =

2
f
x
2
(a)h
2
1
+ 2

2
f
xy
(a)h
1
h
2
+

2
f
y
2
(a)h
2
2
o, usando la notacion (h
1
, h
2
) = (dx, dy) y omitiendo el punto a,
d
2
f =

2
f
x
2
dx
2
+ 2

2
f
xy
dxdy +

2
f
y
2
dy
2
Reiterando este proceso se pueden denir de forma analoga el difer-
encial de orden 3 de f, d
3
f, el de orden 4, d
4
f, y, en general, el difer-
encial de orden n, d
n
f. Por ejemplo, d
3
f actuara as:
d
3
f(a)(h
1
, h
2
, h
3
) =
N

i=1
N

j=1
N

k=1

3
f
x
i
x
j
x
k
(a)h
1
h
2
h
3
3.6. El teorema de Taylor en varias variables
Hasta ahora sabemos que las funciones diferenciables se pueden
aproximar por medio funciones anes (cuyas ecuaciones no son otra
cosa que polinomios de grado 1). El teorema de Taylor trata de mejorar
esta aproximacion utilizando para ello polinomios en varias variables de
grado superior, para lo cual necesitaremos que la funcion posea diferen-
ciales de orden superior. Ademas el teorema de Taylor nos dara tambien
una expresion para el error que se comete al aproximar un valor de una
funcion por el valor correspondiente de los polinomios de Taylor.
Recordemos que para una funcion f : I R R, f C
n
(I)
siendo I un intervalo de R y para todo x, a I el teorema de Taylor
para funciones reales de variable real nos garantiza la existencia de un
c en el intervalo de extremos a y x tal que f(x) = P
n
(x)+R
n
(x), siendo
P
n
(x) := f(a) +f

(a)(xa) +
1
2!
f

(a)(xa)
2
+ +
1
n!
f
(n)
(a)(xa)
n
R
n
(x) :=
1
(n + 1)!
f
(n+1)
(c)(x a)
n+1
3.6. EL TEOREMA DE TAYLOR EN VARIAS VARIABLES 29
En el caso general, para una funcion de N variables, esas funciones
se denen de la siguiente manera:
Definici on 3.6.1. Sea f : A R
N
R. Se llama polinomio de
Taylor de orden n de f en a al polinomio T
n
(f, a) = P
n
dado por
P
n
(x) := f(a) +df(a)(x a) +
1
2!
df
2
(a)(x a) + +
1
n!
df
n
(a)(x a)
y se llama resto de Taylor de orden n de f en a a la funcion
R(x) := f(x) P
n
(x)
Ademas, para funciones de varias variables, el papel que despe na el
intervalo de extremos a y x va a ser llevado a cabo por el segmento de
extremos a y x. Dados un par de puntos a y b de R
N
, el segmento de
extremos a y b se puede denir, de un modo riguroso, como el conjunto
[a, b] := ta + (1 t)b : 0 t 1
donde los puntos a y b se obtienen para los valores t = 1 y t = 0
respectivamente, por lo que tambien es coherente denotar por
]a, b[:= ta + (1 t)b : 0 < t < 1
al segmento [a, b] sin sus correspondientes extremos a y b.
Ya estamos en condiciones de enunciar el Teorema de Taylor en
varias variables, el cual me dice que puedo usar T
n
(f, a) para aproximar
el valor exacto de f(x) para puntos proximos al punto a y me da una
expresion del resto de Taylor que me permite acotar el error cometido
al realizar tal aproximacion.
Teorema 3.6.2 (de taylor en varias variables). Si tenemos
una funcion f : A R
N
R, f C
n+1
(A), A abierto, entonces
para todo x, a A con [a, x] A existe un c ]a, x[ tal que
f(x) = T
n
(f, a)(x) +
1
(n + 1)!
df
n+1
(c)(x a)
Merece la pena observar que, en particular, el teorema de Taylor
con resto de orden 1 (esto es, para n = 0 con la notacion anterior) no
es mas que la siguiente generalizacion del Teorema del Valor Medio a
varias variables (pues para N = 1 se vuelve a obtener dicho teorema):
Teorema 3.6.3 (del valor medio en varias variables). Si
f : A R
N
R, f C
n
(A), A abierto, entonces para todo a, b A
con [a, b] A existe un c ]a, b[ tal que f(b) f(a) = df(c)(b a)
Ademas, la formula del resto que nos proporciona el Teorema de
Taylor, nos permite deducir el siguiente resultado de manera inmedia-
ta, el cual nos dice que a medida que aumente el orden n del polinomio
30 3. DIFERENCIACI

ON DE FUNCIONES DE VARIAS VARIABLES


de Taylor usado para aproximar f, aumenta tambien el grado de aprox-
imacion entre ambas funciones en un entorno del punto considerado
Corolario 3.6.4 (f

ormula infinitesimal del resto). Si f :


A R
N
R, f C
n+1
(A), A abierto, entonces se verica que
lm
xa
f(x) P
n
(x)
|x a|
n
= 0
n N, siendo P
n
el polinomio de Taylor de orden n de f en a.
Notese que para n = 1 volvemos a obtener que el polinomio (de
grado 1) P
1
(x) = f(a) + df(a)(x a) es la funcion afn que mejor
aproxima a f en un entorno del punto a, pues lm
xa
f(x) P
1
(x)
|x a|
= 0.
Y para n = 2, el polinomio de Taylor P
2
= T
2
(f, a) es
P
2
(x) = f(a) + df(a)(x a) +
1
2
d
2
f(a)(x a)
que para una funcion de N = 2 variables y un punto a = (a
1
, a
2
) queda
P
2
(x, y) = f(a) +
f
x
(a)(x a
1
) +
f
y
(a)(y a
2
) +
+
1
2
_

2
f
x
2
(a)(x a
1
)
2
+ 2

2
f
xy
(a)(x a
1
)(y a
2
) +

2
f
y
2
(a)(y a
2
)
_
Ejemplo 3.6.5. Calcular el polinomio de Taylor de orden 2 de la
funcion f(x, y) = exp xy en el punto (0, 0).
3.7. Extremos relativos de una funcion real de varias
variables
Definici

on 3.7.1. Sea f : A R
N
R, A abierto, a A.
f alcanza un maximo relativo (o local) en a si > 0 tal que
B

(a) A y f(x) f(a), x A.


f alcanza un mnimo relativo (o local) en a si > 0 tal que
B

(a) A y f(a) f(x), x A.


f alcanza un extremo relativo en a si alcanza un maximo o un
mnimo relativo en a
f presenta un punto de silla en a si > 0 existen x
1
, x
2

B

(a) A tal que f(x


1
) f(a) f(x
2
).
a es un punto crtico de f si df(a) = 0, esto es, si f(a) = 0.
Geometricamente es evidente que si una funcion f de dos variables
alcanza un extremo relativo en un punto a, el plano tangente de f en
dicho punto tiene que ser paralelo al plano z = 0. El siguiente resultado
expresa esta idea de un modo riguroso.
3.7. EXTREMOS RELATIVOS 31
Proposici

on 3.7.2 (cond. necesaria de extremo relativo).


Sea A R
N
abierto, a A y f : A R diferenciable en a. Si f
alcanza un extremo relativo en a entonces a es un punto crtico de f.
Por lo tanto, los posibles extremos relativos de f se encuentran entre
los puntos crticos de f, pero no en todo punto crtico la funcion alcanza
un extremo relativo, como ponen de maniesto ejemplos sencillos como
este
Ejemplo 3.7.3. La funcion f(x, y) := x
2
y
2
es diferenciable en el
punto (0, 0) con f(0, 0) = 0 y sin embargo no tiene extremo relativo
en (0, 0).
Como acabamos de ver, entre los puntos crticos de una funcion f
puede haber tambien puntos de silla. En el caso real, era la derivada
segunda de la funcion la que permita decidir si en tales puntos se
alcanzaba o no un extremo relativo. En el caso de funciones reales de
varias variable este papel le va a corresponder a la matriz hessiana (la
matriz con todas las derivadas parciales de orden 2 de f), realmente a
su forma cuadratica asociada d
2
f:
Teorema 3.7.4 (conds. suficientes de extremo relativo).
Sea A R
N
abierto, f : A R, f C
2
(A), a un punto crtico de f.
(i) Si d
2
f(a) es denida positiva entonces f alcanza un mnimo
relativo en el punto a
(ii) Si d
2
f(a) es denida negativa entonces f alcanza un maximo
relativo en el punto a
(iii) Si d
2
f(a) es indenida entonces a es un punto de silla de f.
Corolario 3.7.5 (N=2). Sea f C
2
, a un punto crtico de f,
Hf(a) =
_


_
,
1
:= ,
2
:=
2

1
> 0,
2
> 0 f alcanza un mnimo relativo en a

1
< 0,
2
> 0 f alcanza un maximo relativo en a

2
< 0 f tiene un punto de silla en a
Si
2
= 0 este criterio no da informacion
Corolario 3.7.6 (N=3). Sean f C
2
, a un punto crtico de f, y
sean
1
,
2
,
3
los menores principales de Hf(a).

1
> 0,
2
> 0,
3
> 0 mnimo relativo de f en a

1
< 0,
2
> 0,
3
< 0 maximo relativo de f en a

3
,= 0 y no (i) ni (ii) punto de silla de f en a
Si
3
= 0 este criterio no da informacion
32 3. DIFERENCIACI

ON DE FUNCIONES DE VARIAS VARIABLES


3.8. Extremos condicionados de una funcion real de varias
variables. El teorema de los multiplicadores de
Lagrange
Muchos problemas de optimizacion tiene condiciones (restricciones
o ligaduras) que limitan los valores que pueden usarse para lograr la
solucion optima. Esto tiende a complicar los problemas de optimizacion
ya que dicha solucion optima puede encontrarse facilmente en un punto
de la frontera del dominio.
Ejemplo 3.8.1. Hallar el rectangulo de area maxima que puede
inscribirse en la elipse
x
2
3
2
+
y
2
4
2
= 1. Se trata, por tanto, de maximizar
la funcion A(x, y) := 4xy restringida a los puntos de esa elipse.
En general queremos hallar los puntos x A R
N
tal que una
cierta funcion f : A R (llamada funcion objetivo) sea maxima o
mnima, de entre todos los que verican una cierta ecuacion (o ligadura)
g(x) = 0. A tales puntos les llamaremos extremos de f condicionados
a g (o sujetos a la ligadura g(x) = 0).
Vamos a empezar considerando el caso mas sencillo, cuando f y g
son funciones reales de dos variables. En este caso, el conjunto de puntos
donde buscamos los extremos de f es una curva del plano, dada por la
ecuacion (implcita) g(x, y) = 0. Por tanto, si consideramos las curvas
de nivel f(x, y) = k de la funcion objetivo f, es claro (gracamente) que
las curvas de esa familia que corten a la curva g(x, y) = 0 corresponden
a aquellos valores k de la funcion f para los cuales hay puntos que
cumplen la ligadura.
La idea ingeniosa que permite hallar los extremos de f condiciona-
dos a g consiste en darse cuenta que (si f es continua) el mayor o
menor valor de k que cumple lo anterior correspondera, precisamente,
a la curva (o curvas) de nivel k que sea tangente a la curva g(x, y) = 0.
Como dos curvas son tangentes si y solo si sus vectores normales
son paralelos y los vectores normales a las curvas de nivel f(x, y) = k
y g(x, y) = 0 son sus gradientes f y g, los extremos de f condi-
cionados a g se encontraran entre aquellos puntos donde exista un
(llamado multiplicador de Lagrange) tal que f = g.
En el siguiente teorema precisamos las condiciones bajo las cuales
se puede garantizar la existencia de tales multiplicadores.
Teorema 3.8.2 (de los multiplicadores de lagrange, N=2).
Sea A R
2
abierto, f, g : A R de clase C
1
(A), y a A.
Si f alcanza en a un extremo condicionado a la curva g(x, y) = 0
y g(a) ,= 0, entonces R tal que f(a) = g(a).
3.8. EXTREMOS CONDICIONADOS 33
En la practica, como (f g) = f g, los puntos para los
que existe multiplicador de Lagrange se suelen hallar de la siguiente
manera:
Corolario 3.8.3 (m etodo de los multiplicadores, N=2).
Sea A R
N
abierto, f, g : A R de clase C
1
(A), y a A.
Si f alcanza un extremo condicionado a g(x, y) = 0 en un punto
a entonces a es un punto crtico de la funcion F (llamada funcion
auxiliar de Lagrange) dada por F(x, y, ) := f(x, y) g(x, y).
En general, si tenemos una funcion f de N variables con M restric-
ciones para ellas g
1
(x
1
, . . . , x
N
) = 0, . . . , g
M
(x
1
, . . . , x
N
) = 0 tambien
se puede emplear el metodo anterior, pero ahora usaremos tantos mul-
tiplicadores como restricciones tengamos.
Teorema 3.8.4 (m

etodo de los multiplicadores). Sea A


R
N
abierto, f : A R, g : A R
M
de clase C
1
(A), y a A.
Si f tiene un extremo condicionado a g(x
1
, . . . , x
N
) = 0 en un punto
a entonces a es un punto crtico de la funcion (auxiliar de Lagrange)
F : R
N+M
R dada por
F(x,
1
, . . . ,
M
) := f(x)
1
g
1
(x)
M
g
M
(x).
Observaci

on 3.8.5. El sistema de ecuaciones que surge en el meto-


do de los multiplicadores de Lagrange no es, en general, un sistema
lineal y resolverlo requiere frecuentemente algo de ingenio.
Observaci

on 3.8.6. Para averiguar si los puntos crticos de la fun-


cion auxiliar de la Lagrange F son extremos de f se puede usar el crite-
rio de la matriz hessiana sobre dicha funcion auxiliar F pero solo como
condicion suciente, esto es del siguiente modo:
(i) Si HF(a) es denida positiva entonces f alcanza un mnimo
relativo condicionado a g
(ii) Si HF(a) es denida negativa entonces f alcanza un maximo
relativo condicionado a g
De hecho, se puede probar que realmente basta con estudiar el caracter
de la forma cuadratica dF(a) restringida al Kerg(a). Pero a menudo
no necesitaremos recurrir a esto ya que podremos garantizar su existen-
cia a priori y por tanto simplemente tendremos que evaluar la funcion
en los puntos crticos de la funcion auxiliar de Lagrange para ver en
cual de ellos la funcion toma su mayor y su menor valor.
34 3. DIFERENCIACI

ON DE FUNCIONES DE VARIAS VARIABLES


3.9. Extremos absolutos de una funcion real de varias
variables
A menudo, los metodos dados anteriormente para el calculo de ex-
tremos relativos y para el calculo de extremos condicionados se pueden
combinar para encontrar los extremos absolutos de una funcion en cier-
tos conjuntos.
En concreto, supongamos que f : A R
N
R es una funcion
continua y K A es un conjunto compacto con frontera Fr(K) =
x R
N
: g(x) = 0, siendo g una funcion de R
N
en R
M
de clase C
1
.
El Teorema de Weierstrass garantiza entonces que f alcanza sus
extremos absolutos en algunos puntos de K. Podemos localizar esos
puntos x
0
pues en ellos tiene que ocurrir una de estas tres cosas:
(1
o
) f no es diferenciable en x
0
(2
o
) f es diferenciable en x
0
y x
0
K

(3
o
) f es diferenciable en x
0
y x
0
Fr(K)
En el segundo caso f alcanza un extremo relativo en x
0
y en el
tercer caso f alcanza un extremo condicionado a g en x
0
. Por tanto,
para determinar los extremos absolutos de f sobre K tenemos que
(1
o
) Localizar los puntos en los que f no es diferenciable
(2
o
) Calcular los puntos crticos de f que pertenecen a K

(3
o
) Hallar los puntos crticos de f condicionados a g
y entre todos esos puntos se encuentran forzosamente aquellos en los
que f alcanza sus extremos, con lo cual solamente tenemos que estudiar
en cual de ellos toma f toma el mayor y el menor valor.

You might also like