Espaço Euclidiano n-dimensional

Capı́tulo 1
Topologia do espaço Euclidiano
1 O espaço vetorial Rn
Seja n ∈ N. O espaço euclidiano n− dimensional é o produto cartesiano de n fatores

iguais a R:
Rn = R
| ×R×
{z· · · × R}
n cópias
Os pontos de Rn são as n−listas x = (x1 , . . . , xn ), cujas coordenadas x1 , . . . , xn são

números reais.
Dados x = (x1 , . . . , xn ) , y = (y1 , . . . , yn ) ∈ Rn e um número real λ, definimos a soma x + y

e o produto λx pondo:
x + y = (x1 + y1 , . . . , xn + yn ) λx = (λx1 , . . . , λxn ) .
Com estas operações, Rn é um espaço vetorial de dimensão n sobre R, no qual

0 = (0, . . . , 0) é o elemento neutro para a adição e −x = (−x1 , . . . , −xn ) é o simétrico de
x = (x1 , . . . , xn ).
No espaço vetorial Rn , destaca-se a base canônica {e1 , . . . , en } formada pelos vetores

e1 = (1, 0, . . . , 0) , e2 = (0, 1, . . . , 0) , . . . , en = (0, 0, . . . , 1),
que tem uma coordenada igual a 1 e as outras nulas. Para todo x = (x1 , . . . , xn ) temos:
x = x 1 e1 + x 2 e2 + . . . + x n en .
• Sejam L(Rm , Rn ) o conjunto das transformações lineares T : Rm −→ Rn e M(n × m) o

conjunto das matrizes reais A = (aij ) com n linhas e m colunas.
• Existe uma bijeção natural entre L(Rm , Rn ) e M(n × m).
-1
Análise
De fato, dada T ∈ L(Rm , Rn ), seja AT = (aij ) a matriz cuja j−ésima coluna é o vetor coluna
(Tej )t , onde {e1 , . . . , em } é a base canônica de Rm , ou seja, a matriz AT = (aij ) é definida pelas
igualdades
X
n
Tej = aij ei , j = 1, . . . , m ,
i=1
onde {e1 , . . . , en } é a base canônica de Rn .
Reciprocamente, dada A ∈ M(n × m), seja TA ∈ L(Rm , R!n ) definida por

X
m X
m
TA (x) = a1j xj , . . . , anj xj .
j=1 j=1
Como TA (ej ) = (a1j , . . . , anj ), temos que a aplicação

Φ : L(Rm , Rn ) −→ M(n × m)
T 7−→ AT
é sobrejetora.
Além disso, Φ é injetora, pois se Φ(T ) = Φ(L), então T (ej ) = L(ej ), j = 1, . . . , m, e,

portanto,
T (x) = x1 T (e1 ) + . . . + xm T (em ) = x1 L(e1 ) + . . . + xm L(em ) = L(x) , ∀ x = (x1 , . . . , xm ) ∈ Rm .
Escrevendo as colunas de uma matriz A ∈ M(n × m) uma após a outra numa linha,
podemos identificar A com um ponto do espaço euclidiano Rnm .
Assim, M(n × m) torna-se um espaço vetorial real de dimens

 ão nm, no qual as matrizes
1 se (i, j) = (k, `)
k` k` k`
A = aij , 1 ≤ k ≤ n , 1 ≤ ` ≤ m, onde aij =
0 se (i, j) 6= (k, `) ,
formam uma base natural.
Além disso, como Φ é uma bijeção, podemos induzir em L(Rm , Rn ) uma estrutura de
espaço vetorial, para a qual T `k , 1 ≤ k ≤ n e 1 ≤ ` ≤ m, onde T `k (e` ) = ek e T `k (ej ) = 0 se
j 6= `, é uma base natural.
Podemos, assim, sempre que for conveniente, substituir L(Rm , Rn ) ora por M(n × m), ora
por Rn m .
• No caso particular em que n = 1, L(Rm , R) é o espaço vetorial real de dimensão n formado

pelos funcionais lineares de Rm em R, para oqual {π1 , . . . , πm } é uma base, onde
1 se i = j
πi (ej ) =
0 se i 6= j ,
ou seja,
0 Instituto de Matemática UFF

Produto interno e norma
X
n
πi (x1 , . . . , xi , . . . , xm ) = xj πi (ej ) = xi ,
j=1
m
é a projeção de R sobre seu i−ésimo fator.
O espaço L(Rm , R) = (Rm )? é chamado o espaço dual do espaço euclidiano Rm , e a base

{π1 , . . . , πm } é chamada base dual da base canônica de Rm .
Observe que se f ∈ L(Rm , R) e f(ei ) = ai , i = 1, . . . , m, então

f(x1 , . . . , xm ) = a1 x1 + . . . + am xm ,
e (a1 · · · am ) é a matriz 1 × m associada ao funcional f.
Definição 1.1. Sejam E, F e G espaços vetoriais reais. Uma aplicação ϕ : E × F −→ G

chama-se bilinear quando é linear em relação a cada uma de suas variáveis, ou seja:
ϕ(λx + x 0 , y) = λϕ(x, y) + ϕ(x 0 , y)
ϕ(x, λy + y 0 ) = λϕ(x, y) + ϕ(x, y 0 ) ,
quaisquer que sejam x, x 0 ∈ E, y, y 0 ∈ F e λ ∈ R.
Observação 1.1. ϕ(x, 0) = ϕ(0, y) = 0 quaisquer que sejam x ∈ E e y ∈ F.
Observação 1.2. Se E = Rm , F = Rn , temos que !

X
m X
n X
ϕ(x, y) = ϕ xi e i , yj ej = xi yj ϕ(ei , ej ) ,
i=1 j=1 ij
de modo que ϕ fica inteiramente determinada pelos mn valores ϕ(ei , ej ) que assume nos pares
ordenados de vetores básicos (ei , ej ), 1 ≤ i ≤ m e 1 ≤ j ≤ n.
Definição 1.2. Uma aplicação bilinear ϕ : E × E −→ G é simétrica quando

ϕ(x, y) = ϕ(y, x) ,
quaisquer que sejam x, y ∈ E.
2 Produto interno e norma
Definição 2.1. Seja E um espaço vetorial real. Um produto interno em E é uma aplicação
h , i : E × E −→ R que satisfaz as seguintes propriedades:
(1) hx, yi = hy, xi ;
(2) hx + x 0 , yi = hx, yi + hx 0 , yi ;
J. Delgado - K. Frensel 1
Análise
(3) hλx, yi = λhx, yi ;
(4) x 6= 0 =⇒ hx, xi > 0 ,
para quaisquer x, x 0 , y ∈ E e λ ∈ R.
Ou seja, um produto interno sobre E é uma função real bilinear, simétrica e positiva defi-
nida.
Observação 2.1. hx, xi = 0 ⇐⇒ x = 0 .
Exemplo 2.1. O produto interno canônico do espaço euclidiano Rn é dado por

hx, yi = x1 y1 + . . . xn yn ,
onde x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ).
Observação 2.2. Se ϕ : Rn × Rn −→ R é um produto interno em Rn , então a matriz

A = (aij )1≤i,j≤n , onde ϕ(ei , ej ) = aij , é simétrica e positiva definida, ou seja, aij = aji e
xAxt > 0 para todo x ∈ Rn − {0}, já que
X
n
ϕ(x, y) = aij xi yj = xAyt .
i,j=1
Reciprocamente, se A ∈ M(n × n) é uma matriz simétrica e positiva definida, então

Xn
ϕ(x, y) = aij xi yj
i,j=1
n
define um produto interno em R .
O produto interno canônico corresponde a tomar a matriz identidade I = (δij ), onde

1 se i = j
δij =
0 se i 6= j
é a delta de Kronecker.
Definição 2.2. Dizemos que dois vetores x, y são ortogonais em relação ao produto interno
h , i se hx, yi = 0.
Observação 2.3.
• O vetor nulo 0 é ortogonal a todos os vetores do espaço.
• Se h , i é o produto interno canônico de Rn e {e1 , . . . , en } é a base canônica, então

hei , ej i = δij , i, j = 1, . . . , n.

Proposição 2.1. (Desigualdade de Cauchy-Schwarz)

Seja E um espaço vetorial com produto interno h , i. Então
| hx, yi | ≤ kxk kyk , ∀ x, y ∈ E ,
p p
e a igualdade é válida se, e somente se, x e y são LD, onde kxk = hx, xi e kyk = hy, yi.
Prova.
Suponhamos que y 6= 0 e seja λ ∈ R. Como
hx + λy, x + λyi = kxk2 + 2λhx, yi + λ2 kyk2 ≥ 0 , ∀λ ∈ R,
temos que o discriminante

∆ = 4hx, yi2 − 4kxk2 kyk2 ≤ 0 ,
ou seja, | hx, yi| ≤ kxk kyk.
Além disso, | hx, yi| = kxk kyk se, e só se, ∆ = 0, ou seja, se, e só se, existe λ0 ∈ R tal que
x + λ0 y = 0.
Logo | hx, yi| = kxk kyk se, e só se, x e y são LD.
Definição 2.3. Uma norma num espaço vetorial real E é uma função real k k : E −→ R que
satisfaz as seguintes condições:
(1) kλxk = |λ| kxk ;
(2) kx + yk ≤ kxk + kyk ;
(3) x 6= 0 =⇒ kxk > 0 ,
para quaisquer x, y ∈ E e λ ∈ R.
Observação 2.4. k0k = 0 .
Observação 2.5. kxk = 0 ⇐⇒ x = 0 .
Observação 2.6. k − xk = kxk .
Observação 2.7. | kxk − kyk | ≤ kx − yk .
De fato, como
kxk = k(x − y) + yk ≤ kx − yk + kyk ,
e
kyk = k(x − y) − xk ≤ kx − yk + kxk ,
Análise
temos que
−kx − yk ≤ kxk − kyk ≤ kx − yk ,
ou seja, | kxk − kyk | ≤ kx − yk .
Proposição 2.2. Se h , i : E × E −→ R é um produto interno em E, então k k : E −→ R,

p
kxk = hx, xi é uma norma em E.
Prova.
Sejam x, y ∈ E e λ ∈ R. Então:
(1) kλxk = hλx, λxi = λ2 hx, xi = |λ| hx, xi = |λ| kxk .

p p p
(2) kx + yk2 = hx + y, x + yi = kxk2 + 2hx, yi + kyk2 ≤ kxk2 + 2kxk kyk + kyk2 , pela desi-
gualdade de Cauchy-Schwarz.
Logo kx + yk2 ≤ ( kxk + kyk )2 , ou seja, kx + yk ≤ kxk + kyk.

p
(3) x 6= 0 =⇒ hx, xi > 0 =⇒ kxk = hx, xi > 0 .
Observação 2.8. kxk + kyk = kx + yk ⇐⇒ ∃ λ > 0 tal que x = λy ou y = λx .

De fato, se y 6= 0, temos que kx + yk = kxk + kyk ⇐⇒ hx, yi = kxk kyk ⇐⇒ ∃λ > 0 ; x = λy.
Exemplo 2.2. Se h , i é o produto interno canônico de Rn ,

p p
kxk = hx, xi = x21 + . . . + x2n ,
é chamada de norma euclidiana do vetor x ∈ Rn .
Observação 2.9. Há uma infinidade de normas que podem ser definidas no espaço euclidi-
ano Rn . Dentre elas, temos:
• a norma do máximo: kxkM = max{|x1 |, . . . , |xn |} ,
• a norma da soma: kxkS = |x1 | + . . . + |xn | .
É fácil verificar que k kM e k kS realmente definem normas em Rn (exercı́cio).
Além disso, para todo x ∈ Rn ,
kxkM ≤ kxk ≤ kxkS ≤ nkxkM , (1)
onde k k é a norma euclidiana.
De fato, como kxk = x21 + . . . + x2n ≥ |xi | para todo i = 1, . . . , n, temos que kxk ≥ kxkM .
p

E se kxkM = |xi |, então

kxkS = |x1 | + . . . + |xn | ≤ n|xi | = nkxkM .
Finalmente,
X
n
kxk2S = ( |x1 | + . . . + |xn | ) = |x1 | + . . . + |xn | + 2
2 2 2
|xi | |xj | ≥ |x1 |2 + . . . + |xn |2 = kxk2 ,
i, j = 1
i<j
ou seja, kxkS ≥ kxk.
Estas desigualdades servirão para mostrar que as três normas acima são equivalentes.
Definição 2.4. Uma métrica num conjunto M é uma função real d : M × M −→ R que satisfaz
as seguintes condições:
(1) d(x, y) = d(y, x) ;
(2) d(x, z) ≤ d(x, y) + d(y, z) (desigualdade triangular) ;
(3) x 6= y =⇒ d(x, y) > 0 ,
para quaisquer x, y, z ∈ M. O par (M, d) é dito um espaço métrico.
Observação 2.10. Se (E, k k) é um espaço vetorial normado, então d : E × E −→ R definida

por
d(x, y) = kx − yk , x, y ∈ E
é uma métrica em E.
De fato, se x, y, z ∈ E, então:
(1) d(x, y) = kx − yk = ky − xk = d(x, y) ;
(2) d(x, z) = kx − zk = k(x − y) + (y − z)k ≤ kx − yk + ky − zk = d(x, y) + d(y, z) ;
(3) x 6= y =⇒ x − y 6= 0 =⇒ kx − yk > 0 =⇒ d(x, y) > 0.
Exemplo 2.3. Em Rn ,
p
• d(x, y) = (x1 − y1 )2 + . . . + (xn − yn )2 é a métrica que provém da norma euclidiana.
• dM (x, y) = max1≤i≤n { |xi − yi | } é a métrica que provém da norma do máximo.
• dS (x, y) = |x1 − y1 | + . . . + |xn − yn | é a métrica que provém da norma da soma.
Observação 2.11. Uma norma num espaço vetorial E pode não provir de um produto interno,
Análise
ou seja, nem sempre existe um produto interno h , i em E tal que

p
kxk = hx, xi .
Com efeito, se a norma k k provém de um produto interno h , i, então vale a identidade do

paralelogramo:

kx + yk2 + kx − yk2 = 2 kxk2 + kyk2 ,
que diz que a soma dos quadrados das diagonais de um paralelogramo é igual à soma dos
quadrados de seus quatro lados.
De fato,
kx + yk2 = hx + y, x + yi = kxk2 + kyk2 + 2hx, yi
kx − yk2 = hx − y, x − yi = kxk2 + kyk2 − 2hx, yi

=⇒ kx + yk2 + kx − yk2 = 2 kxk2 + kyk2 .
Com isso, podemos provar que as normas k kM e k kS em Rn , n ≥ 2, não provêm de um
produto interno, pois:

• ke1 + e2 k2M + ke1 − e2 k2M = 1 + 1 = 2 6= 4 = 2 ke1 k2M + ke2 k2M ,
e

• ke1 + e2 k2S + ke1 − e2 k2S = 4 + 4 = 8 6= 4 = 2 ke1 k2S + ke2 k2S .
3 Bolas e conjuntos limitados
Num espaço métrico (M, d), definimos os seguintes conjuntos:
• Bola aberta de centro a ∈ M e raio r > 0: B(a, r) = {x ∈ M | d(x, a) < r}.
• Bola fechada de centro a ∈ M e raio r > 0: B[a, r] = {x ∈ M | d(x, a) ≤ r}.
• Esfera de centro a ∈ M e raio r > 0: S[a, r] = {x ∈ M | d(x, a) = r}.
Segue-se que B[a, r] = B(a, r) ∪ S[a, r] .
Se a métrica d provém de uma norma k k do espaço vetorial E, temos:

B(a, r) = {x ∈ E | kx − ak < r} ;
B[a, r] = {x ∈ E | kx − ak ≤ r} ;
S[a, r] = {x ∈ E | kx − ak = r} .
Exemplo 3.1. No espaço euclidiano R de dimensão 1, as três normas, definidas anterior-

mente, coincidem, e: B(a, r) = (a − r, a + r) , B[a, r] = [a − r, a + r] e S[a, r] = {a − r, a + r} .

Bolas e conjuntos limitados
Observação 3.1. A forma geométrica das bolas e esferas dependem, em geral, da norma
que se usa.
Por exemplo, se consideramos o plano R2 com a métrica euclidiana, teremos:
• B((a, b), r) = {(x, y) ∈ R2 | (x − a)2 + (y − b)2 < r} (disco aberto de centro (a, b) e raio r > 0).
• B[(a, b), r] = {(x, y) ∈ R2 | (x − a)2 +(y − b)2 ≤ r} (disco fechado de centro (a, b) e raio r > 0).
• S[(a, b), r] = {(x, y) ∈ R2 | (x − a)2 + (y − b)2 = r} (cı́rculo de centro (a, b) e raio r > 0).
Fig. 1: Bola aberta, bola fechada e esfera no plano em relação à métrica euclidiana
E se consideramos R2 com a métrica do máximo, teremos:
• BM ((a, b), r) = {(x, y) ∈ R2 | |x − a| < r e |y − b| < r} = (a − r, a + r) × (b − r, b + r).
• BM [(a, b), r] = {(x, y) ∈ R2 | |x − a| ≤ r e |y − b| ≤ r} = [a − r, a + r] × [b − r, b + r].
• SM [(a, b), r] = {(x, y) ∈ R2 | |x − a| ≤ r e |y − b| = r} ∪ {(x, y) ∈ R2 | |x − a| = r e |y − b| ≤ r}.
Fig. 2: Bola aberta, bola fechada e esfera no plano em relação à métrica do máximo
Finalmente, se tomarmos R2 com a métrica da soma, teremos:
• BS ((a, b), r) = {(x, y) ∈ R2 | |x − a| + |y − b| < r} ,
é a região interior ao quadrado de vértices nos pontos (a, b + r), (a, b − r), (a − r, b), (a + r, b).
• BS [(a, b), r] = {(x, y) ∈ R2 | |x − a| + |y − b| ≤ r} ,
é a união da região limitada pelo quadrado de vértices nos pontos (a, b + r), (a, b − r), (a − r, b),
(a + r, b) com o próprio quadrado.
Análise
• SS [(a, b), r] = {(x, y) ∈ R2 | |x − a| + |y − b| = r}
é o quadrado de vértices nos pontos (a, b + r), (a, b − r), (a − r, b), (a + r, b).
Fig. 3: Bola aberta, bola fechada e esfera no plano em relação à métrica da soma
Então, temos que:

BS ((a, b), r) ⊂ B((a, b), r) ⊂ BM ((a, b), r) .
Fig. 4: Relação entre as bolas abertas de mesmo centro e raio em relação às métricas euclidiana, da soma e do máximo
Observação 3.2. De um modo geral, a bola aberta BM (a, r) ⊂ Rn , definida pela norma
kxkM = max{ |x1 |, . . . , |xn |}, é o produto cartesiano (a1 − r, a1 + r) × . . . × (an − r, an + r), onde
a = (a1 , . . . , an ).
De fato,
x = (x1 , . . . , xn ) ∈ BM (a, r) ⇐⇒ |x1 − a1 | < r , . . . , |xn − a| < r
⇐⇒ x1 ∈ (a1 − r, a1 + r) , . . . , xn ∈ (an − r, an + r)
⇐⇒ (x1 , . . . , xn ) ∈ (a1 − r, a1 + r) × . . . × (an − r, an + r) .
O fato das bolas de Rn serem produto cartesiano de intervalos da reta, torna esta métrica, em
muitas ocasiões, mais conveniente do que a métrica euclidiana.
• Mostraremos, agora, que as bolas relativas a diferentes normas em Rn têm em comum o fato
de serem convexas.
Definição 3.1. Sejam x, y ∈ Rn . O segmento de reta de extremos x e y é o conjunto

[x, y] = { (1 − t) x + t y | t ∈ [0, 1] } .

Bolas e conjuntos limitados
Definição 3.2. Um subconjunto X ⊂ Rn é convexo quando contém qualquer segmento de reta

cujos extremos pertencem a X, ou seja,
x, y ∈ X =⇒ [x, y] ⊂ X .
Exemplo 3.2. Todo subespaço vetorial E ⊂ Rn é convexo.
Exemplo 3.3. Todo subespaço afim a + E = {a + x | x ∈ E}, onde E ⊂ Rn é um subespaço, é

um conjunto convexo.
Exemplo 3.4. Se X ⊂ Rm e Y ⊂ Rn são conjuntos convexos, então X×Y ⊂ Rm+n é convexo.
Exemplo 3.5. O conjunto X = Rn − {0} ⊂ Rn não é convexo, pois e1 ∈ X, −e1 ∈ X, mas

1 1
[e1 , −e1 ] 6⊂ X, pois e1 + (−e1 ) = 0 ∈
/ X.
2 2
Teorema 3.1. Toda bola aberta ou fechada de Rn , com respeito a qualquer norma, é um
conjunto convexo.
Prova.
Sejam x, y ∈ B(a, r). Então kx − ak < r e ky − ak < r. Logo,
k(1 − t)x + ty − ak = k(1 − t)x + ty − (1 − t)a − tak ≤ k(1 − t)(x − a)k + kt(y − a)k < (1 − t)r + tr = r ,
para todo t ∈ [0, 1], pois 1 − t ≥ 0 e t > 0 ou 1 − t > 0 e t ≥ 0.
De modo análogo, podemos provar que a bola fechada é convexa.
Definição 3.3. Um subconjunto X ⊂ Rn é limitado com respeito a uma norma k k em Rn

quando existe c > 0 tal que kxk ≤ c para todo x ∈ X, ou seja, quando existe c > 0 tal que
X ⊂ B[0, c] .
Observação 3.3. Um subconjunto X ⊂ Rn é limitado se, e só se, existe a ∈ Rn e r > 0 tal
que X ⊂ B[a, r].
De fato, se X ⊂ B[a, r], então kx − ak ≤ r para todo x ∈ X. Logo,

kxk = kx − a + ak ≤ kx − ak + kak ≤ r + kak ,
para todo x ∈ X, ou seja, X ⊂ B[0, r + kak].
Observação 3.4. Como as três normas usuais de Rn satisfazem as desigualdades

kxkM ≤ kxk ≤ kxkS ≤ nkxkM ,
temos que um subconjunto X ⊂ Rn é limitado em relação a uma dessas normas se, e só se, é
limitado em relação a qualquer das outras duas.
Análise
Teorema 3.2. Um subconjunto X ⊂ Rn é limitado em relação à norma euclidiana se, e só se,
suas projeções π1 (X), . . . , πn (X) são conjuntos limitados em R.
Prova.
X é limitado com respeito à norma euclidiana k k ⇐⇒ X ⊂ Rn é limitado com respeito à norma
do máximo k kM ⇐⇒ ∃ r > 0 tal que X ⊂ BM [0, r] = [−r, r] × . . . × [−r, r] ⇐⇒ ∃ r > 0 tal que
π1 (X) ⊂ [−r, r], . . . , πn (X) ⊂ [−r, r] ⇐⇒ π1 (X), . . . , πn (X) são limitados em R.
Observação 3.5. Mostraremos depois que duas normas quaisquer k k1 e k k2 em Rn são

equivalentes, ou seja, existem d, c > 0 tais que
c kxk2 ≤ kxk1 ≤ d kxk2 ,
para todo x ∈ Rn . Assim, se X ⊂ Rn é limitado com respeito a uma norma em Rn , será também
limitado em relação a qualquer outra norma em Rn .
4 Sequências no espaço euclidiano
Salvo menção explı́cita em contrário,estaremos assumindo que a norma considerada em

Rn é a norma euclidiana.
Definição 4.1. Uma sequência em Rn é uma aplicação x : N −→ Rn . O valor x(k) é indicado

com xk , e chama-se o k−ésimo termo da sequência.
Usaremos a notação (xk ), (xk )k∈N ou (x1 , x2 , . . . , xn , . . .) para indicar a sequência cujo k−ésimo
termo é xk .
Definição 4.2. Uma subsequência de (xk ) é a restrição da sequência a um subconjunto infi-

nito N 0 = {k1 < k2 < . . . < ki < . . .} ⊂ N.
A subsequência é indicada pelas notações (xk )k∈N 0 , (xki )i∈N ou (xk1 , xk2 , . . . , xki , . . .).
Definição 4.3. Dizemos que uma sequência (xk )k∈N é limitada quando o conjunto formado
pelos seus termos é limitado, ou seja, quando existe c > 0 tal que kxk k ≤ c para todo k ∈ N.
Observação 4.1. Uma sequência (xk ) em Rn equivale a n sequências (xki )k∈N , i = 1, . . . , n,

de números reais, onde xki = πi (xk ) = i−ésima coordenada de xk , i = 1, . . . , n.
As n sequências (xki )k∈N , i = 1, . . . , n são chamadas as sequências das coordenadas da

sequência (xk ).

Sequências no espaço euclidiano
Pelo teorema 3.2, temos, então, que uma sequência (xk ) é limitada se, e só se, cada uma
de suas sequências de coordenadas (xki )k∈N , i = 1, . . . , n, é limitada em R.
Definição 4.4. Dizemos que o ponto a ∈ Rn é o limite da sequência (xk ) quando, para todo
ε > 0 dado, existe k0 ∈ N tal que k > k0 =⇒ kxk − ak < ε
Neste caso, dizemos que (xk ) converge para a ou tende para a.
Notação:
• lim xk = a , lim xk = a , lim xk = a ou xk −→ a são equivalentes.

k→∞ k∈N
• Quando existe o limite a = lim xk , dizemos que a sequência (xk ) é convergente. Caso contrário,
dizemos que a sequência (xk ) é divergente.
Observação 4.2. O limite de uma sequência (xk ) convergente é único.

Ou seja, se a = lim xk e b = lim xk , então a = b.
ka − bk
De fato, se ε = > 0, existe k0 ∈ N tal que kxk0 − ak < ε e kxk0 − bk < ε. Logo,
2
ka − bk ≤ kxk0 − ak + kxk0 − bk < 2ε = ka − bk ,
uma contradição.
Observação 4.3. lim xk = a ⇐⇒ lim kxk − ak = 0.

k→∞ k→∞
Observação 4.4. lim xk = a ⇐⇒ ∀ ε > 0 ∃ k0 ∈ N ; xk ∈ B(a, ε) ∀ k > k0 , ou seja, qualquer

k→∞
bola aberta de centro a contém todos os termos xk salvo, possivelmente, um número finito de
ı́ndices k.
• Com isto, podemos definir o limite e convergência de uma sequência num espaço métrico
(M, d) qualquer.
Observação 4.5. Toda sequência convergente é limitada.

De fato, seja (xk )k∈N uma sequência convergente.
Dado ε = 1 > 0, existe k0 ∈ N tal que kxk − ak < 1 para todo k > k0 .
Se r = max{ 1, kx1 − ak, . . . , kxk0 − ak } > 0, então, kxk − ak ≤ r para todo k ∈ N, ou seja,
{xk | k ∈ N} ⊂ B[a, r].
• Mas a recı́proca não é verdadeira.
Por exemplo, se a 6= b, a sequência {a, b, a, b, a, . . .} é limitada, mas não é convergente.
Análise
Observação 4.6. Toda subsequência de uma sequência convergente é convergente e tem o

mesmo limite.
Observação 4.7. Como as três normas usuais de Rn estão relacionadas pelas desigualda-
des
kxkM ≤ kxk ≤ kxkS ≤ nkxkM ,
temos que:
lim kxk − akM = 0 ⇐⇒ lim kxk − ak = 0 ⇐⇒ lim kxk − akS = 0 .
k→∞ k→∞ k→∞
ou seja, a afirmação lim xk = a independe de qual das três normas usuais estamos conside-
k→∞
rando.
Como provaremos depois que duas normas quaisquer de Rn são equivalentes, a noção de
limite de uma sequência em Rn permanece a mesma seja qual for a norma que considerarmos.
Teorema 4.1. Uma sequência (xk ) em Rn converge para o ponto a = (a1 , . . . , an ) se, e só se,
lim xk i = ai para todo i = 1, . . . , n.
k→∞
Prova.
Como |xk i − ai | ≤ kxk − akM , temos que se lim xk = a, ou seja, se lim kxk − akM = 0,
k→∞ k→∞
então lim |xk i − ai | = 0, para todo i = 1, . . . , n, e, portanto, lim xk i = ai , i = 1, . . . , n.
k→∞ k→∞
Suponhamos, agora, que lim xk i = ai , i = 1, . . . , n.

k→∞
Dado ε > 0, existe, para cada i = 1, . . . , n, um número natural ki tal que |xk i − ai | < ε para todo
k > ki .
Seja k0 = max{ k1 , . . . , kn }. Então, k > k0 =⇒ kxk − akM = max { |xk i − ai | } < ε.

1≤i≤n
Logo lim xk = a.
k→∞
Corolário 4.1. Se (xk ), (yk ) são sequência convergentes em Rn e (λk ) é uma sequência
convergente em R, com a = lim xk , b = lim yk e λ = lim λk , então:
(a) lim (xk + yk ) = a + b ,

k→∞
(b) lim λk xk = λa ,
k→∞
(c) lim hxk , yk i = ha, bi .

k→∞
(d) lim kxk k = kak.

k→∞

Prova.
Pelo teorema 4.1, temos que lim xki = ai e lim yki = bi , i = 1, . . . , n.
k→∞ k→∞
Utilizando novamente o teorema 4.1 e os fatos conhecidos sobre limites de somas e de produtos
de sequências de números reais, temos que:
(a) lim (xki + yki ) = ai + bi , i = 1, . . . , n =⇒ lim (xk + yk ) = a + b .

k→∞ k→∞
(b) lim λk xki = λai , i = 1, . . . , n =⇒ lim λk xk = λa .

k→∞ k→∞
(c) lim hxk , yk i = lim ( xk1 yk1 + . . . + xkn ykn ) = a1 b1 + . . . + an bn = ha, bi .

k→∞ k→∞
p p
(d) lim kxk k = lim hxk , xk i = ha, ai = kak .
k→∞ k→∞
Também podemos provar (d) observando que | kxk k − kak | ≤ kxk − ak, que tem a vantagem de
valer para qualquer norma.
Teorema 4.2. (Bolzano-Weierstrass)

Toda sequência limitada em Rn possui uma subsequência convergente.
Prova.
Caso n = 1: Seja (xk ) uma sequência limitada de números reais, e sejam a < b tais que
xk ∈ [a, b] para todo k ∈ N.
Consideremos o conjunto:
A = { t ∈ R | xk ≥ t para uma infinidade de ı́ndices k } .
Temos que a ∈ A e todo elemento de A é menor ou igual a b. Logo A 6= ∅ e é limitado

superiormente por b. Seja c = sup A.
Então, dado ε > 0 existe tε ∈ A tal que c − ε < tε . Assim, existe uma infinidade de ı́ndices k tais
que xk > c − ε.
Por outro lado, como c + ε 6∈ A, xk ≥ c + ε no máximo para um número finito de ı́ndices.
Assim, c − ε < xk < c + ε para uma infinidade de ı́ndices k, e, portanto, c é o limite de uma
subsequência de (xk ).
Caso geral: Seja (xk ) uma sequência limitada em Rn .
Pelo teorema 3.2, as sequências (xki )k∈N , i = 1, . . . , n, de coordenadas de (xk ) são sequências
limitadas de números reais.
Como (xk1 )k∈N é limitada, existe N1 ⊂ N infinito e a1 ∈ R tal que lim xk1 = a1 . Por sua vez,
k∈N1
como a sequência (xk2 )k∈N1 de números reais é limitada, existe N2 ⊂ N1 infinito e a2 ∈ R tais
Análise
que lim xk2 = a2 .

k∈N2
Prosseguindo dessa maneira, obtemos n conjuntos infinitos N ⊃ N1 ⊃ . . . ⊃ Nn e n números

reais a1 , . . . , an tais que lim xki = ai , i = 1, . . . , n.
k∈Ni
Sendo a = (a1 , . . . , an ), temos que lim xk = a, o que conclui a demonstração.

k∈Nn
Definição 4.5. Dizemos que um ponto a ∈ Rn é valor de aderência de uma sequência (xk )
de pontos de Rn quando a é limite de alguma subsequência de (xk ).
Observação 4.8. Uma sequência (xk ) não possui valor de aderência ⇐⇒ (xk ) não possui
subsequência limitada ⇐⇒ para todo número real A > 0 dado, existe k0 ∈ N tal que k > k0 =⇒
kxk k > A.
Observação 4.9. a ∈ Rn é valor de aderência de (xk )k∈N ⇐⇒ dados ε > 0 e k0 ∈ N, existe

k > k0 tal que kxk − ak < ε.
Observação 4.10. Uma sequência convergente possui um único valor de aderência, mas a
recı́proca não vale, pois, por exemplo, a sequência (1, 2, 1, 3, 1, 4, . . .) possui o 1 como único
valor de aderência, mas não converge, já que é ilimitada.
Teorema 4.3. Uma sequência limitada em Rn é convergente se, e somente se, possui um
único valor de aderência.
Prova.
(=⇒) É imediato.
(⇐=) Seja (xk ) uma sequência limitada e seja a ∈ Rn o seu único valor de aderência.
Suponhamos, por absurdo, que a sequência (xk ) não converge para a. Então, existe ε0 > 0 tal
que para todo k ∈ N, existe k 0 > k tal que kxk 0 − ak ≥ ε0 , ou seja, o conjunto N 0 = { k ∈ N | xk ∈
/
B(a, ε0 ) } é ilimitado e, portanto, infinito.
Como a sequência (xk )k∈N 0 é limitada, existe, pelo teorema 4.2, N 00 ⊂ N 0 infinito e b ∈ Rn tais
que lim00 xk = b.
k∈N
Sendo kxk − ak ≥ ε0 > 0 para todo k ∈ N 00 , temos que kb − ak ≥ ε0 > 0. Logo b 6= a e b é valor
de aderência de (xk ), uma contradição, já que (xk ) possui um único valor de aderência.
Definição 4.6. Dizemos que uma sequência (xk ) é de Cauchy quando para todo ε > 0 existe
k0 ∈ N tal que k, ` > k0 =⇒ kxk − x` k < ε.

Observação 4.11. (xk )k∈N é de Cauchy ⇐⇒ para cada i = 1, . . . , n, a sequência (xki )k∈N das
suas i−ésimas coordenadas é uma sequência de Cauchy de números reais.
Teorema 4.4. Uma sequência (xk )k∈N em Rn é de Cauchy se, e só se, é convergente.
Prova.
(⇐=) É imediato.
(=⇒) Seja (xk ) uma sequência de Cauchy em Rn .
Então, para cada i = 1, . . . , n, a sequência (xki )k∈N de suas i−ésimas coordenadas é de Cau-
chy e, portanto, convergente. Sendo ai = lim xki , i = 1, . . . , n, temos, pelo teorema 4.2, que
k∈N
a = (a1 , . . . , an ) = lim xk , ou seja, (xk ) é convergente e tem limite a.
k∈N
Definição 4.7. Dizemos que duas normas k k1 e k k2 em Rn são equivalentes quando

existem a > 0 e b > 0 tais que
kxk1 ≤ akxk2 e kxk2 ≤ bkxk1 ,
para todo x ∈ Rn .
Observação 4.12. Se, para todo x0 ∈ Rn e todo r > 0, B1 (x0 , r) e B2 (x0 , r) indicarem, res-
pectivamente, a bola aberta de centro x0 e raio r segundo as normas k k1 e k k2 , as desigual-
dades acima significam que:
B2 (x0 , r) ⊂ B1 (x0 , ar) e B1 (x0 , r) ⊂ B2 (x0 , br) .
Observação 4.13. As três normas usuais em Rn são equivalentes, pois

kxkM ≤ kxk ≤ kxkS ≤ nkxkM .
Observação 4.14. A equivalência entre normas é uma relação reflexiva, simétrica e transi-
tiva.
Observação 4.15. Se duas normas k k1 e k k2 são equivalentes, então:

• lim kxk −ak1 = 0 ⇐⇒ lim kxk −ak2 = 0, ou seja, normas equivalentes dão origem à mesma
noção de limite em Rn .
• X ⊂ Rn é limitado em relação à norma k k1 se, e só se, X ⊂ Rn é limitado em relação à

norma k k2 .
Teorema 4.5. Duas normas quaisquer no espaço Rn são equivalentes.
Análise
Prova.
Por transitividade, basta mostrar que uma norma qualquer k k em Rn é equivalente à norma
X n
da soma kxkS = |xi |.
i=1
Sejam {e1 , . . . , en } a base canônica de Rn e a = max{ke1 k, . . . , ken k}. Então,

kxk = kx1 e1 + . . . + xn en k ≤ |x1 | ke1 k + . . . + |xn | ken k
≤ a ( |x1 | + . . . + |xn | ) ≤ a kxkS ,
para todo x = (x1 , . . . , xn ) ∈ Rn .
Seja F = { kxk | kxkS = 1 } ⊂ R. Então, F 6= ∅ e limitado, pois 0 < kxk ≤ a para todo x ∈ Rn tal
que kxkS = 1.
Seja b = inf F. Então b ≥ 0.
Suponhamos que b = 0.
1
Dado k ∈ N, existe xk ∈ Rn tal que 0 < kxk k < e kxk kS = 1.
k
Como a sequência (xk )k ∈ N é limitada na norma da soma, temos, pelo teorema 4.2, que existe
N 0 ⊂ N infinito e c ∈ Rn tais que lim0 kxk − ckS = 0.
k∈N
Assim, pelo item (d) do corolário 4.1, temos que lim0 kxk kS = kckS . Logo kckS = 1, e, portanto,
k∈N
c 6= 0.
Como kxk − ck ≤ akxk − ckS para todo k ∈ N 0 e lim0 kxk − ckS = 0, temos que lim0 kxk − ck = 0
k∈N k∈N
e, portanto, lim0 kxk k = kck.
k∈N
1
Por outro lado, como kxk k < para todo k ∈ N, temos que lim kxk k = 0, o que é uma
k k∈N
contradição, já que kck =
6 0.
Logo inf F = b > 0. Assim, kxk ≥ b para todo x ∈ Rn tal que kxkS = 1.

x
kxkS ≥ b , para todo x ∈ R − {0}, ou seja, kxk ≥ bkxkS para todo x ∈ R .
n n
Então,
Aplicação: Uma sequência de polinômios pk (t) = ak0 +ak1 t+. . .+akn tn de grau ≤ n converge
para o polinômio p(t) = a0 + a1 t + . . . + an tn uniformemente no intervalo não-degenerado [α, β]
se, e só se, para cada i = 0, 1, . . . , n, a sequência (aki )k∈N dos coeficientes de ti nos polinômios
pk converge para o coeficiente ai de ti no polinômio p.
De fato, existe um isomorfismo linear Φ entre o espaço vetorial Rn+1 e o espaço vetorial Pn
dos polinômios reais de grau ≤ n dado por Φ((b0 , b1 , . . . , bn )) = pb (t) = b0 + b1 t + . . . + bn tn .

Pontos de acumulação
Seja kxk = sup{ |px (t)| | t ∈ [α, β] }. É fácil verificar que k k define uma norma em Rn+1 ,
pois:
(a) kλxk = sup{ |pλx (t)| | t ∈ [α, β] } = sup{ |λ| |px (t)| | t ∈ [α, β] } = |λ| kxk .
(b) x = (x0 , x1 , . . . , xn ) 6= 0 =⇒ px (t) = 0 no máximo para n valores distintos de t ∈ [α, β]
=⇒ ∃ t0 ∈ [α, β] tal que |px (t0 )| > 0 =⇒ kxk = sup |px (t)| ≥ |px (t0 )| > 0 .
t∈[α,β]
(c) Como px+y (t) = px (t) + py (t), temos que

|px+y (s)| ≤ |px (s)| + |py (s)| ≤ sup |px (t)| + sup |py (t)| , para todo s ∈ [α, β] ,
t∈[α,β] t∈[α,β]
Logo,
|px+y (s)| ≤ kxk + kyk , para todo t ∈ [α, β]
e, portanto, kx + yk ≤ kxk + kyk.
Em relação a esta norma, xk −→ a em Rn+1 ⇐⇒ kxk − ak = sup |pxk (t) − pa (t)| −→ 0

t∈[α,β]
⇐⇒ pxk −→ pa uniformemente em [α, β].
Como duas normas quaisquer são equivalentes em Rn+1 , temos que xki −→ ai para todo
i = 0, 1, . . . , n ⇐⇒ kxk − akM −→ 0 ⇐⇒ kxk − ak −→ 0 ⇐⇒ pxk −→ pa uniformemente em [α, β].
• Na norma k k definida acima, podemos trocar o intervalo [α, β] não-degenerado por um

subconjunto X ⊂ R infinito qualquer.
5 Pontos de acumulação
Definição 5.1. Seja X ⊂ Rn . Um ponto a ∈ Rn é ponto de acumulação de X quando para

todo ε > 0 temos que X ∩ (B(a, ε) − {a}) 6= ∅, ou seja, para todo ε > 0, existe x ∈ X tal que
0 < kx − ak < ε.
O conjunto dos pontos de acumulação de X será representado por X 0 e chamado o conjunto

derivado de X.
Exemplo 5.1. B[a, r] = (B(a, r)) 0 .

De fato:
(1) S[a, r] ⊂ (B(a, r)) 0

r
Seja b ∈ S[a, r]. Dado ε > 0, podemos supor, sem perda de generalidade, que 0 < ε < .
2
Análise
ε 1
Tome 0 < t0 = < . Então:
2r 4
ε
• kb − ((1 − t0 )b + t0 a)k = kt0 (b − a)k = |t0 | r = < ε,
2
e
• ka − ((1 − t0 )b + t0 a)k = |1 − t0 | kb − ak = (1 − t0 )r < r, pois 0 < 1 − t0 < 1.
Logo (1 − t0 )a + t0 b ∈ B(b, ε) ∩ (B(a, r) − {a}), ou seja, B(b, ε) ∩ (B(a, r) − {a}) 6= ∅.
Então b ∈ B(a, r) 0 .
(2) B(a, r) ⊂ B(a, r) 0 .
• Seja b ∈ B(a, r), b 6= a. Dado ε > 0, podemos supor, sem perda de generalidade, que
0 < ε < kb − ak.
ε 1
Tome 0 < t0 = < . Então:
2kb − ak 2
ε
• k(1 − t0 )b + t0 a − bk = |t0 | kb − ak = < ε,
2
e
• k(1 − t0 )b + t0 a − ak = |1 − t0 | kb − ak < r , pois kb − ak < r e |1 − t0 | < 1.
Logo (1 − t0 )a + t0 b ∈ B(b, ε) ∩ (B(a, r) − {a}).
Então b ∈ B(a, r) 0 .
ε e1
• Para b = a e 0 < ε < r, tome c = a + .
2 ke1 k
ε ke1 k ε
Assim, kb − ck = ka − ck = = < ε < r. Logo c ∈ B(a, ε) ∩ (B(a, r) − {a}).
2 ke1 k 2
Ou seja, a ∈ B(a, r) 0 .
(3) b 6∈ B[a, r] =⇒ b 6∈ B(a, r) 0 .
Seja b 6∈ B[a, r], isto é, kb − ak > r, e seja ε0 = kb − ak − r > 0.
Então, B(b, ε0 ) ∩ B(a, r) = ∅, pois, caso contrário, existiria x ∈ Rn tal que kx − bk < ε0 e
kx − ak < r =⇒ ka − bk ≤ kx − bk + ka − xk < ε0 + r = kb − ak, uma contradição.
Logo b 6∈ B(a, r) 0 .
Observação 5.1. Como vimos neste exemplo, um ponto de acumulação de um conjunto X

pode pertencer ou não a X.
E neste exemplo, todo ponto de X é ponto de acumulação de X, mas isso nem sempre acontece.

Pontos de acumulação
Definição 5.2. Um ponto a ∈ X que não é ponto de acumulação de X é chamado ponto

isolado de X.
Ou seja, a ∈ X é um ponto isolado de X se, e só se, existe ε0 > 0 tal que B(a, ε0 ) ∩ X = {a}.
Quando todos os pontos de X são pontos isolados, dizemos que X é um conjunto discreto.
Exemplo 5.2. N é um conjunto discreto.

1 1
1 1
Exemplo 5.3. No conjunto X = 0, 1, , . . . , , . . . , os pontos 1, , . . . , , . . . são isolados e
2 n 2 n
0 ∈ X 0.
Teorema 5.1. Dados X ⊂ Rn e a ∈ Rn , as seguintes afirmações são equivalentes:

(1) a ∈ X 0 ;
(2) Existe uma sequência (xk ) de pontos de X com lim xk = a e xk 6= a para todo k ∈ N;
(3) Toda bola aberta de centro a contém uma infinidade de pontos de X.
Prova. 1 1
(1)=⇒(2): Como a ∈ X 0 , dado k ∈ N, existe xk ∈ B a, ∩ (X − {a}), ou seja, 0 < kxk − ak < .
k k
Logo xk 6= a para todo k ∈ N e lim xk = a .
k→∞
(2)=⇒(3): Dado ε > 0, existe k0 ∈ N tal que xk ∈ B(a, ε) para todo k ≥ k0 .
O conjunto {xk | k ≥ k0 } é infinito, porque, caso contrário, (xk ) teria uma subsequência constante,
que convergiria para um limite diferente de a, já que xk 6= a para todo k ∈ N. Logo X ∩ B(a, ε) é
um conjunto infinito.
(3)=⇒(1): É evidente.
Corolário 5.1. Se X 0 6= ∅, então X é infinito.
Observação 5.2. A recı́proca do corolário acima é falsa. Por exemplo, N é infinito, mas
N 0 = ∅.
Teorema 5.2. (Bolzano-Weierstrass)

Se X ⊂ Rn é um conjunto infinito e limitado, então X 0 6= ∅.
Prova.
Sendo infinito, X contém um subconjunto infinito enumerável {x1 , . . . , xk , . . .}. Assim, (xk ) é uma
sequência limitada de pontos de X tal que xk 6= x` para k 6= `.
Análise
Pelo teorema 4.4, existe N 0 ⊂ N infinito e a ∈ Rn tais que lim0 xk = a. Como os termos xk são
k∈N
dois a dois distintos, no máximo um deles é igual a a. Eliminando-o, se necessário, obtemos
uma sequência de pontos de X, todos diferentes de a, com limite a.
Então, pelo teorema 5.1, a ∈ X 0 .
6 Aplicações contı́nuas
Definição 6.1. Seja f : X −→ Rn uma aplicação definida no conjunto X ⊂ Rm . Dizemos que

f é contı́nua no ponto a ∈ X quando, para todo ε > 0 dado, existe δ > 0 tal que se x ∈ X e
kx − ak < δ, então kf(x) − f(a)k < ε.
Ou seja, para toda bola aberta B(f(a), ε) de centro f(a) em Rn , existe uma bola aberta B(a, δ)
de centro a ∈ Rm tal que f(X ∩ B(a, δ)) ⊂ B(f(a), ε).
Se f : X −→ Rn é contı́nua em todos os pontos do conjunto X, dizemos que f é uma aplicação

contı́nua.
Observação 6.1. Se a ∈ Y ⊂ X e f : X −→ Rn é contı́nua em a, então f|Y : Y −→ Rn é

contı́nua em a.
Observação 6.2. Se a ∈ X e r > 0 são tais que f|B(a,r)∩X é contı́nua em a, então f : X −→ Rn

é contı́nua em a, pois, dado ε > 0, existe δ > 0 tal que
f(B(a, r) ∩ X ∩ B(a, δ)) ⊂ B(f(a), ε) .
Então, para δ 0 = min{r, δ} > 0,

f(B(a, δ 0 ) ∩ X) ⊂ B(f(a), ε) .
Portanto, a continuidade de uma aplicação é uma propriedade local.
Observação 6.3. Pela definição de continuidade de uma aplicação f : X ⊂ Rm −→ Rn num

ponto a ∈ X, pela definição de normas equivalentes e pelo teorema 4.5, verifica-se, facilmente,
que a continuidade (ou descontinuidade) de f num ponto a independe das normas consideradas
em Rm e Rn .
Observação 6.4. Se a é um ponto isolado do conjunto X, então toda aplicação f : X −→ Rn

é contı́nua no ponto a.
De fato, seja δ0 > 0 tal que B(a, δ0 ) ∩ X = {a}. Então, dado ε > 0, existe δ = δ0 > 0 tal que
f(B(a, δ) ∩ X) = {f(a)} ⊂ B(f(a), ε) .

Aplicações contı́nuas
Definição 6.2. Dado X ⊂ Rm , uma aplicação f : X −→ Rn é lipschitziana quando existe K > 0

tal que
kf(x) − f(y)k ≤ Kkx − yk ,
para quaisquer x, y ∈ X.
Observação 6.5. Toda aplicação lipschitziana f : X −→ Rn é contı́nua.

ε
De fato, dados ε > 0 e a ∈ X, existe δ = > 0, tal que
K
x ∈ X e kx − ak < δ =⇒ kf(x) − f(a)k ≤ Kkx − ak < K δ = ε.
Observação 6.6. Ser ou não lipschitziana independe das normas tomadas em Rm e Rn .
Observação 6.7. Toda transformação linear A : Rm −→ Rn é lipschitziana.

De fato, sejam {e1 , . . . , em } a base canônica de Rm e K = max{kA(e1 )k, . . . , kA(em )k}. Então,
para todo x ∈ Rm ,
kA(x)k = kA(x1 e1 + . . . + xm em )k = kx1 A(e1 ) + . . . + xm A(em )k
≤ |x1 | kA(e1 )k + . . . + |xm | kA(em )k ≤ K(|x1 | + . . . + |xm |)
= K kxkS .
Logo kA(x) − A(y)k = kA(x − y)k ≤ Kkx − ykS , quaisquer que sejam x, y ∈ Rm .
Observação 6.8. Seja ϕ : Rm × Rn −→ Rp uma aplicação bilinear. Então ϕ|X é lipschitziana,

para todo X ⊂ Rm × Rn limitado.
De fato, se K = max{kϕ(ei , ej )k | i = 1, . . . , m , j = 1, . . . , n}, então

X X X
!
m n
kϕ(x, y)k = ϕ xi e i , yj ej = xi yj ϕ(ei , ej )

i=1 j=1 i,j
X X
≤ |xi | |yj | kϕ(ei , ej )k ≤ K |xi | |yj |
i,j i,j
= K kxkS kykS .
Se consideramos Rm × Rn com a norma da soma, temos que

kϕ(x, y) − ϕ(x 0 , y 0 )k = kϕ(x, y − y 0 ) + ϕ(x − x 0 , y 0 )k
≤ kϕ(x, y − y 0 )k + kϕ(x − x 0 , y 0 )k
≤ K ( kxkS ky − y 0 kS + kx − x 0 kS ky 0 kS ) ,
para quaisquer (x, y), (x 0 , y 0 ) ∈ Rm × Rn .
Como X é limitado em Rm × Rn , existe r > 0 tal que k(x, y)kS = kxkS + kykS ≤ r para todo
(x, y) ∈ X.
Análise
Logo, se (x, y), (x 0 , y 0 ) ∈ X, temos que kxkS ≤ r e ky 0 kS ≤ r e, portanto,

kϕ(x, y) − ϕ(x 0 , y 0 )k ≤ K r ( kx − x 0 kS + ky − y 0 kS ) = K r ( k(x, y) − (x 0 , y 0 )kS ) .
Portanto, ϕ cumpre uma condição de Lipschitz, com constante Kr, em cada bola BS [0, r] do
espaço Rm × Rn = Rm+n .
Em particular, toda aplicação bilinear é contı́nua.
6.1 Exemplos de aplicações bilineares
(1) A multiplicação de números reais ϕ : R × R −→ R ϕ(x, y) = xy.
(2) A multiplicação de um escalar por um vetor ϕ : R × Rn −→ Rn , ϕ(λ, x) = λx.

X
n
n
(3) O produto interno ϕ : R × R −→ R , ϕ(x, y) = xi yi .
i=1
(4) A multiplicação de matrizes ϕ : M(m × n) × M(n × p) −→ M(m × p) , ϕ(A, B) = A B .
(5) A avaliação ϕ : L(Rm , Rn ) × Rm −→ Rn , ϕ(T, x) = T x .
Observação 6.9. Toda aplicação bilinear não-nula ϕ : Rm × Rn −→ Rp não é lipschitziana

em Rm × Rn .
De fato, seja (x0 , y0 ) ∈ Rm × Rn tal que ϕ(x0 , y0 ) 6= 0. Suponhamos, por absurdo, que existe
K > 0 tal que kϕ(x, y)k ≤ K k(x, y)k para todo (x, y) ∈ Rm × Rn .
Então kϕ(λx0 , λy0 )k ≤ K k(λx0 , λy0 )k para todo λ ∈ R.
Logo λ2 kϕ(x0 , y0 )k ≤ K |λ| k(x0 , y0 )k para todo λ ∈ R.

K k(x0 , y0 )k
Assim, |λ| ≤ para todo λ ∈ R, o que é uma contradição.
kϕ(x0 , y0 )k
Definição 6.3. Uma aplicação f : X ⊂ Rm −→ Rn é uma imersão isométrica quando

kf(x) − f(y)k = kx − yk para quaisquer x, y ∈ X.
Observação 6.10. A noção de imersão isométrica depende das normas consideradas nos
espaços Rm e Rn .
Observação 6.11. Toda imersão isométrica é uma aplicação lipschitziana.
Observação 6.12. Toda imersão isométrica é injetora, pois

f(x) = f(y) =⇒ kx − yk = kf(x) − f(y)k = 0 =⇒ x = y .

Exemplo 6.1. Para m ≥ n a aplicação f : Rn −→ Rm , dada por

f(x1 , . . . , xn ) = (x1 , . . . , xn , 0, . . . , 0) ,
é uma imersão isométrica, se consideramos Rn e Rm com a norma euclidiana, ou com a norma

do máximo ou com a norma da soma, por exemplo.
Definição 6.4. Uma imersão isométrica f : X ⊂ Rm −→ Rn , com f(X) = Y, chama-se uma

isometria de X sobre Y. Sua inversa f−1 : Y −→ X é, por sua vez, uma isometria de Y sobre X.
Exemplo 6.2. Dado a ∈ Rn , a translação Ta : Rn −→ Rn , Ta (x) = a + x, é uma isometria de

Rn sobre Rn sendo (Ta )−1 = T−a a sua inversa.
Observe que Ta é linear se, e somente se, a = 0.
Exemplo 6.3. Consideremos Rn com a norma euclidiana. Uma transformação linear

n n
T : R −→ R é uma isometria se, e somente se, é ortogonal, ou seja, hTx, Tyi = hx, yi quaisquer
que sejam x, y ∈ Rn .
De fato, se kTxk = kxk para todo x ∈ Rn , então

1 1
hTx, Tyi = kTx + Tyk2 − kTx − Tyk2 = kT (x + y)k2 − kT (x − y)k2
4 4
1
= kx + yk2 − kx − yk2 = hx, yi .
4
E, reciprocamente, se hTx, Tyi = hx, yi para todos x, y ∈ Rn , então
kTx − Tyk2 = kT (x − y)k2 = hT (x − y), T (x − y)i = hx − y, x − yi = kx − yk2 ,
ou seja, kTx − Tyk = kx − yk quaisquer que sejam x, y ∈ Rn .
Uma transformação ortogonal T : Rn −→ Rn também se caracteriza pelo fato de ser {Te1 , . . . , Ten }
uma base ortonormal. Isto equivale a dizer que as colunas da matriz da transformação T em
relação à base canônica são duas a duas ortogonais e unitárias. Isto é, At A = A At = I.
Observação 6.13. Consideremos Rn com a norma euclidiana.

Toda isometria T : Rn −→ Rn é obtida fazendo a composição de uma translação com uma
transformação ortogonal (ver exercı́cio 7.13).
Definição 6.5. Uma contração fraca f : X ⊂ Rm −→ Rn é uma aplicação lipschitziana com

constante de Lipschitz K = 1. Ou seja, f é uma contração fraca se kf(x) − f(y)k ≤ kx − yk para
quaisquer x, y ∈ X.
Observação 6.14. Se trocarmos a norma de Rm ou de Rn , uma contração fraca continua
Análise
sendo uma aplicação lipschitziana (e, portanto, contı́nua), mas ela pode deixar de ser uma
contração fraca.
Exemplo 6.4. (Contrações fracas)

(a) A soma de vetores s : Rn × Rn −→ Rn , s(x, y) = x + y, é uma contração fraca.
De fato, tomando em Rn e em Rn × Rn a norma da soma, temos que:

ks(x, y) − s(x 0 , y 0 )kS = k(x + y) − (x 0 + y 0 )kS ≤ kx − x 0 kS + ky − y 0 kS = k(x, y) − (x 0 , y 0 )kS .
(b) A projeção πi : Rn −→ R, definida por πi (x) = xi , onde x = (x1 , . . . , xn ), é uma contração

fraca.
De fato,
|πi (x) − πi (y)| = |xi − yi | ≤ kx − yk ,
podendo-se tomar em Rn qualquer uma das três normas usuais.
(c) A norma k k : Rn −→ R é uma contração fraca.
De fato, para quaisquer x, y ∈ Rn , temos que

| kxk − kyk | ≤ kx − yk .
(d) A distância d : Rn × Rn −→ R, definida por d(x, y) = kx − ykS , também é uma contração

fraca se considerarmos Rn × Rn com a norma da soma, pois:
|d(x, y) − d(x 0 , y 0 )| = | kx − ykS − kx 0 − y 0 kS |
≤ k(x − y) − (x 0 − y 0 )kS
≤ kx − x 0 kS + ky − y 0 kS = k(x, y) − (x 0 , y 0 )kS ,
para quaisquer (x, y), (x 0 , y 0 ) ∈ Rn × Rn .
Teorema 6.1. Dados X ⊂ Rm , Y ⊂ Rn , f : X −→ Rn contı́nua no ponto a ∈ X, com f(X) ⊂ Y, e

g : Y −→ Rp contı́nua no ponto b = f(a) ∈ Y, então g ◦ f : X −→ Rp é contı́nua no ponto a.
Prova.
Sendo g contı́nua em b = f(a), dado ε > 0, existe η > 0 tal que
y ∈ Y , ky − f(a)k < η =⇒ kg(y) − g(f(a))k < ε .
Por outro lado, sendo f contı́nua em a, existe δ > 0 tal que

x ∈ X , kx − ak < δ =⇒ kf(x) − f(a)k < η .
Então,
x ∈ X , kx − ak < δ =⇒ kg(f(x)) − g(f(a))k < ε .
Isto é, g ◦ f é contı́nua no ponto a.

Observação 6.15. Dada uma aplicação f : X ⊂ Rm −→ Rn , temos que, para todo x ∈ X,

f(x) = (f1 (x), . . . , fn (x)) , onde fi = πi ◦ f : X ⊂ Rm −→ R, i = 1, . . . , n, são as funções
coordenadas de f.
Teorema 6.2. Uma aplicação f : X ⊂ Rm −→ Rn é contı́nua no ponto a ∈ X se, e só se, cada
uma das suas funções coordenadas fi = πi ◦ f : X −→ R é contı́nua no ponto a.
Prova.
(=⇒) Sendo f contı́nua no ponto a e πi : Rm −→ R contı́nua em Rn , i = 1, . . . , n, temos,
pelo teorema anterior, que fi = πi ◦ f é contı́nua no ponto a, i = 1, . . . , n.
(⇐=) Se cada função coordenada fi = πi ◦ f, i = 1, . . . , n, é contı́nua no ponto a, dado ε > 0,

existem números reais δ1 , . . . , δn > 0 tais que
x ∈ X , kx − ak < δi =⇒ |fi (x) − fi (a)| < ε .
Considerando em Rn a norma do máximo e tomando δ = min{δ1 , . . . , δn } > 0, temos que

x ∈ X , kx − ak < δ =⇒ kf(x) − f(a)kM < ε .
Logo f é contı́nua no ponto a.
Corolário 6.1. Dadas f : X −→ Rm e g : X −→ Rn , seja (f, g) : X −→ Rm × Rn = Rm+n

a aplicação definida por (f, g)(x) = (f(x), g(x)). Então (f, g) é contı́nua no ponto a se, e só se, f
e g são contı́nuas no ponto a.
Prova.
Se f = (f1 , . . . , fm ) e g = (g1 , . . . , gn ), então, as funções coordenadas de (f, g) são
f1 , . . . , fm , g1 , . . . , gn .
Logo, pelo teorema 6.2, a aplicação (f, g) é contı́nua em a ⇐⇒ as funções coordenadas f1 , . . . , fm , g1 , . . .

são todas contı́nuas no ponto a ⇐⇒ f e g são contı́nuas no ponto a.
O teorema 6.1 e o corolário 6.1 são de grande utilidade para mostrar a continuidade de
certas aplicações. Vejamos alguns exemplos.
Exemplo 6.5. Sejam X ⊂ Rm e f, g : X −→ Rn , λ : X −→ R aplicações contı́nuas. Então são

também contı́nuas as aplicações:
f + g : X −→ Rn , (f + g)(x) = f(x) + g(x) ;
λ f : X −→ Rn , (λ f)(x) = λ(x) f(x) ;
Análise
hf, gi : X −→ R , hf, gi(x) = hf(x), g(x)i ;

1
1 1
: X − Zλ −→ R , (x) = ,
λ λ λ(x)
onde Zλ = {x ∈ X | λ(x) = 0}.
De fato, como as aplicações s : Rn × Rn −→ Rn , ϕ : R × Rn −→ Rn , ξ : Rn × Rn −→ R e

1
ρ : R − {0} −→ R, dadas por s(x, y) = x + y, ϕ(t, x) = t x, ξ(x, y) = hx, yi e ρ(t) = , são
t
aplicações contı́nuas, e, pelo corolário 6.1, as aplicações (f, g) e (λ, f) são contı́nuas temos,
1
pelo teorema 6.1, que as aplicações f + g = s ◦ (f, g), λ f = ϕ ◦ (λ, f), hf, gi = ξ ◦ (f, g) e = ρ◦λ
λ
são também contı́nuas.
Exemplo 6.6. A função f : R2 −→ R dada por f(x, y) = (sen x) ex2 +y3 é contı́nua, pois
f = ϕ ◦ (sen ◦π1 , exp ◦s ◦ (ξ ◦ π1 , η ◦ π2 )) ,
onde ϕ : R × R −→ R , π1 : R × R −→ R, π2 : R × R −→ R, s : R × R −→ R, ξ : R −→ R,
η : R −→ R e exp : R −→ R são as funções contı́nuas dadas por: ϕ(x, y) = x y , π1 (x, y) = x ,
π2 (x, y) = y , s(x, y) = x + y , ξ(x) = x2 , η(x) = x3 e exp(x) = ex .
Teorema 6.3. Uma aplicação f : X ⊂ Rm −→ Rn é contı́nua no ponto a ∈ X se, e só se, para
toda sequência (xk ) de pontos de X com lim xk = a tem-se lim f(xk ) = f(a) .
k→∞ k→∞
Prova.
(=⇒) Seja f contı́nua no ponto a e (xk ) uma sequência de pontos de X com lim xk = a.
Dado ε > 0, existe δ > 0 tal que x ∈ X e kx − ak < δ =⇒ kf(x) − f(a)k < ε .
Como lim xk = a, existe k0 ∈ N tal que kxk − ak < δ para todo k > k0 . Logo kf(xk ) − f(a)k < ε
para todo k > k0 . Então f(xk ) −→ f(a).
(⇐=) Suponhamos que f não é contı́nua no ponto a. Então existe ε0 > 0 tal que para todo k ∈ N
1
podemos obter xk ∈ X com kxk − ak < e kf(xk ) − f(a)k ≥ ε0 .
k
Assim, xk −→ a, mas (f(xk )) não converge para f(a).
Definição 6.6. Dizemos que uma aplicação f : Rm −→ Rn é contı́nua em relação à variável

xi , (i = 1, . . . , m) quando, para cada (a1 , . . . , ai−1 , ai+1 , . . . , am ) fixado, a aplicação parcial
t 7−→ f(a1 , . . . , ai−1 , t, ai+1 , . . . , an ) é contı́nua.
• Toda aplicação contı́nua f : Rm −→ Rn é separadamente contı́nua em relação a cada uma de

suas variáveis, pois suas aplicações parciais são compostas de f com uma aplicação contı́nua
do tipo t 7−→ (a1 , . . . , ai−1 , t, ai+1 , . . . , an ).

Mas a recı́proca é falsa.
De fato, a função f : R2 −→ R, dada

 por

 xy
2 2
se (x, y) 6= (0, 0)
f(x, y) = x + y

0 se (x, y) = (0, 0) ,
bx
é contı́nua separadamente em relação a x e a y, pois f(x, b) = se b 6= 0 e f(x, 0) = 0,
x2 + b2
ay
enquanto f(a, y) = se a 6= 0 e f(0, y) = 0 . Mas f não é contı́nua na origem, pois
a2 + y2
1
f ◦ g(t) = se t 6= 0 e f ◦ g(0) = 0 , onde g : R −→ R2 , dada por g(t) = (t, t), é uma aplicação
2
contı́nua em R. Como f ◦ g não é contı́nua em t = 0, temos que f não é contı́nua na origem.
Definição 6.7. Uma aplicação f : X ⊂ Rm −→ Rn é uniformemente contı́nua quando para

todo ε > 0, existe δ > 0 tal que x, y ∈ X e kx − yk < δ =⇒ kf(x) − f(y)k < ε.
Observação 6.16. A noção de continuidade uniforme independe das normas consideradas

em Rm e Rn .
Observação 6.17. Toda aplicação uniformemente contı́nua é contı́nua.
Observação 6.18. Toda aplicação lipschitziana é uniformemente contı́nua.

ε
De fato, se kf(x) − f(y)k ≤ K kx − yk para todos x, y ∈ X, dado ε > 0, existe δ = > 0 tal que
K
x, y ∈ X , kx − yk < δ =⇒ kf(x) − f(y)k ≤ K kx − yk < K δ = ε .
Em particular,
• toda aplicação linear T : Rm −→ Rn é uniformemente contı́nua;
• se X ⊂ Rm × Rn é um subconjunto limitado e ϕ : Rm × Rn −→ Rp é uma aplicação bilinear,

então ϕ|X é uniformemente contı́nua.
√
Observação 6.19. A função f : [0, +∞) −→ R, dada por f(x) = x , é um exemplo de uma
função uniformemente contı́nua que não é lipschitziana (veja Curso de Análise, Vol. I de E. Lima,
pag. 244).
Observação 6.20. A composta de duas funções uniformemente contı́nuas é uniformemente

contı́nua.
Observação 6.21. Uma aplicação f : X ⊂ Rm −→ Rn é uniformemente contı́nua ⇐⇒ suas

funções coordenadas f1 , . . . , fn : X −→ R são uniformemente contı́nuas.
Análise
Teorema 6.4. Uma aplicação f : X ⊂ Rm −→ Rn é uniformemente contı́nua se, e só se, para
quaisquer duas sequências (xk ) e (yk ) em X com lim (xk − yk ) = 0, tem-se
k→∞
lim ( f(xk ) − f(yk ) ) = 0.
k→∞
Prova.
(=⇒) Dado ε > 0, existe δ > 0 tal que x, y ∈ X e kx − yk < δ =⇒ kf(x) − f(y)k < ε.
Se (xk ) e (yk ) são sequências em X com lim (xk − yk ) = 0, existe k0 ∈ N tal que kxk − yk k < δ
k→∞
para todo k > k0 .
Logo kf(xk ) − f(yk )k < ε para todo k > k0 , ou seja, lim ( f(xk ) − f(yk ) ) = 0 .
k→∞
(⇐=) Suponhamos que f não é uniformemente contı́nua. Então existe ε0 > 0 tal que, para todo
1
k ∈ N, podemos obter um par de pontos xk , yk ∈ X com kxk − yk k < e kf(xk ) − f(yk )k ≥ ε0 .
k
Logo (xk − yk ) −→ 0, mas ( f(xk ) − f(yk ) ) 9 0.
Exemplo 6.7. A função f : R −→ R, definida por f(x) = cos(x2 ) não é uniformemente

contı́nua.
p √
De fato, se xk = (k + 1) π e yk = k π , então:
p √ p √
(k + 1) π − k π (k + 1) π + k π
xk − yk = p √
(k + 1) π + k π
(k + 1) π − k π
= p √
(k + 1) π + k π
π
= p √ −→ 0 .
(k + 1) π + kπ
Mas, como cos(x2k ) = cos ( (k + 1) π ) = ±1 e cos(y2k ) = cos(kπ) = ∓1 , temos que

kf(xk ) − f(yk )k = 2 para todo k, e, portanto, ( f(xk ) − f(yk ) ) 9 0.
7 Homeomorfismos
Definição 7.1. Sejam X ⊂ Rm e Y ⊂ Rn . Um homeomorfismo entre X e Y é uma bijeção

contı́nua f : X −→ Y, cuja inversa f−1 : Y −→ X também é contı́nua.
Dizemos que os conjuntos X e Y são homeomorfos se existe um homeomorfismo f : X −→ Y .
Exemplo 7.1. Toda aplicação linear invertı́vel T : Rn −→ Rn é um homeomorfismo de Rn

sobre si próprio, pois sua inversa T −1 : Rn −→ Rn é linear e, portanto, contı́nua.

Homeomorfismos
Observação 7.1. A aplicação composta de dois homeomorfismos é um homeomorfismo, e o

inverso de um homeomorfismo é um homeomorfismo.
Observação 7.2. Já sabemos (veja Curso de Análise, Vol. I de E. Lima, pag. 237) que se
f : I −→ R é uma função contı́nua injetora definida num intervalo I, então f(I) = J é um intervalo
e f−1 : J −→ R é contı́nua, ou seja, f : I −→ J é um homeomorfismo.
Mas, em geral, uma bijeção f : X ⊂ Rm −→ Y ⊂ Rn pode ser contı́nua sem que sua inversa o
seja.
Exemplo 7.2. Seja f : [0, 2π) −→ S1 ⊂ R2 a aplicação definida por f(t) = (cos t, sen t). Pelo
teorema 6.2, f é contı́nua. Além disso, f é uma bijeção. Mas sua inversa f−1 : S1 −→ [0, 2π) é
descontı́nua no ponto p = (1, 0).
1
De fato, para cada k ∈ N, sejam tk = 2π − e zk = f(tk ). Então lim f(tk ) = lim zk = p, mas
k k→∞ k→∞
lim f−1 (zk ) = lim tk = 2π 6= 0 = f−1 (p).
k→∞ k→∞
• No entanto, f : (0, 2π) −→ S1 − {p} é um homeomorfismo.
De fato, seja (zk ) uma sequência de pontos de S1 − {p} tal que lim zk = q ∈ S1 − {p}.
k→∞
Como f é uma bijeção, para cada k ∈ N, existe um único tk ∈ (0, 2π) tal que f(tk ) = zk .
Afirmação: A sequência (tk ) é convergente e seu limite b pertence ao intervalo (0, 2π).
Com efeito, sendo (tk ) uma sequência limitada, ela possui pelo menos um valor de aderência,
e todos os seus valores de aderência pertencem ao intervalo [0, 2π].
Seja (tk )k∈N 0 uma subsequência convergente e seja b = lim0 tk .

k∈N
Então f(b) = lim0 f(tk ) = lim0 zk = q ∈ S1 − {p}. Logo b ∈ (0, 2π) e, pela injetividade, b = f−1 (q).
k∈N k∈N
Portanto, b = f−1 (q) é o único valor de aderência da sequência limitada (tk ).
Pelo teorema 4.3, (tk ) é convergente e lim tk = f−1 (q), ou seja, lim f−1 (zk ) = f−1 (q).
k∈N k∈N
Assim, do teorema 6.3, obtemos que f −1

: S − {p} −→ (0, 2π)
1
é contı́nua e, portanto,
f : (0, 2π) −→ S1 − {p} é um homeomorfismo.
• De modo análogo, podemos provar que a aplicação f : (a, a + 2π) −→ S1 − {q} , onde
q = (cos a, sen a), é um homeomorfismo.
Observação 7.3. Os homeomorfismos desempenham na Topologia um papel análogo aos

movimentos rı́gidos na Geometria Euclidiana: dois conjuntos homeomorfos são indistinguı́veis
do ponto de vista topológico.
Análise
Vejamos, agora, outros exemplos de homeomorfismos.
Exemplo 7.3. As translações Ta : Rn −→ Rn , Ta (x) = a + x, são homeomorfismos, pois Ta e

(Ta )−1 = T−a são isometrias e, portanto, são contı́nuas.
Exemplo 7.4. As homotetias Hλ : Rn −→ Rn , Hλ (x) = λx, com λ 6= 0, são homeomorfismos,

pois cada Hλ é uma transformação linear invertı́vel com (Hλ )−1 = Hλ−1 .
Exemplo 7.5. Duas bolas abertas ou duas bolas fechadas ou duas esferas quaisquer no
espaço Rn são homeomorfas.
De fato, dados a, b ∈ Rn e r > 0, s > 0 números reais, temos que a aplicação ϕ = Tb ◦ Hs/r ◦ T−a :
Rn −→ Rn é um homeomorfismo tal que:
ϕ(B(a, r)) = B(b, s) , ϕ(B[a, r]) = B[b, s] e ϕ(S[a, r)] = S[b, s] ,
s s
pois, como ϕ(x) = (x − a) + b, então kϕ(x) − bk = kx − ak e, portanto:
r r
kϕ(x) − bk < s ⇐⇒ kx − ak < r ;
kϕ(x) − bk ≤ s ⇐⇒ kx − ak ≤ r ;
kϕ(x) − bk = s ⇐⇒ kx − ak = r .
Exemplo 7.6. Toda bola aberta em Rn é homeomorfa ao espaço euclidiano Rn .

Como duas bolas abertas em Rn são homeomorfas, basta mostrar que Rn é homeomorfo à bola
aberta B(0, 1) de centro na origem 0 e raio 1.
Para isso, considere as aplicações f : Rn −→ B(0, 1) e g : B(0, 1) −→ Rn definidas por:

x y
f(x) = , portanto kf(x)k < 1 , e g(y) = .
1 + kxk 1 − kyk
Então f e g são contı́nuas,
x x/(1 + kxk)
g ◦ f(x) = g = = x,
1 + kxk 1 − kxk/(1 + kxk)
e
y y/(1 − kyk)
f ◦ g(y) = f = = y , pois 1 − kyk > 0.
1 − kyk 1 + kyk/(1 − kyk)
Logo f : Rn −→ B(0, 1) é uma bijeção contı́nua, cuja inversa é a aplicação contı́nua
g : B(0, 1) −→ Rn . Portanto, f e g são homeomorfismos.
Exemplo 7.7. Seja f : X ⊂ Rm −→ Rn uma aplicação contı́nua. Seu gráfico é o conjunto

G = Graf(f) = { (x, f(x)) | x ∈ X } ⊂ Rm × Rn = Rm+n .
Afirmação: O domı́nio X e o gráfico G da aplicação contı́nua f são homeomorfos.

Homeomorfismos
Considere a aplicação f : X −→ G, definida por f(x) = (x, f(x)).
Como f e a aplicação identidade Id : Rn −→ Rn são contı́nuas, temos, pelo corolário 6.1, que
f é uma bijeção contı́nua. Sua inversa g : G −→ X, dada por g((x, f(x))) = x, é contı́nua, pois
g = π1 |G , onde π1 : Rm × Rn −→ Rm é a projeção π1 (x, y) = x.
• Em particular, R − {0} é homeomorfo à hipérbole

H = {(x, y) ∈ R2 | xy = 1} = x, x1 | x ∈ R − {0} ,

1
pois H é o gráfico da função contı́nua f : R − {0} −→ R dada por f(x) = .
x
• Também, usando o resultado acima, podemos provar que o hemisfério norte

Sm
+ = x ∈ Rm+1 | kxk = 1 e xm+1 > 0
da esfera m−dimensional é homeomorfo à bola aberta B(0, 1) = { x ∈ Rm | kxk < 1 } ⊂ Rm .
+ = { (x, 1 − kxk2 ) | x ∈ B(0, 1) } e, portanto, Sm

p
De fato, Sm + é o gráfico da aplicação contı́nua
p
f : B(0, 1) ⊂ Rm −→ R dada por f(x) = 1 − kxk2 .
Exemplo 7.8. (Projeção estereográfica)

Seja Sm = { x ∈ Rm+1 | hx, xi = 1 } a esfera m−dimensional de centro na origem e raio 1 e
p = (0, . . . , 0, 1) ∈ Sm seu pólo norte.
A projeção estereográfica é a aplicação ϕ : Sm − {p} −→ Rm , onde ϕ(x) é o ponto em que a

semi-reta −p→x ⊂ Rm+1 corta o hiperplano xm+1 = 0, o qual identificamos com Rm .
Fig. 5: Projeção estereográfica
Como −p→x = { (1 − t)p + tx | t > 0 } = { p + t(x − p) | t > 0 }, temos que um ponto y = (1 − t)p + tx ∈
−→
p x pertence ao hiperplano Rm × {0} ⊂ Rm+1 se, e só se,
Análise
ym+1 = πm+1 (p + t(x − p)) = pm+1 + t(xm+1 − pm+1 ) = 1 + t(xm+1 − 1) = 0 .
p→
1
Logo y = (1 − t)p + tx ∈ −x ∩ (Rm × {0}) se, e somente se, t = e, portanto,
1 − xm+1
x0
ϕ(x) = ϕ(x1 , . . . , xm , xm+1 ) = , sendo x 0 = (x1 , . . . , xm ) .
1 − xm+1
Assim, ϕ : Sm − {p} −→ Rm é uma aplicação contı́nua.
Seja agora a aplicação ξ : Rm −→ Sm − {p} definida pelo processo inverso, ou seja, ξ(x) é a
−−→
intersecção de Sm − {p} com a semi-reta p x? , onde x? = (x, 0).
Então ξ(x) = p + t(x? − p), onde t > 0 e kp + t(x? − p)k = 1. Assim,

k(tx1 , . . . , txm , (1 − t))k2 = 1 ⇐⇒ t2 (x21 + . . . + x2m ) + 1 − 2t + t2 = 1
2
⇐⇒ t2 (1 + kxk2 ) − 2t + 1 = 1 ⇐⇒ t((1 + kxk2 )t − 2) = 0 ⇐⇒ t = 0 ou t = .
1 + kxk2

2 2x kxk2 − 1
Logo t = 2
e ξ(x) = 2
, 2
.
1 + kxk 1 + kxk 1 + kxk
Como ξ : Rm −→ Sm − {p} é contı́nua,
2x 1
ϕ ◦ ξ(x) = · = x,
1 + kxk2 kxk2 − 1
1−
kxk2 + 1
e
2x 0 1 + xm+1
 
−1
x0  1 − xm+1 1 − xm+1
ξ ◦ ϕ(x) = ξ = ,  = (x 0 , xm+1 ) = x ,

1 − xm+1 1 + xm+1 1 + xm+1
1+ +1
1 − xm+1 1 − xm+1
pois, 2
x0
= kx 0 k2 1 − x2m+1 1 + xm+1

1 − xm+1 2
= 2
= ,
(1 − xm+1 ) (1 − xm+1 ) 1 − xm+1
temos que ξ é a inversa de ϕ, e, portanto, ϕ : Sm − {p} −→ Rm é um homeomorfismo.
8 Limites
Definição 8.1. Sejam a aplicação f : X ⊂ Rm −→ Rn e a ∈ X 0 . Dizemos que b ∈ Rn é o limite

de f(x) quando x tende para a, e escrevemos
b = lim f(x) ,
x→a
se, para todo ε > 0 dado, podemos obter δ > 0 tal que
x ∈ X , 0 < kx − ak < δ =⇒ kf(x) − bk < ε .
Ou seja, f( X ∩ (B(a, δ) − {a} ) ⊂ B(b, ε).

Limites
Observação 8.1. Para que tenha sentido a existência do limite b = x→a

lim f(x), não é necessário
que a pertença a X, ou seja, que f esteja definida no ponto a, e mesmo que a ∈ X, o valor f(a)
não desempenha papel algum na definição de limite. Importam apenas os valores f(x) para x
próximo, porém diferente de a.
Observação 8.2. (Unicidade do limite)

Se a ∈ X 0 , lim f(x) = b e lim f(x) = c, então b = c .
x→a x→a
De fato, dado ε > 0, existe δ > 0 tal que

ε ε
x ∈ X e 0 < kx − ak < δ =⇒ kf(x) − bk < e kf(x) − ck < .
2 2
Como a ∈ X 0 , existe xδ ∈ X tal que 0 < kxδ − ak < δ .
Logo,
kb − ck ≤ kf(xδ ) − ck + kb − f(xδ )k < ε ,
para todo ε > 0. Assim, b = c.
Observação 8.3. A continuidade se exprime em termos de limite.

Se a ∈ X é um ponto isolado de X, então toda aplicação f : X ⊂ Rm −→ Rn é contı́nua no ponto
a.
Mas, se a ∈ X ∩ X 0 , f : X ⊂ Rm −→ Rn é contı́nua no ponto a se, e só se, f(a) = lim f(x).

x→a
lim f(x) = b ⇐⇒ para toda sequência (xk ) de pontos de X − {a} com

Observação 8.4. x→a
lim xk = a , tem-se lim f(xk ) = b.
k→∞ k→∞
Este resultado prova-se de modo análogo ao teorema 6.3.
Teorema 8.1. Existe lim f(x) ⇐⇒ para toda sequência (xk ) de pontos de X − {a} com
x→a
lim xk = a , existe lim f(xk ) .
k→∞ k→∞
Prova.
Pela observação anterior, basta mostrar que se (xk ) e (yk ) são duas sequências em X − {a}
com lim xk = lim yk = a, então lim f(xk ) = lim f(yk ).
Sejam b = lim f(xk ) e c = lim f(yk ).
Consideremos a sequência (zk )k∈N = (x1 , y1 , x2 , y2 , . . . , xn , yn , . . .), ou seja, z2k−1 = xk e

z2k = yk , k = 1, . . . , n, . . ..
Como lim z2k = lim z2k−1 = a, temos que lim zk = a. Logo, pela hipótese, a sequência (f(zk )) é
convergente. Assim, b = c, pois lim f(z2k−1 ) = b e lim f(z2k ) = c.
Análise
Observação 8.5. No caso em que f : X ⊂ R −→ R é uma função real de variável real e

a ∈ X−0 (ou a ∈ X+0 ) podemos provar que o lim− f(x) (respectivamente, lim+ f(x)) existe se, e
x→a x→a
somente se, para toda sequência (xk ) crescente (respectivamente, decrescente) de pontos de
X − {a} com lim xk = a , o limite lim f(xk ) existe.
k→∞
Observação 8.6. Sejam a ∈ X 0 ⊂ Rm e f : X −→ Rn uma aplicação cujas funções coordena-

das são f1 , . . . , fn : X −→ R. Então, lim f(x) = b = (b1 , . . . , bn ) se, e somente se, lim fi (x) = bi ,
x→a x→a
i = 1, . . . , n.
A demonstração se faz de modo análogo ao teorema 6.2.
Observação 8.7. Sejam X ⊂ Rm , a ∈ X 0 , b, c ∈ Rn , f, g : X −→ Rn e λ : X −→ R tais que

lim f(x) = b, lim g(x) = c e lim λ(x) = λ0 . Então:
x→a x→a x→a
(1) lim (f(x) + g(x)) = b + c ;

x→a
(2) lim λ(x) f(x) = λ0 b ;

x→a
(3) lim hf(x), g(x)i = hb, ci ;

x→a
As afirmações decorrem do corolário 4.1 e da caracterização de limite por meio de sequências

(ver observação 8.4).
Observação 8.8. Seja ϕ : Rn × Rp −→ Rq uma aplicação bilinear. Se f : X ⊂ Rm −→ Rn e

g : X −→ Rp são aplicações com lim f(x) = 0, a ∈ X 0 , e g é limitada, então lim ϕ(f(x), g(x)) = 0.
x→a x→a
De fato, basta observar que

kϕ(f(x), g(x))k ≤ M kf(x)k kg(x)k ,
para todo x ∈ X, onde M é uma constante positiva que depende apenas da aplicação bilinear ϕ
e das normas consideradas em Rn , Rp e Rq .
• Como caso particular, temos que lim hf(x), g(x)i = 0 e lim α(x) f(x) = 0 se um dos fatores é
x→a x→a
limitado e o outro tende para zero.
x2 y
Exemplo 8.1. Se f : R2 − {0} −→ R é a função f(x, y) = , então lim f(x, y) = 0.
x2 + y2 (x,y)−→(0,0)
xy
De fato, a função f(x, y) é o produto de x por , sendo lim x = 0 e a aplicação
x2 + y2 (x,y)−→(0,0)
xy
(x, y) 7−→ limitada, pois, para (x, y) 6= (0, 0),
x2 + y2
|xy| 2 |x| |y| x 2 + y2
≤ ≤ = 1.
x 2 + y2 x2 + y2 x2 + y2

Limites
Observação 8.9. (Relação de limite e composição de aplicações)

Sejam f : X −→ Rm , g : Y −→ Rp , a ∈ X 0 , b ∈ Y 0 e f(X) ⊂ Y. Então:
(1) Se lim f(x) = b, lim g(y) = c e x 6= a =⇒ f(x) 6= b, então lim (g ◦ f) (x) = c.

x→a y→b x→a
De fato, dado ε > 0, existe µ > 0 tal que

y ∈ Y e 0 < ky − bk < µ =⇒ kg(y) − ck < ε .
Como lim f(x) = b e x 6= a =⇒ f(x) 6= b, existe δ > 0 tal que

x→a
x ∈ X e 0 < kx − ak < δ =⇒ 0 < kf(x) − bk < µ.
Logo x ∈ X e 0 < kx − ak < δ =⇒ kg(f(x)) − ck < ε.
(2) Se lim f(x) = b e g é contı́nua no ponto b, então lim g(f(x)) = g(b).

x→a x→a
A demonstração se faz de modo análogo ao resultado anterior.
• Como consequência de (2), temos que se lim f(x) = b então lim kf(x)k = kbk, pois a função
x→a x→a
norma k k : Rn −→ R é contı́nua.
• E como consequência de (1), temos que se lim f(x) = b, então lim f(a+tu) = b, para qualquer
x→a t→0
vetor u 6= 0.
xy
Segue daı́ que não existe lim , pois, para u = (α, β) , o valor do limite
(x,y)→(0,0) x2 + y2
αβ
lim f(tα, tβ) = , que varia com α e β .
t→0 α2 + β2
Observação 8.10. Sejam f, g : X ⊂ Rm −→ R, a ∈ X 0 , tais que f(x) ≤ g(x) para todo

x ∈ X − {a}. Se lim f(x) = b e lim g(x) = c, então b ≤ c.
x→a x→a
b−c
De fato, suponhamos que b > c e seja ε = > 0.
2
Então existe δ > 0 tal que x ∈ X e 0 < kx − ak < δ =⇒ f(x) ∈ (b − ε, b + ε) e g(x) ∈ (c − ε, c + ε).
Como b − ε = c + ε, temos que g(x) < f(x) para todo x ∈ {x ∈ X | 0 < kx − ak < δ} 6= ∅, pois
a ∈ X 0 , uma contradição.
Observação 8.11. Se f : X ⊂ Rm −→ Rn é uma aplicação uniformemente contı́nua e (xk ) é

uma sequência de Cauchy de pontos de X, então (f(xk )) é uma sequência de Cauchy.
De fato, dado ε > 0, existe δ > 0 tal que x, y ∈ X e kx − yk < δ =⇒ kf(x) − f(y)k < ε.
Como (xk ) é de Cauchy, existe k0 ∈ N tal que kxk − x` k < δ para k, ` ≥ k0 .
Logo kf(xk ) − f(x` )k < ε para k, ` ≥ k0 .
Análise
Teorema 8.2. Seja f : X ⊂ Rm −→ Rn uma aplicação uniformemente contı́nua. Então, para

todo a ∈ X 0 , existe lim f(x).
x→a
Prova.
Seja (xk ) uma sequência de pontos de X − {a}, com lim xk = a. Como (xk ) é uma sequência de
Cauchy e f é uniformemente contı́nua, então (f(xk )) é uma sequência de Cauchy e é, portanto,
convergente. Então, pelo teorema 8.1, existe lim f(x).
x→a
xy
Observação 8.12. A função contı́nua f : R2 − {(0, 0)} −→ R definida por f(x, y) = não
x2 + y2
é uniformemente contı́nua em qualquer conjunto X ⊂ R2 − {(0, 0)} do qual (0, 0) seja um ponto
de acumulação, pois não existe lim f(x, y).
(x,y)→(0,0)
Corolário 8.1. Seja f : X ⊂ Rm −→ Rn uma aplicação uniformemente contı́nua e seja

X = X ∪ X 0 . Então existe uma única aplicação uniformemente contı́nua f : X −→ Rn tal que
fX = f.
Isto é, toda aplicação uniformemente contı́nua definida em X se estende de modo único a
uma aplicação uniformemente contı́nua em X = X ∪ X 0 .
Prova.
Para cada x ∈ X 0 − X, faça f(x) = lim f(x), o qual existe pelo teorema anterior. E se x ∈ X,
x→x
faça f(x) = f(x).
Então f : X −→ Rn , assim definida, é uma aplicação que estende f.
Observe que se x ∈ X 0 ∩ X, então f(x) = f(x) = lim f(x). Ou seja, f(x) = lim f(x), para todo
x→x x→x
x ∈ X 0.
Afirmação: f : X −→ Rn é uniformemente contı́nua.

ε
Dado ε > 0, existe δ > 0 tal que x, y ∈ X e kx − yk < δ =⇒ kf(x) − f(y)k < .
3
Sejam x, y ∈ X tais que kx − yk < δ. Como X = X ∪ X 0 , lim f(x) = f(x), se x ∈ X 0 , e lim f(x) =
x→x x→y
δ − kx − yk
f(y), se y ∈ X 0 , existem 0 < δ0 < e x, y ∈ X tais que
2
ε ε
kx − xk < δ0 , ky − yk < δ0 , kf(x) − f(x)k < e kf(y) − f(y)k <
3 3
(Se x ∈ X, basta tomar x = x, e se y ∈ X, basta tomar y = y).
Logo,
kx − yk ≤ kx − xk + kx − yk + ky − yk < δ0 + δ0 + |kx − yk < δ − kx − yk + kx − yk = δ ,
e, portanto,

Conjuntos abertos
ε ε ε
kf(x) − f(y)k ≤ kf(x) − f(x)k + kf(x) − f(y)k + kf(y) − f(y)k < + + = ε.
3 3 3
Assim, se x, y ∈ X , kx − yk < δ =⇒ kf(x) − f(y)k < ε.
Unicidade: Seja g : X −→ Rn uniformemente contı́nua tal que g|X = f.
Então, se x ∈ X, g(x) = f(x) = f(x). E se x ∈ X 0 − X, seja (xk ) uma sequência de pontos de X

com lim xk = x.
Logo g(x) = lim g(xk ) = lim f(xk ) = lim f(x) = f(x) .

k→∞ k→∞ x→x
9 Conjuntos abertos
Definição 9.1. Seja X ⊂ Rn . Um ponto a ∈ X é um ponto interior a X se existe δ > 0 tal que
B(a, δ) ⊂ X.
Observação 9.1. A definição de ponto interior independe da norma considerada em Rn .
Definição 9.2. O interior de X é o conjunto int X formado pelos pontos interiores a X.
Observação 9.2. int X ⊂ X
Definição 9.3. Dizemos que um conjunto V é uma vizinhança do ponto a quando a ∈ int V.
Definição 9.4. Um conjunto X ⊂ Rn é aberto quando todos os seus pontos são pontos interi-
ores a X, ou seja, quando para todo a ∈ X existe δ > 0 tal que B(a, δ) ⊂ X.
Assim, X é aberto ⇐⇒ int X = X.
Observação 9.3. Toda bola aberta B(a, r) é um conjunto aberto de Rn .

De fato, seja b ∈ B(a, r), ou seja, kb − ak < r. Então δ = r − kb − ak > 0 e B(b, δ) ⊂ B(a, r),
pois se kx − bk < δ =⇒ kx − ak ≤ kx − bk + kb − ak < δ + kb − ak = r.
Observação 9.4. O complementar Rn − B[a, r] de uma bola fechada é um conjunto aberto

em Rn .
De fato, dado b ∈ Rn − B[a, r], então kb − ak > r. Seja δ = kb − ak − r > 0.
Então B(b, δ) ⊂ Rn −B[a, r], pois se kx−bk < δ =⇒ kb−ak ≤ kb−xk+kx−ak < δ+kx−ak =⇒
kx − ak > kb − ak − δ = r.
Análise
Observação 9.5. Para todo X ⊂ Rn , int X é um conjunto aberto.

De fato, se a ∈ int X, existe r > 0 tal que B(a, r) ⊂ X. Seja x ∈ B(a, r).
Então, pondo δ = r − kx − ak > 0, temos que B(x, δ) ⊂ B(a, r) ⊂ X.
Logo, se x ∈ B(a, r) então x ∈ int X, ou seja, B(a, r) ⊂ int X, o que prova que int X é aberto.
Observação 9.6. Se X ⊂ Y então int X ⊂ int Y.

De fato, se x0 ∈ int X, existe r > 0 tal que B(x0 , r) ⊂ X. Logo B(x0 , r) ⊂ Y e, portanto, x0 ∈ int Y.
• Com isso, podemos provar a observação 9.5 da seguinte maneira:
Seja x0 ∈ int X. Então existe r > 0 tal que B(x0 , r) ⊂ X.
Logo, pelo provado acima, int(B(x0 , r)) ⊂ int X, e, portanto, B(x0 , r) ⊂ int X, pois B(x0 , r) é um
conjunto aberto.
Observação 9.7. Uma bola fechada B[a, r] ⊂ Rn não é um conjunto aberto.

De fato, seja x0 ∈ S[a, r]. Então, existe u ∈ Rn vetor unitário (de norma 1) tal que x0 = a + ru.
ε

Seja ε > 0 e tome x = a + r + u.
2
ε ε
Então kx − x0 k = ka + ru − a − (r + ε/2)uk = < ε e kx − ak = r + > r , ou seja, x ∈ B(x0 , ε),
2 2
mas x 6∈ B[a, r]. Ou seja, se x0 ∈ S[a, r] então x0 6∈ int B[a, r].
Portanto, int B[a, r] = B(a, r), uma vez que B(a, r) = int B(a, r) ⊂ int B[a, r].
Definição 9.5. Sejam X ⊂ Rn e a ∈ Rn . Dizemos que a é ponto fronteira de X se, para todo
r > 0, B(a, r) ∩ X 6= ∅ e B(a, r) ∩ (Rn − X) 6= ∅.
O conjunto ∂X formado pelos pontos fronteira de X é chamado fronteira de X.
Observação 9.8. ∂X = ∂(Rn − X).
Observação 9.9. Dados X ⊂ Rn e a ∈ X, há três possibilidades que se excluem mutuamente:

a ∈ int X , ou x ∈ int(Rn − X) ou x ∈ ∂X .
Ou seja,
Rn = int X ∪ int(Rn − X) ∪ ∂X ,
sendo int X, int(Rn − X) e ∂X dois a dois disjuntos.
Exemplo 9.1. Como Rn − B[a, r] é aberto e int B[a, r] = B(a, r), temos que ∂B[a, r] = S[a, r].

Conjuntos abertos
Exemplo 9.2. Como Rn − B[a, r] é aberto e Rn − B[a, r] ⊂ Rn − B(a, r), temos que
Rn − B[a, r] ⊂ int(Rn − B(a, r)). Logo,
∂B(a, r) = Rn − (int B(a, r) ∪ int(Rn − B(a, r))) = Rn − (B(a, r) ∪ int(Rn − B(a, r))) ⊂ S[a, r] .
E se x ∈ S[a, r], ou seja, x = a + ru, kuk = 1, então, para todo 0 < ε < r,
x ∈ B(x, ε) ∩ (Rn − B(a, r)) e y = a + (r − ε/2)u ∈ B(x, ε) ∩ B(a, r),
ε ε
pois ky − xk = < ε e ky − ak = r − < r. Logo, S[a, r] ⊂ ∂B(a, r). Assim, ∂B(a, r) = S[a, r].
2 2
Observação 9.10. Um conjunto A ⊂ Rn é aberto se, e só se, nenhum de seus pontos é
ponto fronteira de A, ou seja, se, e só se, A ∩ ∂A = ∅.
Teorema 9.1. Os conjuntos abertos do espaço euclidiano Rn possuem as seguintes proprie-

dades:
(1) ∅ e Rn são conjuntos abertos;
(2) A intersecção A = A1 ∩ . . . ∩ Ak de um número finito de conjuntos abertos A1 , . . . , Ak é um

conjunto aberto.
S
(3) A reunião A = λ∈L Aλ de uma famı́lia qualquer (Aλ )λ∈L de conjuntos abertos Aλ é um
conjunto aberto.
Prova.
(1) Rn é obviamente aberto, e ∅ é aberto, pois um conjunto só pode deixar de ser aberto se
contiver algum ponto que não seja interior.
(2) Seja a ∈ A = A1 ∩ . . . ∩ Ak , ou seja, a ∈ Ai , para todo i = 1, . . . , k. Como cada Ai é aberto,

existe δi > 0 tal que B(a, δi ) ⊂ Ai . Seja δ = min{δ1 , . . . , δk } > 0. Então B(a, δ) ⊂ Ai para todo
i = 1, . . . , k e, portanto, B(a, δ) ⊂ A. Logo A é aberto.
S
(3) Seja a ∈ A = λ∈L Aλ . Então existe λ0 ∈ L tal que a ∈ Aλ0 . Como Aλ0 é aberto, existe δ > 0
tal que B(a, δ) ⊂ Aλ0 ⊂ A. Logo A é aberto.
Definição 9.6. Seja X ⊂ Rn . Dizemos que A ⊂ X é aberto em X quando, para cada a ∈ A,

existe δ > 0 tal que B(a, δ) ∩ X ⊂ A.
Observação 9.11. Um conjunto A ⊂ X é aberto em X se, e só se, existe um aberto B ⊂ Rn

tal que A = B ∩ X.
[
De fato, para cada a ∈ A, existe δa > 0 tal que B(a, δa ) ∩ X ⊂ A. Tome B = B(a, δa ).
a∈A
n
Então B é aberto em R e B ∩ X = A.
Análise
Reciprocamente, se A = B ∩ X, onde B é aberto em Rn , dado a ∈ A = B ∩ X, existe δ > 0 tal

que B(a, δ) ⊂ B. Logo B(a, δ) ∩ X ⊂ B ∩ X = A. Portanto, A é aberto em X.
Observação 9.12. Se X ⊂ Rn é aberto, então A ⊂ X é aberto em X se, e só se, A é aberto

em Rn .
De fato, se A é aberto em X, existe B aberto em Rn tal que A = X ∩ B. Como X e B são abertos

em Rn , temos que A também é aberto em Rn .
Reciprocamente, se A é aberto em Rn , então A = A ∩ X é aberto em X.
Exemplo 9.3. A = (0, 1] é aberto em X = [0, 1], pois A = (0, 2) ∩ [0, 1], onde (0, 2) é aberto em
R.
Observação 9.13. Um resultado análogo ao do teorema 9.1 vale para os abertos em X:

(1) ∅ e X são abertos em X, pois ∅ = ∅ ∩ X e X = Rn ∩ X, com ∅ e X abertos em Rn .
(2) Uma intersecção finita A = A1 ∩ . . . ∩ Ak de conjuntos A1 , . . . , Ak abertos em X é um conjunto

aberto em X, pois, para cada Ai , i = 1, . . . , k, existe Bi aberto em Rn tal que Ai = Bi ∩ X. Então
A = (B1 ∩ X) ∩ . . . ∩ (Bk ∩ X) = (B1 ∩ . . . ∩ Bk ) ∩ X, onde B1 ∩ . . . ∩ Bk é aberto em Rn . Logo
A = A1 ∩ . . . ∩ Ak é aberto em X.
S
(3) Uma reunião A = λ∈L Aλ de abertos Aλ em X é um conjunto aberto em X, pois para cada

Aλ , λ ∈ L, existe Bλ aberto em Rn tal que Aλ = Bλ ∩ X. Então A = λ∈L (Bλ ∩ X) =
S S
λ∈L B λ ∩ X,
n
S S
onde λ∈L Bλ é aberto em R . Logo A = λ∈L Aλ é aberto em X.
Teorema 9.2. Uma aplicação f : X ⊂ Rm −→ Rn é contı́nua se, e só se, a imagem inversa
f−1 (A), de todo aberto A ⊂ Rn , é um aberto em X.
Prova.
(=⇒) Seja x0 ∈ f−1 (A). Então f(x0 ) ∈ A. Como A é aberto em Rn , existe ε > 0 tal que
B(f(x0 ), ε) ⊂ A, ou seja, ky − f(x0 )k < ε =⇒ y ∈ A.
Sendo f contı́nua no ponto x0 ∈ X, existe δ > 0 tal que x ∈ X, kx − x0 k < δ =⇒ kf(x) − f(x0 )k < ε.
Logo f(X ∩ B(x0 , δ)) ⊂ B(f(x0 ), ε) ⊂ A, e, portanto, X ∩ B(x0 , δ) ⊂ f−1 (A). Provamos, assim, que
f−1 (A) é aberto em X.
(⇐=) Seja x0 ∈ X e seja ε > 0. Então, como por hipótese, f−1 (B(f(x0 ), ε)) é aberto em X,
existe δ > 0 tal que B(x0 , δ) ∩ X ⊂ f−1 (B(f(x0 ), ε). Logo, se x ∈ X e kx − x0 k < δ =⇒
f(x) ∈ B(f(x0 ), ε) =⇒ kf(x) − f(x0 )k < ε, ou seja, f é contı́nua no ponto x0 ∈ X. Como x0 ∈ X é
arbitrário, f é contı́nua.

Conjuntos abertos
Observação 9.14. Uma aplicação f : X ⊂ Rm −→ Y ⊂ Rn é contı́nua se, e só se, para todo
conjunto A ⊂ Y aberto em Y, f−1 (A) é aberto em X.
De fato, se A ⊂ Y é aberto em Y, existe B aberto em Rn tal que A = B∩Y. Como f−1 (A) = f−1 (B)
e f é contı́nua, temos, pelo teorema anterior que f−1 (B) = f−1 (A) é aberto em X. Reciproca-
mente, se A é aberto em Rn , então A ∩ Y é aberto em Y. Logo, por hipótese, f−1 (A ∩ Y) = f−1 (A)
é aberto em X. Assim, pelo teorema anterior, f é contı́nua.
Observação 9.15. Se f : Rn −→ R é uma função contı́nua, então, para todo a ∈ R,

f−1 ((−∞, a)) = {x ∈ Rn | f(x) < a} é aberto em Rn , pois (−∞, a) é aberto em R.
Mais geralmente, se f1 , . . . , fk : X ⊂ Rn −→ R são funções contı́nuas, então

1 ((−∞, a1 )) ∩ f2 ((−∞, a2 )) ∩ . . . ∩ fk ((−∞, ak )) = { x ∈ X | f1 (x) < a1 , f2 (x) < a2 , . . . , fk (x) < ak }
f−1 −1 −1
é um conjunto aberto em X, pois cada conjunto f−1

i ( (−∞, ai ) ), i = 1, . . . , k, é aberto em X.
Com isso, podemos provar novamente que a bola aberta B(a, r) é um conjunto aberto de Rn ,
pois
B(a, r) = {x ∈ Rn | kx − ak < r} = { x ∈ Rn | f(x) < r } ,
onde f : Rn −→ R é a função contı́nua dada por f(x) = kx − ak .
Observação 9.16. Se A1 ⊂ Rn1 , . . . , Ak ⊂ Rnk são abertos, então o produto cartesiano

A1 × . . . × Ak ⊂ Rn1 × . . . × Rnk é aberto.
De fato, considerando as projeções πi : Rn1 × . . . × Rnk −→ Rni , i = 1, . . . , k, que são aplicações

contı́nuas, temos que
π−1
i (Ai ) = R
n1
× . . . × Rni−1 × Ai × Rni+1 × . . . × Rnk , i = 1, . . . , k
são conjuntos abertos. Logo,

A1 × . . . × Ak = π−1 −1
1 (A1 ) ∩ . . . ∩ πk (Ak )
é um conjunto aberto.
Definição 9.7. Dados X ⊂ Rm , Y ⊂ Rn , dizemos que f : X −→ Y é uma aplicação aberta

quando para cada A ⊂ X aberto em X, sua imagem f(A) é um subconjunto aberto em Y.
Observação 9.17. As projeções πi : Rn −→ R, i = 1, . . . , n, são funções abertas.

De fato, considerando a norma do máximo em Rn , temos que se A ⊂ Rn é aberto e ai = πi (a),
a = (a1 , . . . , an ) ∈ A, existe δ > 0 tal que
BM (a, δ) = (a1 − δ, a1 + δ) × · · · × (an − δ, an + δ) ⊂ A ,
e, portanto, πi (BM (a, δ)) = (ai − δ, ai + δ) ⊂ πi (A). Logo πi (A) é aberto em R.
Análise
10 Conjuntos fechados
Definição 10.1. Seja X ⊂ Rn . Dizemos que um ponto a ∈ Rn é aderente a X quando a é

limite de uma sequência de pontos de X.
Observação 10.1. Todo ponto a ∈ X é aderente a X, pois a = lim xk , com xk = a para todo
k ∈ N. Mas um ponto a pode ser aderente a X sem pertencer a X. Neste caso, a ∈ X 0 .
Logo a é aderente a X se, e só se, a ∈ X ou a ∈ X 0 , ou seja, a ∈ X ∪ X 0 .
Observação 10.2. Um ponto a ∈ Rn é aderente a X ⇐⇒ para todo ε > 0, B(a, ε) ∩ X 6= ∅.

De fato, se a ∈ Rn é aderente a X, existe uma sequência (xk ) de pontos de X tal que lim xk = a.
Então, dado ε > 0, existe k0 ∈ N tal que kxk − ak < ε para todo k > k0 , ou seja xk ∈ B(a, ε) ∩ X
para todo k > k0 . Logo B(a, ε) ∩ X 6= ∅.
1
Reciprocamente, para todo k ∈ N, temos, por hipótese, que existe xk ∈ B a, ∩ X, ou seja,
k
1
existe xk ∈ X com kxk − ak < .
k
Logo (xk ) é uma sequência de pontos de X que converge para a. Portanto, a é aderente a X.
Definição 10.2. O fecho de X é o conjunto X formado pelos pontos aderentes a X.
Observação 10.3. X = X ∪ X 0 (ver observação 10.1).
Observação 10.4. b 6∈ X ⇐⇒ ∃ δ > 0 ; B(b, δ) ∩ X = ∅ ⇐⇒ ∃ δ > 0 ; B(b, δ) ⊂ Rn − X ⇐⇒

b ∈ int(Rn − X).
Como Rn = int X ∪ int(Rn − X) ∪ ∂X (união disjunta), temos que X = int X ∪ ∂X.
• Em particular
B(a, r) = int B(a, r) ∪ ∂B(a, r) = B(a, r) ∪ S[a, r] = B[a, r]
e B[a, r] = int B[a, r] ∪ ∂B[a, r] = B(a, r) ∪ S[a, r] = B[a, r].
Ou seja, B(a, r) = B[a, r] = B[a, r] .
Exemplo 10.1. Se X = Qn , então X = Rn , pois todo número real é o limite de uma sequência
de números racionais, e, portanto, todo ponto (a1 , . . . , an ) ∈ Rn é o limite de uma sequência de
pontos de Qn .
Observação 10.5. O conceito de ponto aderente a X pode ser reformulado com abertos, em
vez de bolas:

Conjuntos fechados
• a ∈ X ⇐⇒ para todo aberto A, contendo a, tem-se A ∩ X 6= ∅.
• b 6∈ X ⇐⇒ existe um aberto A com b ∈ A e A ∩ X = ∅.
Para provar a primeira afirmação, basta observar que toda bola aberta é um conjunto aberto, e
que todo conjunto aberto A contendo a, contém também uma bola aberta de centro a.
Definição 10.3. Dizemos que um conjunto X ⊂ Rn é fechado quando contém todos os seus
pontos aderentes, ou seja, quando X = X.
Observação 10.6. X ⊂ Rn é fechado ⇐⇒ ”se lim xk = a e xk ∈ X para todo k ∈ N =⇒

a ∈ X”.
Exemplo 10.2. Toda bola fechada B[a, r] é um conjunto fechado, pois, pela observação 10.4,
B[a, r] = B[a, r].
Ou, mais diretamente, se (xk ) é uma sequência de pontos de B[a, r] , e lim xk = b , então
kb − ak ≤ r , pois kxk − ak ≤ r para todo k ∈ N e kb − ak = lim kxk − ak.
k→∞
Observação 10.7. X ⊂ Y ⊂ Rn =⇒ X ⊂ Y .
De fato, se a ∈ X, existe uma sequência (xk ) de pontos de X tal que lim xk = a. Como X ⊂ Y,
(xk ) é uma sequência de pontos de Y com lim xk = a. Logo a ∈ Y.
Observação 10.8. Se X ⊂ Rn é limitado, então X é limitado.

De fato, como X é limitado, existe r > 0 tal que X ⊂ B[0, r]. Logo X ⊂ B[0, r] = B[0, r] e, portanto,
X é limitado.
Proposição 10.1. Seja X ⊂ Rn . Então Rn − X é aberto em Rn .
Prova.
Seja b ∈ Rn − X, ou seja, b 6∈ X. Então existe δ > 0 tal que B(b, δ) ∩ X = ∅. Seja y ∈ B(b, δ).
Como B(b, δ) é um aberto que contém y tal que B(b, δ) ∩ X = ∅, temos, pela observação 10.5,
que y 6∈ X, ou seja, y ∈ Rn − X. Logo B(b, δ) ⊂ Rn − X, provando, assim, que Rn − X é aberto.
Teorema 10.1. Um conjunto X ⊂ Rn é fechado se, e só se, Rn − X é aberto.
Prova.
(=⇒) Se X é fechado, então X = X. Logo Rn − X = Rn − X é aberto.
Análise
(⇐=) Suponhamos que Rn − X é aberto e seja a 6∈ X, ou seja, a ∈ Rn − X. Então existe δ > 0

tal que B(a, δ) ⊂ Rn − X. Logo B(a, δ) ∩ X = ∅, e, portanto, a 6∈ X. Assim, todo ponto aderente
a X deve pertencer a X. Então X é fechado.
Observação 10.9. A ⊂ Rn é aberto ⇐⇒ Rn − A é fechado.
Corolário 10.1. O fecho de todo conjunto é um conjunto fechado. Ou seja, X = X.
Teorema 10.2. Os conjuntos fechados do espaço euclidiano possuem as seguintes proprie-

dades:
(1) ∅ e Rn são conjuntos fechados;
(2) A reunião F = F1 ∪. . .∪Fk de um número finito de conjuntos fechados F1 , . . . , Fk é um conjunto

fechado;
T
(3) A intersecção F = λ∈L Fλ de uma famı́lia qualquer (Fλ )λ∈L de conjuntos fechados Fλ é um
conjunto fechado.
Prova.
(1) ∅ e Rn são conjuntos fechados, pois Rn = Rn − ∅ e ∅ = Rn − Rn são conjuntos aber-
tos.
(2) Se F1 , . . . , Fk são conjuntos fechados, então Rn − F1 , . . . , Rn − Fk são conjuntos abertos. Logo

(Rn − F1 ) ∩ . . . ∩ (Rn − Fk ) é aberto.
Assim, F = F1 ∪ . . . ∪ Fk é um conjunto fechado, pois

Rn − F = Rn − (F1 ∪ . . . ∪ Fk ) = (Rn − F1 ) ∩ . . . ∩ (Rn − Fk )
(3) Se (Fλ )λ∈L é uma famı́lia de conjuntos fechados, então (Rn −Fλ )λ∈L é uma famı́lia de conjuntos
[ \
abertos. Logo (Rn − Fλ ) é um conjunto aberto. Assim, F = Fλ é fechado, pois
λ∈L \ [ λ∈L
n n n
R −F=R − Fλ = (R − Fλ )
λ∈L λ∈L
Observaç 10.10. Seja x ∈ R . Então o conjunto unitário {x}

ão n
De fato, se y 6= x,
é fechado.
kx − yk kx − yk
B y, ∩ {x} = ∅ (pois kx − yk > kx − yk/2), ou seja, B y, ⊂ Rn − {x}. Logo,
2 2
Rn − {x} é um conjunto aberto e, portanto, {x} é um conjunto fechado.

Conjuntos fechados
Observação 10.11. Uma reunião infinita de conjuntos fechados pode ser um conjunto fe-
[
chado ou não, pois todo conjunto X ⊂ Rn é reunião de seus pontos: X = {x}. Como há
x∈X
conjuntos em Rn que não são fechados, há reuniões infinitas de conjuntos fechados que não
são fechados
Observação 10.12. Se X ⊂ Rn então a ∈ ∂X se, e só se, a ∈ X ∩ Rn − X.

Ou seja, ∂X = X ∩ Rn − X. Em particular, a fronteira de todo conjunto X ⊂ Rn é um conjunto
fechado.
Definição 10.4. Seja X ⊂ Rn . Dizemos que um conjunto F ⊂ X é fechado em X quando F

contém todos os seus pontos aderentes que pertencem a X, ou seja, quando F = F ∩ X.
Observação 10.13. F ⊂ X é fechado em X ⇐⇒ existe G ⊂ Rn fechado tal que F = G ∩ X.

De fato, se F é fechado em X então F = F ∩ X, onde G = F é fechado em Rn .
Reciprocamente, se F = G ∩ X, com G ⊂ Rn fechado, então F ⊂ G e, portanto, F ⊂ G = G. Logo

F ⊂ F ∩ X ⊂ G ∩ X = F, ou seja, F = F ∩ X.
Exemplo 10.3. O intervalo J = (0, 2] é fechado no intervalo I = (0, 3], pois J = [0, 2] ∩ (0, 3] e
[0, 2] ⊂ R é fechado. Mas J não é fechado em R.
Observação 10.14. Seja X ⊂ Rn fechado. Então F ⊂ X é fechado em X se, e só se, F é

fechado em Rn .
De fato, se F é fechado em X, existe G ⊂ Rn fechado tal que F = G ∩ X. Como G e X são

fechados em Rn , temos que F é fechado em Rn .
Reciprocamente, se F é fechado em Rn , então F é fechado em X, pois F = F ∩ X. A recı́proca é

válida para todo X ⊂ Rn .
Observação 10.15. Os conjuntos fechados em X possuem propriedades análogas às de-

monstradas no teorema 10.2 para os conjuntos fechados em Rn .:
(1) ∅ e X são fechados em X, pois ∅ = ∅ ∩ X e X = Rn ∩ X, onde ∅ e Rn são fechados em Rn .
(2) Uma reunião finita de conjuntos F1 , . . . , Fk fechados em X é um conjunto fechado em X, pois,

para cada i = 1, . . . , k , Fi = Gi ∩ X, onde Gi é fechado em Rn . Logo,
F1 ∪ . . . ∪ Fk = (G1 ∩ X) ∪ . . . ∪ (Gk ∩ X) = (G1 ∪ . . . ∪ Gk ) ∩ X ,
onde G1 ∪ . . . ∪ Gk é fechado em Rn .
Análise
\
(3) A intersecção F = Fλ de uma famı́lia arbitrária de conjuntos Fλ fechados em X é um
λ∈L
n
conjunto fechado em X, pois, para cada λ ∈ L, Fλ = Gλ ∩ X, com
! Gλ fechado em R . Logo,
\ \ \
F= Fλ = (Gλ ∩ X) = Gλ ∩ X ,
λ∈L λ∈L λ∈L
Gλ é fechado em Rn .
T
onde λ∈L
Observação 10.16. Seja F ⊂ X ⊂ Rn . Então F é fechado em X se, e só se, A = X − F, o

complementar de F em X, é aberto em X.
De fato, se F é fechado em X, então F = G ∩ X, com G fechado em Rn . Logo,

X − F = X − (G ∩ X) = X ∩ ( (Rn − G) ∪ (Rn − X) ) = X ∩ (Rn − G)
é aberto em X, pois Rn − G é aberto em Rn .
Reciprocamente, se X − F é aberto em X, X − F = A ∩ X, onde A é aberto em Rn .
Logo F = (Rn − A) ∩ X. Como Rn − A é fechado em Rn , F é fechado em X.
Teorema 10.3. Uma aplicação f : X ⊂ Rm −→ Rn é contı́nua se, e só se, a imagem inversa
f−1 (F) de todo conjunto fechado F ⊂ Rn é um conjunto fechado em X.
Prova.
(=⇒) Seja f : X −→ Rn contı́nua e seja F ⊂ Rn fechado em Rn . Então A = Rn − F é aberto
em Rn e, portanto, pelo teorema 9.2, f−1 (A) é aberto em X. Mas, como f−1 (A) = f−1 (Rn − F) =
X − f−1 (F), temos, pela observação anterior, que f−1 (F) é fechado em X.
(⇐=) Seja A ⊂ Rn aberto em Rn . Então F = Rn − A é fechado em Rn , e, por hipótese,

f−1 (F) = f−1 (Rn − A) = X − f−1 (A) é fechado em X. Logo f−1 (A) é aberto em X, e pelo teorema
9.2, f é contı́nua.
Observação 10.17. Uma aplicação f : X ⊂ Rm −→ Y ⊂ Rn é contı́nua se, e só se, para todo
F ⊂ Y fechado em Y, o conjunto f−1 (F) é fechado em X.
De fato, suponhamos f contı́nua e seja F ⊂ Y fechado em Y. Então F = F0 ∩ Y, com F0 fechado

em Rn . Como f−1 (F) = f−1 (F0 ), temos, pelo teorema 10.3, que f−1 (F) é fechado em X.
Reciprocamente, seja F0 ⊂ Rn fechado em Rn . Então F = F0 ∩ Y é fechado em Y e, por hipótese,

f−1 (F) é fechado em X. Mas, como f−1 (F0 ) = f−1 (F), temos que f−1 (F0 ) é fechado em X e,
portanto, pelo teorema 10.3, f é contı́nua.
Observação 10.18. Se f1 , . . . , fk : Rn −→ R são funções contı́nuas e a1 , . . . , ak ∈ R, então

o conjunto

Conjuntos fechados
F = {x ∈ Rn | f1 (x) ≤ a1 , . . . , fk (x) ≤ ak }
é fechado em Rn , pois F = f−1 −1

1 ((−∞, a1 ]) ∩ . . . ∩ fk ((−∞, ak ]) e (−∞, a1 ], . . . , (−∞, ak ] são
conjuntos fechados em R.
Em particular, se f : Rn −→ R é a função contı́nua dada por f(x) = kx − ak e r é um número real

positivo, então B[a, r] = f−1 ((−∞, r]) é fechado em Rn .
Observação 10.19. Se f1 , . . . , fk : Rn −→ R são funções contı́nuas e a1 , . . . , ak são números

reais, então o conjunto
F = {x ∈ Rn | f1 (x) = a1 , . . . , fk (x) = ak }
é fechado em Rn , pois
1 ({a1 }) ∩ . . . ∩ fk ({ak })
F = f−1 {a1 }, . . . , {ak }
−1
e
são fechados em R.
Em particular, se f : Rn −→ R é a função contı́nua dada por f(x) = kx−ak, então S[a, r] = f−1 ({r})
é fechado em Rn .
Observação 10.20. Se F1 ⊂ Rn1 , . . . , Fk ⊂ Rnk são conjuntos fechados, então o produto

cartesiano F1 × . . . × Fk ⊂ Rn1 × . . . × Rnk = Rn1 +...+nk é fechado.
De fato, como as projeções πi : Rn1 × . . . × Rnk −→ Rni , dadas por πi (x1 , . . . , xi , . . . , xk ) = xi ,

são contı́nuas e
π−1
i (Fi ) = R
n1
× . . . × Rni−1 × Fi × Rni+1 × . . . × Rnk , i = 1, . . . , k ,
temos que π−1

i (Fi ) é fechado para todo i = 1, . . . , k e, portanto,
F1 × . . . × Fk = π−1 −1
1 (F1 ) ∩ . . . ∩ πk (Fk )
é fechado em Rn1 +...+nk .
Observação 10.21. Se f : X ⊂ Rm −→ Rn é uma aplicação contı́nua, então seu gráfico

G = { (x, f(x)) | x ∈ X } é um subconjunto fechado de X × Rn , pois, a aplicação g : X × Rn −→ Rn
dada por g(x, y) = y − f(x) é contı́nua e
g−1 ({0}) = { (x, y) ∈ X × Rn | g(x, y) = 0 } = { (x, y) ∈ X × Rn | y = f(x) }
= { (x, f(x)) | x ∈ X } = G .
Em particular, se X ⊂ Rm é fechado, temos que G é fechado em Rm × Rn , pois X × Rn é fechado
em Rm × Rn .
Definição 10.5. Dizemos que uma aplicação f : X ⊂ Rm −→ Y ⊂ Rn é fechada quando f(F) é

fechado em Y para todo F ⊂ X fechado em X.
Análise
Exemplo 10.4. A função f : R −→ R, f(x) = ex , é contı́nua, mas não é fechada, pois

F = (−∞, 1] é fechado em R, mas f(F) = (0, 1] não é fechado em R.
Exemplo 10.5. A projeção π1 : Rm ×Rn −→ Rm não transforma necessariamente um conjunto

fechado F ⊂ Rm × Rn num conjunto fechado π1 (F) ⊂ Rm .
Por exemplo, a hipérbole H = {(x, y) ∈ R2 | xy = 1} é um subconjunto fechado de R2 , pois H é

a imagem inversa do fechado {1} ⊂ R pela função contı́nua (x, y) 7−→ xy, mas sua projeção no
eixo das abscissas π1 (H) = R − {0} não é fechada em R.
Definição 10.6. Sejam Y ⊂ X ⊂ Rn . O fecho de Y relativamente a X é o conjunto YX = Y ∩ X

dos pontos aderentes a Y que pertencem ao conjunto X.
Observação 10.22. Y ⊂ X é fechado em X se, e só se, YX = Y, ou seja, se, e só se, Y = Y∩X.
De fato, se Y = Y ∩ X, temos que Y é fechado em X, pois Y é fechado em Rn .
Reciprocamente, se Y é fechado em X, então Y = G ∩ X, G fechado em Rn . Logo Y ⊂ G e,

portanto, Y ⊂ G = G. Assim, Y ⊂ Y ∩ X ⊂ G ∩ X = Y, ou seja, Y = Y ∩ X = YX .
Definição 10.7. Sejam Y ⊂ X ⊂ Rn . Dizemos que Y é denso em X quando YX = Y ∩ X = X,

isto é, quando o fecho de Y relativamente a X é todo o conjunto X.
Observação 10.23. Y ⊂ X ⊂ Rn é denso em X ⇐⇒ X ⊂ Y ⇐⇒ todo ponto de X é limite de

uma sequência de pontos de Y ⇐⇒ toda bola aberta com centro em algum ponto de X contém
pontos de Y.
Proposição 10.2. Sejam f, g : X ⊂ Rm −→ Rn aplicações contı́nuas e Y ⊂ X um subconjunto

denso em X. Se f(y) = g(y) para todo y ∈ Y, então f(x) = g(x) para todo x ∈ X, ou seja, f = g.
Prova.
Seja x ∈ X. Então existe uma sequência (yk ) de pontos de Y tal que lim yk = x.
Logo f(x) = lim f(yk ) = lim g(yk ) = g(x).
Proposição 10.3. Todo subconjunto X ⊂ Rn contém um subconjunto enumerável E denso

em X.
Prova.
A coleção B das bolas abertas B(q, r) com centro num ponto q ∈ Qn e raio r > 0 racional,
com B(q, r) ∩ X 6= ∅, é enumerável. Seja B = {B1 , . . . , Bk , . . .} uma enumeração de B.

Conjuntos Compactos
Para cada i ∈ N, escolhemos um ponto xi ∈ Bi ∩ X. O conjunto E dos pontos xi , assim obtidos,

é um subconjunto enumerável de X.
Para mostrar que E é denso em X, basta verificar que B(x0 , ε) ∩ E 6= ∅ para todo x0 ∈ X e para
todo ε > 0.
ε
Seja r > 0, r ∈ Q, tal que r < , e seja q ∈ Qn tal que kq − x0 k < r. Então x0 ∈ B(q, r) ∩ X e,
2
portanto, B(q, r) ∩ X 6= ∅, ou seja, B(q, r) = Bi , para algum i ∈ N. Existe, então, xi ∈ Bi ∩ E.
Logo kxi − x0 k ≤ kxi − qk + kq − x0 k < 2r < ε, ou seja, xi ∈ B(x0 , ε) ∩ E.
Observação 10.24. E é finito ⇐⇒ X é finito. Neste caso, E = X. De fato, se E é finito, então

E = E e, portanto, X = EX = E ∩ X = E.
Reciprocamente, se X é finito, então E é finito, pois E ⊂ X.
11 Conjuntos Compactos
Definição 11.1. Dizemos que um conjunto K ⊂ Rn é compacto quando ele é limitado e

fechado.
Exemplo 11.1. As bolas fechadas, as esferas e os conjuntos finitos de Rn são conjuntos

compactos.
Exemplo 11.2. Rn , n ≥ 1, não é compacto, pois não é limitado.
Observação 11.1. K ⊂ Rn é compacto ⇐⇒ toda sequência (xk ) de pontos de K possui uma

subsequência que converge para um ponto de K.
De fato, se K é compacto e (xk ) é uma sequência de pontos de K, então (xk ) é uma sequência
limitada, pois K é limitado.
Pelo teorema de Bolzano-Weierstrass, existe N 0 ⊂ N infinito tal que (xk )k∈N 0 converge. Mais
ainda, lim0 xk ∈ K, pois K é fechado.
k∈N
Reciprocamente, suponhamos que K não é limitado Então, para todo k ∈ N, existe xk ∈ K tal
que kxk k ≥ k. Logo (xk ) é uma sequência de pontos de K que não possui uma subsequência
convergente, pois toda subsequência de (xk ) é ilimitada, o que contradiz a hipótese.
Assim, K é limitado.
Suponhamos agora que K não é fechado.
Análise
Então existe x ∈ K−K. Como x ∈ K, existe uma sequência (xk ) de pontos de K tal que lim xk = x.
Logo, (xk ) é uma sequência de pontos de K tal que toda subsequência converge para x 6∈ K, o
que contradiz a hipótese. Assim, K é fechado.
Observação 11.2. K1 , . . . , Kp compactos em Rn =⇒ K1 ∪ . . . ∪ Kp compacto.
Observação 11.3. A intersecção de uma famı́lia qualquer de compactos Kλ ⊂ Rn , λ ∈ L, é

um conjunto compacto.
Observação 11.4. K1 ⊂ Rn1 , . . . , Kp ⊂ Rnp compactos =⇒ K1 × . . . × Kp ⊂ Rn1 × . . . × Rnp é

compacto.
De fato, K1 × . . . × Kp é fechado em Rn1 +...+np , pois cada Ki é fechado em Rni , i = 1, . . . , p.
Sendo cada Ki limitado, existe ri > 0 tal que kxkS ≤ ri para todo x ∈ Ki , i = 1, . . . , p.
Logo k(x1 , . . . , xp )kS ≤ kx1 kS + . . . + kxp kS ≤ r1 + . . . + rp para todo (x1 , . . . , xp ) ∈ K1 × . . . × Kp ,

ou seja, K1 × . . . × Kp é limitado.
Teorema 11.1. (Propriedade de Cantor)

Se K1 ⊃ K2 ⊃ . . . ⊃ Kk ⊃ . . . é uma sequência decrescente de compactos não-vazios, então a
\
intersecção Kk é um conjunto compacto não-vazio.
k∈N
Prova.
\ \
Pela observação 11.3, temos que Kk é compacto. Basta, então, mostrar que Kk 6= ∅.
k∈N k∈N
Para isso, tome xk ∈ Kk para cada k ∈ N.
Como xk ∈ K1 para todo k ∈ N, a sequência (xk )k∈N possui uma subsequência (xki )i∈N que
converge para um ponto x ∈ K1 .
Além disso, dado k ∈ N, temos que xki ∈ Kk para todo ki > k. Logo x = lim xki ∈ Kk para todo
\ i∈N
k ∈ N, ou seja, x ∈ Kk .
k∈N
Teorema 11.2. Seja f : X ⊂ Rm −→ R uma aplicação contı́nua. Se K ⊂ X é compacto então

f(K) é compacto.
Prova.
Seja (yk ) uma sequência de pontos de f(K). Então, para todo k ∈ N, existe xk ∈ K tal que
yk = f(xk ).

Conjuntos Compactos
Como (xk ) é uma sequência de pontos de K e K é compacto, (xk )k∈N possui uma subsequência
(xki )i∈N que converge para um ponto x ∈ K.
Assim, sendo f é contı́nua, temos que lim f(xki ) = f(x), ou seja, (f(xki ))i∈N é uma subsequência
i→∞
de (yk ) que converge para um ponto f(x) ∈ f(K).
Logo, pela observação 11.1, f(K) é compacto.
Observação 11.5.
• Uma aplicação contı́nua pode transformar um conjunto limitado num conjunto ilimitado.
1
Por exemplo, a função f(x) = leva o intervalo limitado (0, 1) no intervalo ilimitado (1, +∞).
x
• E, também, uma aplicação contı́nua pode transformar um conjunto fechado num conjunto que
não é fechado.
1
Por exemplo, a função f(x) = transforma R, fechado, no intervalo (0, 1) que não é fechado.
1 + x2
Corolário 11.1. (Weierstrass)

Seja K ⊂ Rn um conjunto compacto. Toda função real contı́nua f : K −→ R atinge seu valor
máximo e seu valor mı́nimo em pontos de K, isto é, existem x0 , x1 ∈ K tais que
f(x0 ) ≤ f(x) ≤ f(x1 ) para todo x ∈ K.
Prova.
Como f é contı́nua e K é compacto, f(K) é compacto em R.
Sejam m = inf{f(x) | x ∈ K} e M = sup{f(x) | x ∈ K}. Então existem sequências (xk ) e (yk ) de

pontos de K tais que f(xk ) −→ m e f(yk ) −→ M.
Como K é compacto, existem N 0 ⊂ N e N 00 ⊂ N infinitos, x0 , x1 ∈ K, tais que lim0 xk = x0 e

k∈N
lim00 yk = x1 . Então m = lim0 f(xk ) = f(x0 ) e M = lim00 f(yk ) = f(x1 ).
k∈N k∈N k∈N
Portanto, f(x0 ) ≤ f(x) ≤ f(x1 ) para todo x ∈ K.

x
Exemplo 11.3. A função contı́nua f : R −→ R dada por f(x) = , tem imagem
1 + |x|
f(R) = (−1, 1). Portanto, nenhum valor f(x) é menor nem maior do que todos os demais valores
de f. Neste exemplo, o domı́nio R é fechado mas não é limitado.
Observação 11.6. Toda aplicação contı́nua f : K ⊂ Rm −→ Rn definida num compacto K é

limitada, isto é, existe c > 0 tal que kf(x)k ≤ c para todo x ∈ K.
Observação 11.7. Se f : K ⊂ Rn −→ R é uma função contı́nua e f(x) > 0 para todo x ∈ K,

então existe c > 0 tal que f(x) ≥ c para todo x ∈ K.
Análise
Se K não é compacto, pode não existir c > 0 tal que f(x) ≥ c para todo x ∈ K.
1
Por exemplo, a função f : (0, +∞) −→ R, dada por f(x) = , é contı́nua e positiva, mas
x
f((0, +∞)) = (0, +∞).
Corolário 11.2. Toda aplicação contı́nua f : K −→ Rn definida num compacto K ⊂ Rm é

fechada, isto é, F ⊂ K fechado em K =⇒ f(F) fechado em Rn .
Prova.
Seja F ⊂ K fechado em K. Como K é fechado em Rn , temos que F é fechado em Rn . Além
disso, como K é limitado e F ⊂ K, temos que F é limitado. Portanto, F é compacto. Logo f(F) é
compacto, uma vez que f é contı́nua. Assim, f(F) é fechado em Rn .
Corolário 11.3. Toda bijeção contı́nua f : K ⊂ Rm −→ L ⊂ Rn definida num compacto K é um

homeomorfismo sobre sua imagem.
Prova.
Seja f : K −→ L uma bijeção contı́nua. Como K é compacto, f(K) = L é compacto.
Seja g = f−1 : L −→ K e seja F ⊂ K fechado em K. Então g−1 (F) = f(F) é fechado em Rn pelo
corolário 11.2 e, portanto, g−1 (F) é fechado em L. Logo, pela observação 10.17, g : L −→ K é
contı́nua e, portanto, f : K −→ L é um homeomorfismo.
Corolário 11.4. Seja f : K ⊂ Rm −→ L uma aplicação contı́nua do compacto K sobre o

conjunto (necessariamente compacto) L = f(K). Dado F ⊂ L, se sua imagem inversa f−1 (F) é
fechada, então F é fechado.
Prova.
Como f é sobrejetora e F ⊂ L, temos que f(f−1 (F)) = F. Portanto, pelo corolário 11.2, F é
fechado.
Corolário 11.5. Seja ϕ : K −→ L uma aplicação contı́nua do compacto K ⊂ Rm sobre o

compacto L ⊂ Rn . Então uma aplicação f : L −→ Rp é contı́nua se, e só se, f ◦ ϕ : K −→ Rp é
contı́nua.
Prova.
(=⇒) É evidente.
(⇐=) Suponhamos f ◦ ϕ : K −→ Rp contı́nua e seja F ⊂ Rp fechado. Então o conjunto

ϕ−1 (f−1 (F)) = (f ◦ ϕ)−1 (F) é fechado em K. Logo, pelo corolário 11.4, f−1 (F) é fechado em
L. Assim, pelo teorema 10.3, f : L −→ Rp é contı́nua.

Conjuntos Compactos
Aplicação: Seja g : [0, 2π] −→ Rn uma aplicação contı́nua com g(0) = g(2π). E seja a
aplicação f : S1 −→ Rn definida por f(eit ) = f(cos t, sen t) = g(t), que está bem definida, pois
g(0) = g(2π).
Como a aplicação ϕ : [0, 2π] −→ S1 , dada por ϕ(t) = (cos t, sen t), é contı́nua do compacto
[0, 2π] sobre o compacto S1 e f◦ϕ = g é contı́nua, temos, pelo corolário anterior, que a aplicação
f : S1 −→ Rn é contı́nua.
Teorema 11.3. Se f : X ⊂ Rm −→ Rn é contı́nua e K ⊂ X é compacto, então, para todo ε > 0,

existe δ > 0, tal que x ∈ X, y ∈ K, kx − yk < δ =⇒ kf(x) − f(y)k < ε.
Prova.
Suponhamos, por absurdo, que existe ε0 > 0 tal que para todo δ > 0 podemos obter xδ ∈ X
e yδ ∈ K tais que kxδ − yδ k < δ e kf(xδ ) − f(yδ )k > ε0 .
1
Então, para todo k ∈ N, existem xk ∈ X e yk ∈ K tais que kxk − yk k < e kf(xk ) − f(yk )k ≥ ε0 .
k
Como (yk ) é uma sequência de pontos do compacto K, existe N 0 ⊂ N infinito tal que a sub-
sequência (yk )k∈N 0 converge para um ponto x ∈ K. Logo (xk )k∈N 0 converge, também, para
x e, portanto, pela continuidade de f, lim0 kf(xk ) − f(yk )k = kf(x) − f(x)k = 0, o que é uma
k∈N
contradição, pois kf(xk ) − f(yk )k ≥ ε0 , para todo k ∈ N.
Observação 11.8. Toda aplicação contı́nua f : K −→ Rn definida num compacto K ⊂ Rm é

uniformemente contı́nua.
Teorema 11.4. Seja f : X × K −→ Rn contı́nua, onde K é compacto, e seja x0 ∈ X. Então,

para todo ε > 0, existe δ > 0, tal que x ∈ X, kx − x0 k < δ =⇒ kf(x, y) − f(x0 , y)k < ε para todo
y ∈ K.
Prova.
Suponhamos, por absurdo, que existe ε0 > 0 tal que, para todo δ > 0, podemos obter xδ ∈ X e
yδ ∈ K tais que kxδ − x0 k < δ e kf(xδ , yδ ) − f(x0 , yδ )k ≥ ε0 .
Então, para todo k ∈ N, existem xk ∈ X e yk ∈ K tais que

1
kxk − x0 k < e kf(xk , yk ) − f(x0 , yk )k ≥ ε0 .
k
Como xk −→ x0 e (yk ) possui uma subsequência (yk )k∈N 0 que converge para um ponto y0 ∈ K,
temos, pela continuidade de f, que f(xk , yk ) −→0 f(x0 , y0 ) e f(x0 , yk ) −→0 f(x0 , y0 ). Logo,
k∈N k∈N
ε0 ≤ lim0 kf(xk , yk ) − f(x0 , yk )k = 0 ,
k∈N
o que é uma contradição.
Análise
Aplicação: Seja f : X × [a, b] −→ R contı́nua.Z Definimos ϕ : X −→ R, para cada x ∈ X, por

b
ϕ(x) = f(x, t) dt .
a
Então ϕ é contı́nua em todo ponto x0 ∈ X. De fato, pelo teorema anterior, dado ε > 0, existe
ε
δ > 0, tal que x ∈ X e kx − x0 k < δ =⇒ kf(x, t) − f(x0 , t)k < para todo t ∈ [a, b]. Logo,
2(b − a)
Zb
ε ε
|ϕ(x) − ϕ(x0 )| ≤ |f(x, t) − f(x0 , t)| dt ≤ × (b − a) = < ε .
a 2(b − a) 2
Definição 11.2. Uma cobertura de um conjunto X ⊂ Rn é uma famı́lia (Cλ )λ∈L de subconjun-
[
tos Cλ ⊂ Rn tal que X ⊂ Cλ .
λ∈L
Uma subcobertura de uma cobertura (Cλ )λ∈L é uma subfamı́lia (Cλ )λ∈L 0 , L 0 ⊂ L, para a qual
[
ainda se tem X ⊂ Cλ .
λ∈L 0
[
Dizemos que a cobertura X ⊂ Cλ é
λ∈L
• aberta, quando os Cλ são todos conjuntos abertos;
• finita, se L é um conjunto finito;
• enumerável, se L é um conjunto enumerável.
Teorema 11.5. (Lindelöf)

[
Seja X ⊂ Rn . Toda cobertura aberta X ⊂ Aλ possui uma subcobertura enumerável
λ∈L
X ⊂ Aλ1 ∪ . . . ∪ Aλk ∪ . . .
Prova.
Se E = {x1 , . . . , xk , . . .} ⊂ X é um subconjunto enumerável denso em X e B é a coleção de
todas as bolas abertas B(x, r), com x ∈ E e r ∈ Q+ , tais que cada uma delas está contida em
algum Aλ , então B é um conjunto enumerável de bolas abertas.
[
Afirmação: X ⊂ B.
B∈B
Dado x ∈ X, existe λ ∈ L tal que x ∈ Aλ . Como Aλ é aberto, existe r > 0 racional tal que
B(x, 2r) ⊂ Aλ , e sendo E denso em X, existe xi ∈ E tal que kx − xi k < r, ou seja, x ∈ B(xi , r).
Se y ∈ B(xi , r), temos que ky − xi k < r =⇒ ky − xk ≤ ky − xi k + kxi − xk < 2r. Logo

y ∈ B(x, 2r) ⊂ Aλ . Ou seja, B(xi , r) ∈ B.

Conjuntos Compactos
Tomando uma enumeração {B1 , . . . , Bk , . . .} de B, e escolhendo para cada i ∈ N, um ı́ndice

[ [
λi ∈ L tal que Bi ⊂ Aλi , temos que X ⊂ Bk ⊂ Aλk .
k∈N k∈N
Teorema 11.6. (Borel-Lebesgue)

[
Seja K ⊂ Rn compacto. Então toda cobertura aberta K ⊂ Aλ possui uma subcobertura finita
λ∈L
K ⊂ A λ1 ∪ . . . ∪ A λk .
Prova.
Pelo teorema de Lindelöf, podemos obter uma subcobertura enumerável K ⊂ Aλ1 ∪. . .∪Aλk ∪. . ..
Seja Ki = K ∩ (Rn − (Aλ1 ∪ . . . ∪ Aλi ) , i ∈ N. Como Rn − (Aλ1 ∪ . . . ∪ Aλi ) é fechado e K é

compacto, temos que cada Ki é compacto. Além disso, K1 ⊃ K2 ⊃ . . . ⊃ Kk ⊃ . . . é uma
sequência decrescente, pois Rn − (Aλ1 ∪ . . . ∪ Aλi+1 ) ⊂ Rn − (Aλ1 ∪ . . . ∪ Aλi ) para todo i ∈ N.
\
Dado x ∈ K, existe i0 ∈ N tal que x ∈ Ai0 . Logo x 6∈ Kj , para todo j ≥ i0 . Portanto, Ki = ∅.
i∈N
Assim, pela propriedade de Cantor, existe j0 ∈ N tal que Kj0 = ∅, ou seja, K ⊂ Aλ1 ∪ . . . ∪ Aλj0 .
Teorema 11.7. Se toda cobertura aberta do conjunto K ⊂ Rn possui uma subcobertura finita,
então K é compacto, ou seja, K é limitado e fechado.
Prova.
As bolas abertas de raio 1 centradas em pontos de K constituem uma cobertura aberta
[
K⊂ B(x, 1), que, por hipótese, possui uma subcobertura finita K ⊂ B(x1 , 1) ∪ . . . ∪ B(xk , 1).
x∈K
Assim, K é limitado por estar contido numa reunião finita de conjuntos limitados.
[ rx
Seja x0 ∈ Rn − K. Então, para todo x ∈ K, temos que rx = kx − x0 k > 0 e K ⊂ B x, .
2
x∈K
r r

Por hipótese, existem x1 , . . . , xk ∈ K tais que K ⊂ B x1 , x1 ∪ . . . ∪ B xk , xk .
2 2

r r

Seja r = min x1 , . . . , xk > 0.
2 2
rxj
Então B(x0 , r) ⊂ R − K, pois se y ∈ B(x0 , r) ∩ K, existiria j ∈ {1, . . . , k} tal que y ∈ B xj ,
n
e,
2
portanto,
rxj
rxj = kxj − x0 k ≤ kx0 − yk + ky − xj k < r + ≤ rxj ,
2
ou seja, rxj < rxj , uma contradição.
Provamos, assim, que se x0 ∈ Rn − K, existe r > 0 tal que B(x0 , r) ⊂ Rn − K. Logo Rn − K é

aberto, e, portanto, K é fechado.
Análise
Observação 11.9. Os teoremas 11.6 e 11.7 mostram que poderı́amos ter definido um con-
[
junto compacto K pela condição de que toda cobertura aberta K ⊂ Aλ possui uma subcober-
tura finita K ⊂ Aλ1 ∪ . . . ∪ Aλk .
\
Corolário 11.6. Se o aberto U contém a intersecção K = Ki de uma sequência decres-
i∈N
cente K1 ⊃ K2 ⊃ . . . ⊃ Ki ⊃ . . . de conjuntos compactos, então existe i0 ∈ N tal que Ki0 ⊂ U.
Prova.
\ \ [
Como Ki ⊂ U, temos que Rn − U ⊂ Rn − Ki = (Rn − Ki ). Logo os abertos Ui = Rn − Ki ,
i∈N i∈N i∈N
juntamente com U, constituem uma cobertura aberta de K1 , da qual podemos extrair uma sub-
cobertura finita K1 ⊂ U ∪ Ui1 ∪ . . . ∪ Uip .
Seja i = max{i1 , . . . , ip }. Como U1 ⊂ U2 ⊂ . . . temos que Ui = Ui1 ∪ . . . ∪ Uip . Logo K1 ⊂ U ∪ Ui

e, portanto, Ki ⊂ U ∪ Ui . Mas, como Ki ∩ Ui = ∅, temos que Ki ⊂ U, como querı́amos provar.
• O nosso objetivo, agora, é demonstrar o teorema de Baire. Mas antes precisamos dar algumas
definições e provar alguns resultados preliminares.
Definição 11.3. Sejam Y ⊂ X ⊂ Rn . Dizemos que x0 ∈ Y é um ponto interior de Y em X

quando existe δ > 0 tal que B(x0 , δ) ∩ X ⊂ Y.
O interior de Y em X é o conjunto intX Y formado pelos pontos interiores de Y em X.
Observação 11.10. Y ⊂ X é aberto em X ⇐⇒ intX Y = Y.

De fato, se Y ⊂ X é aberto em X, existe A ⊂ Rn aberto tal que Y = A ∩ X. Logo, dado y0 ∈ Y,
existe δ > 0 tal que B(y0 , δ) ⊂ A, e, portanto, B(y0 , δ) ∩ X ⊂ A ∩ X = Y. Então x0 ∈ intX Y.
Reciprocamente, se intX Y = Y, dado y ∈ Y, existe δy > 0 tal que B(y, δy ) ∩ X ⊂ Y.

!
[ [
Logo Y = B(y, δy ) ∩ X, onde B(y, δy ) é um conjunto aberto de Rn . Assim, Y é aberto
y∈Y y∈Y
em X.
Definição 11.4. Dizemos que um conjunto X ⊂ Rn é completo quando toda sequência de

Cauchy (xk ) de pontos de X converge para um ponto x ∈ X.
Observação 11.11. X ⊂ Rn é completo ⇐⇒ X é fechado em Rn .
Definição 11.5. Sejam X ⊂ Y ⊂ Rn . Dizemos que X é magro em Y se existe uma sequência

[
F1 , . . . , Fk , . . . de subconjuntos de Y fechados com interior vazio em Y tal que X ⊂ Fi
i∈N

Conjuntos Compactos
Observação 11.12. Todo subconjunto de um conjunto magro em Y é também magro em Y.
Observação 11.13. Toda reunião enumerável de conjuntos magros em Y é ainda um con-

junto magro em Y.
Observação 11.14. Nem sempre um conjunto magro em Y tem interior vazio em Y.

Por exemplo, o conjunto Q dos números racionais é magro em Q, pois Q é a reunião enumerável
[
{x}, onde {x} é fechado e intQ {x} = ∅, para todo x ∈ Q. Mas, intQ Q = Q.
x∈Q
Entretanto, Q é magro em R e intR Q = ∅.
Isto ocorre apenas porque Q não é completo (fechado) em R, conforme resulta do teorema de
Baire a seguir.
Observação 11.15. O conjunto unitário {x} ⊂ Y tem interior vazio em Y se, e só se, x não é
isolado em Y.
De fato,
{x} tem interior vazio em Y ⇐⇒ x 6∈ intY {x} ⇐⇒ ∀ δ > 0 , B(x, δ) ∩ Y 6⊂ {x}
⇐⇒ ∀δ > 0 , B(x, δ) ∩ Y 6= {x} ⇐⇒ x não é isolado em Y .
Observação 11.16. Seja X ⊂ Y. Então intY X = ∅ ⇐⇒ Y − X é denso em Y.

De fato, intY X = ∅ ⇐⇒ B(x, δ) ∩ Y 6⊂ X para todo x ∈ X e δ > 0 ⇐⇒ B(y, δ) ∩ (Y − X) 6= ∅ para
todo y ∈ Y e δ > 0 ⇐⇒ Y − X é denso em Y.
Teorema 11.8. (Baire)

Seja Y ⊂ Rn fechado. Todo conjunto magro em Y tem interior vazio em Y.
[
Equivalentemente, se F = Fi , onde Fi é fechado e tem interior vazio em Y, então intY F = ∅.
i∈N
Ou então: toda interseção enumerável de abertos densos em Y é um subconjunto denso em Y.
Prova.
Sejam A1 , . . . , Ai , . . . subconjuntos abertos e densos em Y.
\
Para provar que A = Ai é denso em Y, basta mostrar que B(x, δ) ∩ A 6= ∅ para todo x ∈ Y e
i∈N
todo δ > 0.
Seja B1 = B(x, δ) a bola aberta de centro x ∈ Y e raio δ > 0.
Análise
Como A1 é aberto e denso em Y, A1 ∩ B1 é não-vazio e aberto em Y. Então existe uma bola

1
aberta B2 de raio < tal que B2 ∩ Y 6= ∅ e B2 ∩ Y ⊂ A1 ∩ B1 (=⇒ B2 ∩ Y ⊂ B1 ∩ Y).
2
Por sua vez, sendo A2 aberto e denso em Y, A2 ∩ B2 é não-vazio e aberto em Y. Logo existe
1
uma bola aberta B3 de raio < tal que B3 ∩ Y 6= ∅ e B3 ∩ Y ⊂ A2 ∩ B2 (=⇒ B3 ∩ Y ⊂ B2 ∩ Y).
3
1
Prosseguindo desta maneira, obtemos uma sequência de bolas fechadas Bi de raio ri < ,
i
i ≥ 2, tais que:
B1 ∩ Y ⊃ B2 ∩ Y ⊃ . . . ⊃ Bi ∩ Y ⊃ . . . ;
Bi+1 ∩ Y ⊂ Ai ∩ Bi e Bi ∩ Y 6= ∅ para todo i ∈ N .
\
Sendo a bola fechada um conjunto compacto, temos, pelo teorema 11.1, que (Bi ∩ Y) 6= ∅.
i∈N
1 \
Como o raio ri da bola Bi é menor do que , i ≥ 2, temos que se a, b ∈ (Bi ∩ Y), então
i
i∈N
2 \
ka − bk ≤ para todo i ≥ 2, e, portanto, (Bi ∩ Y) = {a} é um conjunto unitário.
i
i∈N
Além disso, como Bi+1 ∩ Y ⊂ Ai ∩ Bi para todo i ∈ N, temos que a ∈ Ai para todo i ∈ N, e
a ∈ B1 .
\
Logo a ∈ A = Ai e a ∈ B1 , ou seja, A ∩ B1 6= ∅, como querı́amos provar.
i∈N
[
Corolário 11.7. Seja F ⊂ Rn fechado. Se F = Fi , onde cada Fi é fechado em F (e, portanto
i∈N
em Rn ), então existe i0 ∈ N tal que intF Fi0 6= ∅.
Prova.
Se intF Fi = ∅ para todo i ∈ N, temos, pelo teorema de Baire, que intF F = ∅, o que é uma
contradição, pois intF F = F.
Corolário 11.8. Todo conjunto F ⊂ Rn fechado enumerável possui um ponto isolado.
Prova.
[
Como F = {xi }, F = {x1 , . . . , xi , . . .}, temos que F é uma reunião enumerável de conjuntos
i∈N
fechados. Então, pelo corolário 11.7, existe i0 ∈ N tal que intF {xi0 } 6= ∅.
Ou seja, xi0 é um ponto isolado de F.
Exemplo 11.4. O espaço Rn , n ≥ 1, não é enumerável.

\
Exemplo 11.5. O conjunto Q dos números racionais não é uma interseção enumerável Ai
i∈N
de conjuntos abertos da reta, pois, caso contrário, cada Ai seria denso em R. Então, o conjunto

Distância entre dois conjuntos; diâmetro de um conjunto
R−Q dos números irracionais seria uma reunião enumerável de conjuntos fechados com interior
vazio em R, ou seja, R − Q seria magro em R.
Como Q é magro em R, terı́amos que R = Q ∪ (R − Q) seria magro em R, e, pelo teorema de

Baire, teria interior vazio em R, uma contradição.
Definição 11.6. Um conjunto X ⊂ Rn é perfeito quando é fechado e todo ponto de X é ponto

de acumulação de X, ou seja, quando X é fechado e não possui pontos isolados.
Observação 11.17. X é perfeito ⇐⇒ X = X = X ∪ X 0 e X ⊂ X 0 ⇐⇒ X 0 = X.
Corolário 11.9. Todo conjunto X ⊂ Rn perfeito não-vazio é infinito não-enumerável.
Exemplo 11.6. O conjunto de Cantor K é fechado, sem pontos isolados e com interior vazio
(ver Curso de Análise, Vol. I de E. Lima). Logo K é magro e perfeito e, portanto, infinito não-
enumerável.
12 Distância entre dois conjuntos; diâmetro de um conjunto
Definição 12.1. Sejam S, T ⊂ Rn conjuntos não-vazios. Definimos a distância d(S, T ) entre S

e T por:
d(S, T ) = inf{ kx − yk | x ∈ S e y ∈ T }
• d(S, T ) = d(T, S) ;
• S ∩ T 6= ∅ =⇒ d(S, T ) = 0 ;
• S1 ⊂ S2 e T1 ⊂ T2 =⇒ d(S2 , T2 ) ≤ d(S1 , T1 ) .
Observação 12.2. A distância d(S, T ) é caracterizada pelas duas propriedades abaixo:

(1) d(S, T ) ≤ kx − yk para x ∈ S e y ∈ T arbitrários;
(2) Dado ε > 0, existem x ∈ S e y ∈ T tais que kx − yk < d(S, T ) + ε.
Um caso particular de distância entre dois conjuntos ocorre quando um deles consiste de
um único ponto.
Dados x ∈ Rn e T ⊂ Rn não-vazio, temos:

d(x, T ) = inf{ kx − yk | y ∈ T } .
Análise
• x ∈ T =⇒ d(x, T ) = 0 ;
• T1 ⊂ T2 =⇒ d(x, T2 ) ≤ d(x, T1 ) ;
• A distância d(x, T ) é caracterizada pelas propriedades:
(1) d(x, T ) ≤ kx − yk para todo y ∈ T ;
(2) Dado ε > 0, existe y ∈ T tal que kx − yk < d(x, T ) + ε.
• d(x, T ) = 0 ⇐⇒ ∀ ε > 0 , ∃ y ∈ T tal que kx − yk < ε ⇐⇒ ∀ ε > 0 , ∃y ∈ T tal que
y ∈ B(x, ε) ⇐⇒ x ∈ T .
• Em particular, se T ⊂ Rn é fechado, temos que d(x, T ) = 0 ⇐⇒ x ∈ T .
Observação 12.5. Como ∂T = T ∩ (Rn − T ), x ∈ ∂T ⇐⇒ d(x, T ) = d(x, Rn − T ) = 0.
Teorema 12.1. d(S, T ) = d(S, T ).
Prova.
Como S ⊂ S e T ⊂ T , temos que d(S, T ) ≤ d(S, T ).
Sejam x ∈ S e y ∈ T . Então existem sequências (xk ) de pontos de S e (yk ) de pontos de T tais

que lim xk = x e lim yk = y.
Como kxk − yk k −→ kx − yk e d(S, T ) ≤ kxk − yk k para todo k ∈ N, temos que d(S, T ) ≤ kx − yk.
Logo d(S, T ) é uma cota inferior do conjunto { kx−yk | x ∈ S e y ∈ T } e, portanto d(S, T ) ≤ d(S, T ).
Assim, d(S, T ) = d(S, T ).
Corolário 12.1. d(x, T ) = d(x, T ) .
Teorema 12.2. Se K ⊂ Rn é compacto e F ⊂ Rn é fechado, então existem x0 ∈ K e y0 ∈ F

tais que d(K, F) = kx0 − y0 k.
Em particular, d(K, F) = 0 se, e só se, K ∩ F 6= ∅.
Prova.
Como d(K, F) = inf{ kx − yk | x ∈ K e y ∈ F } existem sequências (xk ) de pontos de K e (yk )
de pontos de F tais que d(K, F) = lim kxk − yk k.
k→∞

Como as sequências (xk ) e (kxk − yk k) são limitadas (pois os seus termos xk pertencerem ao
compacto K e (kxk − yk k) é uma sequência convergente) resulta da desigualdade
kyk k ≤ kyk − xk k + kxk k ,
que a sequência (yk ) também é limitada. Então existe N 0 ⊂ N infinito tal que lim0 xk = x0 e
k∈N
lim0 yk = y0 .
k∈N
Sendo K e F fechados, temos que x0 ∈ K e y0 ∈ F.
Assim, d(K, F) = lim0 kxk − yk k = kx0 − y0 k .

k∈N
Corolário 12.2. Se x ∈ Rn e F ⊂ Rn é fechado, então existe y0 ∈ F tal que d(x, F) = kx − y0 k.
Corolário 12.3. Sejam K ⊂ Rn compacto e U ⊂ Rn aberto. Se K ⊂ U, existe δ > 0 tal que

x ∈ K =⇒ B(x, δ) ⊂ U, para todo x ∈ K. Em particular,
x ∈ K , y ∈ Rn , kx − yk < δ =⇒ [x, y] ⊂ U .
Prova.
Seja F = Rn − U. Como F é fechado e F ∩ K = ∅, temos, pelo Teorema 12.2, que d(F, K) = δ > 0.
Sejam x ∈ K e y ∈ B(x, δ). Então kx − yk < δ, e, portanto, y 6∈ F, ou seja, y ∈ U.
Logo B(x, δ) ⊂ U para todo x ∈ K.
Em particular, se x ∈ K e y ∈ Rn são tais que kx − yk < δ, então, para todo t ∈ [0, 1], temos:
k(1 − t)x + ty − xk = kt(x − y)k ≤ kx − yk < δ ,
ou seja, (1 − t)x + ty ∈ B(x, δ) ⊂ U para todo t ∈ [0, 1]. Logo [x, y] ⊂ U.
Corolário 12.4. Sejam S, T ⊂ Rn , com S limitado. Então, existem x0 ∈ S e y0 ∈ T tais que

d(S, T ) = kx0 − y0 k.
Prova.
Como S é compacto, T é fechado e d(S, T ) = d(S, T ), temos, pelo teorema 12.2, que existem
x0 ∈ S e y0 ∈ T tais que d(S, T ) = d(S, T ) = kx0 − y0 k.
• Em geral, dados um conjunto fechado F ⊂ Rn e um ponto x ∈ Rn , podem existir muitos
pontos de F que estão a uma distância mı́nima do ponto x. Por exemplo, se F = S[a, r], então
d(a, F) = ka − xk para todo x ∈ F.
• Mas, quando F é fechado e convexo e a norma de Rn provém de um produto interno, existe,

para cada x ∈ Rn , um único y0 ∈ F tal que d(x, F) = kx − y0 k.
Análise
x0 + y0
De fato, sejam x0 , y0 ∈ F tais que d(x, F) = kx − x0 k = kx − y0 k. Então, tomando z0 = ,
2
temos que z0 ∈ F, pois F é convexo,
e, portanto,
x x x y kx − x0 k kx − y0 k
d(x, F) ≤ kx − z0 k = + − 0 − 0 ≤ + = d(x, F) ,
2 2 2 2 2 2
ou seja,
kx − x0 k kx − y0 k
d(x, F) = kx − z0 k = + .
2 2
Como a norma considerada em Rn provém de um produto interno, temos que x − x0 e x − y0
são LD e existe λ ≥ 0 tal que x − x0 = λ(x − y0 ) . Mas, como kx − x0 k = kx − y0 k , temos que
λ = 1 e, portanto, x0 = y0
Observação 12.7. Dados dois conjuntos fechados ilimitados F, G ⊂ Rn , podemos ter

d(F, G) = 0 com F ∩ G = ∅.
De fato, basta tomar F = {(x, 0) | x ∈ R} e G= {(x,

1/x) | x > 0}, pois, como
1 1
(n, 0) − n, = −→ 0 ,

n n
temos que d(F, G) = 0, com F ∩ G = ∅, F e G fechados.
Teorema 12.3. |d(x, T ) − d(y, T )| ≤ kx − yk.
Prova.
Pelo corolário 12.2, existem x0 , y0 ∈ T tais que
d(x, T ) = d(x, T ) = kx − x0 k e d(y, T ) = d(y, T ) = ky − y0 k.
Então,
• d(x, T ) = kx − x0 k ≤ kx − y0 k ≤ kx − yk + ky − y0 k = kx − yk + d(y, T ),
ou seja, d(x, T ) − d(y, T ) ≤ kx − yk;
• d(y, T ) = ky − y0 k ≤ ky − x0 k ≤ ky − xk + kx − x0 k = ky − xk + d(x, T ),
ou seja, d(x, T ) − d(y, T ) ≥ −kx − yk.
Logo −kx − yk ≤ d(x, T ) − d(y, T ) ≤ kx − yk (⇐⇒ |d(x, T ) − d(y, T )| ≤ kx − yk).
Corolário 12.5. A função f : Rn −→ R definida por f(x) = d(x, T ) é uma contração fraca. Em
particular, f é uniformemente contı́nua.
Observação 12.8. Sejam F, G ⊂ Rn dois subconjuntos fechados, disjuntos e não-vazios. A

função de Urysohn do par (F, G) é a função f : Rn −→ R definida por:
d(x, F)
f(x) = .
d(x, F) + d(x, G)

Observe que f está bem definida, pois F ∩ G = ∅ =⇒ d(x, F) + d(x, G) > 0 para todo x ∈ Rn ,
uma vez que d(x, F) + d(x, G) = 0 ⇐⇒ d(x, G) = d(x, F) = 0 ⇐⇒ x ∈ F ∩ G.
Além disso: f é contı́nua; f(x) = 0 ⇐⇒ d(x, F) = 0 ⇐⇒ x ∈ F; f(x) = 1 ⇐⇒ d(x, G) = 0 ⇐⇒ x ∈

G.
Logo, A = f−1 ((−∞, 1/2)) e B = f−1 ((1/2, +∞)) são dois abertos disjuntos tais que F ⊂ A e
G ⊂ B.
Provamos, assim, que dados dois fechados disjuntos F, G ⊂ Rn , existem sempre dois abertos
disjuntos A, B ⊂ Rn tais que F ⊂ A e G ⊂ B.
Definição 12.2. Seja T ⊂ Rn um conjunto limitado não-vazio. O diâmetro de T é o número

real dado por:
diam(T ) = sup{ kx − yk | x, y ∈ T }
• O diâmetro de um subconjunto T ⊂ Rn é caracterizado pelas seguintes propriedades:
(1) diam(T ) ≥ kx − yk para quaisquer x, y ∈ T .
(2) Dado ε > 0, existem x, y ∈ T tais que kx − yk > diam(T ) − ε.
Observação 12.9. Existem x0 , y0 ∈ T tais que diam(T ) = kx0 − y0 k.

De fato, como diam(T ) = sup{ kx − yk | x, y ∈ T }, existem sequências (xk ), (yk ) de pontos de T
tais que lim kxk − yk k = diam T .
k→∞
Sendo T limitado, existe N 0 ⊂ N infinito tal que as subsequências (xk )k∈N 0 e (yk )k∈N 0 convergem.
Então lim0 xk = x0 ∈ T , lim0 yk = y0 ∈ T e diam(T ) = lim0 kxk − yk k = kx0 − y0 k.
k∈N k∈N k∈N
• Quando T é compacto, temos que x0 , y0 ∈ T , ou seja, o diâmetro de um conjunto compacto é

a maior distância entre dois dos seus pontos.
Observação 12.10. S ⊂ T =⇒ diam(S) ≤ diam(T ).
Observação 12.11. O diâmetro da bola fechada B[a, r] é igual a 2r.

De fato, x, y ∈ B[a, r] =⇒ kx − ak ≤ r e ky − ak ≤ r =⇒ kx − yk ≤ kx − ak + ka − yk ≤ 2r.
Logo diam(B[a, r]) ≤ 2r.
Seja u ∈ Rn com norma kuk = r. Então a + u e a − u pertencem a B[a, r] e

k(a + u) − (a − u)k = k2 uk = 2 kuk = 2r.
Logo diam(B[a, r]) ≥ 2r. Assim, diam(B[a, r]) = 2r.
Análise
Observação 12.12. T ⊂ B[a, r] =⇒ diam(T ) ≤ 2r.
Observação 12.13. Se diam(T ) = r e a ∈ T , então kx − ak ≤ r para todo x ∈ T . Logo

T ⊂ B[a, r].
Teorema 12.4. Seja T ⊂ Rn limitado e não-vazio. Então diam(T ) = diam(T ).
Prova.
Como T ⊂ T , temos que diam(T ) ≤ diam(T ).
Sejam x0 , y0 ∈ T tais que diam(T ) = kx0 − y0 k.
Então existem sequências (xk ) e (yk ) de pontos de T tais que lim xk = x0 e lim yk = y0 .
Logo diam(T ) ≥ kxk − yk k para todo k ∈ N e, portanto,

diam(T ) ≥ lim kxk − yk k = kx0 − y0 k = diam(T ) ,
ou seja, diam(T ) ≥ diam(T ). Assim, diam(T ) = diam(T ).
Teorema 12.5. Sejam K ⊂ Rm compacto, U ⊂ Rn aberto e f : K −→ U uma aplicação

contı́nua. Então existem ε, δ > 0 tais que a imagem f(T ) de qualquer subconjunto T ⊂ K com
diam(T ) < δ está contida em alguma bola aberta B ⊂ U de raio ε.
Prova.
Como f(K) é um conjunto compacto contido no aberto U, existe, pelo corolário 12.3, ε > 0
tal que B(f(x), ε) ⊂ U para todo x ∈ K.
E, pela continuidade uniforme de f, existe δ > 0 tal que x, y ∈ K, kx−yk < δ =⇒ kf(x)−f(y)k < ε.
Seja T ⊂ K um subconjunto com diam(T ) < δ e tome x0 ∈ T .
Então x ∈ T =⇒ kx − x0 k < δ =⇒ kf(x) − f(x0 )k < ε =⇒ f(x) ∈ B(f(x0 ), ε) = B .
Logo f(T ) ⊂ B ⊂ U.
Definição 12.3. Dizemos que um número δ > 0 é número de Lebesgue de uma cobertura
[
X⊂ Cλ quando todo subconjunto de X com diâmetro < δ está contido em algum Cλ .
λ∈L
Observação 12.14. Uma cobertura, mesmo aberta e finita, pode não ter número de Lebes-
gue algum.
Por exemplo, R − {0} = (−∞, 0) ∪ (0, +∞) é uma cobertura aberta e finita de R − {0}. Dado δ > 0,
o conjunto {−δ/4, δ/4} tem diâmetro < δ, mas não está contido em (0, +∞) nem em (−∞, 0).
Logo não existe número de Lebesgue para tal cobertura.

Conexidade
[
Teorema 12.6. Se K ⊂ Rn é compacto, então toda cobertura aberta K ⊂ Aλ possui um
λ∈L
número de Lebesgue.
Prova.
1
Suponhamos, por absurdo, que para todo k ∈ N, exista um subconjunto Sk ⊂ K com diam Sk <
k
que não está contido em algum Aλ .
Para cada k ∈ N, tome xk ∈ Sk . Como xk ∈ K para todo k ∈ N, existe N 0 ⊂ N infinito tal que a
subsequência (xk )k∈N 0 converge para um ponto a ∈ K.
Logo existe λ0 ∈ L tal que a ∈ Aλ0 . Seja δ > 0 tal que B(a, δ) ⊂ Aλ0 e seja k0 ∈ N 0 tal que
1 δ δ
< e kxk0 − ak < .
k0 2 2
1 δ
Então y ∈ Sk0 =⇒ ky − ak ≤ ky − xk0 k + kxk0 − ak < + < δ =⇒ y ∈ B(a, δ) =⇒ y ∈ Aλ0 .
k0 2
Assim, Sk0 ⊂ Aλ0 , o que é uma contradição.
13 Conexidade
Definição 13.1. Seja X ⊂ Rn . Uma cisão de X é uma decomposição X = A ∪ B, onde A e B

são abertos em X e A ∩ B = ∅.
Observação 13.1. Todo subconjunto X ⊂ Rn possui pelo menos a cisão trivial X = X ∪ ∅.
Exemplo 13.1. R − {0} = (−∞, 0) ∪ (0, +∞) é uma cisão não-trivial de R − {0}.
Definição 13.2. Dizemos que um conjunto X ⊂ Rn é conexo quando só admite a cisão trivial.
Ou seja, se X é conexo, X = A ∪ B, com A e B abertos disjuntos em X, então A = ∅ ou B = ∅.
Exemplo 13.2. ∅ e {x} são conjuntos conexos.
Exemplo 13.3. Todo intervalo aberto da reta é conexo (ver Teorema 13.2). Em particular, R
é conexo.
Definição 13.3. Dizemos que X é desconexo, quando existir uma cisão não-trivial X = A ∪ B.
Exemplo 13.4. R − {0} é desconexo.
Análise
Observação 13.2. Todo subconjunto discreto X ⊂ Rn com mais de um elemento, é desco-

nexo.
De fato, se x ∈ X, então {x} é aberto em X, pois existe δ > 0 tal que B(x, δ) ∩ X = {x}. Assim, todo
subconjunto de X é aberto em X, pois é reunião de seus pontos. Então, se A ⊂ X e ∅ 6= A 6= X,
X = A ∪ (X − B) é uma cisão não-trivial de X.
Observação 13.3. O conjunto Q dos números racionais não é discreto, mas X ⊂ Q é conexo
se, e só se, X possui um único elemento.
De fato, seja X ⊂ Q tal que a, b ∈ X, a < b, e seja ξ um número irracional entre a e b. Então,
X = ( (−∞, ξ) ∩ X ) ∪ ( (ξ, +∞) ∩ X )
é uma cisão não-trivial de X.
Observação 13.4. Se X = A ∪ B é uma cisão de X, então B = X − A e A = X − B, e, portanto,

A e B são, também, fechados em X.
Ou seja, se X = A ∪ B é uma cisão de X, então A e B são abertos e fechados em X. Assim:
• X = A ∪ B é uma cisão de X ⇐⇒ A e B são disjuntos e fechados em X.
• X é conexo ⇐⇒ ∅ e X são os únicos subconjuntos de X que são abertos e fechados em X,

pois se A é aberto e fechado em X e ∅ 6= A 6= X, então X = A ∪ (X − A) é uma cisão não-trivial.
Teorema 13.1. Seja f : X ⊂ Rm −→ Rn uma aplicação contı́nua. Se X é conexo, então f(X) é

conexo.
Prova.
Se A ⊂ f(X) é aberto e fechado em f(X), então f−1 (A) é aberto e fechado em X. Pela co-
nexidade de X temos que f−1 (A) = ∅ ou f−1 (A) = X, e, portanto, A = ∅ ou A = f(X).
Corolário 13.1. Todo subconjunto homeomorfo a um conjunto conexo é também conexo.
Teorema 13.2. X ⊂ R é conexo se, e só se, X é um intervalo.
Prova.
(=⇒) Seja X ⊂ R conexo e sejam a, b ∈ X, a < b.
Suponhamos, por absurdo, que existe c ∈ R, a < c < b, tal que c 6∈ X.
Então X = ( (−∞, c) ∩ X ) ∪ ( (c, +∞) ∩ X ) é uma cisão não-trivial, pois a ∈ (−∞, c) ∩ X e

b ∈ (c, +∞) ∩ X, o que é uma contradição.

Conexidade
(⇐=) Seja I ⊂ R um intervalo.Suponhamos, por absurdo, que existe uma cisão não-trivial
I = A ∪ B de I.
Sejam a ∈ A, b ∈ B, a < b. Então [a, b] ⊂ I e [a, b] = (A ∩ [a, b]) ∪ (B ∩ [a, b]) é uma cisão
não-trivial de [a, b].
Como K = A ∩ [a, b] e L = B ∩ [a, b] são fechados no compacto [a, b], temos que K e L são
fechados em R e, portanto, compactos, pois K, L ⊂ [a, b].
Logo existem x0 ∈ K e y0 ∈ L tais que d(K, L) = |x0 − y0 |.
Seja c o ponto médio do intervalo de extremos x0 e y0 . Então c ∈ [a, b].
Mas, como |x0 − c| < |x0 − y0 | e |y0 − c| < |x0 − y0 |, temos que c 6∈ K e c 6∈ L, e, portanto, c 6∈ [a, b],
uma contradição.
Assim, I só possui a cisão trivial sendo, portanto, conexo.
Corolário 13.2. Se X ⊂ Rm é conexo e f : X −→ R é uma aplicação contı́nua, então f(X) é

um intervalo.
• Uma reformulação do corolário acima é o seguinte teorema.
Teorema 13.3. (do valor intermediário)

Seja X ⊂ Rn conexo e f : X −→ R uma aplicação contı́nua. Se existem a, b ∈ X e d ∈ R tais que
f(a) < d < f(b) (ou f(b) < d < f(a)), então existe c ∈ X tal que f(c) = d.
Exemplo 13.5. O cı́rculo S1 = {(x, y) ∈ R2 | x2 + y2 = 1} é conexo, pois f(R) = S1 , onde

f : R −→ R2 é a aplicação contı́nua f(t) = (cos t, sen t), definida no conjunto conexo R.
Aplicação: Dada f : S1 −→ R contı́nua, existe u ∈ S1 tal que f(u) = f(−u).

De fato, seja g : S1 −→ R a função contı́nua definida no conexo S1 por g(z) = f(z) − f(−z).
Como g(z) = −g(−z), temos, pelo Teorema do Valor Intermediário, que existe u ∈ S1 tal que
g(u) = 0, ou seja, f(u) = f(−u).
Em particular, nenhuma função contı́nua f : S1 −→ R é injetiva e, portanto, S1 não é homeomorfo

a um subconjunto da reta.
Teorema 13.4. (da alfândega)

Seja X ⊂ Rn um conjunto arbitrário e seja C ⊂ Rn conexo. Se C ∩ X 6= ∅ e C ∩ (R − X) 6= ∅,
então C contém algum ponto da fronteira de X.
Análise
Prova.
Suponhamos, por absurdo, que C ∩ ∂X = ∅. Então X ∩ C é aberto em C, pois X ∩ C = (int X) ∩ C,
e (Rn − X) ∩ C é aberto em C, pois (Rn − X) ∩ C = int(Rn − X) ∩ C .
Como C é conexo e C = (C ∩ X) ∪ (C ∩ (Rn − X)) é uma cisão de C, temos que C ∩ X = ∅ ou

C ∩ (Rn − X) = ∅, ou seja, C ⊂ Rn − X ou C ⊂ X, uma contradição.
Observação 13.5. Se X ⊂ Y ⊂ Rn e A ⊂ Y é aberto em Y, então A ∩ X é aberto em X.

De fato, como A ⊂ Y é aberto em Y, existe A0 ⊂ Rn aberto em Rn tal que A = A0 ∩ Y.
Logo A ∩ X = A0 ∩ Y ∩ X = A0 ∩ X, e, portanto, A ∩ X é aberto em X.

[
Teorema 13.5. A reunião C = Cλ de uma famı́lia de conjuntos conexos Cλ , λ ∈ L, com um
λ∈L
ponto em comum, é um conjunto conexo.
Prova.
Seja a ∈ Rn tal que a ∈ Cλ para todo λ ∈ L e seja C = A ∪ B uma cisão de C. Sem perda
de generalidade podemos supor a ∈ A.
Como A e B são abertos em C e Cλ ⊂ C temos, pela observação 13.5, que A ∩ Cλ e B ∩ Cλ são

abertos em Cλ para todo λ ∈ L.
Logo Cλ = (A ∩ Cλ ) ∪ (B ∩ Cλ ) é uma cisão de Cλ .
Como Cλ é conexo e A ∩ Cλ 6= ∅, temos que B ∩ Cλ = ∅ para todo λ ∈ L.

!
[ [
Assim, B = B ∩ C = B ∩ Cλ = (B ∩ Cλ ) = ∅.
λ∈L λ∈L
Provamos, então, que C só possui a cisão trivial. Portanto, C é conexo.
Corolário 13.3. Um conjunto X ⊂ Rn é conexo se, e só se, para quaisquer a, b ∈ X, existe
um conjunto conexo Ca b ⊂ X tal que a, b ∈ Ca b .
Prova.
(=⇒) É evidente.
(⇐=) Seja a ∈ X fixo. Então, para todo x ∈ X existe um conjunto conexo Ca x ⊂ X tal que
[
a, x ∈ Ca x . Logo X = Ca x .
x∈X
Como os conjuntos Ca x são conexos e têm em comum o ponto a, temos, pelo Teorema 13.5,
que C é conexo.

Conexidade
Corolário 13.4. Dados X ⊂ Rm e Y ⊂ Rn , o produto cartesiano X × Y é conexo se, e só se, X

e Y são conexos.
Prova.
(=⇒) Se X × Y é conexo, temos que X e Y são conexos, pois as projeções π1 : X × Y −→ X e
π2 : X × Y −→ Y são contı́nuas, π1 (X × Y) = X e π2 (X × Y) = Y.
(⇐=) Sejam a = (a1 , a2 ), b = (b1 , b2 ) ∈ X × Y arbitrários e Ca b = ({a1 } × Y) ∪ (X × {b2 }).

Então a, b ∈ Ca b . Além disso, como {a1 } × Y é homeomorfo ao conjunto conexo Y, X × {b2 } é
homeomorfo ao conjunto conexo X e esses conjuntos tem o ponto (a1 , b2 ) em comum, temos,
pelo teorema 13.5, que Ca b é conexo. Logo, pelo corolário 13.3, X × Y é conexo.
Observação 13.6. O mesmo vale para um produto cartesiano X1 × . . . × Xk de um número

finito de fatores.
Em particular, Rn = R × . . . × R é conexo. Portanto, ∅ e Rn são os únicos subconjuntos de Rn

que são simultaneamente abertos e fechados em Rn .
Observação 13.7. Todo conjunto X ⊂ Rn convexo é conexo.

De fato, seja x0 ∈ X fixo. Então, para todo x ∈ X, [x0 , x] é conexo, pois é a imagem da aplicação
contı́nua αx : [0, 1] −→ X, αx (t) = (1 − t)x0 + tx, definida no conjunto conexo [0, 1] ⊂ R.
[
Como X = [x0 , x] e os conexos [x0 , x], x ∈ X, possuem em comum o ponto x0 , temos, pelo
x∈X
teorema 13.5, que X é conexo.
Em particular, toda bola aberta e toda bola fechada em Rn são conjuntos conexos.
Observação 13.8. A interseção de conjuntos conexos pode não ser um conjunto conexo.
Por exemplo, sejam G1 = {(x, x2 ) | x ∈ R} e G2 = {(x, x) | x ∈ R}. Como G1 é o gráfico da função
contı́nua f1 : R −→ R, f1 (x) = x2 , G2 é o gráfico da função contı́nua f2 : R −→ R, f2 (x) = x, e R
é conexo, temos que G1 e G2 são conexos, pois G1 e G2 são homeomorfos a R.
Mas, G1 ∩ G2 = {(0, 0), (1, 1)}. Logo G1 ∩ G2 é desconexo.

∞
\
Teorema 13.6. A interseção K = Ki de uma sequência decrescente K1 ⊃ K2 ⊃ . . . ⊃ Ki ⊃
i=1
. . . de conjuntos compactos conexos em Rn é um conjunto compacto e conexo.
Prova.
Seja K = A ∪ B uma cisão. Como A e B são fechados em K e K é fechado em Rn , temos que A
e B são fechados em Rn , e, portanto, compactos disjuntos, pois A ⊂ K, B ⊂ K e A ∩ B = ∅.
Análise
Pela Observação 12.8, existem U e V abertos em Rn tais que A ⊂ U, B ⊂ V e U ∩ V = ∅.

\
Logo K = Ki = A ∪ B ⊂ U ∪ V e, pelo Corolário 11.6, existe i0 ∈ N tal que Ki0 ⊂ U ∪ V.
Portanto, Ki0 = (Ki0 ∩ U) ∪ (Ki0 ∩ V) é uma cisão de Ki0 . Como Ki0 é conexo, temos que
Ki0 ∩ U = ∅ ou Ki0 ∩ V = ∅. Logo A = ∅ ou B = ∅, pois A ⊂ Ki0 ∩ U e B ⊂ Ki0 ∩ V. Ou seja, K
só possui a cisão trivial e, portanto, K é conexo.
Observação 13.9. O mesmo não vale para uma sequência decrescente F1 ⊃ F2 ⊃ . . . ⊃ Fi ⊃

. . . de conjuntos fechados conexos.
Por exemplo, os conjuntos Fi = R × {0} ∪ R × {1} ∪ [i, +∞) × [0, 1], i = 1, 2, . . ., formam uma
sequência decrescente de conjuntos fechados conexos, pois R × {0}, R × {1} e [i, +∞) × [0, 1]
são produtos cartesianos de dois conjuntos conexos da reta, R × {0} e [i, +∞) × [0, 1] possuem
um ponto em comum e R × {0} ∪ [i, +∞) × [0, 1] e R × {1} possuem um ponto em comum.
Fig. 6: Conjuntos Fi
\
Mas, F = Fi = R × {0} ∪ R × {1} não é conexo, pois F = R × {0} ∪ R × {1} é uma cisão não trivial
de F, uma vez que R × {0} e R × {1} são fechados disjuntos em R2 e, portanto, em F.
Teorema 13.7. Sejam X ⊂ Y ⊂ X em Rn . Se X é conexo, então Y é conexo.
Prova.
Seja A ⊂ Y aberto não-vazio em Y e seja a ∈ A.
Então existe δ > 0 tal que B(a, δ) ∩ Y ⊂ A. Como Y ⊂ X, temos que a ∈ X e, portanto,
B(a, δ) ∩ X 6= ∅. Logo A ∩ X 6= ∅.
Seja Y = A∪B uma cisão. Como A e B são abertos em Y e X ⊂ Y, temos que X = (X∩A)∪(X∩B)
é uma cisão de X. Logo X ∩ A = ∅ ou X ∩ B = ∅. Assim, pelo provado acima, A = ∅ ou B = ∅,
ou seja, Y só possui a cisão trivial e, portanto, é conexo.
Corolário 13.5. O fecho de um conjunto conexo é conexo.
Exemplo 13.6. A esfera Sn = {x ∈ Rn+1 | hx, xi = 1} é conexa para todo n ≥ 1.

Conexidade
Primeiro observe que todo ponto x ∈ Sn é ponto de acumulação de Sn .
De fato, existe i ∈ {1, . . . , n + 1}, (n + 1 ≥ 2) tal que x e ei não são LD.

ei ei
x+ x+
Portanto, k 6= x para todo k ∈ N, e k −→ x = x.
ei ei kxk
x + x +

k k
Logo, como Sn é fechado, temos que (Sn ) 0 = Sn .
Além disso, como Sn −{pN } (onde pN = (0, 0, . . . , 0, 1) é o pólo norte) é homeomorfo a Rn , através
da projeção estereográfica, temos que Sn − {pN } é um conjunto conexo. Sendo Sn − {pN } = Sn ,
pois Sn − {pN } ⊂ Sn − {pN } ⊂ Sn e pN é ponto de acumulação de Sn , temos, pelo corolário 13.5,
que a esfera Sn é conexa.
Observe que a esfera Snk k = {x ∈ Rn+1 | kxk = 1}, com respeito a qualquer norma k k de Rn+1 , é
x
também conexa, pois f : Sn −→ Snk k , dada por f(x) = é um homeomorfismo, uma vez que
kxk
y
f−1 : Snk k −→ Sn , dada por f−1 (y) = , é contı́nua, onde k k0 é a norma euclidiana.
kyk0
1
Exemplo 13.7. Seja a função contı́nua f : (0, 1] −→ R dada por f(x) = sen . Como o gráfico

1
x
de f, G(f) = x, sen x ∈ (0, 1] , é homeomorfo ao intervalo (0, 1], G(f) é conexo.
x
Temos que G(f) = G(f) ∪ I, onde I = {(0, t) |t ∈ [−1, 1]}.
⊂ G(f)
De fato, G(f) ∪ I, pois se (x0 , y0 ) ∈ G(f), existe uma
1
sequência xk , sen de pontos de G(f) que converge a (x0 , y0 ).
xk
Logo x0 ∈ [0, 1] e y0 ∈ [−1, 1]. Se x0 ∈ (0, 1],temos que
1 1 1
sen −→ sen , ou seja (x0 , y0 ) = x0 , sen ∈ G(f) e,
xk x0 x0
se x0 = 0, (x0 , y0 ) ∈ I.
Seja, agora, y0 ∈ [−1, 1]. Então existe ξ0 ∈ [0, 2π) tal que
sen ξ0 = y0 .

1
Logo xk = é uma sequência em (0, 1] tal que
ξ0 + 2πk
1
xk , sen −→ (0, y0 ).
xk Fig. 7: G(f) se acumulando num segmento
Portanto, (0, y0 ) ∈ G(f). Assim, G(f) ∪ I ⊂ G(f).
Como G(f) é conexo, temos que G(f) é conexo e, também, para todo T ⊂ I, G(f) ∪ T é conexo.
Em particular, G(f) ∪ {(0, 0)} é conexo.
Análise
Este exemplo destoa da intuição, que nos sugere um conjunto conexo como aquele for-
mado por ”um só pedaço”. Daremos, por isso, uma noção mais ampla de conexidade.
Definição 13.4. Um caminho em X ⊂ Rn é uma aplicação contı́nua f : I −→ X definida no

intervalo I.
Exemplo 13.8. Dados x, y ∈ Rn , o caminho f : [0, 1] −→ Rn , dado por f(t) = (1 − t)x + ty, é
chamado o caminho retilı́neo que liga x a y. Às vezes, vamos nos referir a ele como o caminho
[x, y].
Definição 13.5. Dizemos que a, b ∈ X podem ser ligados por um caminho em X quando
existe um caminho f : I −→ X tal que a, b ∈ f(I).
Exemplo 13.9. Se X ⊂ Rn é convexo, dois pontos quaisquer a, b ∈ X podem ser ligados pelo
caminho retilı́neo [a, b].
Observação 13.10. Se a, b ∈ X podem ser ligados por um caminho f : I −→ X, então existe

um caminho g : [0, 1] −→ X tal que g(0) = a e g(1) = b. Basta tomar g(t) = f((1 − t)α + tβ),
onde f(α) = a e f(β) = b.
Definição 13.6. Sejam f, g : [0, 1] −→ X caminhos em X com f(1) = g(0). Definimos o

caminho justaposto h = f ∨ g : [0, 1] −→ X, pondo
 h 1i
f(2t) se t ∈ 0,
h(t) = h 2i
g(2t − 1) se t ∈ 1 , 1 .
2
1
Como f(2t) e g(2t − 1) definem o mesmo valor para h em t = e h|[0, 1 ] , h|[ 1 ,1] são contı́nuas,
2 2 2
então h é contı́nua.
Fig. 8: Caminho h obtido pela justaposição de f com g
Observação 13.11. Sejam a, b, c ∈ X ⊂ Rn . Se a e b podem ser ligados por um caminho

f : [0, 1] −→ X, f(0) = a, f(1) = b, e os pontos b e c podem ser ligados por um caminho
g : [0, 1] −→ X, g(0) = b, g(1) = c, então a e c podem ser ligados pelo caminho f∨g : [0, 1] −→ R.

Conexidade
Definição 13.7. Dizemos que um conjunto X ⊂ Rn é conexo por caminhos quando dois pon-
tos quaisquer a, b ∈ X podem ser ligados por um caminho em X.
Observação 13.12. Todo conjunto convexo X ⊂ Rn é conexo por caminhos. Em particular,

toda bola aberta e toda bola fechada em Rn são conjuntos conexos por caminhos.
Observação 13.13. A esfera Sn = {x ∈ Rn+1 | kxk = 1} é conexa por caminhos.

De fato, dados a, b ∈ Sn pontos não-antı́podas, isto é, a 6= −b, então α(t) = (1 − t)a + t(b) 6= 0
para todo t ∈ [0, 1], pois se existisse t0 ∈ (0, 1) tal que α(t0 ) = 0, terı́amos (1 − t0 )a = −t0 b e,
1
portanto, (1 − t0 ) = (1 − t0 ) kak = t0 = t0 kbk, ou seja, t0 = e a = −b, uma contradição.
2
α(t)
Logo f : [0, 1] −→ Sn dada por f(t) = é um caminho em Sn que liga f(0) = a a f(1) = b.
kα(t)k
Agora, se a = −b, a, b ∈ Sn , tomamos um ponto c ∈ Sn − {a, −a}, ligamos a com c e c com
b = −a pelo processo acima. O caminho justaposto ligará, então, o ponto a com seu antı́poda
b = −a.
Observação 13.14. Se X ⊂ Rn é conexo por caminhos, então X é conexo.

De fato, sejam a, b ∈ X. Então existe um caminho f : [0, 1] −→ X tal que f(0) = a e f(1) = b.
Como f([0, 1]) é conexo e a, b ∈ f([0, 1]), provamos que dados a, b ∈ X, existe um conjunto
conexo Ca b = f([0, 1]) ⊂ X tal que a, b ∈ Ca b . Logo, pelo corolário 13.3, X é conexo.
• A recı́proca é falsa, pois G(f) ∪ {(0, 0)},

onde
1

G(f) = x, sen x ∈ (0, 1]
x
1
é o gráfico da função f(x) = sen , é um conjunto conexo que não é conexo por caminhos.
x
De fato, seja λ : [0, 1] −→ G(f) ∪ {(0, 0)} um caminho com λ(0) = (0, 0). Seja α(t) = π1 (λ(t)), ou
seja, λ(t) = (α(t), f(α(t))), onde estamos fazendo f(0) = 0.
Seja A = {t ∈ [0, 1] | α(t) = 0}. Então A é fechado e não-vazio.
Afirmação: A é aberto em [0, 1].
Seja t0 ∈ A, ou seja, t0 ∈ [0, 1] e α(t0 ) = 0. Como λ é contı́nua em t0 , existe δ > 0 tal que
t ∈ [0, 1] e |t − t0 | < δ =⇒ |λ(t)| = |λ(t) − λ(t0 )| < 1.
Seja J = [0, 1] ∩ (t0 − δ, t0 + δ). Então J é um intervalo que contém t0 .
Além disso, J é aberto em [0, 1].
Logo α(J) é um intervalo que contém 0 = α(t0 ). Se α(J) não é degenerado, existe n ∈ N tal que
1
ξn = ∈ α(J) e, portanto, existe tn ∈ J tal que α(tn ) = ξn .
(2n + 1) π2
Análise
Então λ(tn ) = (α(tn ) , sen(α(tn ))) = (ξn , ±1).
Assim, |λ(tn )| > 1, uma contradição. Portanto, α(J) = {0}, ou seja, α(t) = 0 para todo t ∈ J.
Como A é não-vazio, aberto e fechado em [0, 1] e [0, 1] é conexo, temos que A = [0, 1], ou seja,
α(t) = 0 para todo t ∈ [0, 1], e, portanto, λ(t) = (0, 0) para todo t ∈ [0, 1].
Então não existe um caminho em G(f) ∪ {(0, 0} que liga (0, 0) a um ponto do gráfico de f.
Definição 13.8. Dizemos que f : [0, 1] −→ X é um caminho poligonal em X quando f é a

justaposição de um número finito de caminhos retilı́neos.
Teorema 13.8. Se A ⊂ Rn é aberto e conexo, então dois pontos quaisquer de A podem ser
ligados por um caminho poligonal contido em A.
Prova.
Seja a ∈ A fixo, e seja U o conjunto formado pelos pontos de A que podem ser ligados ao
ponto a por um caminho poligonal contido em A.
Então U é não-vazio, pois a ∈ U, já que f : [0, 1] −→ A, f(t) = a para todo t ∈ [0, 1], é um
caminho em A que liga o ponto a ao ponto a.
Afirmação: U é aberto.
Seja b ∈ U. Então existe um caminho poligonal que liga o ponto a ao ponto b. Como b ∈ U ⊂ A
e A é aberto, existe δ > 0 tal que B(b, δ) ⊂ A. Dado y ∈ B(b, δ), o caminho retilı́neo que liga b
a y está contido em B(b, δ), pois B(b, δ) é convexo. Logo todo ponto y ∈ B(b, δ) pode ser ligado
ao ponto a por meio de um caminho poligonal em A, ou seja, B(b, δ) ⊂ U.
Afirmação: A − U é aberto.
Seja c ∈ A − U e seja δ > 0 tal que B(c, δ) ⊂ A. Então todo ponto y ∈ B(c, δ) não pode ser
ligado ao ponto a por meio de um caminho poligonal, pois, caso contrário, c poderia ser ligado
ao ponto a, uma vez que o caminho retilı́neo que liga y a c está contido em B(c, δ) e, portanto,
em A. Logo B(c, δ) ⊂ A − U.
Como U é não-vazio, aberto e fechado em A e A é conexo, temos que U = A, ou seja, todo

ponto de A pode ser ligado ao ponto a por meio de um caminho poligonal contido em A.
Observação 13.15. No enunciado acima, podemos trocar caminhos poligonais por cami-
nhos poligonais formados por segmentos paralelos aos eixos coordenados. Para tanto, basta
verificar que isso é possı́vel para quaisquer dois pontos x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ) per-
tencentes à bola aberta B(a, δ) = (a1 −δ, a1 +δ)×. . .×(an −δ, an +δ) de centro a = (a1 , . . . , an )

Conexidade
e raio δ, na norma do máximo.
De fato, como [xi , yi ] ⊂ (ai − δ, ai + δ) para todo i = 1, . . . n, temos que o caminho formado pela
justaposição dos caminhos retilı́neos
[(x1 , x2 , . . . xn ), (y1 , x2 , . . . , xn )] , [(y1 , x2 , . . . , xn ), (y1 , y2 , x3 , . . . , xn )] ,
. . . , [(y1 , y2 , . . . , yn−1 , xn ), (y1 , y2 , . . . , yn−1 , yn )] ,
é um caminho poligonal em B(a, δ), formado por segmentos paralelos aos eixos coordenados,
que liga o ponto x = (x1 , . . . , xn ) ao ponto y = (y1 , . . . , yn ) .
Corolário 13.6. Um aberto A ⊂ Rn é conexo se, e só se, é conexo por caminhos.
Observação 13.16. O problema central da topologia é determinar se dois conjuntos X e Y

dados são ou não são homeomorfos.
Para afirmar que X e Y são homeomorfos é necessário definir um homeomorfismo entre eles.
Para garantir que X e Y não são homeomorfos, deve-se lançar mão de invariantes topológicos
como a compacidade e a conexidade.

2 y2
2 x
Exemplo 13.10. Sejam C = {(x, y) ∈ R | x +y = 1} um cı́rculo, E = (x, y) ∈ R 2 + 2 = 1
2 2 2
a b
x2 y 2
uma elipse, H = (x, y) ∈ R2 2 − 2 = 1 uma hipérbole e P = {(x, y) ∈ R2 | y = px2 } uma

c d
parábola.
• C e E são homeomorfos e h : C −→ E dada por h(x, y) = (ax, by) é um homeomorfismo entre

eles.
• C e E não são homeomorfos a H nem a P, pois C e E são compactos, enquanto que H e P

não são compactos.
• H e P não são homeomorfos, pois H é desconexo e P é conexo.
Exemplo 13.11. O intervalo fechado X = [a, b], a < b e a bola fechada Y = B[c, r] ⊂ R2 não
são homeomorfos, apesar de ambos serem compactos e conexos.
De fato, se x ∈ (a, b), então X − {x} = (X ∩ (−∞, x)) ∪ (X ∩ (x, +∞)) é desconexo, mas se
y ∈ B(c, r), B[c, r] − {y} continua sendo conexo, pois se:
• y = c e z0 ∈ S[c, r], então

[
B[c, r] − {c} = (S[c, s] ∪ [zs , z0 ]) ,
s∈(0,r]
s s

onde zs = 1 − c+ z0 ∈ S[c, s], é uma reunião de conexos, S[c, s] ∪ [zs , z0 ], s ∈ (0, r], que
r r
possuem em comum o ponto z0
Análise
Fig. 9: B[c, r] − {c} como reunião de conjuntos conexos com um ponto em comum
r
• y 6= c e y0 = (1 − t0 )c + t0 y, t0 = − , temos que
ky − ck
[
B[c, r] − {y} = ( S[c, s] ∪ [c, y0 ] ) ∪ ( (S[c, s0 ] − {y}) ∪ [c, y0 ] ) ,
s ∈ [0, r]
s 6= s0
onde s0 = ky − ck, é uma reunião de conjuntos conexos que possuem o ponto c em comum.
Fig. 10: B[c, r] − {y} como reunião de conjuntos conexos com um ponto em comum
Logo, se existisse um homeomorfismo f : [a, b] −→ B[c, r], terı́amos que [a, b] − {d}, a < d <
b, e B[c, r] − {f(d)} seriam homeomorfos, uma contradição, já que [a, b] − {d} é desconexo e
B[c, r] − {f(d)} é conexo.
Observação 13.17. Se tentarmos provar, usando um raciocı́nio análogo ao do exemplo an-

terior, que a bola B[a, r] ⊂ R2 não é homeomorfa à bola B[b, s] ⊂ R3 , não chegarı́amos a nada,
pois as bolas B[a, r] e B[b, s] permanecem conexas ao retirar delas um ponto qualquer.
É verdade que uma bola em Rm só é homeomorfa a uma bola em Rn quando m = n. Mas
a demonstração desse fato requer o uso de invariantes topológicos mais elaborados, que são
estudados na Topologia Algébrica ou na Topologia Diferencial.
Exemplo 13.12. O conjunto X = {(x, y) ∈ R2 | x2 = y2 } (um par de retas que se cortam na

origem) e a parábola Y = {(x, y) ∈ R2 | y = x2 } não são homeomorfos, pois se retirarmos um
ponto a de Y, o conjunto Y − {a} possui dois ”pedaços” conexos, enquanto a retirada da origem

Conexidade
(0, 0) faz com que o conjunto X − {(0, 0)} tenha quatro ”pedaços” conexos.
Fig. 11: X − {(0, 0)} tem 4 pedaços, enquanto Y − {a} tem apenas 2 pedaços
Na seguinte definição vamos tornar precisa a idéia de dividir um conjunto em ”pedaços”

conexos.
Definição 13.9. Sejam x ∈ X ⊂ Rn . A componente conexa do ponto x no conjunto X é a

reunião Cx de todos os subconjuntos conexos de X que contém o ponto x.
Exemplo 13.13. Se X = Q ⊂ R, então a componente conexa de qualquer ponto x ∈ X é {x},

pois todo subconjunto de Q com mais de um elemento é desconexo.
Exemplo 13.14. Se X ⊂ Rn é conexo, então Cx = X para todo x ∈ X.

Exemplo 13.15. Se X = (−∞, 0) ∪ (0, +∞), então a componente conexa de −1 em X é
(−∞, 0) e a componente conexa de 1 em X é (0, +∞), pois qualquer subconjunto de X que
contém pontos de (−∞, 0) e (0, +∞) é desconexo.
Observação 13.18. Dados x ∈ X ⊂ Rn , a componente conexa Cx é o maior subconjunto

conexo de X que contém o ponto x.
De fato, dado um subconjunto conexo C de X que contém o ponto x, temos que C ⊂ Cx , pois Cx
é a reunião de todos os subconjuntos conexos de X que contém x.
Por outro lado, pelo teorema 13.5, Cx é conexo, pois é uma reunião de conjuntos conexos que
possuem um ponto em comum.
Em particular, nenhum subconjunto conexo de X pode conter Cx propriamente.
Mais ainda, se C ⊂ X é conexo e tem algum ponto em comum com Cx então C ⊂ Cx , pois C ∪ Cx
é um conjunto conexo que contém x e, portanto, C ∪ Cx ⊂ Cx , ou seja, C ⊂ Cx .
Observação 13.19. Sejam x e y dois pontos de X. Então suas componentes conexas Cx e

Cy ou coincidem ou são disjuntas, pois se Cx ∩Cy 6= ∅, então, pela observação anterior, Cy ⊂ Cx
e Cx ⊂ Cy , ou seja, Cx = Cy .
Análise
Assim, a relação x e y pertencem a um subconjunto conexo de X é uma relação de equivalência

e as classes de equivalência são as componentes conexas dos pontos de X, ou seja, [x] = Cx .
Então x e y pertencem a um subconjunto conexo de X ⇐⇒ Cx = Cy .
Observação 13.20. Toda componente conexa Cx é um conjunto fechado em X.

De fato, como Cx ⊂ Cx ∩ X ⊂ Cx e Cx é conexo, temos, pelo Teorema 13.7, que Cx ∩ X é um
subconjunto conexo de X que contém x.
Então, pela Observação 13.18, Cx = Cx ∩ X e, portanto, Cx é fechado em X.
Observação 13.21. As componentes conexas de um conjunto aberto U ⊂ Rn são subcon-

juntos abertos de Rn .
De fato, sejam x0 ∈ U e y0 ∈ Cx0 .
Então existe δ > 0 tal que B(y0 , δ) ⊂ U. Como B(y0 , δ) ∪ Cx0 é conexo e contém o ponto x0 ,
temos que B(y0 , δ) ∪ Cx0 ⊂ Cx0 , ou seja, B(y0 , δ) ⊂ Cx0 . Logo Cx0 é aberto em Rn .
Observação 13.22. Seja h : X ⊂ Rm −→ Y ⊂ Rn um homeomorfismo. Se Cx é a compo-

nente conexa de x em X, então h(Cx ) é a componente conexa de y = h(x) em Y.
De fato, seja Dy a componente conexa de y em Y. Como, pelo Teorema 13.1, h(Cx ) é conexo
e contém y, temos que h(Cx ) ⊂ Dy . Por outro lado, como h−1 (Dy ) é um conjunto conexo que
contém x, então h−1 (Dy ) ⊂ Cx , ou seja, Dy ⊂ h(Cx ). Logo Dy = h(Cx ).
Assim, o homeomorfismo h : X −→ Y estabelece uma bijeção entre as componentes conexas

de X e as componentes conexas de Y.
14 A norma de uma transformação linear
Fixemos uma norma k k1 em Rm e uma norma k k2 em Rn . Então, dada uma transformação

linear A : Rm −→ Rn , existe c > 0 tal que kAxk2 ≤ ckxk1 para todo x ∈ Rm .
Assim, se x ∈ Rm e kxk1 = 1 =⇒ kAxk2 ≤ c. Ou seja, A transforma a esfera unitária de

Rm num subconjunto limitado de Rn .
• Se A ∈ L(Rm , Rn ) = Rmn , ou seja, se A : Rm −→ Rn é uma transformação linear, então

kAk = sup { kA xk2 | x ∈ Rm ; kxk1 = 1 }
é uma norma em L(Rm , Rn ).

A norma de uma transformação linear
De fato: se A, B ∈ L(Rm , Rn ) e λ ∈ R,
(1) kλ Ak = sup { k(λA)(x)k2 | x ∈ Rm ; kxk1 = 1 } = sup { |λ| kA(x)k2 | x ∈ Rm ; kxk1 = 1 }
= |λ| sup { kA(x)k2 | x ∈ Rm ; kxk1 = 1 } = |λ| kAk .
(2) kA + Bk ≤ kAk + kBk , pois: kA(x)k2 ≤ kAk e kB(x)k2 ≤ kBk ∀ x ∈ Rn ; kxk1 = 1

=⇒ k(A + B)(x)k2 ≤ kA(x)k2 + kB(x)k2 ≤ kAk + kBk ∀ x ∈ Rm ; kxk1 = 1
=⇒ kA + Bk ≤ kAk + kBk .
(3) kAk = 0 ⇐⇒ kA(x)k2 = 0 para todo x ∈ Rm ; kxk1 = 1

⇐⇒ A(x) = 0 para todo x ∈ Rm ; kxk1 = 1

x
⇐⇒ A = 0 para todo x ∈ Rm − {0}
kxk1
⇐⇒ A(x) = 0 para todo x ∈ Rm
⇐⇒ A = 0 .
Além disso, a função A 7−→ kAk possui as seguintes propriedades:
(I) kA(x)k2 ≤ kAk kxk1 para todo x ∈ Rm .

x
∀ x ∈ Rm − {0} =⇒ kA(x)k2 ≤ kAk kxk1

De fato, A ≤ kAk ∀ x ∈ Rm .
kxk1 2
(II) kABk ≤ kAk kBk, se A ∈ L(Rm , Rn ) e B ∈ L(Rk , Rm ), onde a norma em Rm deve ser
tomada a mesma.
De fato, sejam k k1 , k k2 , k k3 as normas tomadas em Rk , Rm e Rn , respectivamente.
Por (I), kA(y)k3 ≤ kAk kyk2 ∀ y ∈ Rm e kB(x)k2 ≤ kBk kxk1 ∀ x ∈ Rk . Logo,

k(AB)(x)k3 = kA(B(x))k3 ≤ kAk kB(x)k2 ≤ kAk kBk ,
para todo x ∈ Rk ; kxk1 = 1.
Portanto, kABk ≤ kAk kBk.
Observação 14.1. Como duas normas no espaço vetorial L(Rm , Rn ) = Rmn são equivalen-
tes, temos que se Ak ∈ L(Rm , Rn ), k ∈ N, e A ∈ L(Rm , Rn ), então kAk −Ak −→ 0 ⇐⇒ akij −→ aij
para i = 1, . . . , n, j = 1, . . . , m, onde Ak = (akij ) e A = (aij ).
Exemplo 14.1. Considerando Rm e Rn com a norma do máximo, a norma do sup de uma

transformação linear A : Rm −→ Rn é dada por
X
m
!
kAk = max |aij | ,
1≤i≤n
j=1
isto é, é a maior ”norma da soma” entre as linhas.
Análise
De fato, seja x = (x1 , . . . , xm ) ∈ Rm tal que kxkM = max |xk | = 1. Então,

1≤k≤m
X X
! !
m m
kA(x)kM = max aij xj ≤ max |aij xj |

1≤i≤n 1≤i≤n
j=1 j=1
X m
!
≤ max |aij | ,
1≤i≤n
j=1
pois |xj | ≤ kxkM = 1 para todo j = 1, . . . , m.

Xm
!
Assim, kAk ≤ max |aij | .
1≤i≤n
j=1
X X
m m
!
Seja i0 = 1, . . . , n tal que |ai0 j | = max |aij | , e seja x0 = (x01 , . . . , x0m ) ∈ Rm tal que
1≤i≤n
j=1 j=1
x0j = 1 se ai0 j > 0, e x0j = −1 se ai0 j ≤ 0.
Então kxkM = 1 e
X X X
!
m m m
kA(x0 )kM = max 0
aij xj ≥ 0
ai0 j xj = |ai0 j | ≥ kAk .

1≤i≤n
j=1 j=1 j=1
Logo,
X
m
0
kA(x )kM ≤ kAk ≤ |ai0 j | ≤ kA(x0 )kM ,
j=1
ou seja,
X X
m m
!
kAk = |ai0 j | = max |aij | .
1≤i≤n
j=1 j=1
m n
• Para outras escolhas de normas em R e R , veja a tabela da página 66 do livro Curso de
Análise, Vol II de E. Lima.

Capı́tulo 2
Caminhos no espaço Euclidiano
1 Caminhos diferenciáveis
Nota: Neste capı́tulo, os
Definição 1.1. Um caminho em Rn é uma aplicação f : I −→ Rn defi- caminhos não serão por
definição, contı́nuos. Mas,
nida num intervalo I ⊂ R. Se f(t) = (f1 (t), . . . , fn (t)), t ∈ I, as n funções
a partir do próximo capı́tulo,
fi : I −→ R são chamadas as funções coordenadas de f. os caminhos voltarão a ser
contı́nuos.
Observação 1.1. f = (f1 , . . . , fn ) : I −→ R é contı́nua no ponto a ∈ I ⇐⇒ fi : I −→ R é
n
contı́nua no ponto a ∈ I, para todo i = 1, . . . , n.
Observação 1.2. Se f = (f1 , . . . , fn ) é definida no conjunto X ⊂ R e a ∈ X 0 , então

lim f(x) = b = (b1 , . . . , bn ) se, e só se, lim fi (x) = bi para todo i = 1, . . . , n.
x→a x→a
Observação 1.3. Se X ⊂ R e a ∈ X+0 , ou seja, a é ponto de acumulação à direita de X,

dizemos que lim+ f(x) = b quando,
x→a
para todo ε > 0, existe δ > 0 tal que x ∈ X, a < x < a + δ =⇒ kf(x) − bk < ε.
De modo análogo, se X ⊂ R e a ∈ X−0 , ou seja, a é ponto de acumulação à esquerda de X,

dizemos que lim− f(x) = b quando,
x→a
para todo ε > 0, existe δ > 0 tal que x ∈ X, a − δ < x < a =⇒ kf(x) − bk < ε.
Assim, podemos provar que se a ∈ X±0 , então lim± f(x) = b = (b1 , . . . , bn ) se, e só se,
x→a
lim± fi (x) = bi , para todo i = 1, . . . , n.
x→a
Definição 1.2. O vetor velocidade do caminho f : I −→ Rn no ponto a ∈ X é, por definição, o

limite
83
Análise
f(a + t) − f(a)
f 0 (a) = lim .
t→0 t
quando tal limite existe. A norma kf 0 (a)k chama-se velocidade escalar de f no ponto a.
• Quando f possui vetor velocidade no ponto a ∈ I, dizemos que f é diferenciável nesse ponto.
E se existe f 0 (a) para todo a ∈ I, dizemos que f é um caminho diferenciável.
• Quando f 0 (a) 6= 0, o vetor velocidade f 0 (a) determina a reta L = { f(a) + t f 0 (a) | t ∈ R }, cha-
mada reta tangente à curva f no ponto a.
Fig. 1: Reta tangente à curva f no ponto a
f(a + t) − f(a)
Observação 1.4. A diferenciabilidade de f no ponto a ∈ I e o limite lim inde-
t→0 t
pendem da norma considerada em Rn .
Observação 1.5. f = (f1 , . . . , fn ) é diferenciável no ponto a ∈ I se, e só se, fi : I −→ R é

fi (a + t) − fi (a)
derivável no ponto a para todo i = 1, . . . , n, pois são as coordenadas do vetor
t
f(a + t) − f(a)
para todo t ∈ I.
t
Neste caso, f 0 (a) = (f10 (a), . . . , fn0 (a)).
Observação 1.6.
• Um caminho f : I −→ Rn é diferenciável no ponto a ∈ I se, e só se, existe um vetor v ∈ Rn tal
que, para a + t ∈ I, temos
f(a + t) = f(a) + t v + r(t) ,
r(t)
onde lim = 0. Neste caso, v = f 0 (a).
t→0 t
De fato, a igualdade acima nos dá, para t 6= 0,

f(a + t) − f(a) r(t)
−v= .
t t
• Equivalentemente, f é diferenciável no ponto a ∈ I se, e só se, existe v ∈ Rn tal que, para
a + t ∈ I,
f(a + t) = f(a) + [v + ρ(t)]t ,
onde lim ρ(t) = 0.

t→0

Caminhos diferenciáveis
r(t)
Basta por ρ(t) = , se t 6= 0, e ρ(0) = 0.
t
Observação 1.7. Se I = [a, b), só podemos definir a derivada lateral de f à direita no ponto
a:
f(a + t) − f(a)
f 0 (a+ ) = lim+ .
t→0 t
E se I = (a, b], só podemos definir a derivada lateral de f à esquerda no ponto b:
f(b + t) − f(b)
f 0 (b− ) = lim− .
t→0 t
Podemos verificar facilmente, que se a ∈ int I, então f : I −→ R é diferenciável no

ponto a se, e só se, existem e são iguais as derivadas laterais de f no ponto a. Neste caso,
f 0 (a) = f 0 (a+ ) = f 0 (a− ).
Exemplo 1.1. Se f : R −→ R2 é o caminho f(t) = (cos(t), sen(t)) = eit , para todo t ∈ R,

então f é diferenciável em R, f 0 (t) = (− sen t, cos t) = i eit , f(R) = S1 e kf 0 (t)k = 1, ou seja, a
velocidade escalar é constante igual a 1.
Exemplo 1.2. Seja g : R −→ R2 o caminho dado por g(t) = (t, |t|). Então g 0 (t) = (1, 1), para
todo t > 0 e g 0 (t) = (1, −1), para todo t < 0.
Mas g não possui vetor velocidade no ponto t = 0, pois as

derivadas laterais g 0 (0+ ) = (1, 1) e g 0 (0− ) = (1, −1) são dife-
rentes.. A imagem de g é o gráfico da função módulo y = |x|,
que apresenta um ponto anguloso na origem.
Podemos, no entanto, descrever a mesma imagem por meio de

outras ”parametrizações” . Por exemplo, consideremos o cami-
nho h : R −→ R2 dado por h(t) = (t3 , t2 |t|). Então h(R) = g(R), Fig. 2: h(R) = g(R)
h 0 (t) = (3t2 , 3t2 ), t > 0, h 0 (t) = (3t2 , −3t2 ), t < 0 e h 0 (0) = (0, 0), pois h 0 (0+ ) = h 0 (0− ) = (0, 0).
Ou seja, para descrever a rota h(R), o ponto, cuja posição no tempo t é h(t), precisou dar uma
parada instantânea ao atingir o ponto anguloso (0, 0) de sua trajetória (ver exercı́cio 1.15).
Observação 1.8. Se f, g : I −→ Rn são caminhos diferenciáveis e λ : I −→ R é uma função

diferenciável, temos que:
d d
(1) [f(t) + g(t)] = f 0 (t) + g 0 (t) ; (3) hf(t), g(t)i = hf 0 (t), g(t)i + hf(t), g 0 (t)i ;
dt dt
d d hf(t), f 0 (t)i
(2) [λ(t) f(t)] = λ 0 (t) f(t) + λ(t) f 0 (t) ; (4) kf(t)k = , se f(t) 6= 0 ,
dt dt kf(t)k
p
onde k k é a norma que provém de um produto interno h , i em Rn , ou seja, kxk = hx, xi para
todo x ∈ Rn .
Análise
As propriedades acima seguem das propriedades usuais da derivada de uma função real
de uma variável real aplicadas às funções coordenadas de um caminho diferenciável.
Observação 1.9. Se uma norma k k não provém de um produto interno, podemos ter um
caminho diferenciável f : I −→ Rn , com f(t) 6= 0 para todo t ∈ I, para o qual a função
ϕ(t) = kf(t)k não é diferenciável.
Por exemplo, seja f : R −→ R2 o caminho diferenciável dado por f(t) = (1, t). Considerando a
norma do máximo em R2 , temos que kf(t)kM = 1, se |t| ≤ 1 e kf(t)kM = |t|, se |t| ≥ 1. Logo a
função t 7−→ kf(t)kM não possui derivada nos pontos t = −1 e t = 1.
Observação 1.10. Sempre que tomarmos a derivada de kf(t)k estaremos considerando que
k k provém de um produto interno h , i.
Observação 1.11. Seja f : I −→ Rn um caminho diferenciável. Então f(t) tem comprimento

constante se, e só se, o vetor velocidade f 0 (t) é perpendicular ao vetor posição f(t) para todo
t ∈ I.
De fato, kf(t)k = a para todo t ∈ I ⇐⇒ hf(t), f(t)i = a2 para todo t ∈ I ⇐⇒ 2hf(t), f 0 (t)i = 0
para todo t ∈ I ⇐⇒ f(t) ⊥ f 0 (t) para todo t ∈ I.
Exemplo 1.3. Seja o caminho diferenciável f : R −→ R2 dado por f(t) = (cos t, sen t). Então
kf(t)k = 1 para todo t ∈ R e f 0 (t) = (− sen t, cos t) é perpendicular a f(t) para todo t ∈ R.
Neste exemplo, temos também kf 0 (t)k = 1 para todo t ∈ R,

mas isso é acidental.
Por exemplo, para o caminho diferenciável g : R −→ R2 , dado

por
g(t) = (cos t2 , sen t2 ),
temos kg(t)k = 1 para todo t ∈ R, g 0 (t) = (−2t sen t2 , 2t cos t2 )

é perpendicular a g(t) para todo t ∈ R, mas kg 0 (t)k = 2 |t| não
é constante. Fig. 3: f(t) ⊥ f 0 (t) para todo t ∈ R
Definição 1.3. Seja f : I −→ Rn um caminho diferenciável. Se f 0 : I −→ Rn é contı́nuo,

dizemos que f é de classe C1 .
E se f 0 é diferenciável no ponto a ∈ I, dizemos que (f 0 ) 0 (a) = f 00 (a) é a derivada segunda de f

no ponto a ou o vetor aceleração do caminho f no ponto a.
Tem-se f 00 (a) = (f100 (a), . . . , fn00 (a)).

Caminhos diferenciáveis
Se existe f 00 (t) para todo t ∈ I, dizemos que f é duas vezes diferenciável. E se f 00 é contı́nua,
dizemos que f é de classe C2 .
Prosseguindo desta maneira, dizemos que o caminho f : I −→ Rn é p + 1 vezes diferenciável

quando o caminho f(p) : I −→ Rn (derivada de ordem p de f) existe e é derivável. Põe-se, então,
f(p+1) = (f(p) ) 0 . Quando f(p) é de classe C1 , dizemos que f é de classe Cp+1 .
Se existem as derivadas de todas as ordens do caminho f, dizemos que f é de classe C∞ .
Por extensão, dizemos que um caminho contı́nuo é de classe C0 e que f = f(0) é sua própria
derivada de ordem zero.
Definição 1.4. Dizemos que o caminho f : I −→ Rn é p−vezes diferenciável no ponto a ∈ I

quando existe δ > 0 tal que f é p − 1 vezes diferenciável no intervalo J = {t ∈ I | |t − a| < δ} e
f(p−1) é diferenciável no ponto a.
Observação 1.12. Seja 0 ≤ p ≤ ∞. Então f = (f1 , . . . , fn ) ∈ Cp (é de classe Cp ) se, e só se,
fi ∈ Cp para todo i = 1, . . . , n.
Definição 1.5. Seja p > 0. Dizemos que o caminho f : I −→ Rn é de classe Cp por partes
quando f é contı́nua e existem t1 < . . . < tk pertencentes ao interior do intervalo I tais que
f|I∩(−∞,t1 ] , f|[t1 ,t2 ] , . . . , f|[tk−1 ,tk ] , f|I∩[tk ,+∞)
são de classe Cp .
Exemplo 1.4. Para todo p > 0, considere o caminho f : R −→ Rn dado por f(t) = (tp+1 , tp |t|).
Como tp |t| = tp+1 para t ≥ 0 e tp |t| = −tp+1 para t ≤ 0, podemos provar, por indução, que f é
de classe Cp , onde f(p) (t) = ((p + 1)! t, −(p + 1)! t), para t ≤ 0, f(p) (t) = ((p + 1)! t, (p + 1)! t)
para t ≥ 0, e f(p) (0) = (0, 0).
Entretanto f não é p + 1 vezes diferenciável no ponto t = 0, pois f(p+1) (0+ ) = ((p + 1)!, (p + 1)!)
e f(p+1) (0− ) = ((p + 1)!, −(p + 1)!) .
Apesar disso, f é de classe C∞ por partes, pois

(j) (p + 1)! (p + 1)!
f|(−∞,0] (t) = tp+1−j , − tp+1−j
((p + 1) − j)! ((p + 1) − j)!
e
(j) (p + 1)! (p + 1)!
f|[0,+∞) (t) = tp+1−j , tp+1−j
((p + 1) − j)! ((p + 1) − j)!
(j) (j)
são contı́nuas para todo 0 ≤ j ≤ p + 1, e f|(−∞,0] = f|[0,+∞) ≡ 0 são também contı́nuas para todo
j > p + 1.
Análise
2 Integral de um caminho
Definição 2.1. Seja f : [a, b] −→ Rn um caminho limitado definido no intervalo compacto

[a, b]. Uma partição de [a, b] é um conjunto finito P = {t0 < t1 < . . . < tk }, onde t0 = a e tk = b,
e a norma da partição P é o número |P| = max (ti − ti−1 ) .
0≤i≤k
Uma partição pontilhada é um par P ? = (P, ξ), onde P é uma partição e ξ = (ξ1 , . . . , ξk ) é tal
que ti−1 ≤ ξi ≤ ti para todo i = 1, . . . , k.
Dados f e uma partição pontilhada P ? = (P, ξ), o somatório

X Xk
?
(f; P ) = (ti − ti−1 ) f(ξi )
i=1
é chamado soma de Riemann.

X
• Dizemos que um vetor v ∈ Rn é o limite das somas de Riemann (f; P ? ) quando a norma de
P tende a zero se, para todo ε > 0 dado, existe
X δ > 0 tal que

|P| < δ =⇒ (f; P ? ) − v < ε .

X
Neste caso, dizemos que f é integrável no intervalo [a, b] e chamamos v = lim (f; P ? )
|P|→a
a integral de f no intervalo [a, b]. Usamos a notação
Zb X
f(t) dt = v = lim (f; P ? ) .
a |P|→0
Observação 2.1. O caminho limitado f = (f1 , . . . , fn ) é integrável se, e só se, fi : [a, b] −→ R
é integrável para todo i = 1, . . . , n. Neste
Z caso,
Zb b Zb
f(t) dt = f1 (t) dt, . . . , fn (t) dt .
a a a
Observação 2.2. Se f : [a, b] −→ Rn é integrável e c ∈ [a, b], então f|[a,c] e f|[c,b] são in-
tegráveis e
Zb Zc Zb
f(t) dt = f(t) dt + f(t) dt .
a a c
Observação 2.3. Seja D o conjunto dos pontos de descontinuidade do caminho limitado

f = (f1 , . . . , fn ) : [a, b] −→ Rn e, para cada i = 1, . . . , n, seja Di o conjunto dos pontos de
descontinuidade da i−ésima função coordenada fi : [a, b] −→ R. Então D = D1 ∪ . . . ∪ Dn .
Como fi é integrável se, e só se, Di tem medida nula, temos que f é integrável se, e só se, D
tem medida nula.
De fato, m(D) = 0 ⇐⇒ m(Di ) = 0 para todo i = 1, . . . , n ⇐⇒ fi é integrável para todo

i = 1, . . . , n ⇐⇒ f é integrável.

Integral de um caminho
Zb
Observação 2.4. A integrabilidade de f e o valor f(t) dt não dependem da norma consi-
a
derada em Rn .
Exemplo 2.1. Sejam f : [0, 2π] −→ R2 e g : [0, 1] −→ R2 os caminhos C∞ dados por

f(t) = (cos t, sen t) e g(t) = (t, t2 ) . Então:
Z 2π Z 2π Z 2π
f(t) dt = cos t dt , sen t dt = (0, 0) ;
0 0 0
Z1 Z1 Z1 1 1

e g(t) dt = t dt , t2 dt = , .
0 0 0 2 3
Observação 2.5. Sejam f, g : [a, b] −→ Rn caminhos integráveis e α, β ∈ R arbitrários.

Segue-se da definição ou da observação 2.1, que o caminho αf + βg é integrável e
Zb Zb Zb
( αf + βg ) (t) dt = α f(t) dt + β g(t) dt .
a a a
Observação 2.6. Seja k k uma norma qualquer em Rn e seja f : [a, b] −→ Rn um caminho

integrável. Como Dkfk ⊂ Df , temos que kfk : [a, b] −→ R é integrável.
Além disso, Zb Zb

f(t) dt ≤ kfk(t) dt .

a a
X
De fato, dada qualquer partição pontilhada (f; P ? ), temos que:
X X X X

n n
?
(f; P ) = (ti − ti−1 ) f(ξi ) ≤ (ti − ti−1 ) kf(ξi )k = (kfk, P ? ) .

i=1 i=1
Logo,
Zb Zb
X X X

?
? ?
f(t) dt = lim (f; P ) = lim (f; P ) ≤ lim (kfk; P ) = kf(t)k dt .

|P|→0 |P|→0 |P|→0
a a
• Assim, se kf(t)k ≤ M para todo t ∈ [a, b], temos que

Z
b

f(t) dt ≤ M(b − a) .

a
n
• Porém, se n > 1, f : [a, b] −→ R é contı́nuo e kf(t)k ≥ c > 0 para todo t ∈ [a, b], não se pode
Zb
concluir que f(t) dt 6= 0. Veja o exemplo 2.1.
a
Observação 2.7. Segue-se da definição que se f : [a, b] −→ Rm é um caminho integrável e

A : Rm −→ Rn é uma transformação linear, então A ◦ f : [a, b] −→ Rn é integrável e
Zb Zb
(A ◦ f)(t) dt = A f(t) dt .
a a
Análise
3 Os teoremas clássicos do Cálculo
Regra da cadeia
Sejam ϕ : I −→ J uma função real diferenciável no ponto a ∈ I e f : J −→ Rn um caminho

diferenciável no ponto b = ϕ(a). Então f ◦ ϕ : I −→ Rn é um caminho diferenciável no ponto a
e
(f ◦ ϕ) 0 (a) = ϕ 0 (a)f 0 (ϕ(a)) .
• Basta aplicar a regra da cadeia em cada uma das funções coordenadas fi ◦ ϕ do caminho
f ◦ ϕ.
Observação 3.1. A função composta t 7−→ f(ϕ(t)) pode ser interpretada como uma mudança
de variável no caminho f, que equivale a descrever o mesmo percurso de outra maneira, sendo
o vetor velocidade (f◦ϕ) 0 (a) = ϕ 0 (a)f 0 (ϕ(a)) no ponto a um múltiplo escalar do vetor velocidade
de f no ponto ϕ(a).
• Os seis teoremas abaixo se demonstram observando quese f = (f1 , . . . , fn ), então

Zb Zb Zb
0 0 0
f = (f1 , . . . , fn ) e f(t) dt = f1 (t) dt , . . . , fn (t) dt , e, aplicando às funções
a a a
coordenadas, o teorema correspondente para funções reais de uma variável real.
Mudança de variável na integral
Se f : [a, b] −→ Rn é um caminho contı́nuo e ϕ : [c, d] −→ [a, b] é uma função com derivada

integrável, então
Z ϕ(d) Zd
f(x) dx = f(ϕ(t)) ϕ 0 (t) dt .
ϕ(c) c
Teorema Fundamental do Cálculo
Se f : [a, b] −→ Rn é um caminho com derivada integrável, então

Zb Z1
0
f(b) − f(a) = f (t) dt = f(a + (b − a)t) (b − a) dt .
a 0
Definição 3.1. Seja f : [a, b] −→ Rn um caminho integrável. A integral indefinida de f é o

caminho F : [a, b] −→ Rn definido por Zx
F(x) = f(t) dt .
a

Os teoremas clássicos do Cálculo
Seja M > 0 tal que kf(t)k ≤ M para todo t ∈ [a, b]. Então, pela observação 2.6,
Zx Zy Z x

kF(x) − F(y)k = f(t) dt − f(t) dt = f(t) dt ≤ M kx − yk ,

a a y
e, portanto, F é lipschitziana. Em particular, F é contı́nua.
Derivação da integral indefinida
Se f : [a, b] −→ Rn é um caminho integrável contı́nuo no ponto c ∈ [a, b], então F é diferenciável

neste ponto e F 0 (c) = f(c).
Em particular, se f é um caminho contı́nuo, temos

Zb
F(b) − F(a) = f(t) dt .
a
Fórmula de Taylor infinitesimal
Seja f : I −→ Rn um caminho p vezes diferenciável no ponto a ∈ I e escrevemos, para todo h

tal que a + h ∈ I,
hp
f(a + h) = f(a) + f 0 (a) h + . . . + f(p) (a) + rp (h) .
p!
rp (h)
Então lim = 0.
h→0 hp
Fórmula de Taylor com resto integral
Seja f : [a, a + h] −→ Rn um caminho p vezes diferenciável no intervalo [a, a + h], com f(p)
integrável. Então,
hp−1
f(a + h) = f(a) + f 0 (a) h + . . . + f(p−1) (a) + rp ,
(p − 1)!
onde Z1 Z a+h
hp p−1 (p) 1
rp = (1 − t) f (a + th) dt = (a + h − x)p−1 f(p) (x) dx .
(p − 1)! 0 (p − 1)! a
Definição 3.2. Dizemos que um caminho f : [a, b] −→ Rn é uniformemente diferenciável,

quando, para todo ε > 0 dado, existe δ > 0 tal que
x, x + h ∈ [a, b] , 0 < |h| < δ =⇒ kf(x + h) − f(x) − f 0 (x)hk < ε|h| .
Teorema 3.1. Um caminho f : [a, b] −→ Rn é de classe C1 se, e só se, f é uniformemente

diferenciável.
Análise
Este teorema decorre do teorema análogo para funções reais.
Realmente:
• A diferenciabilidade uniforme de f não depende da norma considerada, pois duas normas

quaisquer em Rn são equivalentes;
• Um caminho f é uniformemente diferenciável na norma do máximo se, e só se, cada uma de
suas funções coordenadas fi é uniformemente diferenciável;
• Uma função fi : [a, b] −→ R é uniformemente diferenciável se, e só se, fi é de classe C1 (ver
Curso de Análise, Vol. I de E. Lima, pag. 277).
Observação 3.2. O Teorema do Valor Médio não vale para caminhos diferenciáveis em Rn ,
n > 1.
Por exemplo, seja f : [0, 2π] −→ R2 o caminho diferenciável dado por f(t) = (cos t, sen t).
Como f(2π) − f(0) = (0, 0) e |f 0 (t)| = 1 para todo t ∈ [0, 2π], não existe c ∈ (0, 2π) tal que
f(2π) − f(0) = 2π f 0 (c).
Tem-se, no entanto, na forma de desigualdade.
Teorema do Valor Médio
Seja f : [a, b] −→ Rn um caminho contı́nuo em [a, b] e diferenciável em (a, b). Se kf 0 (t)k ≤ M

para todo t ∈ (a, b), então kf(b) − f(a)k ≤ M (b − a) .
1a Demonstração: Suponhamos que, além das hipóteses acima, f 0 é integrável em cada su-
bintervalo compacto [c, d] ⊂ (a, b).
Pelo Teorema Fundamental do Cálculo, temos Zd

f(d) − f(c) = f 0 (t) dt .
c
Logo kf(d) − f(c)k ≤ M(d − c), para todo [c, d] ⊂ (a, b).
Como f é contı́nua em [a, b], e existem sequências (ck ) e (dk ) tais que a < ck < dk < b, com
lim ck = a e lim dk = b, temos que
kf(b) − f(a)k = lim kf(ck ) − f(dk )k ≤ M lim |ck − dk | = M |b − a| ,
k→∞ k→∞
ou seja, kf(b) − f(a)k ≤ M kb − ak .
2a Demonstração: Suponhamos que a norma k k provém de um produto interno, ou seja,

kxk2 = hx, xi para todo x ∈ Rn .

Seja ϕ : [a, b] −→ R a função real dada por ϕ(t) = hf(t), f(b) − f(a)i. Então ϕ é contı́nua em
[a, b], diferenciável em (a, b) e ϕ 0 (t) = hf 0 (t), f(b) − f(a)i para todo t ∈ (a, b).
Logo, pelo Teorema do Valor Médio para funções reais, existe c ∈ (a, b) tal que
ϕ(b) − ϕ(a) = (b − a) hf 0 (c), f(b) − f(a)i.
Então, pela Desigualdade de Cauchy-Schwarz,

kf(b) − f(a)k2 ≤ kf 0 (c)k kf(b) − f(a)k (b − a) ≤ M (b − a) kf(b) − f(a)k,
ou seja,
kf(b) − f(a)k ≤ M (b − a) .
3a Demonstração: (Caso Geral) Se baseia nos dois lemas abaixo.
Lema 3.1. Seja f : I −→ Rn um caminho diferenciável no ponto c ∈ I. Sejam (ak ) e (bk )

sequências tais que ak , bk ∈ I, ak 6= bk , ak ≤ c ≤ bk , lim ak = lim bk = c. Então,
f(bk ) − f(ak )
f 0 (c) = lim .
k→∞ bk − ak
Prova.
Sejam N 0 = {k ∈ N | ak = c}, N 00 = {k ∈ N | bk = c} e N 000 = {k ∈ N | k ∈ N | ak < c < bk }.
Então N = N 0 ∪ N 00 ∪ N 000 e N 0 , N 00 , N 000 são dois a dois disjuntos.
• Se N 0 ⊂ N é infinito, temos que a subsequência

f(bk ) − f(ak ) f(bk ) − f(c)
=
bk − ak k∈N 0
bk − c k∈N 0
0
converge para f (c), pois f é diferenciável em c.
• De modo análogo, se N 00 ⊂ N é infinito, a subsequência

f(bk ) − f(ak ) f(c) − f(ak )
=
bk − ak k∈N 00
c − ak k∈N 00
0
também converge para f (c).

000 f(bk ) − f(ak )
• Resta, agora, mostrar que se N ⊂ N é infinito, converge para f 0 (c).
bk − ak k∈N 000
Como ak < c < bk , podemos escrever

f(bk ) − f(ak ) f(bk ) − f(c) f(ak ) − f(c)
= (1 − tk ) + tk ,
bk − ak bk − c ak − c
a −c b −c
onde tk = k e, portanto, 1 − tk = k .
ak − bk bk − ak
Logo
f(bk ) − f(ak ) f(bk ) − f(c) f(ak ) − f(c)
− f 0 (c) = (1 − tk ) − f 0 (c) + tk − f 0 (c) .
bk − ak bk − c ak − c
Análise

f(ak ) − f(c) f(bk ) − f(c)
Assim, como e convergem para f 0 (c) e (tk ), (1 − tk )
ak − c k∈N 000
b k − c
k∈N 000
f(bk ) − f(ak )
são sequências limitadas, temos que converge para f 0 (c).
bk − ak k∈N 000
Lema 3.2. Sejam ϕ : [a, b] −→ R e f : [a, b] −→ Rn contı́nuas em [a, b] e diferenciáveis em

(a, b). Se kf 0 (t)k ≤ ϕ 0 (t) e ϕ 0 (t) > 0 para todo t ∈ (a, b), então kf(b) − f(a)k ≤ ϕ(b) − ϕ(a).
Prova.
Suponhamos que f e g são diferenciáveis no intervalo fechado [a, b] e admitamos que
kf(b) − f(a)k > ϕ(b) − ϕ(a).
Então existe A > 1 tal que

kf(b) − f(a)k > A (ϕ(b) − ϕ(a)) (> 0) .
Dividindo o intervalo [a, b] ao meio, em pelo menos em uma das metades, digamos, [a1 , b1 ],
temos que
kf(b1 ) − f(a1 )k > A (ϕ(b1 ) − ϕ(a1 )) .
Analogamente, em pelo menos uma das metades [a2 , b2 ] de [a1 , b1 ] temos que
kf(b2 ) − f(a2 )k > A(ϕ(b2 ) − ϕ(a2 )).
Prosseguindo desta maneira, obtemos uma sequência de intervalos

[a, b] ⊃ [a1 , b1 ] ⊃ . . . ⊃ [ak , bk ] ⊃ . . .
tais que
b−a
bk − ak = e kf(bk ) − f(ak )k > A (ϕ(bk ) − ϕ(ak )) , para todo k ∈ N.
2k
Além disso, as sequências (ak ) e (bk ) convergem para um mesmo ponto c ∈ [a, b], pois (ak ) é
não-decrescente limitada, (bk ) é não-crescente limitada e (bk − ak ) −→ 0.
Como ak 6= bk e ak ≤ c ≤ bk para todo k ∈ N temos, pelo lema 3.1, que

kf(bk ) − f(ak )k ϕ(bk ) − ϕ(ak )
kf 0 (c)k = lim ≥ A lim = A ϕ 0 (c) > ϕ 0 (c) .
k→∞ bk − ak k→∞ bk − ak
• Se ϕ e f são diferenciáveis apenas no intervalo aberto (a, b) temos, pelo provado acima, que
kf(d) − f(c)k ≤ ϕ(d) − ϕ(c) para todo [c, d] ⊂ (a, b).
Como ϕ e f são contı́nuas em [a, b] e existem sequências (ck ) e (dk ) de pontos de (a, b) tais
que ck < dk , lim ck = a e lim dk = b, temos que
kf(b) − f(a)k = lim kf(dk ) − f(ck )k ≤ lim (ϕ(dk ) − ϕ(ck )) = ϕ(b) − ϕ(a)
k→∞ k→∞
• A desigualdade do valor médio segue-se do lema 3.2, tomando ϕ(t) = M t .

Corolário 3.1. Se o caminho f : [a, b] −→ Rn é contı́nuo em [a, b] e possui derivada nula em

todos os pontos de (a, b), então f é constante.
Prova.
1
Sejam x ∈ (a, b] e n ∈ N. Como kf 0 (t)k ≤ para todo t ∈ (a, b), temos, pelo Teorema do
n
1
Valor Médio, que kf(x) − f(a)k ≤ kx − ak. Então,
n
1
kf(x) − f(a)k ≤ kx − ak lim = 0,
n→∞ n
ou seja, f(x) = f(a).
Observação 3.3. O corolário acima também pode ser demonstrado aplicando-se a cada
função coordenada fi de f o resultado análogo para funções reais.
Fórmula de Taylor com resto de Lagrange
Seja f : [a, a + h] −→ Rn um caminho de classe Cp−1 , p vezes diferenciável no intervalo aberto

(a, a + h). Se kf(p) (t)k ≤ M para todo t ∈ (a, a + h), então:
hp−1 (p−1)
f(a + h) = f(a) + h f 0 (a) + . . . + f (a) + rp ,
(p − 1)!
hp
onde krp k ≤ M .
p!
Ou equivalentemente, fazendo b = a + h,
(b − a)p−1 (p−1)
f(b) = f(a) + (b − a) f 0 (a) + . . . + f (a) + rp ,
(p − 1)!
(b − a)p
onde krp k ≤ M .
p!
Prova.
Seja g : [a, b] −→ Rn o caminho dado por
(b − t)p−1 (p−1)
g(t) = f(t) + (b − t)f 0 (t) + . . . + f (t)
(p − 1)!
(b − t)p−1 (p)
Então g é um caminho contı́nuo em [a, b], diferenciável em (a, b) e g 0 (t) = f (t) .
(p − 1)!
(b − t)p−1
Logo kg 0 (t)k ≤ M .
(p − 1)!
(b − t)p
Fazendo ϕ(t) = −M , temos, pelo lema 3.2, que
p!
(b − a)p
krp k = kg(b) − g(a)k ≤ ϕ(b) − ϕ(a) = M .
p!
Análise
4 Caminhos retificáveis
Definimos o comprimento de um caminho f : [a, b] −→ Rn como sendo a distância total

percorrida pelo ponto móvel f(t), quando t varia de a até b. Não é o mesmo que o comprimento
da imagem f([a, b]), pois, para ir de f(a) até f(b), o ponto f(t) pode passar pelo mesmo trecho
várias vezes (até infinitas).
√ √
Por exemplo, a imagem do caminho f : [− π, π] −→ R2 dado por f(t) = (cos(t2 ), sen(t2 )),
é o semi-cı́rculo S1+ = {(x, y) ∈ S1 | y ≥ 0}, cujo comprimento é π. Mas como f percorre S1+ duas
√ √
vezes quando t varia de − π a π, temos que o comprimento do caminho f é 2π.
• Seja f : [a, b] −→ Rn um caminho. A cada partição P = {t0 = a < t1 < . . . < tk = b} do

intervalo [a, b], associamos o número real não-negativo
Xk
`(f; P) = kf(ti ) − f(ti−1 )k .
i=1
Intuitivamente, `(f; P) é o comprimento da poligonal inscrita no caminho f com vértices nos

pontos f(ti ), i = 0, . . . , k.
Fig. 4: `(f; P) é o comprimento da poligonal de vértices f(ti ), i = 0, . . . , k.
Definição 4.1. Sejam P e Q partições do intervalo [a, b]. Dizemos que Q é mais fina que P
quando P ⊂ Q.
Teorema 4.1. Se P ⊂ Q, então `(f; P) ≤ `(f; Q).
Prova.
Suponhamos, primeiro, que Q = P ∪ {r}, onde ti−1 < r < ti . Então,
`(f; Q) − `(f; P) = kf(ti ) − f(r)k + kf(r) − f(ti−1 )k − kf(ti ) − f(ti−1 )k .
Como kf(ti ) − f(ti−1 )k ≤ kf(ti ) − f(r)k + kf(r) − f(ti−1 )k, temos que `(f; Q) ≥ `(f; P).
O caso geral prova-se aplicando o processo acima um número finito de vezes.
Definição 4.2. Seja f : [a, b] −→ Rn um caminho. Se o conjunto { `(f; P) | P é partição de [a, b] }

é limitado, dizemos que o caminho f é retificável e `(f) = sup `(f; P) é chamado o comprimento
P
do caminho f.

Caminhos retificáveis
Então, `(f) é caracterizado por:
(1) `(f) ≥ `(f; P) para toda partição P de [a, b].
(2) Dado ε > 0, existe uma partição P de [a, b] tal que `(f; P) > `(f) − ε.
Observação 4.1. Quando n = 1, um caminho retificável chama-se uma função de variação

limitada e o comprimento `(f) chama-se a variação total da função f no intervalo [a, b].
Observação 4.2. Todo caminho retificável f : [a, b] −→ Rn é limitado.

De fato, seja P = {a, t, b}, onde t ∈ [a, b]. Então,
kf(t) − f(a)k + kf(b) − f(t)k = `(f; P) ≤ `(f).
Logo,
kf(t)k ≤ kf(t) − f(a)k + kf(a)k ≤ `(f) + kf(a)k
para todo t ∈ [a, b] e, portanto, f é limitado.
Lema 4.1. Seja P0 uma partição de [a, b]. Então,

sup `(f; P) = sup `(f; Q) .
P Q⊃P0
Prova.
Como sup `(f; P) ≥ `(f; P) para toda partição P de [a, b], temos que
P
sup `(f; Q) ≤ sup `(f; P) .
Q⊃P0 P
Por outro lado, dada uma partição P, temos que Q 0 = P ∪ P0 é uma partição mais fina do que
P e P0 . Logo, pelo teorema 4.1,
`(f; P) ≤ `(f; Q 0 ) ≤ sup `(f; Q) ,

Q⊃P0
ou seja, sup `(f; Q) é uma cota superior do conjunto { `(f; P) | P é partição de [a, b]}.
Q⊃P0
Assim, sup `(f; P) ≤ sup `(f; Q} e. portanto, sup `(f; P) = sup `(f; Q) .
P Q⊃P0 P Q⊃P0
Teorema 4.2. Seja c ∈ [a, b]. Então o caminho f : [a, b] −→ Rn é retificável se, e só se, suas
restrições f1 = f|[a,c] e f2 = f|[c,b] são retificáveis. Neste caso, `(f) = `(f1 ) + `(f2 ).
Prova.
Suponhamos que f é retificável.
Seja P2 uma partição de [c, b] fixa e seja P1 uma partição de [a, c]. Então P = P1 ∪ P2 é uma
partição de [a, b] e `(f; P) = `(f1 ; P1 ) + `(f2 ; P2 ) .
Análise
Logo,
`(f1 ; P1 ) = `(f; P) − `(f2 ; P2 ) ≤ `(f) − `(f2 ; P2 ) ,
e, portanto, f1 é retificável e
`(f1 ) ≤ `(f) − `(f2 ; P2 ) .
Além disso, como `(f2 ; P2 ) ≤ `(f) − `(f1 ) para toda partição P2 de [c, b], temos que f2 é retificável
e `(f2 ) ≤ `(f) − `(f1 ), ou seja, `(f1 ) + `(f2 ) ≤ `(f).
Suponhamos agora que f1 e f2 são retificáveis. Dada uma partição P de [a, b] que contém c,
temos que P = P1 ∪ P2 , onde P1 é uma partição de [a, c] e P2 é uma partição de [c, b].
Como `(f; P) = `(f1 ; P1 ) + `(f2 ; P2 ) ≤ `(f1 ) + `(f2 ) e, pelo lema anterior, sup `(f; Q) = sup `(f; Q),
Q c∈Q
temos que f é retificável e `(f) ≤ `(f1 ) + `(f2 ).
Provamos, assim, que f é retificável se, e só se, f1 e f2 são retificáveis, e, neste caso,
`(f) = `(f1 ) + `(f2 ).
Observação 4.3.
• Seja f : [0, 1] −→ Rn o caminho retilı́neo f(t) = (1 − t) A + t B, com A, B ∈ Rn , e seja
P = {t0 = 0 < t1 < . . . < tk = 1} uma partição de [0, 1]. Como
kf(ti ) − f(ti−1 )k = k [ (1 − ti )A + ti B ] − [ (1 − ti−1 )A + ti−1 B ] k
= k (ti − ti−1 ) (B − A) k = (ti − ti−1 ) kB − Ak ,
para todo i = 0, . . . , k, temos que
X
k X
k
`(f; P) = kf(ti ) − f(ti−1 )k = kB − Ak (ti − ti−1 ) = kB − Ak .
i=1 i=1
Logo `(f) = kB − Ak. Aqui, k k é uma norma qualquer de Rn .
• Em geral,se um caminho retificável f : [a, b] −→ Rn tem extremidades A = f(a) e B = f(b),

então `(f) ≥ kf(b) − f(a)k = kB − Ak, pois P = {a, b} é uma partição de [a, b].
• Se `(f) = kB − Ak e a norma de Rn provém de um produto interno, então f([a, b]) ⊂ [A, B].
De fato, suponhamos que existe C ∈ f([a, b]) tal que C 6∈ [A, B] e seja c ∈ [a, b] tal que f(c) = C.
Como C 6∈ [A, B], temos que B − C não é múltiplo positivo de C − A, pois, caso contrário, existiria
λ > 0 tal que
λ 1
B − C = λ(C − A) =⇒ λC + C = B + λA =⇒ (1 + λ)C = λA + B =⇒ C = A+ B,
1+λ 1+λ
1
uma contradição, uma vez que C = (1 − t)A + tB, onde t = ∈ (0, 1).
1+λ
Logo, como a norma k k provém de um produto interno, kB − Ck + kC − Ak > kB − Ak.

Assim, para a partição P = {a, c, b}, temos que:

`(f; P) = kf(b) − f(c)k + kf(c) − f(a)k = kB − Ck + kC − Ak > kB − Ak ,
uma contradição, pois estamos supondo que `(f) = kB − Ak.
• Suponhamos, agora, que f : [a, b] −→ Rn é contı́nuo, `(f) = kB − Ak = kf(b) − f(a)k e que a

norma k k provém de um produto interno.
Então f([a, b]) = [A, B].
De fato, consideremos a aplicação g : [0, 1] −→ [A, B] dada por g(t) = (1−t) A+t B . A aplicação
g é contı́nua, sobrejetora e injetora, e sua inversa g−1 : [A, B] −→ [0, 1], dada por
kx − Ak
g−1 (x) = ,
kB − Ak
também é contı́nua.
Logo a função g−1 ◦ f : [a, b] −→ [0, 1] é contı́nua e, portanto, g−1 (f[a, b]) é um intervalo contido
no intervalo [0, 1] que contém os extremos 0 e 1, uma vez que f(a) = A e f(b) = B.
Assim, g−1 (f([a, b])) = [0, 1], ou seja, f([a, b]) = g([0, 1]) = [A, B].
• Se a norma não provém de um produto interno, podemos ter kB − Ak = kB − Ck + kC − Ak

sem que C ∈ [A, B], o que permite a existência de um caminho f com `(f) = kf(b) − f(a)k sem
que f([a, b]) esteja contido num segmento de reta.
Por exemplo, consideremos R2 com a norma da soma e

2
 f : [0, 2] −→ R dado por
seja o caminho contı́nuo
(0, 1 − t) se t ∈ [0, 1]
f(t) =
(1 − t, 0) se t ∈ [1, 2]
Então, pelo teorema 4.2, f é retificável e

`(f) = `( f|[0,1] ) + `( f|[1,2] )
= k(0, 1) − (0, 0)kS + k(0, 0) − (−1, 0)kS = 2 ,
uma vez que f|[0,1] e f|[1,2] são caminhos retilı́neos. Fig. 5: `(f) = 2
Portanto, `(f) = 2 = k(0, 1) − (−1, 0)kS = kf(2) − f(0)kS , apesar de f([a, b]) não estar contido
num segmento de reta.
Observação 4.4. `(f) = 0 ⇐⇒ f é um caminho constante.
Observação 4.5. Ser ou não ser retificável é uma propriedade do caminho f que não de-
pende da norma tomada em Rn , uma vez que duas normas quaisquer em Rn são equivalentes,
mas o comprimento `(f) depende da norma. Por exemplo, o segmento de reta que liga os pontos
Análise
A = (0, 1) e B = (1, 0) no plano tem comprimento 2 na norma da soma, 1 na norma do máximo

√
e 2 na norma euclidiana.
Observação 4.6. Se f : [a, b] −→ Rn é um caminho poligonal, temos, pelo teorema 4.2, que
`(f) é a soma dos comprimentos dos segmentos de reta que o compõem. Em particular, para
X
k
toda partição P = {t0 = a < t1 < . . . < tk = b} de [a, b], `(f; P) = kf(ti ) − f(ti−1 )k é,
i=1
realmente, o comprimento da poligonal inscrita em f, com vértices nos pontos f(ti ), i = 0, . . . , k.

(t, 0) se t 6= 1
Exemplo 4.1. O caminho f : [0, 2] −→ R2 dado por f(t) = é descontı́nuo,
(1, 1) se t = 1
mas é retificável e `(f) = 4, considerando R2 com a norma euclidiana.
De fato, pelo lema 4.1, basta considerarmos as partições P

de [0, 2] que contém o ponto ti = 1.
Sejam 0 < δ ≤ 1 e 0 < ε ≤ 1 tais que ti−1 = 1−δ e ti+1 = 1+ε.

Então,
p p
`(f; P) = (1 − δ) + 1 + δ2 + 1 + ε2 + 1 − ε ≤ 4 ,
p p
pois 1 − δ + 1 + δ2 ≤ 2 e 1 − ε + 1 + ε2 ≤ 2, uma vez que
p p
Fig. 6: `(f) = 4
1 + δ2 ≤ 1 + δ e 1 + ε2 ≤ 1 + ε.

1 1

Logo f é retificável e `(f) ≤ 4. Mas, dada Pn = 0, 1 − , 1, 1 + , 2 , temos que
r r n n
1 1 1 1

`(f; Pn ) = 1 − + 1 + 2 + 1 + 2 + 1 − ≤ `(f) ,
n n n n
para todo n ∈ N e, portanto,
4 = lim `(f; Pn ) ≤ `(f) .
n→∞
Assim, `(f) = 4 .
Teorema 4.3. O caminho f : [a, b] −→ Rn é retificável se, e só se, cada uma de suas funções
coordenadas fi : [a, b] −→ R, i = 1, . . . , n é retificável, ou seja, tem variação limitada.
Prova.
Como ser ou não ser retificável independe da norma, podemos tomar em Rn a norma da soma.
Logo,
X
n
`(f; P) = `(fi ; P) .
i=1
Portanto, se f é retificável, temos que

`(fi ; P) ≤ `(f; P) ≤ `(f) ,

para toda partição P de [a, b] e todo i = 1, . . . , n. Então fi tem variação limitada para todo
i = 1, . . . , n.
Por outro lado, se cada fi tem variação limitada, então

Xn X
n
`(f; P) = `(fi ; P) ≤ `(fi ) ,
i=1 i=1
para toda partição P de [a, b]. Logo f é retificável.
Observação 4.7. Toda função monótona f : [a, b] −→ R tem variação limitada e

`(f) = |f(b) − f(a)|.
De fato, suponhamos que f é não-decrescente. Dada P = {t0 = a < t1 < . . . < tk = b} uma
partição de [a, b], temos que
Xk X
k
`(f, P) = |f(ti ) − f(ti−1 )| = ( f(ti ) − f(ti−1 ) ) = f(b) − f(a) .
i=1 i=1
Corolário 4.1. Se cada função coordenada do caminho f é monótona, então f é retificável.

π
Exemplo 4.2. O caminho f : [0, 1] −→ R, dado por f(t) = t sen , se t 6= 0 e f(0) = 0, é
2t
contı́nuo, mas não é retificável.

1 1 1 1 1 1

De fato, para todo k = 4m − 1, m ∈ N, seja Pk = 0,, , . . . , , , , , 1 . Então:
k+1 k 5 4 3 2
1 1 1
1 (4m − 1)π 1 1
f(0) = 0 ; f =f = 0; f = sen =− =− ;
k+1 4m k 4m − 1 2 4m − 1 k
1
1
1 1 (4m − 3)π 1 1
f = sen(2m − 1)π = 0 ; f = sen = = ,
k−1 4m − 2 k−2 4m − 3 2 4m − 3 k−2
e assim sucessivamente, até
1 1 1 1 1
1
f = ; f = 0; f =− ; f = 0 e f(1) = 1 .
5 5 4 3 3 2
Logo,
1 1 1 1 1 1 1 1
`(f; Pk ) = 0 + + + + + ... + + + + + 1,
k k k−2 k−2 5 5 3 3
e, portanto,
1 1 1 1 1 1 1 1 1
`(f; Pk ) ≥
+ + + + ... + + + + + .
k+1 k k−1 k−2 6 5 4 3 2
X1
Como a série harmônica diverge, temos que o conjunto { `(f; P) ; P partição de [0, 1] } não
n
n≥1
é limitado e, portanto, f não tem variação limitada.

t sen 1 se t 6= 0
De modo análogo, podemos provar que g : [0, 1] −→ R , g(t) = t é uma
0 se t = 0 ,
função contı́nua, mas não é retificável.

Análise
Então, pelo teorema 4.3, o caminho h : [0, 1] −→ R2 , dado por


 t, t sen 1

se t 6= 0
h(t) = t
(0, 0) se t = 0 ,
é contı́nuo, mas não é retificável. Observe que h é um caminho injetivo (figura 7).
“ ” “ ”
Fig. 7: Caminho h(t) = t, t sen 1t Fig. 8: Caminho ξ(t) = t cos 1t , t sen 1
t
O caminho espiralado ξ : [0, 1] −→ R2 dado por


tei/t = t cos 1 , t sen 1

se t 6= 0
ξ(t) = t t
(0, 0) se t = 0 ,
também tem comprimento infinito, ou seja, não é retificável.
Neste exemplo, quando t −→ 0, o ponto ξ(t) tende para a origem (0, 0) dando infinitas voltas
em torno dela.
Observe que o caminho ξ também é injetivo (figura 8).
Observação 4.8. No exemplo 4.1, vimos que um caminho descontı́nuo pode ser retificável,
mas, como veremos abaixo, a descontinuidade de um caminho retificável f : [a, b] −→ Rn num
ponto c ∈ [a, b] não pode ser arbitrária.
Teorema 4.4. Seja f : [a, b] −→ Rn um caminho tal que, para cada c ∈ [a, b), a restrição f|[a,c]
é retificável. Se existe K > 0 tal que `(f|[a,c] ) ≤ K para todo c ∈ [a, b), então existe lim− f(t).
t→b
n
Analogamente, dado f : (a, b] −→ R tal que f|[c,b] é retificável para todo c ∈ (a, b], com
`(f|[c,b] ) ≤ K seja qual for c ∈ (a, b], então existe lim+ f(t).
t→a

Prova.
Vamos provar apenas o primeiro resultado, pois o outro demonstra-se de modo análogo.
Seja t1 < t2 < . . . < tk < . . . uma sequência crescente em [a, b) tal que lim tk = b.
k→∞
X
k
Então, para todo k ∈ N, kf(ti ) − f(ti−1 )k ≤ K, pois P = {a, t1 , . . . , tk } é uma partição de [a, c],
i=2
com c = tk .
X
Logo a série de números reais kf(ti ) − f(ti−1 )k é convergente, pois a sequência de suas
i≥2
reduzidas é não-decrescente e limitada superiormente por K. Assim, a sequência das reduzidas
X
da série de vetores ( f(ti ) − f(ti−1 ) ) é de Cauchy e, portanto, convergente.
i≥2
Como a reduzida de ordem k − 1 desta série é f(tk ) − f(t1 ), temos que existe lim f(tk ). Sendo a
k→∞
sequência crescente tk −→ b arbitrária, segue, pela Observação 8.4 do Capı́tulo 1, que o limite
lim f(t) existe.
t→b−
Corolário 4.2. Seja f : [a, b] −→ Rn um caminho retificável. Então existem os limites laterais
lim f(t) (se c 6= a) e lim+ f(t) (se c 6= b).
t→c− t→c
Definição 4.3. Dizemos que um caminho f : [a, b] −→ Rn é regulado se, para todo c ∈ [a, b],
existem os limites laterais f(c− ) = lim− f(t) (se c 6= a) e f(c+ ) = lim+ f(t) (se c 6= b), ou seja, se
t→c t→c
f só possui descontinuidade de 1a espécie.
Em particular, o conjunto dos pontos de descontinuidade de um caminho regulado é enu-

merável (ver Curso de Análise, Vol. I de E. Lima, pag. 233, Teorema 11)
Observação 4.9. Todo caminho retificável é regulado.
Definição 4.4. Dizemos que um caminho f : [a, b] −→ Rn é bem regulado quando ele é
regulado e, para todo c ∈ (a, b),
kf(c+ ) − f(c− )k = kf(c+ ) − f(c)k + kf(c) − f(c− )k .
Observação 4.10. Quando a norma provém de um produto interno, temos

kf(c+ ) − f(c− )k = kf(c+ ) − f(c)k + kf(c) − f(c− )k ,
se, e só se, f(c) pertence ao segmento de reta cujos extremos são f(c− ) e f(c+ ).
Mas, para uma norma arbitrária, podemos apenas afirmar que se f(c) ∈ [f(c− ), f(c+ )] para todo
c ∈ (a, b), então f é bem regulado.

Análise
Observação 4.11. Todo caminho contı́nuo é bem regulado.

Todo caminho regulado, lateralmente contı́nuo, ou seja, f(c+ ) = f(c) ou f(c− ) = f(c) para todo
c ∈ (a, b), é bem regulado.
Observação 4.12. Um caminho f : [a, b] −→ Rn regulado é bem regulado se, e só se, para
todo c ∈ (a, b), tem-se
lim ( kf(t) − f(c)k + kf(c) − f(s)k − kf(t) − f(s)k ) = 0 .
t → c+
s → c−
Exemplo 4.3. O caminho retificável f : [0, 2

 2] −→ R dado por
(t, 0) se t 6= 1
f(t) =
(1, 1) se t = 1 ,
não é bem regulado, pois f(1+ ) = f(1− ) = (1, 0) e, portanto,
kf(1+ ) − f(1− )k = 0 6= kf(1+ ) − f(1)k + kf(1− ) − f(1)k ,
para qualquer norma k k considerada em R2 .
Neste exemplo, não existe lim `(f; P), pois, se a partição P não contém o ponto 1, temos que
|P|→0
`(f; P) = 2, enquanto que, para partições Q que contém 1, temos lim `(f; Q) = 4 .
|Q|→0
Teorema 4.5. As seguintes afirmações a respeito de um caminho f : [a, b] −→ Rn são equi-

valentes:
(1) f é bem regulado e retificável, com `(f) = L.
(2) existe lim `(f; P) = L.

|P|→0
Prova.
(1)=⇒(2) Dado ε > 0 existe uma partição P0 = {t0 = a, t1 , . . . , tk = b} de [a, b] tal que
ε
L− < `(f; P0 ) ≤ L.
2
Seja 0 < δ < min { (ti − ti−1 ) } tal que
1≤i≤k
ε
ti − δ < s < ti < t < ti + δ =⇒ kf(t) − f(ti )k + kf(ti ) − f(s)k − kf(t) − f(s)k < ,
2k
para todo i = 1, . . . , k − 1 .
Seja P uma partição de [a, b] com |P| < δ. Então:

ε
L− < `(f; P ∪ P0 ) ≤ L ,
2
pois `(f; P0 ) ≤ `(f; P ∪ P0 ) , e 0 ≤ `(f; P ∪ P0 ) − `(f; P) = soma de no máximo k − 1 termos da
forma kf(t) − f(ti )k + kf(ti ) − f(s)k − kf(t) − f(s)k , onde [s, t] é um intervalo de P que contém

algum ti em seu interior, pois os demais intervalos de P são também de P ∪ P0 e, portanto,

desaparecem na diferença `(f; P ∪ P0 ) − `(f; P).
Observe que se |P| < δ, então existe no máximo um ti no interior de seus subintervalos, pois
0 < δ < min {ti − ti−1 }.
1≤i≤k
Logo se |P| < δ, então ti − δ < s < ti < t < ti + δ, para todo intervalo [s, t] de P que contém
ε(k − 1) ε
algum ti em seu interior, e, portanto, 0 ≤ `(f; P ∪ P0 ) − `(f; P) < < .
2k 2
Assim,
ε
L ≥ `(f; P) ≥ `(f; P ∪ P0 ) − > L − ε.
2
(2)=⇒(1) Dado ε > 0, existe δ > 0 tal que
|P| < δ =⇒ L − ε < `(f; P) < L + ε .
Seja P0 uma partição de [a, b] fixa com |P0 | < δ.
Então, se P ⊃ P0 , temos que |P| ≤ |P0 | < δ e, portanto,

L − ε < `(f; P) < L + ε .
Logo, como sup {`(f; P)} = sup{`(f; P)}, temos que f é retificável e L − ε < `(f) ≤ L + ε para todo
P⊃P0 P
ε > 0.
Assim, `(f) = L e, pela observação 4.9, f é regulado.
Vamos provar que f é bem regulado, ou seja, que
(kf(c+ ) − f(c)k + kf(c) − f(c− )k − kf(c+ ) − f(c− )k) = 0 ,
para todo c ∈ (a, b).
Dado c ∈ (a, b), seja Qk uma sequência de partições com lim |Qk | = 0 e c 6∈ Qk .
k→∞
Seja Pk = Qk ∪ {c}. Então lim `(f; Pk ) = lim `(f; Qk ) = L e

k→∞ k→∞
0 ≤ `(f; Pk ) − `(f; Qk ) = kf(c) − f(sk )k + kf(tk ) − f(c)k − kf(tk ) − f(sk )k ,
onde [sk , tk ] é o intervalo de Qk que contém c em seu interior.
Como lim |Qk | = 0, temos lim sk = lim tk = c, onde sk < c < tk .

k→∞ k→∞ k→∞
Então lim f(sk ) = f(c ) e lim f(tk ) = f(c+ ) . Logo,

−
k→∞ k→∞
0 = lim ( `(f; Pk ) − `(f; Qk ) ) = lim ( kf(c) − f(sk )k + kf(tk ) − f(c)k − kf(tk ) − f(sk )k )
k→∞ k→∞
= kf(c) − f(c )k + kf(c ) − f(c)k − kf(c+ ) − f(c− )k ,
− +
e, portanto, f é bem regulado.

Análise
Corolário 4.3. Seja f : [a, b] −→ Rn um caminho contı́nuo. Então f é retificável com compri-
mento L se, e só se, lim `(f; P) = L.
|P|→0
Observação 4.13. Seja f : [a, b] −→ Rn um caminho lipschitziano tal que

kf(s) − f(t)k ≤ K |s − t|
para s, t ∈ [a, b] quaisquer. Dada uma partição P = {t0 , t1 , . . . , tk } de [a, b], temos
X
k X
`(f; P) = kf(ti ) − f(ti−1 )k ≤ K (ti − ti−1 ) = K(b − a) .
i=1
Logo f é retificável e `(f) ≤ K(b − a) .
• Em particular, se f : [a, b] −→ Rn é um caminho de classe C1 , então f é lipschitziano, pois:
◦ f 0 ([a, b]) é limitado, ou seja, |f 0 (t)| ≤ M para todo t ∈ [a, b], uma vez que f 0 é contı́nuo e
[a, b] é um intervalo compacto;
◦ e, portanto, pela Desigualdade do Valor Médio, kf(s) − f(t)k ≤ M |s − t| para s, t ∈ [a, b]

quaisquer.
Logo todo caminho de classe C1 é retificável.
Teorema 4.6. Todo caminho f : [a, b] −→ RZn de classe C1 é retificável com

b
`(f) = kf 0 (t)k dt.
a
Prova.
Basta mostrar que Zb
lim `(f; P) = kf 0 (t)k dt .
|P|→0 a
Zεb > 0, existe δ1 > 0 tal que |P| < δ1 , então

Pela definição de integral, dado
X ε
kf 0 (t)k dt − 0
?
(kf k; P ) < 2,
a
?
onde P = (P, ξ), ξ = (t0 , . . . , tk−1 ), ou seja, ξi = ti−1 ∈ [ti−1 , ti ], e
X X
k
0
(kf k; P ) = ?
kf 0 (ti−1 )k (ti − ti−1 ) .
i=1
E, pela diferenciabilidade uniforme de f, existe δ2 > 0 tal que

|P| < δ2 =⇒ f(ti ) − f(ti−1 ) = (f 0 (ti−1 ) + ρi ) (ti − ti−1 ) ,
ε
com |ρi | < , para todo i = 1, . . . , k.
2(b − a)
Logo se |P| < δ2 , então:

O comprimento de arco como parâmetro
X X X

k k k
`(f; P) − kf 0 (ti−1 )k (ti − ti−1 ) = kf(ti ) − f(ti−1 )k − kf 0 (ti−1 )k |ti − ti−1 |

i=1 i=1 i=1
X
k
kf(ti ) − f(ti−1 )k − kf 0 (ti−1 )k |ti − ti−1 |

≤
i=1
Xk
≤ kf(ti ) − f(ti−1 ) − f 0 (ti−1 )(ti − ti−1 )k
i=1
Xk
ε X
k

= kρi (ti − ti−1 )k < ti − ti−1
2(b − a)
i=1 i=1
ε(b − a) ε
= = .
2(b − a) 2
Então se δ = min{ δ1 , δ2 } > 0 e |P| < δ , obtemos que:
Zb X X Zb
ε ε
`(f; P) − kf 0 (t)k dt ≤ `(f; P) − 0 0 0
? ?
(kf k; P ) + (kf k; P ) − kf (t)k dt < + = ε.
2 2

a a
Exemplo 4.4. Seja f : [0, 2π] −→ R2 , f(t) = (cos t, sen t). Então o comprimento de f é
Z 2π Z 2π
0
`(f) = kf (t)k dt = 1 dt = 2π .
0 0
√ √
E se g : [− π, π] −→ R2 , g(t) = (cos t2 , sen t2 ) , temos
Z √π Z √π Z √π √π
`(g) = √ kg (t)k dt = √ |2 t| dt = 2
0 2
2 t dt = 2t = 2π .
− π − π 0 0
5 O comprimento de arco como parâmetro
Definição 5.1. Seja g : [c, d] −→ Rn um caminho. Uma reparametrização de g é um caminho

g ◦ ϕ : [a, b] −→ Rn , onde ϕ : [a, b] −→ [c, d] é uma função monótona sobrejetora (e, portanto,
contı́nua, pelo teorema 10 da pag. 232 do livro Curso de Análise, Vol. I de E. Lima).
Quando
• ϕ é não-decrescente, ϕ(a) = c e ϕ(b) = d;
• ϕ é não-crescente, ϕ(a) = d e ϕ(b) = c;
• ϕ(s) = ϕ(t) com s < t, ϕ é constante em [s, t].

Análise
Observação 5.1. A reparametrização f = g ◦ ϕ : [a, b] −→ Rn é contı́nua ⇐⇒ o caminho

g : [c, d] −→ Rn é contı́nuo.
Essa observação segue-se do corolário 11.5 do Capı́tulo 1, pois ϕ : [a, b] −→ [c, d] é uma
função contı́nua do compacto [a, b] sobre o compacto [c, d].
Teorema 5.1. A reparametrização f = g ◦ ϕ : [a, b] −→ Rn é retificável se, e só se, o caminho

g : [c, d] −→ Rn é retificável. Neste caso, `(g ◦ ϕ) = `(g).
Prova.
(⇐=) Suponhamos que g é retificável. Seja P = {s0 , s1 , . . . , sk } uma partição de [a, b]. Se
ϕ(si−1 ) = ϕ(si ), temos que kg(ϕ(si )) − g(ϕ(si−1 ))k = 0.
Logo, para calcularmos o comprimento de g ◦ ϕ, basta considerarmos as partições P de [a, b]

tais que ϕ|P seja injetora. Neste caso, Q = ϕ(P) é uma partição de [c, d] e
X
k
`(g ◦ ϕ; P) = kg(ϕ(si )) − g(ϕ(si−1 ))k = `(g; Q) ≤ `(g) .
i=1
Assim, g ◦ ϕ é retificável e `(g ◦ ϕ) ≤ `(g).
(=⇒) Suponhamos que g ◦ ϕ é retificável e seja Q = {t0 , t1 , . . . , tk } uma partição de [c, d].
Então para todo i = 0, 1, . . . , k, existe si ∈ [a, b] tal que ϕ(si ) = ti .
Se ϕ é não-decrescente, podemos tomar s0 = a, sk = b, e teremos si−1 < si , para todo

i = 0, 1, . . . , k, ou seja, P = {s0 , s1 , . . . , sk } é uma partição de [a, b]. Logo,
X
k X
k
`(g; Q) = kg(ti ) − g(ti−1 )k = kg(ϕ(si )) − g(ϕ(si−1 ))k = `(g ◦ ϕ; P) .
i=1 i=1
Se ϕ é não-crescente, podemos tomar s0 = b, sk = a, e teremos si−1 > si para todo

i = 0, 1, . . . , k.
Então P = {ξ0 , ξ1 , . . . , ξk }, onde ξi = sk−i , é uma partição de [a, b] tal que

X
k X
k
`(g; Q) = kg(ti ) − g(ti−1 )k = kg(ϕ(si )) − g(ϕ(si−1 ))k
i=1 i=1
Xk X
k
= kg ◦ ϕ(ξk−i ) − g ◦ ϕ(ξk−(i−1) )k = kg ◦ ϕ(ξj ) − g ◦ ϕ(ξj−1 )k
i=1 j=1
= `(g ◦ ϕ; P) .
Logo `(g; Q) = `(g ◦ ϕ; P) ≤ `(g ◦ ϕ) para toda partição Q de [c, d].
Então g é retificável e `(g) ≤ `(g ◦ ϕ) e, portanto, `(g) = `(g ◦ ϕ).

Definição 5.2. Dizemos que um caminho retificável f : [a, b] −→ R é parametrizado pelo

comprimento de arco ou cadenciado, quando `(f|[a,t] ) = t − a para todo t ∈ [a, b].
Neste caso, se s < t, então `(f|[s,t] ) = t − s.
Teorema 5.2. Um caminho f : [a, b] −→ R de classe C1 é parametrizado pelo comprimento

de arco se, e só se, kf 0 (t)k = 1 para todo t ∈ [a, b] .
Prova. Zt
Se f é parametrizado pelo comprimento de arco, então kf 0 (s)k ds = t − a para todo t ∈ [a, b].
Zτ a
d
Logo |f (t)| =
0
kf 0 (s)k ds = 1.
dτ a
Reciprocamente, se kf 0 (t)k = 1 para todo t ∈ [a, b], então
Zt Zt
0
`(f|[a,t] ) = kf (s)k ds = 1 ds = t − a .
a a
Exemplo 5.1. O caminho f : [0, 2π] −→ R2 , f(t) = (cos t, sen t), é parametrizado pelo compri-
mento de arco, pois f ∈ C∞ e kf 0 (t)k = 1 para todo t ∈ [0, 2π].
Lema 5.1. Se f : [a, b] −→ Rn é um caminho contı́nuo retificável, então a função σ : [a, b] −→

[0, L], L = `(f), definida por σ(t) = `(f|[a,t] ), é contı́nua. Como σ(b) = L, σ é sobrejetiva.
Prova.
Vamos mostrar que σ é contı́nua no ponto a. Como σ é monótona não-decrescente, existe
A = lim+ σ(t) = inf{ σ(t) | t ∈ (a, b] }
t→a
4A
Suponhamos, por absurdo, que A > 0 = σ(0). Então existe c1 ∈ (a, b] tal que A ≤ σ(c1 ) < .
3
4A A
Logo A ≤ σ(t) ≤ σ(c1 ) < para todo t ∈ (a, c1 ], e, portanto, `(f|[t,c1 ] ) = σ(c1 ) − σ(t) < .
3 3
A
Por outro lado, sendo f contı́nua em a, existe c2 ∈ (a, b) tal que t ∈ [a, c2 ] =⇒ kf(t) − f(a)k < .
3
Seja c = min{ c1 , c2 }. Então, para toda partição P de [a, c], temos
X
k
A A A 2A
`(f|[a,c] ; P) = kf(t1 ) − f(a)k + kf(ti ) − f(ti−1 )k < + `(f|[t1 ,c] ) < + = .
3 3 3 3
i=2
2A
Logo σ(c) = `(f|[a,c] ) ≤ < A , uma contradição.
3
De modo análogo, podemos provar que
sup { σ(t) | t ∈ [a, b) } = L = σ(b) ,

Análise
e, portanto,
lim σ(t) = sup{ σ(t) | t ∈ [a, b) } = L = σ(b) ,
t→b−
ou seja, σ é contı́nua no ponto b.
No caso geral, tome t0 ∈ (a, b). Como f|[a,t0 ] : [a, t0 ] −→ Rn é um caminho contı́nuo e retificável,
temos, pelo observado acima, que lim− σ(t) = σ(t0 ).
t→t0
E, por outro lado, como f|[t0 ,b] : [t0 , b] −→ Rn é um caminho contı́nuo retificável e
ψ(t) = `(f|[t0 ,t] ) = σ(t) − `(f|[a,t0 ] ) ,
temos, pelo provado acima, que lim+ ψ(t) = ψ(t0 ) = 0 e, portanto,

t→t0

lim+ σ(t) = lim+ ψ(t) + `(f|[a,t0 ] ) = `(f|[a,t0 ] ) = σ(t0 ) .
t→t0 t→t 0
Teorema 5.3. Todo caminho contı́nuo retificável f : [a, b] −→ Rn é a reparametrização de

um caminho parametrizado pelo comprimento de arco g : [0, L] −→ Rn , L = `(f), o qual é,
necessariamente, contı́nuo.
Prova.
Consideremos o diagrama abaixo:
f
[a, b] - Rn

σ
g
?
[0, L]
Dado s < t em [a, b], temos σ(t) = σ(s) + `(f|[s,t] ) .
Portanto, σ(s) = σ(t) =⇒ `(f|[s,t] ) = 0 =⇒ f é constante em [s, t] =⇒ f(s) = f(t).
Definimos g : [0, L] −→ Rn da seguinte maneira: dado u ∈ [0, L], existe t ∈ [a, b] tal que
σ(t) = u. Pomos, então, g(u) = f(t). O caminho g está bem definido, pois se σ(t) = σ(s) = u,
então f(s) = f(t).
Como f = g ◦ σ, f : [a, b] −→ Rn é contı́nuo e σ : [a, b] −→ [0, L] é contı́nua e sobrejetora, temos,

pelo corolário 11.5 do capı́tulo 1, que g é contı́nuo. E, pelo teorema 5.1, g é retificável, uma vez
que f é retificável.
Para provar que g é parametrizado pelo comprimento de arco, tome s ∈ [0, L] arbitrário. Então
existe t ∈ [a, b] tal que σ(t) = s e, portanto, pelo teorema 5.1,
`(g|[0,s] ) = `(g ◦ σ|[a,t] ) = `(f|[a,t] ) = σ(t) = s .

Corolário 5.1. Um caminho contı́nuo é retificável se, e só se, é a reparametrização de um

caminho lipschitziano.
Prova.
(⇐=) Como todo caminho lipschitziano é retificável, temos, pelo teorema 5.1, que toda repa-
rametrização de um caminho lipschitziano é retificável.
(=⇒) Se f é um caminho contı́nuo retificável, então f = g ◦ σ, onde g é parametrizado pelo

comprimento de arco.
Como kg(t) − g(s)k ≤ `(g|[s,t] ) = |t − s| , temos que g é lipschitziano.
Observação 5.2. Seja f : [a, b] −→ Rn um caminho contı́nuo retificável, e seja um caminho

parametrizado pelo comprimento de arco g : [0, L] −→ Rn , do qual f é uma reparametrização.
Então, se f = g ◦ ψ, onde ψ : [a, b] −→ [0, L] é monótona não-decrescente e sobrejetora, temos:
ψ(t) = `(g|[0,ψ(t)] ) = `(g ◦ ψ|[a,t] ) = `(f|[a,t] ) .
Logo ψ é determinada de modo único e, portanto, o caminho g : [0, L] −→ Rn parametrizado

pelo comprimento de arco tal que f = g ◦ ψ, com ψ não-decrescente, também o é.
Agora, se ψ : [a, b] −→ [0, L] é monótona não-crescente e sobrejetora, temos que
ψ(t) = `(g|[0,ψ(t)] ) = `(g ◦ ψ|[t,b] ) = `(f|[t,b] ) = `(f|[a,b] ) − `(f|[a,t] ) = L − σ(t) ,
onde σ(t) = `(f|[a,t] ).
Logo f(t) = g(ψ(t)) = g(L − σ(t)) e, portanto, dado s = σ(t) ∈ [0, L], temos que
g(L − s) = f(t) = g̃(σ(t)) = g̃(s),
onde g̃ : [0, L] −→ Rn é o caminho parametrizado pelo comprimento de arco tal que f = g̃ ◦ σ.
Assim, g(s) = g̃(L − s) para todo s ∈ [0, L], ou seja, g é o caminho g̃ percorrido em sentido
contrário.
Observação 5.3. Um caminho pode ser retificável sem ser lipschitziano. Por exemplo, o
√
caminho f : [0, 1] −→ R2 , dado por f(t) = (t, t) é retificável, pois suas funções coordenadas
√
são monótonas, mas não é lipschitziano, uma vez que a função t 7−→ t, t ∈ [0, 1], não é
lipschitziana.
Definição 5.3. Dizemos que um caminho diferenciável f : [a, b] −→ Rn é regular quando

f 0 (t) 6= 0 para todo t ∈ [a, b].

Análise
Observação 5.4. Seja f : I −→ J uma função regular, ou seja, diferenciável com f 0 (t) 6= 0,
para todo t ∈ I, onde f(I) = J, I, J intervalos da reta.
Então, pelo Teorema do Valor Intermediário para a derivada (teorema de Darboux), temos que
ou f 0 (t) > 0 para todo t ∈ I e f é, então, monótona crescente, ou f 0 (t) < 0 para todo t ∈ I, sendo
f, portanto, monótona decrescente.
Em particular, para n = 1, um caminho f : I −→ Rn regular é injetivo, o que não é verdade, em

geral, quando n > 1.
Por exemplo, o caminho f : [a, b] −→ R2 dado por f(t) = (cos t, sen t), é regular, mas não é
injetivo se b − a > 2π.
Se f : I → J é regular e f(I) = J, temos, pelo Teorema da Função Inversa (ver Curso de Análise,
Vol I de E. Lima, pag. 274, corolário 6), que f−1 : J −→ I é diferenciável e
1
(f−1 ) 0 (y) = ,
f 0 (f−1 (y))
para todo y ∈ J.
E, também, se f ∈ Ck , então f−1 ∈ Ck , pois:

1
• Se f ∈ C1 , então f 0 ◦ f−1 é contı́nua, e, portanto, (f−1 ) 0 = é contı́nua, ou seja, f−1 é de
f0 ◦ f−1
classe C1 .
• Suponhamos, por indução, que se f ∈ Ck−1 , então f−1 ∈ Ck−1 .

1
Assim, se f ∈ Ck , então f 0 ∈ Ck−1 , e, portanto, (f−1 ) 0 = é de classe Ck−1 , ou seja, f−1 é
f0 ◦ f−1
de classe Ck .
Definição 5.4. Dizemos que uma função diferenciável bijetora f : I −→ J é um difeomorfismo

quando f−1 : J −→ I é diferenciável.
Em particular, todo difeomorfismo f : I −→ J é regular, pois f ◦ f−1 = Id e, pela regra da

cadeia, f 0 (f−1 (y))(f−1 ) 0 (y) = 1 para todo y ∈ J.
E, reciprocamente, se f : I −→ J = f(I) é uma função regular, então, pela observação

acima, f é um difeomorfismo.
No teorema abaixo, vamos considerar Rn com a norma euclidiana.
Teorema 5.4. Sejam f : [a, b] −→ Rn um caminho regular de classe Ck (k ≥ 1), L = `(f) e

g : [0, L] −→ Rn um caminho parametrizado pelo comprimento de arco do qual f = g ◦ σ é uma
reparametrização. Então g ∈ Ck e σ : [a, b] −→ [0, L] é um difeomorfismo de classe Ck . Em
particular, g = f ◦ σ−1 é uma reparametrização de f pelo comprimento de arco.

A função-ângulo
Prova.
• Se σ é monótona não-decrescente, temos, pelaZobservação 5.2, que
t
σ(t) = `(f|[a,t] ) = kf 0 (s)k ds .
a
Logo σ (t) = kf (t)k > 0 para todo t ∈ [a, b]. Como k k é a norma euclidiana, temos que σ 0 é
0 0
diferenciável e
hf 00 (t), f 0 (t)i
σ 00 (t) = ,
kf 0 (t)k
caso f ∈ Ck , k ≥ 2.
Então, se f ∈ C1 , σ : [a, b] −→ [0, 1] é um difeomorfismo de classe C1 , pois σ 0 = k k ◦ f 0 é

contı́nua.
E, se f ∈ Ck , k ≥ 2, σ 0 é de classe Ck−1 , ou seja, σ : [a, b] −→ [0, L] é um difeomorfismo de

classe Ck .
hf 00 (t), f 0 (t)i
De fato, se k = 2, σ 00 é contı́nuo, pois σ 00 (t) = , t ∈ [a, b], e as funções f 0 e f 00 são
kf 0 (t)k
contı́nuas. Então σ é de classe C2 .
Suponhamos, por indução, que se f ∈ Ck , k ≥ 2, então σ 0 ∈ Ck−1 .
Seja f ∈ Ck+1 . Então f 0 , f 00 e σ 0 são de classe Ck−1 e, portanto, σ 00 é de classe Ck−1 . Assim, σ 0 é
de classe Ck .
• No caso em que σ é monótona não-crescente,

Z ou seja, t
σ(t) = L − kf 0 (s)k ds ,
a
verifica-se, de modo análogo ao anterior, que σ : [a, b] −→ [0, L] é um difeomorfismo de classe

Ck .
Em qualquer caso, g = f ◦ σ−1 : [0, L] −→ Rn é um caminho de classe Ck , pois f e σ−1 são de

classe Ck .
6 A função-ângulo
Seja z : [a, b] −→ R2 um caminho tal que kz(t)k = 1 para todo t ∈ [a, b], onde k k é a
norma euclidiana. Podemos, portanto, escrever z : [a, b] −→ S1 .
Uma função-ângulo para o caminho z : [a, b] −→ S1 é uma função θ : [a, b] −→ R tal que
z(t) = (cos θ(t), sen θ(t)) para todo t ∈ [a, b].

Análise
Seja ξ : R −→ S1 a função exponencial dada por ξ(t) = (cos t, sen t) = eit .
Então θ : [a, b] −→ R é uma função-ângulo para o caminho z se, e só se, z = ξ ◦ θ.
Teorema 6.1. Todo caminho z : [a, b] −→ S1 de classe Cr , r ≥ 1, possui uma função-ângulo

de classe Cr . Mais precisamente, dado θ0 ∈ R tal que z(a) = (cos θ0 , sen θ0 ), z admite uma
única função-ângulo θ : [a, b] −→ R de classe Cr tal que θ(a) = θ0 .
Prova.
Unicidade (válida também para funções-ângulo contı́nuas).
Sejam θ, ϕ : [a, b] −→ R duas funções contı́nuas tais que ξ ◦ θ = ξ ◦ ϕ = z.
Então θ(t) − ϕ(t) é um múltiplo inteiro de 2π para todo t ∈ [a, b].

θ(t) − ϕ(t) θ(t) − ϕ(t)
Como a função t 7−→ é contı́nua e ∈ Z para todo t ∈ [a, b], temos que
2π 2π
θ(t) − ϕ(t) = 2πk para algum k ∈ Z fixo.
Logo, se ϕ(a) = θ(a) = θ0 , temos k = 0 e, portanto, ϕ(t) = θ(t) para todo t ∈ [a, b].
Existência
Seja z : [a, b] −→ S1 um caminho de classe Cr tal que z(a) = ξ(θ0 ).
Então, se z(t) = (x(t), y(t)), as funções coordenadas x, y : [a, b] −→ R são de classe Cr , com
x(a) = cos θ0 e y(a) = sen θ0 .
Como |z(t)| = 1 para todo t ∈ [a, b], temos que

1 d
hz 0 (t), z(t)i = hz(t), z(t)i = 0 ,
2 dt
para todo t ∈ [a, b], ou seja, z 0 (t) ⊥ z(t), para todo t ∈ [a, b].
Portanto, z 0 (t) é um múltiplo do vetor w(t) = (−y(t), x(t)) para todo t ∈ [a, b].
Assim, para todo t ∈ [a, b], existe λ(t) ∈ R tal que z 0 (t) = λ(t) w(t), ou seja, x 0 (t) = −λ(t) y(t)
e y 0 (t) = λ(t) x(t).
Além disso, como λ(t) = hw(t), z 0 (t)i, para todo t ∈ [a, b], temos que λ é de classe Cr−1 .
Seja θ : [a, b] −→ R definida por Zt

θ(t) = θ0 + λ(s) ds .
a
Então θ(a) = θ0 e θ 0 (t) = λ(t) para todo t ∈ [a, b]. Logo θ é de classe Cr .
Agora vamos provar que x(t) = cos θ(t) e y(t) = sen θ(t) para todo t ∈ [a, b].
De fato, como θ 0 = λ, x 0 = −λy e y 0 = λx, temos que:

A função-ângulo
• ( x(t) cos θ(t) + y(t) sen θ(t) ) 0 = x 0 (t) cos θ(t) − x(t) θ 0 (t) sen θ(t)
+y 0 (t) sen θ(t) + y(t) θ 0 (t) cos θ(t)
= −λ(t) y(t) cos θ(t) − x(t) λ(t) sen θ(t)
+λ(t) x(t) sen θ(t) + y(t) λ(t) cos θ(t) = 0
• ( y(t) cos θ(t) − x(t) sen θ(t) ) 0 = y 0 (t) cos θ(t) − y(t) θ 0 (t) sen θ(t)
−x 0 (t) sen θ(t) − x(t) θ 0 (t) cos θ(t)
= λ(t) x(t) cos θ(t) − y(t) λ(t) sen θ(t)
+λ(t) y(t) sen θ(t) − x(t) λ(t) cos θ(t) = 0 ,
para todo t ∈ [a, b]. Então,
• x(t) cos θ(t) + y(t) sen θ(t) = x(a) cos θ(a) + y(a) sen θ(a)
= cos2 θ0 + sen2 θ0 = 1 (I)
e
• y(t) cos θ(t) − x(t) sen θ(t) = y(a) cos θ(a) − x(a) sen θ(a)
= sen θ(a) cos θ(a) − cos θ(a) sen θ(a) = 0 , (II)
para todo t ∈ [a, b].
Como, para todo t ∈ [a, b],

{ ( cos θ(t), sen θ(t) ) , ( − sen θ(t), cos θ(t) ) }
é uma base ortonormal de R2 , temos que

z(t) = (x(t), y(t))
= h(x(t), y(t)), (cos θ(t), sen θ(t))i (cos θ(t), sen θ(t))
+h(x(t), y(t)), (− sen θ(t), cos θ(t))i (− sen θ(t), cos θ(t)) ,
Logo, por (I) e (II), obtemos

z(t) = ( cos θ(t), sen θ(t) ) ,
Corolário 6.1. Seja f : [a, b] −→ R2 − {0} um caminho de classe Cr , r ≥ 1. Dado θ0 ∈ R tal

que f(a) = kf(a)k (cos θ0 , sen θ0 ), existe uma única função de classe Cr , θ : [a, b] −→ R, tal que
θ(a) = θ0 e f(t) = kf(t)k (cos θ(t), sen θ(t)), para todo t ∈ [a, b].
Prova.
f(t)
Basta tomar a função-ângulo θ do caminho z(t) = com θ(a) = θ0 , uma vez que, pela
kf(t)k
observação 1.8, z é de classe Cr .

Análise
Corolário 6.2. Seja f : [a, b] −→ R2 −{0} um caminho de classe Cr por partes. Dado θ0 ∈ R tal
que f(a) = kf(a)k (cos θ0 , sen θ0 ), existe uma única função de classe Cr por partes θ : [a, b] −→
R tal que θ(a) = θ0 e f(t) = kf(t)k(cos θ(t), sen θ(t)), para todo t ∈ [a, b].
Prova.
Seja P = {t0 = a < t1 < . . . < tk = b} uam partição do intervalo [a, b] tal que f|[ti−1 ,ti ] é de
classe Cr , para todo i = 1, . . . , k.
Então, pelo teorema anterior, f|[a,t1 ] possui uma função-ângulo θ1 : [a, t1 ] −→ R de classe Cr tal
que θ1 (a) = θ0 . Como f|[t1 ,t2 ] é de classe Cr , existe uma função-ângulo θ2 : [t1 , t2 ] −→ R, com
θ2 (t1 ) = θ1 (t1 ), para o caminho f|[t1 ,t2 ] .
Prosseguindo deste modo, obtemos, para cada i = 2, . . . , k, uma função-ângulo de classe Cr

θi : [ti−1 , ti ] −→ R para o caminho f|[ti−1 ,ti ] , com θi (ti−1 ) = θi−1 (ti−1 ).
Então, a função θ : [a, b] −→ R, definida por θ(t) = θi (t), se t ∈ [ti−1 , ti ], é contı́nua e θ|[ti−1 ,ti ] é
de classe Cr para todo i = 1, . . . , k. Logo θ é de classe Cr por partes e é a única função-ângulo
de classe Cr por partes do caminho f tal que θ(a) = θ0 .
Observação 6.1. Seja f : [a, b] −→ R2 − {0} um caminho de classe Cr , r ≥ 1. Se uma função

contı́nua θ : [a, b] −→ R é tal que f(t) = kf(t)k (cos θ(t), sen θ(t)) para todo t ∈ [a, b], então θ é
uma função de classe Cr .
f(t)
De fato, seja ϕ : [a, b] −→ R a função-ângulo de classe Cr para o caminho z(t) = tal
kf(t)k
que ϕ(a) = θ(a). Como a unicidade no teorema 6.1 foi provada para funções-ângulo contı́nuas,
temos que θ = ϕ e, portanto, θ é de classe Cr .
Observação 6.2. Se z : [a, b] −→ S1 é um caminho contı́nuo e z(a) = (cos θ0 , sen θ0 ), então

existe uma única função-ângulo θ : [a, b] −→ R contı́nua tal que θ(a) = θ0 e
z(t) = (cos θ(t), sen θ(t)) ,
para todo t ∈ [a, b] (ver exercı́cio 7.1).

Capı́tulo 3
Funções reais de n variáveis
1 Derivadas parciais
Definição 1.1. Seja f : U −→ R uma função real definida num subconjunto aberto U ⊂ Rn .
Dado a ∈ U, a i−ésima derivada parcial de f no ponto a, 1 ≤ i ≤ n, é o limite
∂f f(a + tei ) − f(a)
(a) = lim ,
∂xi t→0 t
quando tal limite existe. Usa-se também a notação ∂i f(a).
Observação 1.1. Dados o ponto a ∈ U e i ∈ {1, . . . , n}, a imagem do caminho de classe C∞

λ : R −→ Rn , λ(t) = a + tei , é a reta que passa por a e é paralela ao i−ésimo eixo. Como U é
aberto e a ∈ U, existe ε > 0 tal que t ∈ (−ε, ε) =⇒ λ(t) = a + tei ∈ U.
A i−ésima derivada parcial de f no ponto a é, portanto, a derivada da função f ◦ λ : (−ε, ε) −→ R

∂f
no ponto t = 0, ou seja, (a) = (f ◦ λ) 0 (0), pois
∂xi
f ◦ λ(t) − f ◦ λ(0) f(a + tei ) − f(a) ∂f
(f ◦ λ) 0 (0) = lim = lim = (a) .
t→0 t t→0 t ∂xi
• Assim, o cálculo prático da i−ésima derivada parcial de uma função real f(x1 , . . . , xn ) se faz
considerando todas as variáveis como se fossem constantes, exceto a i−ésima, e aplicando as
regras usuais de derivação em relação a esta variável.
Observação 1.2. Quando n = 2, o gráfico de f, G = {(x, y, f(x, y)), | (x, y) ∈ Dom(f)} é uma
”superfı́cie” em R3 , e a restrição de f ao segmento de reta que passa por c = (a, b) e é paralelo
ao eixo das abscissas tem como gráfico uma curva plana x 7−→ (x, b, f(x, b)) obtida na superfı́cie
∂f
fazendo y constante igual a b. Portanto, (a, b) é a inclinação da reta tangente a esta curva,
∂x
no ponto (a, b, f(a, b)), em relação ao plano horizontal, uma vez que:
117
Análise
∂f
Fig. 1: ∂x
(a, b) é a inclinação da reta r

∂f

∂f

r= 1, 0, (a, b) t + (a, b, f(a, b)) | t ∈ R = x, b, (a, b)(x − a) + f(a, b) |x ∈ R .
∂x ∂x
∂f
Observação 1.3. A i-ésima derivada parcial dá informações sobre o comportamento de
∂xi
f ao longo de um segmento de reta contido em U e paralelo ao i−ésimo eixo.
• Por exemplo, se f : U −→ R está definida num aberto U ⊂ R2 , J = {(a, t) | t ∈ [0, 1]} ⊂ U e

∂f
(a, t) > 0 para todo t ∈ [0, 1], então f é crescente ao longo de J, ou seja,
∂y
0 ≤ s < t ≤ 1 =⇒ f(a, s) < f(a, t).
Definição 1.2. Dizemos que uma função f : U ⊂ Rn −→ R não depende da i−ésima variável
quando a, b ∈ U, b = a + tei =⇒ f(a) = f(b).
∂
Neste caso, existe f(a) em todos os pontos a ∈ U e é igual a zero. Mas a recı́proca
∂xi
nem sempre é verdadeira, como veremos abaixo.
Definição 1.3. Um conjunto U ⊂ Rn é chamado i−convexo (1 ≤ i ≤ n) quando:

a, b ∈ U, b = a + tei =⇒ [a, b] = {a + sei | s ∈ [0, t]} ⊂ U.
∂f
• Assim, se U ⊂ Rn é um aberto i−convexo e f : U −→ R é uma função tal que (a) = 0
∂xi
para todo a ∈ U, então f independe da i−ésima variável.
De fato, se a, b ∈ U, b = a + t0 ei , então λ(s) = a + sei ∈ U, para todo s ∈ [0, t0 ], e, portanto,

existe ε > 0 tal que λ(s) ∈ U para todo s ∈ (−ε, t0 + ε).
∂f
Além disso, como f ◦ λ é derivável em (−ε, t0 + ε) e (f ◦ λ) 0 (s) = (a + sei ) = 0 para todo
∂xi
s ∈ (−ε, t0 + ε), então f ◦ λ(s) = f ◦ λ(0) para todo s ∈ (−ε, t0 + ε). Logo f(b) = f(a).

Derivadas parciais
Observação 1.4. Em R2 , dizemos horizontalmente e verticalmente convexo, em vez de

1−convexo e 2−convexo, respectivamente.
Exemplo 1.1. Seja Γ = {(x, 0) ∈ R2 | x ≥ 0} o semi-eixo positivo fechado das abscissas. Então
U = R2 − Γ é aberto, horizontalmente convexo, mas não é verticalmente convexo.
Fig. 2: U = R2 − Γ
Seja f : U −→ R a função definida por f(x, y) = x2 , se x > 0 e y > 0, e f(x, y) = 0, se x ≤ 0 ou

∂f
y ≤ 0. Então f possui derivada parcial (p) = 0 para todo ponto p ∈ U, pois:
∂y
0 = {(0, t) | t > 0} ;
• f|r+0 ≡ 0 , onde r+
0 = {(0, t) | t < 0} ;
• f|r−0 ≡ 0 , onde r−
• f|rx0 ≡ 0 , onde rx0 = {(x0 , t) | t ∈ R} e x0 < 0;
x0 = {(x0 , t) | t > 0} , rx0 = {(x0 , t) | t < 0} e x0 > 0.

• f|r+x ≡ x20 e f|r−x ≡ 0 , onde r+ −
0 0
Mas f não é independente da segunda variável, pois se x > 0 e y > 0, então f(x, y) = x2 > 0 e
f(x, −y) = 0.
Observação 1.5. A existência apenas das derivadas parciais não permite conclusões sobre
o comportamento n−dimensional da função. Por exemplo, a existência de todas as derivadas
parciais num ponto não implica a continuidade da função nesse ponto.
xy
Exemplo 1.2. Seja f : R2 −→ R, definida por f(x, y) = , se (x, y) 6= (0, 0), e f(0, 0) = 0.
x2 + y2
Se z = (x, y) 6= (0, 0), temos que:
∂f y(x2 + y2 ) − xy(2x) y3 − x 2 y ∂f x(x2 + y2 ) − xy(2y) x3 − xy2
(z) = = e (z) = = .
∂x (x2 + y2 )2 (x2 + y2 )2 ∂y (x2 + y2 )2 (x2 + y2 )2
E, na origem:
∂f f(t, 0) − f(0, 0) ∂f f(0, t) − f(0, 0)
(0, 0) = lim =0 e (0, 0) = lim = 0.
∂x t→0 t ∂y t→0 t
Assim, f possui derivadas parciais em todos os pontos de R2 . Mas f não é contı́nua na origem.

Análise
ab
Mais ainda, não existe lim f(x, y), pois f(at, bt) = , para todo t ∈ R e todo (a, b) 6=
(x,y)−→(0,0) a2 + b2
1 2
(0, 0), e, portanto, lim f(t, t) = 6= = lim f(t, 2t), por exemplo.
t→0 2 5 t→0
2 Derivadas direcionais
Definição 2.1. Sejam f : U −→ R uma função definida no aberto U ⊂ Rn , a ∈ U e v ∈ Rn . A

derivada direcional de f no ponto a segundo o vetor v é o limite:
∂f f(a + tv) − f(a)
(a) = lim ,
∂v t→0 t
quando tal limite existe.
∂f
Observação 2.1. Se v = 0, então (a) = 0 para todo a ∈ U.
∂v
Observação 2.2. As derivadas parciais são casos particulares das derivadas direcionais,
∂f ∂f
pois: (a) = (a) é a derivada direcional de f no ponto a segundo o vetor ei .
∂xi ∂ei
Observação 2.3. Dados a ∈ U e v ∈ Rn , existe ε > 0 tal que a + tv ∈ U para todo t ∈ (−ε, ε).
Assim, se λ : (−ε, ε) −→ U é o caminho retilı́neo, com λ(0) = a e λ 0 (t) = v para todo t ∈ (−ε, ε),
∂f
temos que: (a) = (f ◦ λ) 0 (0).
∂v
Fig. 3: f ao longo do caminho retilı́neo λ
xy
Exemplo 2.1. Seja f : R2 −→ R a função dada por f(x, y) = , (x, y) 6= (0, 0), e f(0, 0) =
x2 + y2
∂f
0. Então f possui as derivadas direcionais (0, 0) para todo v = (α, 0) ou v = (0, β), as quais
∂v
são nulas, mas f não possui derivada direcional na origem segundo um vetor v = (α, β), com
α 6= 0 e β 6= 0, pois:

Derivadas direcionais
∂f f(tα, 0) − f(0, 0)
• (0, 0) = lim = 0, v = (α, 0)
∂v t→0 t
∂f f(0, tβ) − f(0, 0)
• (0, 0) = lim = 0, v = (0, β) ,
∂v t→0 t
e o limite
f(αt, βt) − f(0, 0) αβ 1
lim = lim 2
t→0 t t→0 α + β2 t
não existe.
∂f
Observação 2.4. Se α ∈ R − {0}, então existe (a) num ponto a se, e somente se, existe
∂v
∂f
(a) e, no caso afirmativo, temos:
∂(αv)
∂f f(a + tαv) − f(a) f(a + tαv) − f(a) ∂f
(a) = lim = α lim = α (a) .
∂(αv) t→0 t t→0 αt ∂v
∂f
Mas, pode ocorrer que a derivada direcional exista em todos os pontos do domı́nio de f,
∂v
segundo todos os vetores v ∈ Rn , sem que se tenha necessariamente:
∂f ∂f ∂f
(a) = (a) + (a) .
∂(v + w) ∂v ∂w
Exemplo 2.2. Seja g : R2 −→ R a função dada por

x2 y
g(x, y) = , se (x, y) 6= (0, 0), e g(0, 0) = 0.
x2 + y2
∂g
Pode-se provar, a partir da definição, que existe (a) para todo a ∈ R2 e todo v ∈ R2 . Em
∂v
particular, na origem:
∂g g(tα, tβ) − g(0, 0) α2 β
• (0, 0) = lim = 2 , se v = (α, β) 6= (0, 0).
∂v t→0 t α + β2
e
∂g
• (0, 0) = 0 , se v = (0, 0).
∂v
Evidentemente, para a = (0, 0), não vale
∂g ∂g ∂g
(a) + (a) = (a) .
∂v ∂w ∂(v + w)
Por exemplo, para v = (1, 1) e w = (1, 2):
∂g 1 ∂g 2 ∂g 12
(0, 0) = , (0, 0) = , e (0, 0) = ,
∂v 2 ∂w 5 ∂(v + w) 13
∂g ∂g ∂g
e, portanto, (0, 0) + (0, 0) 6= (0, 0) .
∂v ∂w ∂(v + w)
∂f
Observação 2.5. Na seção 3, mostraremos que depende linearmente de v se f é dife-
∂v
renciável, uma hipótese mais forte do que possuir derivadas direcionais.

Análise
A função g do exemplo anterior é contı́nua (ver exercı́cio 8:27, capı́tulo 1), mas não é
verdade, em geral, que a existência de todas as derivadas direcionais implique em continuidade.
x3 y
Exemplo 2.3. Seja h : R2 −→ R a função definida por h(x, y) = , se (x, y) 6= (0, 0), e
x6 + y2
h(0, 0) = 0.
Para (a, b) 6= (0, 0) e v = (α, β) ∈ R2 , temos que, se λ(t) = (a, b) + t(α, β) = (a + tα, b + tβ),
então:
(a + tα)3 (b + tβ)
(h ◦ λ)(t) =
(a + tα)6 + (b + tβ)2
e, portanto, a derivada (h ◦ λ) 0 (t) é dada por:
3(a + tα)2 α(b + tβ) + β(a + tα)3 (a + tα)6 + (b + tβ)2 − (a + tα)3 (b + tβ) 6α(a + tα)5 + 2β(b + tβ)

2
( (a + tα)6 + (b + tβ)2 ) .
Logo,
∂h (3a2 bα + βa3 )(a6 + b2 ) − a3 b(6αa5 + 2βb)
(a, b) = (h ◦ λ) 0 (0) =
∂v (a6 + b2 )2

−3a8 b + 3a2 b3 a9 − a3 b2
= α+ β,
(a6 + b2 )2 (a6 + b2 )2
E para (a, b) = (0, 0) e v = (α, β) ∈ R2 ,
∂h h(tα, tβ) t4 α3 β tα3 β

(0, 0) = lim = lim 6 6 = lim = 0, se β 6= 0;
∂v t→0 t t→0 t(t α + t2 β2 ) t→0 t4 α6 + β2
∂h h(tα, 0)
e (0, 0) = lim = lim 0 = 0 , se β = 0 .
∂v t→0 t t→0
∂h
Assim, existem as derivadas direcionais (a), para todo a ∈ R2 e todo v ∈ R2 , e dependem
∂v
linearmente de v.
1
Em R2 − {(0, 0)}, a função h é contı́nua, mas h não é contı́nua na origem, pois h(x, x3 ) = para
2
todo x 6= 0.
• Outra propriedade desejável para um conceito adequado de derivada de uma função é que a
composta de duas funções deriváveis seja também derivável.
x3 y
Exemplo 2.4. Seja ϕ : R2 −→ R dada por ϕ(0, 0) = 0 e ϕ(x, y) = , se (x, y) 6= (0, 0) .
x4 + y2
Em R2 − {(0, 0)}, ϕ é contı́nua, e em (0,0), ϕ também é contı́nua,
pois, para (x, y) 6= (0, 0),
x 2 y
| ϕ(x, y) | = x p ≤ |x| ,

p
4
x +y 2 4
x +y 2
e, portanto, lim ϕ(x, y) = 0 .

(x,y)→(0,0)
Além disso, para todo v = (α, β) ∈ R2 , β 6= 0,

Derivadas direcionais
∂ϕ ϕ(tα, tβ) tα3 β ∂ϕ ϕ(tα, 0)

(0, 0) = lim = lim 2 4 = 0, e (0, 0) = lim = lim 0 = 0 ,
∂v t→0 t t→0 t α + β2 ∂v t→0 t t→0
para v = (α, 0) ∈ R2 .
Portanto, todas as derivadas direcionais existem na origem e dependem linearmente de v. De

modo análogo ao exemplo anterior, podemos calcular as derivadas direcionais de ϕ num ponto
(a, b) ∈ R2 − {(0, 0)} e verificar que elas dependem linearmente de v.
Entretanto, se considerarmos o caminho derivável λ : R −→ R2 , dado por λ(t) = t, t2 sen 1t , se

t 6= 0, λ(0) = (0, 0), temos que f ◦ λ : R −→ R não é derivável em t = 0, pois o limite

ϕ t, t2 sen 1t t5 sen 1t sen 1t

ϕ(λ(t)) − ϕ(λ(0))
lim = lim = lim 5 = lim ,
t→0 t t→0 t t→0 t + t5 sen 1 t→0 1 + sen 1
t t
não existe, uma vez que:
sen t1n 1
• lim 1
= lim 0 = 0 , quando tn = ,
n→∞ 1 + sen tn
n→∞ nπ
sen t1n 1 1 2
e • lim = lim = , quando tn = .
n→∞ 1 + sen 1
tn
n→∞ 2 2 (4n + 1)π
• No entanto, a existência de derivadas direcionais permite demonstrar o Teorema do Valor

Médio para funções reais de n variáveis sob a forma de igualdade, como no caso de uma só
variável.
Teorema 2.1. (do Valor Médio)

Seja f : U −→ R uma função definida no aberto U ⊂ Rn . Se [a, a + v] ⊂ U , f|[a,a+v] é contı́nua
∂f
e existe a derivada direcional (x) para todo x ∈ (a, a + v), então existe θ0 ∈ (0, 1) tal que
∂v
∂f
f(a + v) − f(a) = (a + θ0 v)
∂v
Prova.
Seja λ : [0, 1] −→ U o caminho C∞ dado por λ(t) = a + tv, t ∈ [0, 1]. Então a função
f ◦ λ : [0, 1] −→ R é contı́nua em [0, 1] e derivável em (0, 1), pois, para θ ∈ (0, 1),
(f ◦ λ)(θ + t) − f ◦ λ(θ) f(a + (θ + t)v) − f(a + θv)
(f ◦ λ) 0 (θ) = lim = lim
t→0 t t→0 t
f((a + θv) + tv) − f(a + θv) ∂f
= lim = (a + θv)
t→0 t ∂v
Assim, pelo Teorema do Valor Médio, para funções reais de uma variável real, existe θ0 ∈ (0, 1)
tal que (f ◦ λ)(1) − (f ◦ λ)(0) = (f ◦ λ) 0 (θ0 ), ou seja, existe θ0 ∈ (0, 1) tal que
∂f
f(a + v) − f(a) = (a + θ0 v) .
∂v

Análise
∂f
Observação 2.6. A existência de em todo ponto de (a, a + v) garante a continuidade de
∂v
f|(a,a+v) .
De fato, como foi provado acima, f◦λ é derivável em (0, 1) e, portanto, se xk = a+tk v, tk ∈ (0, 1),
é uma sequência de pontos de (a, a + v) que converge para o ponto a + t0 v ∈ (a, a + v), então
f(xk ) = f(a + tk v) = f ◦ λ(tk ) −→ f ◦ λ(t0 ) = f(a + t0 v) ,
kxk − ak ka + t0 v − ak
uma vez que tk = −→ = t0 .
kvk kvk
Corolário 2.1. Seja U ⊂ Rn aberto e conexo. Se f : U −→ R possui derivadas direcionais em

∂f
todo ponto x ∈ U e (x) = 0, para todo x ∈ U e todo v ∈ Rn , então f é constante.
∂v
Prova.
Seja a ∈ U fixo.
Afirmação: se [a, b] ⊂ U, então f|[a,b] é contı́nua.
• De fato, como a, b ∈ U e U é aberto, existe ε > 0 tal que o segmento

( a − ε(b − a), a + (1 + ε)(b − a) ) = { a + t(b − a) | t ∈ (−ε, 1 + ε) }
está contido em U.
∂f
Além disso, como existe (x) para todo x ∈ U, temos, pela observação anterior, que a
∂(b − a)
restrição f|(a−ε(b−a),a+(1+ε)(b−a)) é contı́nua.
Portanto, f|[a,b] é contı́nua.
• Resulta, então, do Teorema do Valor Médio, que se [a, b] ⊂ U, existe θ0 ∈ (0, 1) tal que
∂f
f(b) − f(a) = f(a + (b − a)) − f(a) = (a + θ0 (b − a)) = 0 ,
∂(b − a)
ou seja, f(b) = f(a).
Por outro lado, se x ∈ U existe, pelo teorema 13.8 do Capı́tulo 1, uma poligonal contida em U
com vértices a0 = a, a1 , . . . , ak = x.
Temos, então, sucessivamente, que

f(a) = f(a0 ) = f(a1 ) = . . . = f(ak ) = f(x),
ou seja, f(x) = f(a) para todo x ∈ U. Logo f é constante.

∂f
Observação 2.7. Neste corolário, basta que as derivadas parciais , i = 1, . . . , n, existam
∂xi
e sejam nulas em todos os pontos do aberto conexo U ⊂ Rn , pois, pela observação 13.5 do
Capı́tulo 1, dados a, b ∈ U, existe uma poligonal contida em U ligando os pontos a e b com
lados paralelos a um dos eixos coordenados.

Funções diferenciáveis
3 Funções diferenciáveis
A definição de função diferenciável que daremos abaixo é devida a Maurice Fréchet (França,
1878-1973) e Otto Stolz (Áustria, 1842-1905). Ela é uma extensão adequada do conceito de
função derivável de uma só variável para funções de n variáveis.
Definição 3.1. Seja f : U −→ R uma função definida no aberto U ⊂ Rn . Dizemos que f é

diferenciável no ponto a ∈ U quando existem constantes A1 , . . . , An ∈ R tais que, para todo
vetor v = (α1 , . . . , αn ) ∈ Rn , com a + v ∈ U, temos que:
f(a + v) = f(a) + A1 α1 + . . . + An αn + r(v) ,
r(v)
onde lim = 0.
v→0 kvk
Definição 3.2. Dizemos que f : U −→ R é diferenciável quando f é diferenciável em todos os

pontos de U.
Observação 3.1. Seja f : U ⊂ Rn −→ R diferenciável no ponto a. Então, se v = tei , ou seja,

αj = 0, j 6= i, αi = t, temos que
f(a + tei ) − f(a) r(tei ) r(tei )
= Ai + = Ai ± , i = 1, . . . , n .
t t ktei k
r(tei ) ∂f
Logo, como lim = 0, para todo i = 1, . . . , n, obtemos que a derivada parcial (a) existe
t→0 ktei k ∂xi
e é igual a Ai , para todo i = 1, . . . , n.
• Assim, f : U ⊂ Rn −→ R é diferenciável no ponto a ∈ U se, e só se, as derivadas parciais

∂f
(a), i = 1, . . . , n, existem, e para todo v = (α1 , . . . , αn ) ∈ Rn tal que a + v ∈ U, temos
∂xi
∂f ∂f
f(a + v) = f(a) + (a)α1 + . . . + (a)αn + r(v) ,
∂x1 ∂xn
r(v)
onde lim = 0.
v→0 kvk
Observação 3.2. Se f : U ⊂ Rn −→ R é diferenciável no ponto a ∈ U, então f é contı́nua no

ponto a.
r(v) r(v)
De fato, como lim implica que lim r(v) = lim kvk = 0, temos que
v→0 kvk v→0 v→0 kvk
lim f(x) = lim (f(a) + A1 (x1 − a1 ) + . . . + An (xn − an ) + r(x − a)) = f(a) ,

x→a x→a
uma vez que v = x − a −→ 0 quando x → a.
r(v)
Observação 3.3. A condição lim = 0 significa que r(v) tende a zero mais rapidamente
v→0 kvk

Análise
do que v. Isto se exprime dizendo-se que r(v) é um infinitésimo de ordem superior a v. Assim, f
é diferenciável no ponto a ∈ U quando f(a + v) − f(a) é igual a um funcional linear
Xn
∂f
(a) αi + (um resto infinitamente pequeno em relação a v).
∂xi
i=1
r(v)
Observação 3.4. Fazendo ρ(v) = se v 6= 0, a + v ∈ U, e ρ(0) = 0, temos que:
kvk
∂f
f : U −→ R é diferenciável no ponto a ∈ U se, e só se, todas as derivadas parciais (a),
∂xi
i = 1, . . . , n, existem no ponto a e, para todo v = (α1 , . . . , αn ) ∈ Rn tal que a + v ∈ U vale:
X
n
∂f
f(a + v) = f(a) + (a)αi + ρ(v) kvk , onde lim ρ(v) = 0.
∂xi v→0
i=1
Ou seja, f é diferenciável no ponto a ∈ U se, e só se, a função real

ρ : Va = {v ∈ Rn | a + v ∈ U} −→ R
é contı́nua no ponto v = 0. Note que o conjunto Va é aberto em Rn e 0 ∈ Va .
Observação 3.5. Ser ou não ser diferenciável, independe da norma considerada em Rn .
Observação 3.6. Para funções f : I −→ R definidas num intervalo aberto I ⊂ R, diferenciabi-

lidade é o mesmo que derivabilidade, pois + At + ρ(t) |t|, ou seja,
se f(a + t) = f(a)
f(a + t) − f(a)
ρ(t) = ± −A ,
t
então, lim ρ(t) = 0 se, e só se, f é derivável no ponto a e f 0 (a) = A.
t→0
Observação 3.7. Se f : U ⊂ Rn −→ R é diferenciável no ponto a ∈ U, então f possui

derivada direcional no ponto a segundo qualquer vetor v = (α1 , . . . , αn ) e
∂f X
n
∂f
(a) = (a) αi .
∂v ∂xi
i=1
De fato, seja v ∈ Rn . Então existe ε > 0 tal que a + tv ∈ U para todo t ∈ (−ε, ε), e
Xn
∂f
f(a + tv) = f(a) + (a)tαi + ρ(tv) |t| kvk .
∂xi
i=1
Como lim ρ(tv) = 0, temos que

t→0
∂f f(a + tv) − f(a) X
n
∂f X
n
∂f
(a) = lim = (a)αi + lim (±ρ(tv) kvk) = (a)αi .
∂v t→0 t ∂xi t→0 ∂xi
i=1 i=1
∂f
Então (a) existe e depende linearmente de v, ou seja:
∂v
∂f ∂f
• (a) = α (a) , para todo α ∈ R e v ∈ Rn ,
∂(αv) ∂v
e

∂f ∂f ∂f
• (a) = (a) + (a) , para todos v, w ∈ Rn .
∂(v + w) ∂v ∂w
Teorema 3.1. (Regra da cadeia)

Sejam U ⊂ Rm e V ⊂ Rn abertos, f = (f1 , . . . , fn ) : U −→ Rn tal que f(U) ⊂ V e cada função
coordenada fi : U −→ R é diferenciável no ponto a ∈ U. Se g : V −→ R é diferenciável no ponto
b = f(a), então a função composta g ◦ f : U −→ R é diferenciável no ponto a e suas derivadas
parciais são:
∂(g ◦ f) X
n
∂g ∂f
(a) = (f(a)) k (a) , i = 1, . . . , m .
∂xi ∂yk ∂xi
k=1
Prova.
Seja o aberto U0 = {v ∈ Rm | a + v ∈ U} que contém o ponto v = 0.
Para cada v = (α1 , . . . , αm ) ∈ U0 e k = 1, . . . , n, temos que

Xm
∂fk
fk (a + v) = fk (a) + (a) αi + ρk (v) kvk , (I)
∂xi
i=1
onde cada ρk : U0 −→ R é contı́nua no ponto 0 e ρk (0) = 0.
Seja a aplicação ω = (β1 , . . . , βn ) : U0 −→ Rn contı́nua no ponto 0, com ω(0) = 0, cujas funções

coordenadas βk : U0 −→ R são dadas por:
X
m
∂fk
βk (v) = (a)αi + ρk (v) kvk . (II)
∂xi
i=1
|αi |
Considerando Rm com a norma da soma, por exemplo, temos que ≤ 1 para todo
kvkS
v ∈ Rm − {0}.
|βk (v)| kω(v)kS
Logo, cada , k = 1, . . . , n, e, portanto, , é limitada em U1 − {0}, onde U1 é um
kvkS kvkS
aberto contido em U0 tal que 0 ∈ U1 e ρk |U1 limitada para todo k = 1, . . . , n.
Seja V0 = {w ∈ Rn | w + b ∈ V}. Como V0 é um aberto que contém o vetor 0, ω é contı́nua no

ponto 0 e ω(0) = 0, existe um aberto U2 ⊂ U1 tal que 0 ∈ U2 e ω(U2 ) ⊂ V0 .
Seja v ∈ U2 . Então ω(v) + b ∈ V e, como g : V −→ R é diferenciável em b = f(a), temos, por

(I), que
X
n
∂g
g(f(a + v)) = g(f(a) + ω(v)) = g(b + ω(v)) = g(b) + (b)βk (v) + σ(ω(v)) kω(v)k ,
∂yk
k=1
onde σ ◦ ω : U2 −→ R é uma função contı́nua no ponto 0, com σ ◦ ω(0) = 0.
Logo, por (II),

X X
n
" m
#
∂g ∂fk
(g ◦ f)(a + v) = g ◦ f(a) + (b) (a)αi + ρk (v)kvk + σ ◦ ω(v) kω(v)k ,
∂yk ∂xi
k=1 i=1

Análise
ou seja,
X
m
(g ◦ f)(a + v) = (g ◦ f)(a) + Ai αi + R(v) ,
i=1
X
n
∂g ∂fk X
n
∂g
onde Ai = (b) (a) e R(v) = (b) ρk (v) kvk + σ ◦ ω(v) kω(v)k.
∂yk ∂xi ∂yk
k=1 k=1
Como,
R(v) X
n
∂g kω(v)k
= (b) ρk (v) + σ ◦ ω(v) ,
kvk ∂yk kvk
k=1
R(v) kω(v)k
temos que lim = 0, pois lim ρk (v) = 0, k = 1, . . . , n, lim σ ◦ ω(v) = 0 e é limitado em
v→0 kvk v→0 v→0 kvk
U2 − {0}.
Logo g ◦ f é diferenciável no ponto a e

∂(g ◦ f) X
n
∂g ∂f
(a) = (f(a)) k (a) ,
∂xi ∂yk ∂xi
k=1
para todo i = 1, . . . , m.
Corolário 3.1. Se f : U ⊂ Rn −→ R é diferenciável no ponto b ∈ U e λ = (λ1 , . . . , λn ) :

(a − ε, a + ε) −→ Rn é um caminho diferenciável com λ(a) = b, então a função composta
f ◦ λ : (a − ε, a + ε) −→ R é diferenciável no ponto a e
Xn
∂f
0
(f ◦ λ) (a) = (b) λi0 (a) .
∂xi
i=1
dx dxn

1
Observação 3.8. Se escrevemos λ(t) = (x1 (t), . . . , xn (t)), então λ 0 (t) = ,..., .
dt dt
df
Indicando com a derivada da função composta t 7−→ f ◦ λ(t) = f(x1 (t), . . . , xn (t)), a regra da
dt
cadeia nos dá que:
df X
n
∂f dxi
= (notação clássica do Cálculo Diferencial.)
dt ∂xi dt
i=1
Corolário 3.2. Sejam U ⊂ Rn um conjunto aberto, I ⊂ R um intervalo aberto, f : U −→ R uma

função diferenciável no ponto a ∈ U, com f(U) ⊂ I, g : I −→ R diferenciável no ponto b = f(a).
Então g ◦ f : U −→ R é diferenciável no ponto a e

∂(g ◦ f) ∂f
(a) = g 0 (b) (a) ,
∂xi ∂xi
para todo i = 1, . . . , n.
Observação 3.9. Pela Regra da Cadeia, se f : U ⊂ Rn −→ R é diferenciável no ponto a ∈ U,

∂f
para calcularmos a derivada direcional (a) = (f ◦ λ) 0 (0) não é necessário nos restringir ao
∂v

caminho retilı́neo λ(t) = a + tv. Ou seja, se λ : (−ε, ε) −→ U é um caminho diferenciável

qualquer com λ(0) = a e λ 0 (0) = v, ainda teremos
∂f f(λ(t)) − f(a)
(a) = (f ◦ λ) 0 (0) = lim .
∂v t→0 t
De fato, pela Regra da Cadeia,
X
n
∂f X
n
∂f ∂f
(f ◦ λ) 0 (0) = (a) λi0 (0) = (a) αi = (a) .
∂xi ∂xi ∂v
i=1 i=1
Mas, o mesmo não é verdade se f possui derivadas direcionais em todos os pontos do domı́nio
segundo qualquer vetor, mas não é diferenciável.
x3 y
Por exemplo, considere a função h : R2 −→ R dada por h(x, y) = , (x, y) 6= (0, 0), e
x6 + y2
h(0, 0) = 0, e seja λ : R −→ R2 o caminho diferenciável, λ(t) = (t, t2 ), com λ(0) = (0, 0) e
λ 0 (0) = (1, 0). Então,
h(λ(t)) − h(0) t5 1 ∂h
(h ◦ λ) 0 (0) = lim = lim 7 = lim 2 = 1 6= (0, 0) = 0 .
t→0 t t→0 t + t5 t→0 t + 1 ∂x
(ver exemplo 2.3).
Observação 3.10. Nenhuma das funções definidas nos exemplos 2.1, 2.2, 2.3 e 2.4:
xy
• f : R2 −→ R , f(x, y) = , f(0, 0) = 0 ;
x2
+ y2
x2 y
• g : R2 −→ R , g(x, y) = 2 , g(0, 0) = 0 ;
x + y2
x3 y
• h : R2 −→ R , h(x, y) = 6 , h(0, 0) = 0 ;
x + y2
x3 y
• ϕ : R2 −→ R , ϕ(x, y) = 4 , ϕ(0, 0) = 0 ,
x + y2
são diferenciáveis na origem de R2 .
De fato:
• f porque não é contı́nua na origem nem possui derivada direcional segundo qualquer vetor na
origem.
∂g
• g porque, embora seja contı́nua na origem e existe (0, 0), para todo v ∈ R2 , as derivadas
∂v
direcionais na origem não dependem linearmente de v.
∂h
• h porque não é contı́nua na origem, embora possua derivadas direcionais (p), para todo
∂v
v ∈ R2 e todo p ∈ R2 , que dependem linearmente de v.
∂ϕ
• ϕ é contı́nua em R2 , possui derivadas direcionais segundo qualquer vetor v ∈ R2 , em todos
∂v
os pontos do plano, que dependem linearmente de v, mas contraria a Regra da Cadeia, pois
ϕ ◦ λ : R −→ R não é derivável na origem, onde λ : R −→ R2 é o caminho diferenciável dado por

Análise
1

λ(t) = t , t2 sen , t 6= 0, e λ(0) = 0.
t
• Diretamente, podemos verificar que, embora cada uma das funções acima possua derivadas
parciais na origem, elas não cumprem a condição:

r(v) 1 ∂F ∂F
lim = lim p F(α, β) − (0, 0)α − (0, 0)β = 0 ,
v→(0,0) kvk α→0 α2 + β2 ∂x ∂y
β→0
onde v = (α, β).

∂f ∂f αβ
Por exemplo, para F = f, temos que (0, 0) = (0, 0) = 0 e f(α, β) = 2 . Logo, o limite
∂x ∂y α + β2
r(v) 1 αβ
lim = lim p 2 + β2
v→0 kvk α→0 2
α +β 2 α
β→0
1 1

não existe, já que para as sequências αn = e βn = , que convergem para zero, a
  n n

1 αn βn  n
sequência q
2 2
= √ não converge.
αn + βn 2 2
α2n + β2n
Observação 3.11. Seja U ⊂ C aberto. Dizemos que uma função complexa f : U −→ C é

derivável no ponto z = x + iy ∈ U, quando existe o limite
f(z + H) − f(z)
lim = A.
H→0 H
Neste caso, A = f 0 (z) chama-se a derivada da função complexa f no ponto z.
A derivabilidade de f no ponto z = x + iy é equivalente a dizer que:

f(z + H) = f(z) + A H + r(H) ,
r(H)
onde lim = 0.
H→0 H
Fazendo A = a + ib, H = h + ik e r = r1 + ir2 , f é derivável no ponto z = x + iy se, e só se,
f(z + H) = f(z) + (ah − bk) + i(bh + ak) + r1 (H) + ir2 (H) , (I)
r1 (H) r (H)
onde lim = lim 2 = 0.
H→0 |H| H→0 |H|
Sejam u, v : U −→ R a parte real e a parte imaginária da função f, ou seja, f(z) = u(z) + iv(z).
Em (I), separando a parte real e a parte imaginária, temos que:

r (h, k)
• u(x + h, y + k) = u(x, y) + ah − bk + r1 (h, k) , onde lim √1 2 = 0,
h + k2
h,k→0
r (h, k)
• v(x + h, y + k) = v(x, y) + bh + ak + r2 (h, k) , onde lim √2 2 = 0.
h,k→0 h + k2
Assim, se f = u + iv é derivável no ponto z = x + iy, então u e v são diferenciáveis no

∂u ∂v ∂u ∂v
ponto (x, y) e valem as identidades: (x, y) = (x, y) (= a) e (x, y) = − (x, y) (= −b),
∂x ∂y ∂y ∂x
chamadas equações de Cauchy-Riemann.

Reciprocamente, se u, v : U −→ R são funções diferenciáveis no ponto z = (x, y) e satisfa-

zem as equações de Cauchy-Riemann neste ponto, podemos provar, revertendo cada etapa do
argumento anterior, que a função complexa f = u + iv é derivável no ponto z = x + iy e que:
∂u ∂u ∂v ∂v
f 0 (z) = (z) − i (z) = (z) + i (z) .
∂x ∂y ∂y ∂x
Uma função complexa f : U −→ C é holomorfa quando possui derivada f 0 (z) em todos os
pontos do aberto U.
Definição 3.3. Seja U ⊂ Rn aberto. Dizemos que uma função f : U −→ R é de classe C1

∂f ∂f
quando f possui derivadas parciais (x), . . . , (x) em todos os pontos x ∈ U e as funções
∂x1 ∂xn
∂f
: U −→ R, i = 1, . . . , n, são contı́nuas.
∂xi
Mais geralmente, dizemos que uma função f : U −→ R é de classe Ck , k ≥ 1, quando ela
∂f
possui derivadas parciais em todos os pontos de U e as funções : U −→ R, i = 1, . . . , n,
∂xi
são de classe Ck−1 . Para completar a definição indutiva, dizemos que f é de classe C0 quando
f é contı́nua.
Finalmente, dizemos que f é de classe C∞ quando f é de classe Ck para todo k ≥ 0.
Então C0 ⊃ C1 ⊃ C2 ⊃ . . . ⊃ Ck ⊃ . . . ⊃ C∞ , sendo todas as inclusões estritas (ver Curso de

Análise, Vol. I de E. Lima, pag. 278, ex. 21).
Teorema 3.2. Se uma função f : U ⊂ Rn −→ R possui derivadas parciais em todos os pontos

do aberto U e cada uma delas é contı́nua no ponto c ∈ U, então f é diferenciável no ponto c.
Prova.
Para simplificar a notação, vamos considerar apenas o caso n = 2.
Sejam c = (a, b) e δ > 0 tal que BM (c, δ) = (a − δ, a + δ) × (b − δ, b + δ) ⊂ U.
Seja v = (h, k) um vetor tal que c + v ∈ BM (c, δ) ⊂ U e

∂f ∂f
r(v) = r(h, k) = f(a + h, b + k) − f(a, b) − (c)h − (c)k .
∂x ∂y
Reescrevendo, temos:
∂f ∂f
r(v) = f(a + h, b + k) − f(a, b + k) + f(a, b + k) − f(a, b) − (c)h − (c)k .
∂x ∂y
Pelo Teorema do Valor Médio para funções reais de uma variável real, existem θ1 , θ2 ∈ (0, 1) tais
que:
∂f ∂f ∂f ∂f
r(v) = (a + θ1 h, b + k)h + (a, b + θ2 k)k − (c)h − (c)k .
∂x ∂y ∂x ∂y
De fato, existe ε > 0 tal que (a + th, b + k), (a, b + tk) ⊂ U para todo t ∈ (−ε, 1 + ε).
Como as derivadas parciais da função f existem em todos os pontos de U, as funções reais

Análise
f1 (t) = f(a + th, b + k) e f2 (t) = f(a, b + tk) são deriváveis em (−ε, 1 + ε) e
f(a + (t0 + t)h, b + k) − f(a + t0 h, b + k)

• f10 (t0 ) = lim
t→0 t
f((a + t0 h, b + k) + ht(1, 0)) − f(a + t0 h, b + k)
= lim h
t→0 th
∂f
= h (a + t0 h, b + k)
∂x
f(a, b + (t0 + t)k) − f(a, b + t0 k)
• f20 (t0 ) = lim
t→0 t
f((a, b + t0 k) + kt(0, 1)) − f(a, b + t0 k)
= lim k
t→0 tk
∂f
= k (a, b + t0 k) .
∂y
Logo,

r(v)
∂f ∂f h
∂f ∂f k
= (a + θ1 h, b + k) − (a, b) √ 2 + (a, b + θ2 k) − (a, b) √ .
kvk ∂x ∂x h + k2 ∂y ∂y h2 + k2
|h| |k| ∂f ∂f
Como √ ≤ 1, √ ≤ 1, e são contı́nuas no ponto c = (a, b), temos que
h2+ b2 + h2 b2 ∂x ∂y
r(v)
lim = 0, ou seja, f é diferenciável no ponto c = (a, b).
v→0 kvk
Observação 3.12. Na realidade, para que f seja diferenciável no ponto (a, b) é suficiente
∂f ∂f
que exista numa vizinhança deste ponto, que nele seja contı́nua e que (a, b) exista.
∂x ∂y
De fato, escrevendo
∂f ∂f
r(v) = f(a + h, b + k) − f(a, b + k) − (a, b)h + f(a, b + k) − f(a, b) − (a, b)k ,
∂x ∂y
existe, pelo Teorema do Valor Médio para funções reais de uma variável real, θ ∈ (0, 1) tal que

r(v)
∂f ∂f
h f(a, b + k) − f(a, b) ∂f k
= (a + θh, b + k) − (a, b) + − (a, b) .
kvk ∂x ∂x kvk k ∂y kvk
r(v) h k ∂f
Logo lim = 0, pois e são limitadas, é contı́nua no ponto (a, b) e
v→0 kvk kvk kvk ∂x
f(a, b + k) − f(a) ∂f
lim = (a, b) .
k→0 k ∂y
• Para funções de n variáveis, a diferenciabilidade de f num ponto é assegurada quando n − 1
das suas derivadas parciais existem numa vizinhança do ponto, são contı́nuas neste ponto e a
derivada parcial restante apenas exista neste ponto.
Corolário 3.3. Toda função de classe C1 é diferenciável.
Mas a recı́proca não é verdadeira.

1
Exemplo 3.1. Seja f : R −→ R a função dada por f(x) = x2 sen , x 6= 0 e f(0) = 0. Então
x
1 1 x2 sen x1
f 0 (x) = 2x sen − cos , para x 6= 0 , e f 0 (0) = lim = 0.
x x x→0 x
Logo f é diferenciável em R, mas f não é de classe C1 , pois f 0 não é contı́nua em x = 0.
Exemplo 3.2. Um polinômio em duas variáveis é uma função f : R2 −→ R dada por

X
f(x, y) = aij xi yj .
Então f é contı́nuo em R2 e possui derivadas parciais

∂f X ∂f X
= iaij xi−1 yj e = jaij xi yj−1 .
∂x ∂y
∂f ∂f
Como e são polinômios e, portanto, funções contı́nuas, temos que f é de classe C1 .
∂x ∂y
Assim, todo polinômio é de classe C1 .
∂f ∂f ∂f ∂f
Como e são polinômios, ∈ C1 e ∈ C1 . Logo f ∈ C2 .
∂x ∂y ∂x ∂y
Podemos provar, usando o argumento acima, que se todo polinômio é de classe Ck , então todo
polinômio é de classe Ck+1 . Assim, concluı́mos, por indução, que todo polinômio é de classe
C∞ .
Do mesmo modo, podemos mostrar que todo polinômio f : Rn −→ R de n variáveis

X
f(x) = ai1 i2 ··· in xi11 · · · xinn ,
é de classe C∞ .
Observação 3.13. A soma f + g e o produto fg de funções de classe Ck são funções de

classe Ck .
Este resultado segue do fato análogo já provado para funções reais de uma variável real, ou
pode ser provado por indução, primeiro para a soma e depois para o produto.
Corolário 3.4. Sejam U ⊂ Rm , V ⊂ Rn abertos, f = (f1 , . . . , fn ) : U −→ Rn , tal que f(U) ⊂ V

e cada função coordenada fi : U −→ R é de classe Ck . Se g : V −→ R é uma função de classe
Ck , então a composta g ◦ f : U −→ R é de classe Ck .
Prova.
Para k = 0, o resultado é verdadeiro. Suponhamos, por indução, que o corolário vale para
funções de classe Ck−1 , k ≥ 1, e que g, fi , i = 1, . . . , n são funções de classe Ck .
Então, pelo corolário 3.3, g, fi , i = 1, . . . , n são funções diferenciáveis e, pela Regra da Cadeia:

Análise
∂(g ◦ f) X
n
∂g ∂f
(x) = (f(x)) j (x) ,
∂xi ∂yj ∂xi
j=1
para todo x ∈ U e todo i = 1, . . . , m, ou seja, vale a igualdade de funções:

∂(g ◦ f) X
n
∂g

∂f
= ◦f · j .
∂xi ∂yj ∂xi
j=1
∂g ∂g
Como e f são de classe Ck−1 temos, pela hipótese de indução, que ◦ f é de classe Ck−1
∂yj ∂y
j
∂fj ∂g ∂f
para todo j = 1, . . . , n. Além disso, como k−1
∈ C , o produto ◦ f · j é de classe Ck−1 ,
∂xi ∂yj ∂xi
X
m
∂g

∂f
para todo j = 1, . . . , n, e portanto, a soma ◦ f · j é de classe Ck−1 .
∂yj ∂xi
j=1
∂(g ◦ f)
Logo ∈ Ck−1 para todo i = 1, . . . , m, ou seja, g ◦ f ∈ Ck .
∂xi
Observação 3.14. Seja g : U ⊂ Rn −→ R uma função de classe Ck , com g(x) 6= 0 para todo
x ∈ U.
1 1 1
Então a função é de classe Ck , pois = ρ ◦ g, onde ρ : R − {0} −→ R, dada por ρ(x) = , é de
g g x
classe C∞ .
X
n
Exemplo 3.3. O produto interno f : R × R −→ R, f(x, y) =
n n
xi yi , é uma função de classe
i=1
C∞ , pois f é um polinômio de 2n variáveis (de grau 2).
X
∞
n
Também, a função g : R −→ R, g(x) = kxk = 2
x2i , por ser um polinômio de n variáveis, é de
i=1
classe C∞ .
v
uX 2
u n
Então a norma h : Rn − {0} −→ R, h(x) = kxk = t xi é de classe C∞ , pois h = ρ ◦ g, onde
i=1
∞
√
ρ : (0, ∞) −→ R é a função C dada por ρ(x) = x.
Na origem, a função norma h não possui derivadas parciais, pois:

h(0 + tei ) − h(0) |t| h(0 + tei ) − h(0) |t|
• lim+ = lim+ = 1 , e • lim− = lim− = −1 .
t→0 t t→0 t t→0 t t→0 t
• Pode ocorrer que normas k k que não provém de um produto interno não sejam diferenciáveis
em pontos x 6= 0.
∂ϕ
Por exemplo, se ϕ : R2 −→ R é a norma da soma ϕ(x, y) = |x| + |y|, então não existe nos
∂x
∂ϕ
pontos (0, y) e não existe nos pontos (x, 0).
∂y
ϕ(t, y) − ϕ(0, y) |t| ϕ(x, t) − ϕ(x, 0) |t|
De fato, lim± = lim± = ±1 , e lim± = lim± = ±1 .
t→0 t t→0 t t→0 t t→0 t

A diferencial de uma função
4 A diferencial de uma função
Definição 4.1. Sejam U ⊂ Rn um aberto e f : U −→ R uma função diferenciável no ponto a.

A diferencial de f no ponto a é o funcional linear df(a) : Rn −→ R dado por
∂f Xn
∂f
df(a)v = (a) = (a)αi ,
∂v ∂xi
i=1
onde v = (α1 , . . . , αn ) ∈ Rn .

∂f ∂f
Então (a) · · · (a) é a matriz 1 × n do funcional linear df(a) em relação à base
∂x1 ∂xn
canônica {e1 , . . . , en } de Rn .
Quando f é diferenciável em todo ponto de U, podemos definir a aplicação

df : U −→ L(Rn ; R) = (Rn )?

∂f ∂f
que associa a cada x ∈ U o funcional df(x), cuja matriz é (x) · · · (x) .
∂x1 ∂xn
Identificando o funcional df(x) com sua matriz, temos que: df é uma aplicação contı́nua
∂f
⇐⇒ cada uma de suas funções coordenadas : U −→ R é contı́nua ⇐⇒ f é C1 .
∂xi
Exemplo 4.1. Todo funcional linear ϕ : Rn −→ R é diferenciável e dϕ(x) = ϕ, ou seja,

dϕ(x)v = ϕ(v) para quaisquer x, v ∈ Rn .
∂ϕ
De fato, como ϕ(x) = a1 x1 + . . . + an xn , temos (x) = ai para todo x ∈ Rn e todo i = 1, . . . , n.
∂xi
Logo,
X
n
∂ϕ X
n
dϕ(x)v = (x)αi = ai αi = ϕ(v) .
∂xi
i=1 i=1
Notação.
Seja πi : Rn −→ R, πi (x) = xi , a projeção sobre a i−ésima coordenada, i = 1, . . . , n. Então
{π1 , . . . , πn } é a base de (Rn )? dual da base canônica.
Fazendo πi = xi , temos, pelo exemplo acima, que

dxi (a)v = dπi (a)v = πi (v) = αi ,
para todo v = (α1 , . . . , αn ) ∈ Rn .
Logo, podemos escrever:

X n
∂f X
n
∂f
df(a)v = (a) dxi (a)(v) , ou seja, df = dxi ,
∂xi ∂xi
i=1 i=1
se f é diferenciável em todo ponto a ∈ U.

Análise
Com a identificação feita acima, temos que {dx1 , . . . , dxn } é a base de (Rn )? dual da base
canônica.
Assim, a expressão formal da regra da cadeia (no caso R −→ Rn −→ R) diz que se cada
coordenada xi é função de um parâmetro real t, então podemos ”dividir” ambos os membros da
igualdade acima por ”dt” e obter:
df X
n
∂f dxi
= .
dt ∂xi dt
i=1
Teorema 4.1. Sejam f, g : U −→ R funções diferenciáveis no ponto a ∈ U. Então:

(a) f + g : U −→ R é diferenciável no ponto a e d(f + g)(a) = df(a) + dg(a).
(b) f · g : U −→ R é diferenciável no ponto a e d(f · g)(a) = f(a) dg(a) + g(a) df(a) .

f f g(a) df(a) − f(a) dg(a)
(c) Se g(a) 6= 0, é diferenciável no ponto a e d (a) = 2
.
g g g(a)
Prova.
Como as funções s, m : R2 −→ R, q : R × (R − {0}) −→ R dadas por s(x, y) = x + y ,
x
m(x, y) = xy e q(x, y) = são diferenciáveis, por serem de classe C∞ , e a função F : U −→ R2 ,
y
F(x) = (f(x), g(x)), tem coordenadas diferenciáveis no ponto a, temos, pela Regra da Cadeia,
f
que as funções s ◦ F = f + g, m ◦ F = f · g e q ◦ F = são diferenciáveis no ponto a e, além disso:
g
∂(f + g) ∂f ∂g
(a) = (a) + (a)
∂xi ∂xi ∂xi
∂(f · g) ∂f ∂g
(a) = g(a) (a) + f(a) (a)
∂xi ∂xi ∂xi
∂f ∂g
g(a) (a) − f(a) (a)
∂(f/g) ∂xi ∂xi
(a) = .
∂xi g(a)2
Assim,
X
n
∂(f + g) X
n
∂f X
n
∂g
• d(f + g)(a) = (a) dxi = (a) dxi + (a) dxi = df(a) + dg(a) ;
∂xi ∂xi ∂xi
i=1 i=1 i=1
X
n
∂(f · g) X
n
∂f X
n
∂g
• d(f·g)(a) = (a) dxi = g(a) (a) dxi +f(a) (a) dxi = g(a) df(a)+f(a) dg(a) ;
∂xi ∂xi ∂xi
i=1 i=1 i=1
X
n
∂f X
n
∂g
g(a) (a) dxi − f(a) (a) dxi
X
n
∂(f/g) ∂xi ∂xi g(a) df(a) − f(a) dg(a)
i=1 i=1
• d(f/g)(a) = (a) dxi = = .
∂xi g(a)2 g(a)2
i=1

A diferencial de uma função
Teorema 4.2. (do Valor Médio)

Seja f : U −→ R uma função diferenciável em todos os pontos do segmento aberto (a, a + v) e
contı́nua no segmento fechado [a, a + v] ⊂ U. Então existe θ ∈ (0, 1) tal que
∂f Xn
∂f
f(a + v) − f(a) = (a + θv) = df(a + θv) v = (a + θv) αi ,
∂v ∂xi
i=1
onde v = (α1 , . . . , αn ).
Corolário 4.1. Seja U ⊂ Rn aberto conexo. Se f : U −→ R é diferenciável e df(x) = 0 (isto é,

∂f
(x) = 0, i = 1, . . . , n) para todo x ∈ U, então f é constante.
∂xi
Corolário 4.2. Sejam U ⊂ Rn aberto convexo e f : U −→ R uma função diferenciável. Se

kdf(x)k ≤ M para todo x ∈ U, então
|f(x) − f(y)| ≤ M kx − yk ,
para quaisquer x, y ∈ U.
Prova.
Neste corolário, estamos assumindo que
∂f
kdf(x)k = sup { |df(x)v| | v ∈ R , kvk = 1 } = sup (x) v ∈ R , kvk = 1 .
n n

∂v
Logo, se x, y ∈ U, o segmento fechado [x, x + (y − x)] ⊂ U, uma vez que U é convexo.
Assim, pelo Teorema do Valor Médio, existe θ ∈ (0, 1) tal que

f(y) − f(x) = df(x + θ(y − x)) (y − x) ,
e, portanto,
|f(y) − f(x)| = |df(x + θ(y − x)) (y − x)| ≤ M ky − xk .
Observação 4.1. Se tomarmos em Rn a norma euclidiana, ou a norma da soma, ou a norma

kdf(x)k assume, respectivamente, os valores:
do máximo, então v

uX ∂f
u n 2 X n
∂f ∂f
t (x) , (x) , ou max (x) .
∂xi ∂xi 1≤i≤n ∂xi
i=1 i=1
De fato, se k k é a norma euclidiana, por exemplo, temosvque:

v v
X uX 2 uX
uX ∂f
n u n n u n 2
∂f ∂f
|df(x)v| =
u 2
(x) αi ≤ (x) t αi ≤ t (x) ,
t
∂xi ∂xi ∂xi
i=1 i=1 i=1 i=1
v
uX
u n
n
para todo v = (α1 , . . . , αn ) ∈ R com kvk = t α2i = 1.
i=1

Análise
v
uX ∂f X
u n 2 n 2
∂f
Logo kdf(x)k ≤ t (x) . Por outro lado, se (x) 6= 0, podemos tomar o vetor
∂xi ∂xi
i=1 i=1

∂f ∂f
(x), . . . , (x)
∂x1 ∂xn
v= v .
uX ∂f
u n 2
t (x)
∂xi
i=1
Então, como kvk = 1 , temos que:

Xn
∂f
2
(x)
v
uX ∂f
u n 2
∂xi
kdf(x)k ≥ |df(x)v| = vi=1
= t (x) ,
uX
u n
2 ∂xi
∂f i=1
t (x)
∂xi
i=1
v v
uX ∂f uX ∂f
u n 2 u n 2
ou seja, kdf(x)k ≥ t (x) . Assim, kdf(x)k = t (x) .
∂xi ∂xi
i=1 i=1
Observação 4.2. Se V não é convexo, uma função g : V −→ R pode ser diferenciável, com
diferencial dg limitada em V, sem ser Lipschitziana.
Por exemplo, sejam U = R2 − X, onde X = {(x, 0) | x ≥ 0}, e V = {(x, y) ∈ U |

p
x2 + y2 < 2}.
Seja g = f|V , onde f : U −→ R é a função definida por f(x, y) = x2 se x > 0 e y > 0 e f(x, y) = 0
se x ≤ 0 ou y ≤ 0.
∂f ∂f ∂f
Então (x, y) = 0 para todo (x, y) ∈ U; (x, y) = 2x se x > 0, y > 0; (x, y) = 0 se
∂y ∂x ∂x
∂f
(x, y) ∈ U − {(x, y) ∈ R2 | x ≥ 0 , y > 0}, pois f ≡ 0 neste aberto e, também, (0, y) = 0 para
∂x
y > 0, uma vez que
f(t, y) − f(0, y) t2 f(t, y) − f(0, y) 0
• lim+ = lim+ = 0 , e • lim− = lim− = 0 .
t→0 t t→0 t t→0 t t→0 t
∂f ∂f
Logo f é diferenciável, pois e são contı́nuas em U, ou seja, f é de classe C1 em U. Além
∂x ∂y
disso, como |x| < 2 para todo (x, y) ∈ s
V,
∂f 2 ∂f 2
kdf(x, y)k = (x, y) + (x, y) ≤ 4 ,
∂x ∂y
para todo (x, y) ∈ V.
1

Mas, f não é uniformemente contı́nua em V, pois, para as sequências zn = 1, e
n
1

wn = 1, − de pontos de V, temos que:
n 2
zn − wn = 0, −→ (0, 0) e f(zn ) − f(wn ) = 1 −→ 1 .
n
Em particular, f não é Lipschitziana em V.

O gradiente de uma função diferenciável
Observação 4.3. Como consequência do corolário 4.2, temos que se U ⊂ Rn é aberto e

convexo e f : U −→ R é uma função diferenciável com derivadas parciais limitadas em U, então
f é uniformemente contı́nua em U. Em particular, f é a restrição de uma função uniformemente
contı́nua g : U −→ R.
5 O gradiente de uma função diferenciável
O produto interno canônico induz um isomorfismo entre Rn e seu dual (Rn )? dado por:
Rn −→ (Rn )?
v 7−→ v? : Rn −→ R
x 7−→ hv, xi ,
pois dado ϕ ∈ (Rn )? , ϕ = v? , onde v = (ϕ(e1 ), . . . , ϕ(en )), uma vez que
ϕ(x1 , . . . , xn ) = ϕ(e1 )x1 + . . . + ϕ(en )xn .

Além disso, como v (ei ) = αi , i = 1, . . . , n, α1 . . . αn é a matriz 1 × n do funcional v?
?
em relação à base canônica.
Definição 5.1. Seja f : U −→ R uma função diferenciável no aberto U ⊂ Rn . O gradiente de f

no ponto a ∈ U é o vetor grad f(a) que corresponde ao funcional df(a) segundo o isomorfismo
acima, ou seja,
∂f X
n
∂f
hgrad f(a), vi = df(a)v = (a) = (a) αi ,
∂v ∂xi
i=1
n
para todo v = (α1 , . . . , αn ) ∈ R .

∂f ∂f
Logo grad f(a) = (a), . . . , (a) .
∂x1 ∂xn
Observação 5.1. As coordenadas de grad f(a) em relação à base canônica são iguais às
X
n
∂f
coordenadas de df(a) = (a) dxi em relação à base {dx1 , . . . , dxn } de (Rn )? , dual da base
∂xi
i=1
canônica.
• Veremos agora as três propriedades mais importantes do gradiente de uma função dife-
renciável f : U −→ R. Para isso, seja a ∈ U tal que grad f(a) 6= 0.
Primeira propriedade. O gradiente aponta para uma direção segundo a qual a função f é
crescente.
De fato, se w = grad f(a), então

Análise
∂f
df(a) w = (a) = hgrad f(a), wi = k grad f(a)k2 > 0 .
∂w
Assim, se λ : (−ε, ε) −→ U é um caminho diferenciável tal que λ(0) = a e λ 0 (0) = grad f(a),
então
(f ◦ λ) 0 (0) = df(λ(0)) λ 0 (0) > 0 .
Então, se f e λ são de classe C1 , existe ε > 0 tal que (f ◦ λ) 0 (t) > 0 para todo t ∈ (−ε, ε),
e, portanto, f ◦ λ é crescente. Isto é, f cresce na direção do gradiente.
Fig. 4: Gradiente de f no ponto a
Segunda propriedade. Dentre todas as direções ao longo das quais a função f cresce, a
direção do gradiente é a de crescimento mais rápido.
De fato, não se tem df(a)v = hgrad f(a), vi > 0 apenas quando v = grad f(a), pois
hgrad f(a), vi > 0 para todo v que faz um ângulo agudo com grad f(a). Então f cresce ao
longo destas direções, mas grad f(a) é a direção segundo a qual o crescimento de f é o mais
rápido.
Ou seja, se v é um vetor tal que kvk = k grad f(a)k, então

∂f ∂f
(a) ≤ (a) ,
∂v ∂(grad f(a))
pois, pela desigualdade de Cauchy-Schwarz,
∂f ∂f
(a) = hgrad f(a), vi ≤ k grad f(a)k kvk = k grad f(a)k2 = (a) .
∂v ∂(grad f(a))
Observe, ainda, que a igualdade ocorre se, e só se, v = grad f(a).
Terceira propriedade. O gradiente de f no ponto a é perpendicular à ”superfı́cie” de nı́vel de f

que passa por esse ponto.
Dado c ∈ R, chamamos f−1 (c) = {x ∈ U | f(x) = c} conjunto de nı́vel de f e se f(x) = c, isto

é, x ∈ f−1 (c), dizemos que x está no nı́vel c ou que x tem nı́vel c.
O Teorema da Função Implı́cita, que provaremos depois, garante que f−1 (c) é uma su-

O gradiente de uma função diferenciável
perfı́cie (se n ≥ 3), ou uma curva (se n = 2), quando grad f(x) 6= 0 para todo x ∈ f−1 (c).
Dizer que w = grad f(a) é perpendicular ao conjunto de nı́vel f−1 (c), onde f(a) = c, sig-
nifica que w é perpendicular ao vetor velocidade λ 0 (0) de qualquer caminho diferenciável em
t = 0, com λ(0) = a e λ(t) ∈ f−1 (c) para todo t ∈ (−ε, ε). De fato, como f(λ(t)) = c para todo
t ∈ (−ε, ε),
0 = (f ◦ λ) 0 (0) = df(λ(0)) λ 0 (0) = hgrad f(a), λ 0 (0)i .
Exemplo 5.1. Sejam f, g, h : R2 −→ R dadas por: f(x, y) = ax + by, a2 + b2 6= 0; g(x, y) =

x2 + y2 e h(x, y) = x2 − y2 .
• As curvas de nı́vel de f são as retas ax+by = c para qualquer c ∈ R e grad f(x, y) = (a, b) para
todo (x, y) ∈ R2 . Assim, (a, b) é o vetor normal às retas ax + by = c, e {(x, y) ∈ R2 | ax + by > c}
é o semi-plano para o qual o vetor (a, b) aponta.
Fig. 5: Gradiente de f
• Seja c ∈ R e seja g−1 (c) = {(x, y) ∈ R2 | x2 + y2 = c} a curva de nı́vel c da função g. Então:

√
g−1 (c) = ∅ se c < 0, g−1 (0) = {(0, 0)}, g−1 (c) é o cı́rculo de centro na origem e raio c, e
grad f(x, y) = (2x, 2y) é um vetor paralelo ao raio e, portanto, perpendicular ao vetor tangente
ao cı́rculo naquele ponto.
Fig. 6: Gradiente de g

Análise
• As curvas de nı́vel c da função h são:

h−1 (0) = {(x, y) ∈ R2 | x2 = y2 } = {(x, y) ∈ R2 | x = ±y}
que consiste de duas retas, x = y e x = −y, perpendiculares que se cortam na origem; ou

h−1 (c) = {(x, y) ∈ R2 | x2 − y2 = c}
que é uma hipérbole cuja reta focal é o eixo x, se c > 0, e uma hipérbole cuja reta focal é o eixo
y, se c < 0.
Fig. 7: Gradiente de h
O gradiente de h, grad h(x, y) = (2x, −2y), é perpendicular às curvas de nı́vel e indica a direção
de crescimento de h.
• Nos pontos onde o gradiente se anula ocorre uma quebra de regularidade na disposição das
curvas de nı́vel. Um ponto onde o gradiente de uma função é o vetor nulo é chamado singular
ou crı́tico.
Exemplo 5.2. Considere, agora, as funções definidas no espaço R3 tridimensional:

f(x, y, z) = ax + by + cz ; g(x, y, z) = x2 + y2 + z2 e h(x, y, z) = x2 + y2 − z2 .
As superfı́cies de nı́vel de f são planos de equação ax + by + cz = d, d ∈ R, todos perpendicu-

lares ao vetor (a, b, c), que é o gradiente de f em qualquer ponto.
A superfı́cie de nı́vel c da função g é o conjunto vazio, se c < 0; consiste apenas da origem,

√
se c = 0 e é a esfera de centro na origem e raio c, se c > 0, sendo grad g(x, y, z) = 2(x, y, z)
perpendicular à superfı́cie de nı́vel c que passa pelo ponto (x, y, z) 6= (0, 0, 0).
A superfı́cie de nı́vel c da função h é o cone de revolução z2 = x2 +y2 de vértice na origem e eixo

z, o hiperbolóide de revolução de uma folha x2 + y2 − z2 = c de eixo z, se c > 0, e o hiperbolóide
de revolução de duas folhas x2 +y2 −z2 = c de eixo z, se c < 0, sendo grad h(x, y, z) = 2(x, y, −z)
perpendicular à superfı́cie de nı́vel que passa por (x, y, z).

A regra de Leibniz
6 A regra de Leibniz
Teorema 6.1. (Regra de Leibniz – derivação sob o sinal de integral)

Sejam U ⊂ Rn aberto e f : U × [a, b] −→ R uma função com as seguintes propriedades:
(1) Para todo x ∈ U, a função t 7−→ f(x, t) é integrável em [a, b].

∂f
(2) A i−ésima derivada parcial (x, t) existe para todo (x, t) ∈ U × [a, b] e a função
∂xi
∂f
: U × [a, b] −→ R é contı́nua.
∂xi
Zb
Então a função ϕ : U −→ R, dada por ϕ(x) = f(x, t) dt, possui i−ésima derivada parcial em
a
todo ponto x ∈ U, sendo Zb
∂ϕ ∂f
(x) = (x, t) dt .
∂xi a ∂xi
Ou seja, pode-se derivar sob o sinal de integral, desde que o integrando resultante seja uma
função contı́nua.
Prova.
Dado x0 ∈ U, existe δ0 > 0 tal que [x0 , x0 + sei ] ⊂ U, para todo s ∈ R com |s| < δ0 . Então,
pelo Teorema do Valor Médio, existe θ ∈ (0, 1) tal que:
Zb Zb
ϕ(x0 + sei ) − ϕ(x0 ) ∂f f(x0 + sei , t) − f(x0 , t) ∂f
− (x0 , t) dt = − (x0 , t) dt
s a ∂xi a s ∂xi
Zb
∂f ∂f
= (x0 + θsei , t) − (x0 , t) dt .
a ∂xi ∂xi
∂f
Como : U × [a, b] −→ R é contı́nua, temos, pelo teorema 11.4 do capı́tulo 1, que dado ε > 0,
∂xi
existe 0 < δ < δ0 tal que:
∂f ∂f ε
|s| < δ =⇒

(x0 + sθei , t) − (x0 , t) < ,
∂xi ∂xi 2(b − a)
para todo t ∈ [a, b]. Então,se 0 < |s| < δ,
Zb
ϕ(x0 + sei ) − ϕ(x) ∂f
− (x0 , t) dt < ε .
s ∂xi a
Provamos, então, que ϕ possui i−ésima derivada parcial no ponto x0 e

Zb
∂ϕ ∂f
(x0 ) = (x0 , t) dt .
∂xi a ∂xi
Corolário 6.1. Se f : U × [a, b] −→ R é contı́nua e possui as n derivadas

Zb
parciais
∂f
: U × [a, b] −→ R contı́nuas, então ϕ : U −→ R, dada por ϕ(x) = f(x, t) dt, é de
∂xi a
classe C1 .

Análise
Prova. Zb
∂ϕ ∂f
Pelo teorema anterior, ϕ possui as n derivadas parciais e (x) = (x, t) dt para todo
∂xi a ∂xi
∂f
x ∈ U, i = 1, . . . , n. Além disso, como : U × [a, b] −→ R é contı́nua, para todo i = 1, . . . , n,
∂xi
∂ϕ
temos, pela aplicação do teorema 11.4 do capı́tulo 1, que : U −→ R é contı́nua para todo
∂xi
i = 1, . . . , n.
Observação 6.1. Se f : [a, b] × [c, d] −→ R é uma função contı́nua,

Z
temos, pela aplicação
d
do teorema 11.4 do capı́tulo 1, que a função ξ : [a, b] −→ R, ξ(s) = f(s, t) dt , é contı́nua e,
c
portanto, integrável.
Zb
A integral ξ(s) ds se escreve como:
a Zb Zd Zb Zd
f(s, t) dt ds ou ds f(s, t) dt .
a c a c
Teorema 6.2. (da Inversão da Ordem nas Integrais Repetidas)

Se f : [a, b] × [c, d] −→ R é uma função contı́nua, então
Zb Zd Zd Zb
ds f(s, t) dt = dt f(s, t) ds .
a c c a
Prova. Zx
Seja g : [a, b] × [c, d] −→ R definida por g(x, t) = f(s, t) ds .
a
Zx
Para cada x ∈ [a, b] fixo, a função t 7−→ f(s, t) ds é contı́nua e, portanto, integrável. Além
a
∂g
disso, (x, t) = f(x, t) para todo (x, t) ∈ [a, b] × [c, d], pois o integrando s 7−→ f(s, t) é contı́nuo
∂x
para todo t ∈ [c, d].
∂g
Como = f : [a, b] × [c, d] −→ R é contı́nua, temos, pela Regra de Leibniz, que a função
∂x
ϕ : [a, b] −→ R, dada por
Zd Z d Z x
ϕ(x) = g(x, t) dt = f(s, t) ds dt ,
c c a
Zd Zd
∂g
é derivável e ϕ 0 (x) = (x, t) dt = f(x, t) dt.
c ∂x c
Como ϕ 0 : [a, b] −→ R é integrável (por ser contı́nua), temos, pelo Teorema Fundamental do
Cálculo, que Zb Z b Z d
0
ϕ(b) − ϕ(a) = ϕ (s) ds = f(s, t) dt ds .
a a c
Z d Z b
Sendo ϕ(a) = 0 e ϕ(b) = f(s, t) ds dt, obtemos
c a

A regra de Leibniz
Z d Z b Z b Z d
f(s, t) ds dt = f(s, t) dt ds .
c a a c
Corolário 6.2. Seja f : U×[a, b] −→ R uma função contı́nua, com derivadas parciais contı́nuas
∂f ∂f
,..., : U × [a, b] −→ R, e seja g : U −→ [a, b] uma função de classe C1 , onde U ⊂ Rn
∂x1 ∂xn
Z g(x)
é aberto. Então a função ϕ : U −→ R, definida por ϕ(x) = f(x, t) dt, é de classe C1 e suas
a
derivadas parciais são:
Z g(x)
∂ϕ ∂f ∂g
(x) = (x, t) dt + (x) f(x, g(x)) ,
∂xi a ∂xi ∂xi
para todo x ∈ U.
Prova. Zu
Seja ξ : U × [a, b] −→ R a função dada por ξ(x, u) = f(x, t) dt. Então, como a função
a
∂ξ
t 7−→ f(x, t) é contı́nua, (x, u) = f(x, u) para todo (x, u) ∈ U × [a, b].
∂u
Zu
∂ξ ∂f
Além disso, pela Regra de Leibniz, (x, u) = (x, t) dt .
∂xi a ∂xi
∂ξ
Afirmação: : U × [a, b] −→ R é contı́nua, para i = 1, . . . , n.
∂xi
∂f
De fato, como : U × [a, b] −→ R é contı́nua, temos, pelo teorema 11.4 do capı́tulo 1, que
∂xi
dados x0 ∈ U, u0 ∈ [a, b] e ε > 0, existe δ >
0 tal que
∂f ∂f
kx − x0 k < δ =⇒ (x, t) − (x0 , t) < ε 0 ,
∂xi ∂xi
ε ε
para todo t ∈ [a, b], onde ε 0 = se u0 = a e ε 0 = se u0 6= a.
2 2(u0 − a)

∂f ∂f
Sendo t 7−→

(x0 , t) contı́nua no compacto [a, b], existe M > 0 tal que (x0 , t) ≤ M para
∂xi ∂xi
∂f
todo t ∈ [a, b]. Assim, (x, t) ≤ N = ε 0 + M, para todo t ∈ [a, b] e x ∈ B(x0 , δ).
∂xi
ε
Então, se |u − u0 | < e kx − x0 k < δ,
2N
Zu Z u0
∂ξ ∂ξ ∂f ∂f

∂xi (x, u) − (x 0 , u0 ) = (x, t) dt − (x 0 , t) dt
∂xi ∂xi
a a ∂xi

Z u0 Z u0 Zu
∂f ∂f ∂f
≤ (x, t) dt − (x0 , t) dt + (x, t) dt
∂xi
a ∂xi a ∂xi u0
ε ε
≤ ε 0 |u0 − a| + N |u0 − u| < + = ε.
2 2
∂ξ ∂ξ
Logo ξ é de classe C1 , pois =fe , i = 1, . . . , n são contı́nuas.
∂u ∂xi

Análise
Sendo g e ξ são de classe C1 e, portanto, diferenciáveis, temos, pela Regra da Cadeia, que a
função composta ϕ(x) = ξ(x, g(x)) é diferenciável e, para todo i = 1, . . . , n,
Z g(x)
∂ϕ ∂ξ ∂ξ ∂g ∂f ∂g
(x) = (x, g(x)) + (x, g(x)) (x) = (x, t) dt + (x) f(x, g(x)) .
∂xi ∂xi ∂u ∂xi a ∂xi ∂xi
∂ϕ
Logo é contı́nua para todo i = 1, . . . , n, ou seja, ϕ é de classe C1 .
∂xi
Observação 6.2. De modo análogo, podemos provar que se f : U × [a, b] −→ R satisfaz as

hipóteses do corolário acima e g, h : U −→ [a, b] são de classe C1 , então as funções
Zb Z h(x)
ψ(x) = f(x, t) dt , e λ(x) = f(x, t) dt ,
g(x) g(x)
1
são de classe C e
Zb
∂ψ ∂f ∂g
• (x) = (x, t) dt − (x) f(x, g(x)) ;
∂xi g(x) ∂xi ∂xi
Z h(x)
∂λ ∂f ∂h ∂g
• (x) = (x, t) dt + (x) f(x, h(x)) − (x) f(x, g(x)) ,
∂xi g(x) ∂xi ∂xi ∂xi
Zb Z g(x) Zb Zb Z g(x) Zb Z h(x)
uma vez que, − = , e − − = .
a a g(x) a a h(x) g(x)
Observação 6.3. Seja f : I −→ R uma função contı́nua definida no intervalo I, com 0 ∈ I.

Seja F0 = f e Fn : I −→ R, n ≥ 1, definida por
Zx
(x − t)n−1
Fn (x) = f(t) dt .
0 (n − 1)!
(n−1) (n)
Então Fn é de classe Cn , Fn (0) = Fn0 (0) = . . . = Fn (0) = 0 e Fn (x) = f(x) para todo x ∈ I.
De fato, para n = 1, F1 é de classe C1 , F1 (0) = 0 e F10 (x) = f(x) para todo x ∈ I.
Suponhamos o resultado válido para n − 1, n − 1 ≥ 1. Sejam as funções G : I × I −→ R e

g : I −→ I dadas por
(x − t)n−1
G(x, t) = f(t) , e g(x) = x .
(n − 1)!
Então Fn (0) = 0 e, pelo corolário acima, Fn é de classe C1 e
Zx Zx
0 (x − t)n−2 0 (x − t)n−2
Fn (x) = f(t) dt + G(x, x) g (x) = f(t) dt = Fn−1 (x) ,
0 (n − 2)! 0 (n − 2)!
pois G(x, x) = 0.
(n−2) (n−1)
Como, por indução, Fn−1 é de classe Cn−1 e Fn−1 (0) = . . . = Fn−1 (0) = 0 e Fn−1 (x) = f(x) ,
(n−1) (n)
temos que Fn é de classe Cn , Fn (0) = Fn0 (0) = . . . = Fn (0) = 0 e Fn (x) = f(x) para todo
x ∈ I.

O Teorema de Schwarz
7 O Teorema de Schwarz
Definição 7.1. Seja f : U −→ R uma função diferenciável no aberto U ⊂ Rn . Se as derivadas

∂f
parciais : U −→ R, i = 1, . . . , n, são diferenciáveis num ponto a ∈ U, dizemos que f é duas
∂xi
vezes diferenciável no ponto a. Neste caso, existem as derivadas parciais de segunda ordem

∂ ∂f ∂2 f
(a) = (a) ,
∂xj ∂xi ∂xj ∂xi
para todo i, j = 1, . . . , n.
Se f : U −→ R é duas vezes diferenciável em U, ficam definidas n2 funções

∂2 f
: U −→ R , 1 ≤ i, j ≤ n .
∂xj ∂xi
Se todas estas funções são diferenciáveis num ponto a ∈ U, dizemos que f é três vezes
diferenciável nesse ponto. E assim por diante.
Observação 7.1. Já sabemos que se f ∈ C1 , então f é diferenciável.

Suponhamos, por indução, que se uma função é de classe Ck , então ela é k−vezes dife-
renciável.
∂f
Seja f ∈ Ck+1 . Então suas derivadas parciais , i = 1, . . . , n, são de classe Ck .
∂xi
∂f
Logo, por indução, , i = 1, . . . , n, são k−vezes diferenciáveis, e, portanto, f é (k + 1)−vezes
∂xi
diferenciável.
Cabe, então, determinar sob quais hipóteses a ordem em que são tomadas as derivadas
parciais repetidas não influi no resultado final.
Teorema 7.1. (de Schwarz)

Se f : U −→ R é duas vezes diferenciável num ponto c ∈ U ⊂ Rn , então
∂2 f ∂2 f
(c) = (c) ,
∂xi ∂xj ∂xj ∂xi
para quaisquer 1 ≤ i, j ≤ n.
Prova.
Vamos supor, para simplificar a notação, que U ⊂ R2 e c = (a, b). Devemos, então, provar
∂2 f ∂2 f
que (a, b) = (a, b).
∂x ∂y ∂y ∂x
Seja ε > 0 tal que (a − ε, a + ε) × (b − ε, b + ε) ⊂ U. Para todo t ∈ (−ε, ε) e x ∈ (a − ε, a + ε),
sejam:

Análise
• ϕ(t) = f(a + t, b + t) − f(a + t, b) − f(a, b + t) + f(a, b) .
• ξ(x) = f(x, b + t) − f(x, b).
Então ϕ(t) = ξ(a + t) − ξ(a). Pelo Teorema do Valor Médio para funções de uma variável real,
existe θ ∈ (0, 1) tal que ϕ(t) = ξ 0(a + θt)t, ou seja,
∂f ∂f

ϕ(t) = (a + θt, b + t) − (a + θt, b) t.
∂x ∂x
∂f
Como a função : U −→ R é diferenciável no ponto c = (a, b) temos que:
∂x
∂f ∂f ∂2 f ∂2 f
• (a + θt, b + t) = (a, b) + 2 (a, b)θt + (a, b)t + ρ1 t , com lim ρ1 = 0 .
∂x ∂x ∂x ∂y ∂x t→0
e
∂f ∂f ∂2 f
• (a + θt, b) = (a, b) + 2 (a, b)θt + ρ2 t , com lim ρ2 = 0.
∂x ∂x ∂x t→0
∂2 f
Logo ϕ(t) = (a, b)t2 + (ρ1 − ρ2 )t2 , e, portanto,
∂y ∂x
ϕ(t) ∂2 f
lim 2 = (a, b) . (I)
t→0 t ∂y ∂x
Seja, agora, η(y) = f(a + t, y) − f(a, y). Então ϕ(t) = η(b + t) − η(b). Pelo teorema do Valor
0
Médio, existe θ ∈ (0, 1) tal que ϕ(t)
= η (b + θt) t, ou seja,
∂f ∂f
ϕ(t) = (a + t, b + θt) − (a, b + θt) t .
∂y ∂y
∂f
Como a função : U −→ R é diferenciável no ponto c = (a, b), temos que:
∂y
∂f ∂f ∂2 f ∂2 f
• (a + t, b + θ t) = (a, b) + (a, b)t + 2 (a, b)θt + ρ3 t , com lim ρ3 = 0 ,
∂y ∂y ∂x ∂y ∂y t→0
e
∂f ∂f ∂2 f
• (a, b + θt) = (a, b) + 2 (a, b)θt + ρ4 t , com lim ρ4 = 0.
∂y ∂y ∂ y t→0

∂2 f
Logo ϕ(t) = (a, b) + (ρ3 − ρ4 ) t2 , e, portanto,
∂x∂y
ϕ(t) ∂2 f
lim 2 = (a, b) . (II)
t→0 t ∂x ∂y
∂2 f ∂2 f
Assim, por (I) e (II), (a, b) = (a, b) .
∂y ∂x ∂x ∂y
∂2 f ∂2 f
Corolário 7.1. Se f : U −→ R é de classe C2 no aberto U ⊂ Rn , então (x) = (x)
para todo x ∈ U e para todo 1 ≤ i, j ≤ n.
xy(x2 − y2 )
Exemplo 7.1. Seja f : R2 −→ R a função dada por f(x, y) = , se (x, y) 6= (0, 0), e
x 2 + y2
f(0, 0) = 0.

O Teorema de Schwarz
A função f é de classe C∞ em R2 − {(0, 0)}. Além disso, temos que:

∂f f(x + t, 0) − f(x, 0)
• (x, 0) = lim = 0, x ∈ R;
∂x t→0 t
∂f ∂f
∂2 f (t, 0) − (0, 0)
• 2 (0, 0) = lim ∂x ∂x = 0;
∂x t→0 t
∂f f(0, y + t) − f(0, y)
• (0, y) = lim = 0, y ∈ R;
∂y t→0 t
∂f ∂f
(0, t) − (0, 0)
∂2 f ∂y ∂y
• 2 (0, 0) = lim = 0;
∂y t→0 t
∂f f(t, y) − f(0, y) ty(t2 − y2 )
• (0, y) = lim = lim = −y , y ∈ R ;
∂x t→0 t t→0 t(t2 + y2 )
∂f ∂f
∂2 f (0, t) − (0, 0) −t
• (0, 0) = lim ∂x ∂x = lim = −1 ;
∂y ∂x t→0 t t→0 t
∂f f(x, t) − f(x, 0) xt(x2 − t2 )

• (x, 0) = lim = lim = x, x ∈ R;
∂y t→0 t t→0 t(x2 + t2 )
∂f ∂f
(t, 0) − (0, 0)
∂2 f ∂y ∂y t
• (0, 0) = lim = lim = 1 .
∂x ∂y t→0 t t→0 t
Logo f possui derivadas parciais de segunda ordem em todos os pontos do plano, mas
∂2 f ∂2 f
(0, 0) 6= (0, 0) .
∂x, ∂y ∂y ∂x
∂f ∂f
Pode-se verificar também que e são contı́nuas em R2 , ou seja, f é de classe C1 em R2 ,
∂x ∂y
∂f ∂f
mas e não são diferenciáveis na origem. Logo f é diferenciável na origem, mas não é
∂x ∂y
duas-vezes diferenciável na origem.
∂2 f ∂2 f
Além disso, apesar das derivadas de segunda ordem e existirem em todos os pontos
∂x ∂y ∂y ∂x
do plano, elas não são contı́nuas na origem.
De fato, como para (x, y) 6= (0, 0),

∂f (y(x2 − y2 ) + xy 2x)(x2 + y2 ) − 2x xy(x2 − y2 )
(x, y) =
∂x (x2 + y2 )2
((3x2 y − y3 ))(x2 + y2 ) − 2x2 y(x2 − y2 )
=
(x2 + y2 )2
x4 y − y5 + 4x2 y3
= ;
(x2 + y2 )2
∂2 f (x4 − 5y4 + 12x2 y2 )(x2 + y2 )2 − (x4 y − y5 + 4x2 y3 )2(x2 + y2 )2y
(x, y) =
∂y ∂x (x2 + y2 )4
(x4 − 5y4 + 12x2 y2 )(x2 + y2 ) − 4y(x4 y − y5 + 4x2 y3 )
= ,
(x2 + y2 )3

Análise
∂2 f 8t4 · 2t2 − 16t6 ∂2 f ∂2 f

temos que (t, t) = = 0 e, portanto, lim (t, t) = 0 6
= (0, 0) = −1 .
∂y ∂x 8t6 t→0 ∂y ∂x ∂y ∂x
Como f é de classe C∞ em R2 −{(0, 0)}, e, portanto, duas vezes diferenciável em todos os pontos
∂2 f ∂2 f
(x, y) 6= (0, 0), temos que (x, y) = (x, y) para todo (x, y) 6= (0, 0).
∂x ∂y ∂y ∂x
∂2 f ∂2 f
Logo lim (t, t) = 0 6= (0, 0) = 1 .
t→0 ∂x ∂y ∂x ∂y
Daremos, agora, outra versão do Teorema de Schwarz que decorre da Regra de Leibniz.
∂f ∂2 f
Teorema 7.2. Seja f : U ⊂ Rn −→ R uma função tal que existem e em todos os
∂xi ∂xi ∂xj
∂f ∂2 f ∂2 f
pontos de U, e as funções , : U −→ R são contı́nuas. Então, a derivada existe
∂xj ∂xi ∂xj ∂xj ∂xi
∂2 f ∂2 f
em todos os pontos de U e ≡ .
∂xj ∂xi ∂xi ∂xj
Prova.
Vamos supor n = 2 para simplificar a notação.
Dado (x0 , y0 ) ∈ U, existe ε > 0 tal que I × J ⊂ U, onde I = (x0 − ε, x0 + ε) e J = (y0 − ε, y0 + ε).
Seja b ∈ J. Pelo Teorema Fundamental do Cálculo,
Z temos que y
∂f
f(x, y) = f(x, b) + (x, t) dt ,
b ∂y
∂f
para todo (x, y) ∈ I × J, uma vez que é contı́nua, e, portanto, integrável.
∂y
∂f ∂2 f
Como , : I × J −→ R são contı́nuas, por hipótese, temos, pela Regra de Leibniz, que:
∂y ∂x ∂y Zy 2
∂f ∂f ∂ f
(x, y) = (x, b) + (x, t) dt .
∂x ∂x b ∂x ∂y
Zy
∂2 f ∂2 f
Logo, como o integrando é contı́nuo, temos, também, que a função (x, t) dt é
∂x ∂y b ∂x ∂y
derivável em relação a y e Z y
∂ ∂2 f ∂2 f
(x, t) dt = (x, y) .
∂y b ∂x ∂y ∂x ∂y
∂f ∂2 f ∂2 f
Assim, possui derivada em relação a y e (x, y) = (x, y) para todo (x, y) ∈ I × J.
∂x ∂y ∂x ∂x ∂y
Observação 7.2. Seja f : U ⊂ R2 −→ R uma função três vezes diferenciável. Então as seis
derivadas mistas de terceira ordem satisfazem:
∂3 f ∂3 f ∂3 f ∂3 f ∂3 f ∂3 f
= = e = = .
∂x ∂x ∂y ∂x ∂y ∂x ∂y ∂x ∂x ∂y ∂y ∂x ∂y ∂x ∂y ∂x ∂y ∂y
De fato, pelo Teorema de Schwarz, 2
∂3 f ∂ ∂2 f ∂ ∂ f ∂3 f
= = = ,
∂x ∂x ∂y ∂x ∂x ∂y ∂x ∂y ∂x ∂x ∂y ∂x

Fórmula de Taylor; pontos crı́ticos.
∂f
e, fazendo g = , temos que
∂x
∂f
∂3 f ∂ ∂ ∂2 g ∂2 g ∂ ∂3 f
∂ ∂f
= = = = = ,
∂x ∂y ∂x ∂x ∂y ∂x ∂x ∂y ∂y ∂x ∂y ∂x ∂x ∂y ∂x ∂x
uma vez que f e g são duas vezes diferenciáveis.
Analogamente, podemos provar as outras três igualdades acima.
No caso geral, se f : U ⊂ Rn −→ R é uma função p−vezes diferenciável no aberto U, então

para toda sequência de inteiros não-negativos i1 , . . . , in , com i1 + . . . + in = α ≤ p, a derivada
∂α
de ordem α, , que consiste em derivar i1 vezes em relação à variável x1 , . . ., in vezes
∂xi11 . . . ∂xinn
em relação à variável xn , não depende da ordem em que essas derivações foram efetuadas.
Para demonstrar o caso geral, basta sabermos que podemos trocar a ordem de duas deriva-
das sucessivas e que qualquer mudança de ordem numa sequência finita pode ser obtida por
transposições sucessivas entre dois termos consecutivos da sequência.
8 Fórmula de Taylor; pontos crı́ticos.
Seja f : U ⊂ Rn −→ R uma função p−vezes diferenciável no ponto a. Para cada vetor

v = (α1 , . . . , αn ) ∈ Rn , escrevemos:
X
n
∂f
df(a) v = (a)αi ;
∂xi
i=1
X
n
∂2 f
d2 f(a) v2 = (a)αi αj ;
∂xi ∂xj
i,j=1
.. ..
. .
X
n
∂p f
dp f(a) vp = (a)αi1 . . . αip ;
∂xi1 . . . ∂xip
i1 ,...,ip =1
Para cada p > 0, a forma dp f(a) : Rn −→ R chama-se p−ésima diferencial da função f no

ponto a.
Observação 8.1. dfp (a)(tv)p = tp dp f(a) vp , ou seja, dfp (a) é um polinômio homogêneo de
grau p nas coordenadas de v.
Observação 8.2. Usando a notação acima, a Regra da Cadeia enuncia-se do seguinte modo:
Seja f = (f1 , . . . , fn ) : U ⊂ Rm −→ Rn uma aplicação tal que fi : U −→ R é diferenciável em a

Análise
para todo i = 1, . . . , n, e seja g : V ⊂ Rn −→ R diferenciável em f(a) = b, com f(U) ⊂ V. Então

g ◦ f : U −→ R é diferenciável em a e, para todo v ∈ Rn ,
d(g ◦ f)(a) v = dg(f(a)) · (df1 (a) v, . . . , dfn (a) v) = dg(f(a)) df(a) v ,
De fato,
X X X
m m n
!
∂(g ◦ f) ∂g ∂f
d(g ◦ f)(a) v = (a) αi = (f(a)) k (a) αi
∂xi ∂yk ∂xi
i=1 i=1 k=1
X
n X
m
∂g ∂fk X
m
∂g
= (f(a)) (a) αi = (f(a)) dfk (a) v
∂yk ∂xi ∂yk
k=1 i=1 k=1
= dg(f(a))(df1 (a) v, . . . , dfn (a) v) .
Teorema 8.1. (Fórmula de Taylor com resto de Lagrange)

Seja f : U ⊂ Rn −→ R uma função de classe Cp , (p + 1)−vezes diferenciável no segmento
aberto (a, a + v), com [a, a + v] ⊂ U. Então existe θ ∈ (0, 1) tal que:
1
rp (v) = df(p+1) (a + θv) vp+1 ,
(p + 1)!
onde rp (v) é dado pela igualdade:
1 2 1
f(a + v) = f(a) + df(a) v + d f(a) v2 + . . . + dp f(a) vp + rp (v) .
2! p!
Prova.
Seja ε > 0 tal que a + tv ∈ U para todo t ∈ (−ε, 1 + ε), e seja λ : (−ε, 1 + ε) −→ Rn o ca-
minho C∞ dado por λ(t) = a + tv. Então a função ϕ = f ◦ λ : (−ε, 1 + ε) −→ R é de classe Cp
em (−ε, 1 + ε) e é (p + 1)−vezes diferenciável em (0, 1).
Logo, pela Fórmula de Taylor com resto de Lagrange para uma função real de uma variável real,
existe θ ∈ (0, 1), tal que
ϕ 00 (0) ϕ(p) (0)
ϕ(1) = ϕ(0) + ϕ 0 (0) + + ... + + rp ,
2! p!
ϕ(p+1) (θ)
onde rp = . (I)
(p + 1)!
Afirmação: ϕ(i) (t) = d(i) f(a + tv) vi , 1 ≤ i ≤ p + 1 , t ∈ (0, 1).
De fato,
∂f X
n
∂f
0
ϕ (t) = (a + tv) = df(a + tv) v = (a + tv) αi .
∂v ∂xi
i=1
Suponhamos, por indução, o resultado válido para uma função p−vezes diferenciável.
∂f
Seja f : U −→ R uma função (p + 1)−vezes diferenciável em (a, a + v). Então : U −→ R é
∂xi
p−vezes diferenciável, para todo i = 1, . . . , n.


(i) i ∂f
Portanto, pela hipótese de indução, λj (t) = d (a + tv)vi , i = 1, . . . , p, onde
∂xj
∂f
λj (t) = (a + tv). Assim,
∂xj
X
n
(k)
Xn
∂f

(k+1) k k
ϕ (t) = λj (t)αj = d (a + tv) v αj
∂xj
j=1  j=1 

∂f
X
n
 X
n ∂k
∂xj 
=  (a + tv) αj1 . . . αjk 
 αj
 ∂xj1 . . . ∂xjk
j=1 j1 ,...,jk =1
X
n
∂k+1 f
= (a + tv) αj1 . . . αjk αj
∂xj1 . . . ∂xjk ∂xj
j,j1 ,...,jk =1
= dk+1 f(a + tv) vk+1
para todo k = 1, . . . , p e todo v ∈ Rn .
• Como ϕ(1) = f(a + v) , ϕ(0) = f(a) , ϕ(i) (0) = di f(a) vi e ϕp+1 (θ) = df(p+1) (a + θv) vp+1 ,
temos, por (I), que a fórmula de Taylor com resto de Lagrange também é válida para funções
reais de n−variáveis.
Teorema 8.2. (Fórmula de Taylor com resto integral)

Se f : U −→ R é uma função de classe Cp+1 e [a, a + v] ⊂ U, então
Z1
1
rp (v) = (1 − t)p dp+1 f(a + tv)vp+1 dt .
p! 0
Prova.
Como ϕ = f ◦ λ é de classe Cp+1 em (−ε, 1 + ε), temos, pela Fórmula de Taylor com resto
integral para funções reais de uma variável real, que
ϕ(p) (0)
ϕ(1) = ϕ(0) + ϕ 0 (0) + . . . + + rp ,
p!
Z1
1
onde rp = (1 − t)p ϕ(p+1) (t) dt .
p! 0
Logo,
1 (p)
f(a + v) = f(a) + df(a) v + . . . + d (a) vp + rp (v) ,
p!
onde
Z1
1
rp (v) = (1 − t)p dp+1 f(a + tv) vp+1 dt .
p! 0
Antes de provarmos a Fórmula de Taylor Infinitesimal, faremos algumas considerações de

Análise
caráter geral.
Definição 8.1. Seja Rn × . . . × Rn o produto cartesiano de k−cópias do espaço Rn e seja

L : Rn × . . . × Rn −→ R uma transformação k−linear. Dizemos que L é simétrica se
L(v1 , . . . , vbi , . . . , vbj , . . . , vk ) = L(v1 , . . . , vbj , . . . , vbi , . . . , vk ) ,
para quaisquer v1 , . . . , vk ∈ Rn e todo par i, j = 1, . . . , n, com i < j.
Então, se vj = (αj1 , . . . , αjn ), j = 1, . . . , k, temos

X
L(v1 , . . . , vk ) = ai1 ,...,ik α1i1 . . . αkik ,
onde ai1 ,...,ik = L(ei1 , . . . , eik ) independe da ordem dos ı́ndices i1 , . . . , ik = 1, . . . , n.
Observação 8.3. Se f : U ⊂ Rn −→ R é uma função p−vezes diferenciável no ponto a, a

transformação k−linear dk f(a) : Rn × . . . × Rn −→ R definida por:
X
n
∂k f(a)
dk f(a)(v1 , . . . , vk ) = α1 . . . αkik ,
∂xi1 . . . ∂xik i1
i1 ,...,ik =1
chama-se k−ésima diferencial da função f no ponto a, para k = 1, . . . , p.
Por Schwarz, temos que dk f(a) é simétrica, 1 ≤ k ≤ p.
Observe que dk f(a)vk = dk f(a)(v, . . . , v) é a forma associada à aplicação k−linear dk f(a).
Definição 8.2. Dizemos que uma função f : Rn −→ R é k−homogênea quando f(tx) = tk f(x)
para todo x ∈ Rn e t ∈ R.
Exemplo 8.1. Se L : Rn × . . . × Rn −→ R é k−linear, então g : Rn −→ R definida por

g(x) = L(x, . . . , x) é k−homogênea, ou melhor, g é um polinômio homogêneo de grau k e,
portanto, g é C∞ .
Observação 8.4. Seja f : Rn −→ R uma função k−homogênea de classe Ck , k ≥ 1.

∂j f
Afirmação 1: é uma função (k − j)−homogênea para todo 1 ≤ j ≤ k e para quaisquer
∂xi1 . . . ∂xij
i1 , . . . , ij = 1, . . . , n.
Como f(tx) = tk f(x), temos, pela Regra da Cadeia, que

∂f ∂f
(tx) t = tk (x) ,
∂xi ∂xi
para todo x ∈ Rn , t ∈ R, i = 1, . . . , n.
∂f ∂f
Logo, se t 6= 0, (tx) = tk−1 (x) para todo x ∈ Rn . Como f ∈ Ck , k ≥ 1, temos que
∂xi ∂xi
∂f ∂f
(tx) = tk−1 (x) para todo x ∈ Rn , t ∈ R.
∂xi ∂xi

Suponhamos, por indução, que o resultado é válido para funções k − 1 homogêneas, k − 1 ≥ 1.

∂f
Sendo f ∈ Ck , temos que : Rn −→ R são de classe Ck−1 e (k − 1)−homogêneas, para todo
∂xi
i = 1, . . . , n.
Logo, pela hipótese de indução, para cada i = 1, . . . , n, temos que:

∂f ∂f
∂j ∂j
∂xi k−1−j ∂xi
(tx) = t (x) ,
∂xi1 . . . ∂xij ∂xi1 . . . ∂xij
para quaisquer i1 , . . . , ij = 1, . . . , n e para todo j = 1, . . . , k − 1. Ou seja,
∂j+1 f ∂j+1 f
(tx) = tk−1−j (x) ,
∂xi1 . . . ∂xij ∂xi ∂xi1 . . . ∂xij ∂xi
para todo j + 1 = 2, . . . , k, e para quaisquer i1 , . . . , ij , i = 1, . . . , n.
• Logo, se f : Rn −→ R é uma função k−homogênea de classe Ck , então

dj f(tx)(v1 , . . . , vj ) = tk−j dj f(x)(v1 , . . . , vj )
para todo j = 1, . . . , k.
Assim, dk f(tx)(v1 , . . . , vk ) = dk f(x)(v1 , . . . , vk ) para todo t ∈ R e todo x ∈ Rn . Em particular,

dk f(x) = dk f(0) independe do ponto x ∈ Rn .
∂k f ∂k f
Como (x) = (0) para todo x ∈ R e para quaisquer i1 , . . . , ik = 1, . . . , n,
∂xi1 . . . ∂xik ∂xi1 . . . ∂xik
temos que todas as derivadas parciais de ordem k de f são constantes.
Logo f é de classe C∞ e dj f(x) = 0 para todo j > k e para todo x ∈ Rn .
Afirmação 2: dk f(0)xk = k! f(x) e dj f(0)xj = 0 , se j 6= k. (II)
De fato, seja ϕ(t) = f(tx) = tk f(x). Então, como foi provado no Teorema 8.1, temos:
ϕ(i) (t) = di f(tx)xi , para todo i ∈ N.
k!
Mas, por outro lado, ϕ(i) (t) = tk−i f(x), para todo 1 ≤ i ≤ k, e ϕ(j) (t) = 0 para j > k.
(k − i)!
Logo di f(0)xi = 0 para i 6= k e dk f(0)xk = k! f(x).
1 k
Então f(x) = L(x, . . . , x), onde L = d f(0) é uma transformação k−linear simétrica.
k!
Como dk f(x) = dk f(0) para todo x ∈ Rn , temos que dk f(x) = k! L para todo x ∈ Rn .
• Se f não é de classe Ck , f não é necessariamente a forma associada a uma transformação

k−linear simétrica.
x2 − y2
Exemplo 8.2. Seja f : R2 −→ R a função definida por f(x, y) = xy , (x, y) 6= (0, 0), e
x2 + y2
f(0, 0) = 0.

Análise
Então f(tx, ty) = t2 f(x, y) para todo t ∈ R e todo (x, y) ∈ R2 , ou seja, f é uma função
2−homogênea. Mas, f não é a forma quadrática de uma transformação bilinear. Isso ocorre
porque f é de classe C1 , mas f não é duas vezes diferenciável na origem (verifique!).
1
Afirmação 3: dj f(x)(v1 , . . . , vj ) = dk f(0)(x, . . . , x, v1 , . . . , vj ) para todo 1 ≤ j ≤ k.
(k − j)!
∂j f
Sejam 1 ≤ j ≤ k e g(x) = (x) , onde i1 , . . . , ij ∈ {1, . . . , n}. Como
∂xi1 . . . ∂xij
∂j f ∂j f
(tx) = tk−j (x),
∂xi1 . . . ∂xij ∂xi1 . . . ∂xij
temos que g é (k − j)−homogênea e, portanto, por (II), d(k−j) g(0)xk−j = (k − j)! g(x), ou seja,
jf

∂ ∂j f
dk−j (0)xk−j = (k − j)! (x) ,
∂xi1 . . . ∂xij ∂xi1 . . . ∂xij
n
para todo x ∈ R e quaisquer i1 , . . . , ij = 1, . . . , n.
Logo, sendo v` = (α`1 , . . . , α`n ), ` = 1, . . . , j, temos que:

X
n
∂j f
j
d f(x)(v1 , . . . , vj ) = (x) α1i1 . . . αjij
∂xi1 . . . ∂xij
i1 ,...,ij =1
 
1 X
n X
n
∂k f(0)
=  x`1 . . . x`k−j  α1i1 . . . αjij
(k − j)! ∂x`1 . . . ∂x`k−j ∂xi1 . . . ∂xij
i1 ,...,ij =1 `1 ,...,`k−j =1
1
= dk f(0)(x, . . . , x, v1 , . . . , vj ) .
(k − j)!
• Em particular, seja T : Rn × . . . × Rn −→ R uma transformação k−linear e f : Rn −→ R dada
por f(x) = T (x, . . . , x). Então, como f é k−homogênea e de classe C∞ , temos, por (II), que
1
f(x) = T (x, . . . , x) = dfk (0)(x, . . . , x) ,
k!
ou seja,
dfk (0)(x, . . . , x) = k! T (x, . . . , x) . (III)
• Dada uma transformação k−linear T : Rn × . . . × Rn −→ R, a transformação k−linear TS =

X
Tσ , onde P é o conjunto de todas as permutações de {1, . . . , k} e Tσ (v1 , . . . , vk ) = T (vσ(1) , . . . , vσ(k) ),
σ∈P
é chamada simetrização da transformação T .
Observe que TS é k−linear simétrica e TS (x, . . . , x) = k! T (x, . . . , x).
Então, por (III),

dk f(0)(x, . . . , x) = TS (x, . . . , x) . (IV)
Afirmação 4: dk f(x) = dk f(0) = TS . Em particular dk f(x) = dk f(0) = k! T , se T é simétrica.

De fato, por (IV), basta mostrar que se U : Rn × . . . × Rn −→ R é uma transformação k−linear

simétrica tal que g(x) = U(x, . . . , x) = 0 para todo x ∈ Rn , então U ≡ 0.
Vamos fazer a prova deste fato usando indução em k ∈ N.
Se k = 1, a afirmação é evidente.
Suponhamos o resultado válido para transformações (k − 1)−lineares, k − 1 ≥ 1.
Seja U : Rn × . . . × Rn −→ R uma transformação k−linear simétrica tal que U(x, . . . , x) = 0 para

todo x ∈ Rn .
Sejam v, w ∈ Rn e t ∈ R. Então,

k k−1
0 = U(v + tw, v + tw, . . . , v + tw) = t U(v, w, . . . , w)
k−1

k−2 k k
+t U(v, v, w, . . . , w) + . . . + t U(v, . . . , v, w) ,
k−2 1
para todo t ∈ R.
Logo U(v, w, . . . , w) = 0 para quaisquer v, w ∈ Rn .
Seja v ∈ Rn e defina U1 : Rn × . . . × Rn −→ R por U1 (v1 , . . . , vk−1 ) = U(v, v1 , . . . , vk−1 ). Então U1

é uma transformação (k − 1)−linear simétrica tal que U1 (w, . . . , w) = U(v, w, . . . , w) = 0 para
todo w ∈ Rn .
Logo, pela hipótese de indução, U1 ≡ 0, ou seja, U1 (v1 , . . . , vk−1 ) = 0 para quaisquer k − 1

vetores v1 , . . . , vk−1 ∈ Rn . Então U(v, v1 , . . . , vk−1 ) = 0 para quaisquer v, v1 , . . . , vk−1 ∈ Rn .
Assim U ≡ 0.
• Resumindo, se T : Rn × . . . × Rn −→ R é uma transformação k−linear e

f(x) = T (x, . . . , x), então para todo x ∈ Rn :
◦ dk f(x) = dk f(0) = TS ;
◦ dj f(x) = 0, se j > k.
1
◦ dj f(x)(v1 , . . . , vj ) = TS (x, . . . , x, v1 , . . . , vj ), se 1 ≤ j ≤ k, quaisquer que sejam
(k − j)!
v1 , . . . , vj ∈ Rn .
◦ dj f(0) = 0, se 1 ≤ j < k.
• Passamos, agora, a analisar a Fórmula de Taylor Infinitesimal.

rp (v)
Se f : U −→ R é p−vezes diferenciável no ponto a ∈ U, então lim = 0, onde
v→0 kvkp
rp : U0 = {v ∈ Rn ; a + v ∈ U} −→ R é dada por:

Análise
1 2 1
rp (v) = f(a + v) − f(a) − df(a) v − d f(a)v2 − . . . − dp f(a)vp .
2! p!
De fato, seja g : U0 −→ R dada por g(v) = f(a + v). Então g é p−vezes diferenciável na origem,
pois a função v 7−→ a + v é de classe C∞ e f é p−vezes diferenciável em a.
Afirmação: dj g(0) = dj f(a), 1 ≤ j ≤ p.

∂k g ∂k f
Basta mostrar, por indução, que (0) = (a), para todo 1 ≤ k ≤ p e para
∂xi1 . . . ∂xik ∂xi1 . . . ∂xik
quaisquer i1 , . . . , ik ∈ {1, . . . , n}.
Para j = 1, temos, pela Regra da Cadeia (ver observação 8.2), que dg(0)v = df(a)v para todo
∂g ∂f
v ∈ Rn , ou seja, (0) = (a) para todo i = 1, . . . , n.
∂xi ∂xi
Suponhamos que o resultado seja válido para funções (p − 1)−vezes diferenciáveis no ponto
∂f
a ∈ U, p−1 ≥ 1. Seja f uma função p−vezes diferenciável no ponto a. Então é (p−1)−vezes
∂xi
diferenciável no ponto a, para todo i = 1, . . . , n.
∂f
Pela hipótese de indução, a função h dada por h(v) = (a + v), v ∈ U0 , é (p − 1)−vezes
∂xi
diferenciável na origem e

∂f
∂k
∂k h ∂xi
(0) = (a) , (V)
∂xi1 . . . ∂xik ∂xi1 . . . ∂xik
para 1 ≤ k ≤ p − 1, quaisquer que sejam i1 , . . . , ik ∈ {1, . . . , n}.
Logo, como p ≥ 2, temos que f é diferenciável numa vizinhança do ponto a e, portanto,

∂g ∂f
(v) = (a + v) para todo i = 1, . . . , n, e todo v numa vizinhança da origem.
∂xi ∂xi
∂g
Assim, h(v) = (v) e, por (V),
∂xi
k ∂g
∂
∂xi ∂k+1 f
(0) = (a) ,
∂xi1 . . . ∂xik ∂xi1 . . . ∂xik ∂xi
ou seja,
∂k+1 g ∂k+1 f
(0) = (a) ,
∂xi1 . . . ∂xik ∂xi ∂xi1 . . . ∂xik ∂xi
para todo k + 1 = 2, . . . , p e quaisquer i1 , . . . , ik , i ∈ {1, . . . , n}.
• Sendo Hk : Rn −→ R, Hk (v) = dk f(a)vk , 1 ≤ k ≤ p, temos, pelo provado na observação 8.4,

que dj Hk (0) = 0 se j ∈ {1, . . . , p} e j 6= k, e dk Hk (0) = k! dk f(a).
Logo rp (0) = 0 e dj rp (0) = dj f(a) − dj f(a) = 0 para todo j = 1, . . . , p.
Lema 8.1. Seja r : U0 ⊂ Rn −→ R uma função p−vezes diferenciável no ponto 0 ∈ U0 . Então

r(v)
r(0) = dr(0) = . . . = dp r(0) = 0 se, e somente se, lim = 0.
v→0 kvkp

Prova.
(=⇒) Para p = 0, estamos supondo r contı́nua no ponto 0.
Para p = 1, r é diferenciável na origem e r(0) = dr(0) = 0. Logo, como

r(v) = r(0) + dr(0)v + ρ(v)kvk ,
r(v) r(v)
com lim ρ(v) = 0, temos que ρ(v) = , e, portanto, lim = 0.
v→0 kvk v→0 kvk
Suponhamos que o resultado é válido para funções (p − 1)−vezes diferenciáveis na origem,

p − 1 ≥ 1.
Seja r : U0 −→ R uma função p−vezes diferenciável na origem com r(0) = dr(0) = . . . =

dp r(0) = 0.
∂r
Então, para todo 1 ≤ i ≤ n, ϕi = : U0 −→ R é (p − 1)−vezes diferenciável na origem e
∂xi
∂r
(v)
p−1 ∂x i
ϕi (0) = dϕi (0) = . . . = d ϕi (0). Logo, pela hipótese de indução, lim = 0.
v→0 kvkp−1
Como p ≥ 2, r é diferenciável numa vizinhança V0 ⊂ U0 da origem e, portanto, pelo teorema do

valor médio, para todo v ∈ U0 , existe θv ∈ (0, 1) tal que
X
n
∂r ∂r
  
(θv v) αi
r(v) ∂xi X
n (θ v)
 ∂xi v  αi
= i=1
= |θv |p−1  .

kvkp kvkp kθv vkp−1 kvk
 
i=1

n
αi
Considerando R com a norma do máximo, temos que
≤ 1, para todo i = 1, . . . , n.
kvk
∂r
(θv v)
r(v) ∂xi
Logo lim = 0, uma vez que lim = 0, para todo i = 1, . . . , n.
v→0 kvkp v→0 kθv vkp−1
(⇐=) Para p = 0, lim r(v) = 0, e, portanto, r(0) = 0, pois estamos supondo r contı́nua na origem.
v→0
r(v)
Para p = 1, lim r(v) = lim kvk = 0. Então r(0) = 0, pois r é contı́nua na origem, uma vez
v→0 v→0 kvk
que r é diferenciável neste ponto. Além disso, como f é diferenciável na origem,
r(v) = r(0) + dr(0)v + r(v) = dr(0)v + r(v) ,
r(v) r(tv) r(tv)
onde lim = 0. Logo, para todo v ∈ Rn − {0} e para todo t ∈ R − {0}, = dr(0)v + .
v→0 kvk t t
Como
r(tv) r(tv)
lim = lim = 0,
t→0 ktvk t→0 ktvk
temos que
r(tv) r(tv) r(tv) r(tv)
dr(0)v = lim − lim = lim ±kvk − = 0,
t→0 t t→0 t t→0 ktvk ktvk

Análise
para todo v ∈ Rn − {0}. Logo dr(0) = 0.
Suponhamos que o resultado é válido para funções p−vezes diferenciáveis no ponto 0, p ≥ 1.

r(v)
Seja r : U0 −→ R uma função (p + 1)−vezes diferenciável na origem com lim = 0. Como
v→0 kvkp+1
r(v) r(p)
lim p
= lim kvk = 0, temos, pela hipótese de indução, que
v→0 kvk v→0 kvkp+1
r(0) = dr(0) = . . . = dp r(0) = 0.
Mostraremos, agora, que dp+1 r(0) = 0.
De fato, pelo provado na primeira parte do lema, temos que

1
r(v) − dp+1 r(0)vp+1
(p + 1)!
lim = 0,
v→0 kvkp+1
já que dj ϕ(0) = 0, j = 1, . . . , p, e dp+1 ϕ(0) = (p + 1)! dp+1 r(0), onde ϕ(v) = dp+1 r(0)vp+1 .
Então, para todo v ∈ Rn − {0},

1
r(tv) − dp+1 r(0)(tv)p+1
(p + 1)!
lim = 0,
t→0+ ktvkp+1
e, portanto,
1 dp+1 r(0)vp+1 r(tv)
= lim+ = 0.
(p + 1)! kvkp+1 t→0 ktvkp+1
Ou seja, dp+1 r(0)vp+1 = 0 para todo v ∈ Rn . Então dp+1 r(0) = 0.
Observação 8.5. (Unicidade da Fórmula de Taylor)

Seja f : U −→ R uma função p−vezes diferenciável no ponto a ∈ U e, para cada i = 1, . . . , p,
seja ϕi : Rn × . . . × Rn −→ R uma função i−linear. Se
f(a + v) = f(a) + ϕ1 v + ϕ2 v2 + . . . + ϕp vp + rp (v) ,
rp (v) 1
com lim p
= 0, então ϕi vi = di f(a)vi , para todo i = 1, . . . , p e todo v ∈ Rn .
v→0 kvk i!
rp (v)
De fato, como rp é p−vezes diferenciável no ponto 0 e lim = 0, temos, pelo lema acima,
v→0 kvkp
que rp (0) = drp (0) = . . . = dp rp (0) = 0. Mas, pela observação 8.4, di rp (0) = di f(a) − ϕSi , para
todo i = 1, . . . , p, onde ϕSi é a simetrização de ϕi . Logo ϕSi = di f(a), ou seja,
1 S i 1
ϕi vi = ϕi v = di f(a) vi ,
i! i!
para todo i = 1, . . . , p.
Definição 8.3. Seja f : U ⊂ Rn −→ R uma função duas vezes diferenciável no ponto a ∈ U. A

forma Hessiana Hf(a), de f no ponto a é a forma quadrática da transformação bilinear simétrica
d2 f(a), ou seja,

X
n
∂2 f
2 2 2
Hf(a) v = d f(a) v = (a) αi αj ,
∂xi ∂xj
i,j=1
n
onde v = (α1 , . . . , αn ) ∈ R .

∂2 f
• Pelo teorama de Schwarz, a matriz (a) , chamada matriz Hessiana de f no ponto a,
∂xi ∂xj
é simétrica.
Definição 8.4. Seja f : U −→ R uma função diferenciável. Um ponto a ∈ U é um ponto crı́tico

∂f ∂f
de f (ou um ponto singular) quando df(a) = 0, ou seja, (a) = . . . = (a) = 0.
∂x1 ∂xn
Definição 8.5. Dizemos que a função f tem um máximo (respectivamente, um mı́nimo) local
no ponto a ∈ U quando existe δ > 0 tal que
kvk < δ =⇒ f(a + v) ≤ f(a) (respectivamente, f(a) ≤ f(a + v)) .
Observação 8.6. Se f : U −→ R é diferenciável no ponto a ∈ U e a é um ponto de máximo

local (ou de mı́nimo local), então a é um ponto crı́tico de f
De fato, neste caso o ponto 0 é um ponto de máximo (ou de mı́nimo) local para as funções reais
∂f
de uma variável real dadas por: ϕi (t) = f(a + tei ), i = 1, . . . , n. Logo (a) = ϕi0 (0) = 0, para
∂xi
todo i = 1, . . . , n.
Então df(a) = 0, ou seja, a é um ponto crı́tico de f.
Definição 8.6. Dizemos que um ponto crı́tico a de f é n

ão-degenerado quando a matriz Hes-
∂2 f
siana de f no ponto a é invertı́vel, ou seja, det (a) 6= 0.
∂xi ∂xj
Teorema 8.3. Seja f : U ⊂ Rn −→ R uma função duas vezes diferenciável. Todo ponto crı́tico
não-degenerado a ∈ U é um ponto crı́tico isolado.
Este teorema é consequência do seguinte resultado.
Teorema 8.4. Seja F = (f1 , . . . , fn ) : U ⊂ Rn −→ Rn uma função onde cada funç

ão coorde-

∂fi
nada fi : U −→ R, i = 1, . . . , n, é diferenciável no ponto a ∈ U. Se a matriz H = (a)
∂xj n×n
tem determinante diferente de zero, então existe δ > 0 tal que
0 < kx − ak < δ =⇒ F(x) 6= F(a) .
A matriz H, referida no teorema acima, é chamada a matriz Jacobiana de f no ponto a.
Lema 8.2. Seja H : Rn −→ Rn uma transformação linear invertı́vel. Então existe c > 0 tal que
kH(x)k ≥ ckxk para todo x ∈ Rn .

Análise
Prova.
1
Seja = kH−1 k = sup kH−1 (x)k | kxk = 1 > 0. Então, para todo x ∈ Rn :
c
kH(x)k
kxk = kH−1 (H(x))k ≤ kH−1 k kH(x)k = ,
c
ou seja, kH(x)k ≥ ckxk.
Prova.
(Demonstração do teorema 8.4)
Como a função fi : U −→ R é diferenciável no ponto a, para cada i = 1, . . . , n, temos:

X
n
fi (x) = fi (a) + hij (xj − aj ) + ρi (x)kx − ak ,
j=1
∂fi
onde lim ρi (x) = 0 e hij = (a) .
x→a ∂xj
Fazendo ρ(x) = (ρ1 (x), . . . , ρn (x)), temos que:
F(x) = F(a) + H(x − a) + ρ(x) kx − ak ,
onde lim ρ(x) = 0.

x→a
1
Pelo lema 8.2, existe c = > 0 tal que kH(x)k ≥ ckxk para todo x ∈ Rn .
kH−1 k
c
Como lim ρ(x) = 0, existe δ > 0 tal que 0 < kx − ak < δ =⇒ kρ(x)k < .
x→a 2
Logo, se 0 < kx − ak < δ, obtemos:
kF(x) − F(a)k = k H(x − a) + ρ(x)kx − ak k ≥ kH(x − a)k − kρ(x)k kx − ak
c c
≥ ckx − ak − kx − ak = kx − ak ,
2 2
c
ou seja, kF(x) − F(a)k ≥ kx − ak.
2
Então F(x) 6= F(a) para todo x ∈ U tal que 0 < kx − ak < δ.
Prova.
(Demonstração do teorema 8.3)

n ∂f ∂f
Seja F : U −→ R dada por F(x) = (x), . . . , (x) . Então F tem funções coordenadas
∂x1 ∂xn 2
∂f ∂fi ∂ f
fi = diferenciáveis no ponto a e a matriz (a) = (a) é a matriz Hessiana de
f no ponto a. Logo, pelo teorema 8.4, existe δ > 0 tal que 0 < kx − ak < δ =⇒ F(x) 6= F(a) = 0,
ou seja, grad f(x) 6= 0. Provamos, assim, que se 0 < kx − ak < δ, então x não é um ponto crı́tico
de f.
Corolário 8.1. O conjunto dos pontos crı́ticos não-degenerados de uma função duas vezes
diferenciável é enumerável.

Prova.
Basta lembrar que todo conjunto discreto é enumerável.
Corolário 8.2. Se todos os pontos crı́ticos de uma função f : U −→ R, duas vezes dife-
renciável, são não-degenerados, então em cada compacto K ⊂ U há apenas um número finito
deles.
Prova.
Como f é de classe C1 , o conjunto C dos pontos crı́ticos é um subconjunto fechado de U,
∂f ∂f
pois C = F−1 (0), onde F é a função contı́nua dada por F(x) = (x), . . . , (x) . Logo o
∂x1 ∂xn
conjunto dos pontos crı́ticos de f contidos num compacto K ⊂ U é fechado em K e é, portanto,
compacto. Como C ∩ K é compacto e discreto, temos que C ∩ K é finito.
X
n
Definição 8.7. Seja H : R −→ R a forma quadrática dada por H v =
n 2
hij αi αj , onde
i,j=1
hij = hji , i, j = 1, . . . , n, e v = (α1 , . . . , αn ) ∈ Rn .
Dizemos que H é positiva (respectivamente negativa) se H v2 > 0 (respectivamente H v2 < 0)

para todo v ∈ Rn − {0}.
Se uma forma quadrática é positiva ou negativa, dizemos que ela é definida. E dizemos que
uma forma quadrática H é indefinida quando existem v, w ∈ Rn tais que H v2 > 0 e H w2 < 0.
Exemplo 8.3. Se h , i é um produto interno de Rn , a forma quadrática H v2 = hv, vi é positiva,

e a forma quadrática H v2 = −hv, vi é negativa.
E, para todo i = 1, . . . , n − 1, a forma quadrática

H v2 = α21 + . . . + α2i − α2i+1 − . . . − α2n ,
é indefinida.
Observação 8.7.
• H é positiva se, e somente se, todos os autovalores da matriz simétrica (hij ) são positivos.
• H é negativa se, e somente se, todos os autovalores da matriz simétrica (hij ) são negativos.
Em particular, se H é definida então det(hij ) 6= 0, ou seja, a matriz (hij ) é invertı́vel.
Podemos também provar isto, observando que se Hv2 6= 0 para todo v ∈ Rn − {0} então
6 0 para todo v ∈ Rn − {0}, onde H0 = (hij ). Logo H0 v 6= 0 para todo v ∈ Rn − {0}
Hv2 = hH0 v, vi =
e, portanto, H0 é invertı́vel.
• H é indefinida se, e somente se, H0 = (hij ) possui um autovalor positivo e outro negativo.

Análise
Observação 8.8. Se f é duas vezes diferenciável no ponto a, df(a) = 0 e Hf(a) é positiva ou

negativa, então a é um ponto crı́tico não-degenerado.
Teorema 8.5. Sejam f : U −→ R uma função duas vezes diferenciável no ponto crı́tico a ∈ U
e H a forma quadrática Hessiana de f no ponto a. Então:
(1) Se H é positiva, a é ponto de mı́nimo local não-degenerado;
(2) Se H é negativa, a é ponto de máximo local não-degenerado;
(3) Se H é indefinida, a não é ponto de mı́nimo local nem de máximo local de f.
Prova.
Seja δ0 > 0 tal que Bδ0 (a) ⊂ U. Então a + v ∈ U se 0 < kvk < δ0 .
Para todo v ∈ Rn , com 0 < kvk < δ0 , temos " #

2
1 1 v r(v)
f(a + v) = f(a) + Hv2 + r(v) = f(a) + H + kvk2 . (?)
2 2 kvk kr(v)k2
Como a função ϕ0 : Rn −→ R, ϕ0 (v) = Hv2 é contı́nua e Sn−1 = {v ∈ Rn | kvk = 1} é compacto,

temos que se H é positiva, existe c > 0 tal que ϕ0 (u) ≥ c para todo u ∈ Sn−1 .
2
v
Logo H ≥ c para todo v ∈ Rn − {0}.
kvk
r(v)
Além disso, temos que lim = 0, pois f é duas vezes diferenciável no ponto a. Logo existe
v→0 kvk2
r(v) c
0 < δ < δ0 , tal que 0 < kvk < δ =⇒ 2 < .
kvk 4
c c
c
Assim, f(a+v)−f(a) ≥ − kvk2 = kvk2 > 0 para todo 0 < kvk < δ, ou seja, f(a+v) > f(a)
2 4 4
para todo 0 < kvk < δ. Então a é um ponto de mı́nimo local para f.
A afirmação (2) prova-se de modo análogo.
Se H é indefinida, existem v, w ∈ Rn − {0} tais que Hv2 > 0 e Hw2 < 0. Então, para todo t 6= 0,
temos que H (tv)2 = t2 Hv2 > 0 e H (tw)2 = t2 Hw2 < 0. Logo, por (?),
f(a + tv) − f(a) r(tv) f(a + tw) − f(a) r(tw)
2
= Hv2 + 2 e 2
= Hw2 + 2 .
t t t t
r(tv) r(tw)
Como lim 2 = lim 2 = 0, segue-se que
t→0 t t→0 t
f(a + tv) − f(a) f(a + tw) − f(a)

lim = Hv2 > 0 e lim = Hw2 < 0.
t→0 t2 t→0 t2
Logo existe δ > 0 tal que 0 < |t| < δ =⇒ f(a + tv) − f(a) > 0 e f(a + tw) − f(a) < 0.
Portanto, a não é ponto de máximo local nem de mı́nimo local para f.

O teorema da função implı́cita
Exemplo 8.4. Seja f : Rm+n = Rm × Rn −→ R a função definida por f(x, y) = hx, xi − hy, yi,
∂f ∂f
onde x ∈ Rm e y ∈ Rn . Então = 2xi e = −2yj . Logo grad f(x, y) = 2(x, −y) e, portanto,
∂xi ∂yj
a origem é o único ponto crı́tico de f.
A matriz Hessiana de f em qualquer ponto de Rm+n é a matriz diagonal cujas m primeiras

entradas na diagonal principal são iguais a 2 e as n últimas são iguais a −2.
Então a matriz Hessiana é positiva se n = 0, negativa se m = 0, e indefinida se mn 6= 0. Assim,

a origem é ponto de mı́nimo se n = 0 e de máximo se m = 0.
Para mn 6= 0, f não admite mı́nimo nem máximo na origem, que se chama um ponto de sela,
devido à forma do gráfico da função f(x, y) = x2 − y2 .
Observação 8.9. Como vimos na demonstração do teorema 8.5, se grad f(a) = 0 e Hv2 > 0
para algum v ∈ Rn , então existe δ > 0 tal que 0 < |t| < δ =⇒ f(a + tv) > f(a). Então se a é um
ponto de máximo local de f, a forma Hessiana de f no ponto a é não-positiva, isto é, Hv2 ≤ 0
para todo v ∈ Rn . De modo análogo, se a é um ponto de mı́nimo local de f, então a forma
Hessiana de f no ponto a é não-negativa, ou seja, Hv2 ≥ 0 para todo v ∈ Rn .
Mas a recı́proca destas afirmações são falsas, ou seja, quando a forma hessiana de f num ponto
crı́tico é ≤ 0 (ou ≥ 0) não se pode afirmar que a função tem um máximo (ou um mı́nimo) neste
ponto.
Por exemplo, sejam as funções f : R2 −→ R e g : R2 −→ R dadas por

f(x, y) = x2 e g(x, y) = x2 + y3 .
Então grad f(x, y) = (2x, 0), grad g(x, y) = (2x, 3y2 ), e as hessianas de f e g no ponto crı́tico
(0, 0) coincidem e são não-negativas, pois Hf(0, 0)v2 = Hg(0, 0)v2 = 2α2 para todo v = (α, β) ∈
R2 . Mas a origem é um ponto de mı́nimo para f e não é um mı́nimo local para g.
9 O teorema da função implı́cita
Começamos observando o seguinte exemplo:
Seja f : R2 −→ R dada por f(x, y) = x2 + y2 . Então S1 = f−1 (1) = {(x, y) ∈ R2 | x2 + y2 = 1}.
A equação x2 + y2 = 1 não define y como função de x, nem x como função de y,

globalmente. Mas, se tomarmos U1 = {(x, y) ∈ R2 | y > 0}; U2 = {(x, y) ∈ R2 | y < 0};
U3 = {(x, y) ∈ R2 | x > 0} e U4 = {(x, y) ∈ R2 | x < 0}, temos que:

Análise
Fig. 8: O cı́rculo unitário S1 = {(x, y) ∈ R2 | x2 + y2 = 1}

p
• (x, y) ∈ S1 ∩ U1 ⇐⇒ y = 1 − x2 e x ∈ (−1, 1) ;
p
• (x, y) ∈ S1 ∩ U2 ⇐⇒ y = − 1 − x2 e x ∈ (−1, 1) ;
p
• (x, y) ∈ S1 ∩ U3 ⇐⇒ x = 1 − y2 e y ∈ (−1, 1) ;
p
• (x, y) ∈ S1 ∩ U4 ⇐⇒ x = − 1 − y2 e y ∈ (−1, 1) .
Como S1 = (U1 ∩ S1 ) ∪ (U2 ∩ S1 ) ∪ (U3 ∩ S1 ) ∪ (U4 ∩ S1 ), temos que

S1 = Graf ξ1 ∪ Graf ξ2 ∪ Graf ξ3 ∪ Graf ξ4 ,
onde ξi : (−1, 1) −→ R, i = 1, 2, 3, 4, são as funções de classe C∞ dadas por:

p p p p
ξ1 (x) = 1 − x2 , ξ2 (x) = − 1 − x2 , ξ3 (y) = 1 − y2 , e ξ4 (y) = − 1 − y2 ,
Logo todo ponto (x0 , y0 ) ∈ S1 pertence a um aberto V de R2 tal que V ∩ S1 é o gráfico de

uma função de classe C∞ definida num aberto de R.
Definição 9.1. Dizemos que um conjunto C ⊂ R2 é uma curva de classe Ck (0 ≤ k ≤ ∞)

quando C é localmente o gráfico de uma função de classe Ck . Ou seja, para todo ponto p ∈ C
existe um aberto V ⊂ R2 tal que p ∈ V e V ∩ C é o gráfico de uma função ξ de classe Ck definida
num aberto de R.
Fig. 9: Uma curva de classe Ck é, localmente, o gráfico de uma função de classe Ck

Exemplo 9.1. O cı́rculo S1 é uma curva de classe C∞ .
Exemplo 9.2. O conjunto C = {(x, y) ∈ R2 | x2 − y2 = 0} não é uma curva nem de classe C0 ,

pois, para todo aberto V contendo a origem, C ∩ V não é o gráfico de uma função y = ξ(x) nem
x = ξ(y), uma vez que C ∩ V contém sempre dois segmentos de reta de inclinação ±1 que se
cortam na origem.
Fig. 10: O conjunto C não é uma curva nem de classe C0 .
Exemplo 9.3. O conjunto C = {(x, y) ∈ R2 | x2 − y2 = 1} é uma curva desconexa de classe

C∞ , pois C = (V1 ∩ C) ∪ (V2 ∩ C), onde V1 = {(x, y) ∈ R2 | x > 0} e V2 = {(x, y) ∈ R2 | x < 0} são
abertos de R2 tais que:
Fig. 11: O conjunto C é uma curva desconexa de classe C∞ .
• V1 ∩ C é o gráfico da função C∞ ξ1 : R −→ R2 dada por ξ1 (y) =

p
1 + y2 ,
• V2 ∩ C é o gráfico da função C∞ ξ2 : R −→ R2 dada por ξ2 (y) = − 1 + y2

p
Analisaremos, agora, um exemplo de um subconjunto de Rn+1 que é dado localmente

como o gráfico de uma função definida num aberto de Rn .

Análise
Exemplo 9.4. Seja f : Rn+1 −→ R dada por f(x) = hx, xi e seja

f−1 (1) = Sn = {x ∈ Rn+1 | hx, xi = 1}
a esfera unitária n−dimensional.
Indiquemos por U ⊂ Rn a bola aberta de raio 1 e centro na origem.
Para cada i = 1, . . . , n + 1, sejam Vi = {x ∈ Rn+1 | xi > 0} e Wi = {x ∈ Rn+1 | xi < 0}.
Escrevendo x? = (x1 , . . . , xi−1 , xi+1 , . . . , xn ), temos:

x ∈ Sn ∩ Vi ⇐⇒ kx? k < 1 e
p
1 − hx? , x? i
xi =
x ∈ Sn ∩ Wi ⇐⇒ kx? k < 1 e xi = − 1 − hx? , x? i .
p
Logo, se ξ : U −→ R é a função C∞ dada por ξ(u) = 1 − hu, ui , Sn ∩ Vi é o gráfico da função

p
xi = ξ(x? ) e Sn ∩ Wi é o gráfico da função xi = −ξ(x? ), para cada i = 1, . . . , n + 1.

n+1
! n+1
!
[ [
Como Sn = Vi ∩ Sn ∪ Wi ∩ Sn , todo ponto p ∈ Sn pertence a um aberto Z de Rn+1
i=1 i=1
tal que Z ∩ Sn é o gráfico de uma função de classe C∞ definida num aberto de Rn .
Definição 9.2. Um conjunto M ⊂ Rn+1 chama-se uma hipersuperfı́cie (ou hiperfı́cie) de classe
Ck , 0 ≤ k ≤ ∞, de Rn+1 quando M é localmente o gráfico de uma função de classe Ck de n
variáveis. Ou seja, todo ponto p ∈ M pertence a um aberto V ⊂ Rn+1 tal que V ∩ M é o gráfico
de uma função de classe Ck definida num aberto de Rn (existem um aberto U ⊂ Rn , uma função
ξ : U −→ R de classe Ck e um inteiro i ∈ {1, . . . , n + 1} tais que xi = ξ(x1 , . . . , xi−1 , xi+1 , . . . , xn+1 )
e x? = (x1 , . . . , xi−1 , xi+1 , . . . , xn+1 ) ∈ U).
Quando n = 1, dizemos que M ⊂ R2 é uma curva, e quando n = 2, dizemos que M ⊂ R3 é uma

superfı́cie.
Observação 9.1. Podemos também considerar as hipersuperfı́cies diferenciáveis (caso in-

termediário entre C0 e C1 ) que são localmente gráficos de funções diferenciáveis.
Exemplo 9.5. Sn é uma hipersuperfı́cie de classe C∞ de Rn+1 .
Seja M ⊂ Rn+1 e seja p ∈ M. Definimos Tp M como sendo o conjunto de todos os vetores

velocidade λ 0 (0), onde λ : (−ε, ε) −→ M ⊂ Rn+1 é um caminho diferenciável em t = 0 e λ(0) = p.
Quando M é uma hipersuperfı́cie diferenciável, o conjunto Tp M chama-se o espaço tan-

gente a M no ponto p.
Teorema 9.1. Se M ⊂ Rn+1 é uma hipersuperfı́cie diferenciável, então Tp M é um subespaço

vetorial de dimensão n do espaço euclidiano Rn+1 , para cada p ∈ M.

Prova.
Dado p = (a1 , . . . , an+1 ) ∈ M, existem abertos V ⊂ Rn+1 , U ⊂ Rn , com p ∈ V, um inteiro
i ∈ {1, . . . , n + 1} e uma função ξ : U −→ R diferenciável tais que x ∈ V ∩ M ⇐⇒ xi = ξ(x? ),
onde x? = (x1 , . . . , xi−1 , xi+1 , . . . , xn+1 ) ∈ U.

X ∂ξ
Afirmação: Tp M = v = (α1 , . . . , αn+1 ) ∈ Rn+1 αi = (p? ) αj ,
∂xj
j6=i
onde p? = (a1 , . . . , ai−1 , ai+1 , . . . , an+1 ) .
De fato, seja v ∈ Tp M. Então existe um caminho diferenciável em t = 0, λ : (−ε, ε) −→ M, com

λ(0) = p e λ 0 (0) = v. Como V é aberto, p ∈ V e λ é contı́nuo em t = 0, existe 0 < ε0 ≤ ε tal que
λ(t) ∈ M ∩ V para todo t ∈ (−ε0 , ε0 ).
Logo λi (t) = ξ(λ1 (t), . . . , λi−1 (t), λi+1 (t), . . . , λn+1 (t)) para todo t ∈ (−ε0 , ε0 ).
Pela Regra da Cadeia,

X ∂ξ
λi0 (0) = (p? ) λj0 (0) ,
∂xj
j6=i
X ∂ξ
ou seja, αi = (p? )αj .
∂xj
j6=i
X ∂ξ
Sejam agora v = (α1 , . . . , αn+1 ) ∈ Rn+1 tal que αi = (p? )αj e ε > 0 tal que p? + tv? ∈ U
∂xj
j6=i
para todo t ∈ (−ε, ε), onde v? = (v1 , . . . , vi−1 , vi+1 , . . . , vn+1 ).
Podemos, assim, definir o caminho λ : (−ε, ε) −→ M ∩ V pondo λj (t) = aj + tαj , j 6= i, e

λi (t) = ξ(λ1 (t), . . . , λi−1 (t), λi+1 (t), . . . , λn+1 (t)) = ξ(p? + tv? ) .
Logo λ é diferenciável em t = 0, λ(0) = p e λ 0 (0) = v. Então v ∈ Tp M, provando, assim, a

afirmação.
Assim, Tp M é um subespaço vetorial de dimensão n de Rn+1 gerado pelos vetores linearmente

independentes
e1 + c1 ei , . . . , ei−1 + ci−1 ei , ei+1 + ci+1 ei , . . . , en+1 + cn+1 ei ,

∂ξ
onde cj = (p? ) .
∂xj
Outra maneira de interpretar a afirmação acima é dizer que ela caracteriza Tp M como o núcleo
do funcional linear não-nulo ϕ : Rn+1 −→ R, dado por
X
ϕ(v) = αi − cj αj ,
j6=i
∂ξ ?
onde v = (α1 , . . . , αn+1 ) e cj = (p ). Ou ainda, Tp M é o gráfico do funcional linear
∂xj

Análise
dξ(p? ) : Rn −→ R, dado por:

X ∂ξ
v? = (α1 , . . . , αi−1 , αi+1 , . . . , αn+1 ) 7−→ dξ(p? )v? = (p? )αj .
∂xj
j6=i
Exemplo 9.6. Seja Sn = {x ∈ Rn+1 | hx, xi = 1}. Já sabemos que Sn é uma hipersuperfı́cie de
classe C∞ .
Afirmação: Tp Sn = {v ∈ Rn+1 | hv, pi = 0} = [p]⊥ , para todo p ∈ Sn .
De fato, seja λ : (−ε, ε) −→ Sn uma curva diferenciável em t = 0 com λ(0) = p e λ 0 (0) = v.
Então, como hλ(t), λ(t)i = 1 para todo t ∈ (−ε, ε) , temos que 2hλ 0 (0), λ(0)i = 0 , ou seja,
hv, pi = 0 . Logo Tp Sn ⊂ [p]⊥ e, portanto, Tp Sn = [p]⊥ , pois dim Tp Sn = dim[p]⊥ = n.
Para hipersuperfı́cies M ⊂ Rn+1 de classe C0 , Tp M pode não ser um espaço vetorial de

dimensão n.
p
Exemplo 9.7. Seja X = {(x, y, z) ∈ R3 | z = x2 + y2 } o cone de vértice na origem e eixo−z.
Então, para p = (0, 0, 0), Tp M = {(0, 0, 0)}.
Fig. 12: Cone X de vértice na origem.
De fato, seja λ : (−ε, ε) −→ X uma curva diferenciável em t = 0 com λ(0) = (0, 0, 0)

p
e λ 0 (0) = (v1 , v2 , v3 ) . Então, se λ(t) = (λ1 (t), λ2 (t), λ3 (t)), λ3 (t) = (λ1 (t))2 + (λ2 (t))2 ,
λ1 (t) λ (t)
v1 = λ10 (0) = lim e v2 = λ20 (0) = lim 2 .
t→0 t t→0 t
Logo, r
(λ1 (t))2 + (λ2 (t))2
q
1p
v3 = lim+ (λ1 (t))2 + (λ2 (t))2 = lim+ = v21 + v22 ,
t→0 t t→0 t2
e r
(λ1 (t))2 + (λ2 (t))2
q
1p
v3 = lim− (λ1 (t))2 + (λ2 (t))2 = lim− − =− v21 + v22 .
t→0 t t→0 t2

q
Portanto, v21 + v22 = 0, ou seja, v1 = v2 = v3 = 0.
Exemplo 9.8. Seja Y a superfı́cie de classe C0 dada por Y = {(x, y, z) ∈ R3 | z = |x|}. Então,
para p = (0, 0, 0), Tp Y = {(0, β, 0) | β ∈ R} é um espaço vetorial de dimensão 1 (6= 2) em R3 .
Fig. 13: Superfı́cie Y.
De fato, seja λ : (−ε, ε) −→ Y, λ(t) = (λ1 (t), λ2 (t), λ3 (t)), uma curva diferenciável em t = 0 com
λ(0) = (0, 0, 0) e λ 0 (0) = (v1 , v2 , v3 ) = v.
λ1 (t)
Então λ3 (t) = |λ1 (t)| e v1 = λ10 (0) = lim .
t→0 t
Suponhamos que v1 > 0. Então existe 0 < ε0 < ε tal que λ1 (t) > 0 para t ∈ (0, ε0 ) e λ1 (t) < 0
para t ∈ (−ε0 , 0). Assim,
λ3 (t) |λ (t)| λ (t)
v3 = λ30 (0) = lim± = lim± 1 = lim± ± 1 = ±v1 .
t→0 t t→0 t t→0 t
Logo v1 = 0, uma contradição. De modo análogo, podemos provar que v1 não pode ser negativo.
Então v1 = 0 e, portanto, v3 = 0, ou seja, v ∈ {(0, β, 0) ∈ R3 | β ∈ R}.
Reciprocamente, seja v = (0, β, 0) , β ∈ R. Então a curva λ : R −→ Y, dada por λ(t) = (0, βt 0),
é de classe C∞ , λ(0) = (0, 0, 0) e λ 0 (0) = (0, β, 0). Logo (0, β, 0) ∈ Tp Y para todo β ∈ R.
Assim, Tp Y = {(0, β, 0) ∈ R3 | β ∈ R} .
Definição 9.3. Seja f : U ⊂ Rn −→ R uma função diferenciável no aberto U. Dizemos que

c ∈ R é um valor regular de f quando não existem pontos crı́ticos de f no nı́vel c, ou seja,
grad f(x) 6= 0 para todo x ∈ f−1 (c). Quando c é um valor regular de f, diz-se que o nı́vel c é
regular. Quando existem pontos crı́ticos x ∈ U tais que f(x) = c, dizemos que c é um nı́vel
crı́tico de f .
Observação 9.2. Se f−1 (c) = ∅, então c é um valor regular.
Exemplo 9.9. Seja f : R2 −→ R a função de classe C∞ dada por f(x, y) = x2 + y2 .

Análise
Como grad f(x, y) = (2x, 2y) para todo (x, y) ∈ R2 , temos que grad f(x, y) = (0, 0) se, e só se,
(x, y) = (0, 0). Logo f−1 (c) é um nı́vel regular para todo c ∈ R − {0}, pois f(0, 0) = 0.
Teorema 9.2. (Teorema Global da Função Implı́cita)

Sejam f : U ⊂ Rn+1 −→ R uma função de classe Ck , k ≥ 1, definida no aberto U, e c ∈ f(U) um
valor regular de f. Então M = f−1 (c) é uma hipersuperfı́cie de classe Ck e
Tp M = ker df(p) = {v ∈ Rn+1 | df(p)(v) = 0} = {v ∈ Rn+1 | hv, grad f(p)i = 0},
para todo p ∈ M.
Exemplo 9.10. Seja f : Rn+1 −→ R a função de classe C∞ dada por f(x) = hx, xi. Como
∂f
grad f(x) = 2x, pois (x) = 2xi , para todo i = 1, . . . , n + 1, grad f(x) = 0 se, e somente se,
∂xi
x = 0, ou seja, se, e só se, f(x) = 0. Assim, f−1 (c) é um nı́vel regular para todo c ∈ R − {0},
sendo f−1 (c) = ∅, se c < 0, e f−1 (c) = Sn√c (0), se c > 0. Logo, pelo teorema acima, Sn√c é uma
hipersuperfı́cie de classe C∞ e
Tp Sn√c (0) = {v ∈ Rn+1 | hv, 2pi = 0} = [p]⊥ ,
para todo p ∈ Sn√c (0).
Exemplo 9.11. Seja det : Rn2 = Rn × . . . × Rn −→ R a função de classe C∞ que associa a

cada matriz n × n, X = (xij ), o seu determinante.
Como a expansão de det X pelas entradas da i−ésima linha é

X
n
det X = (−1)i+j xij X[i,j] ,
j=1
onde X[i,j] é o determinante da matriz (n − 1) × (n − 1) que se obtém da matriz X omitindo a

i−ésima linha e a j−ésima coluna, temos que
∂ det
(X) = (−1)i+j X[i,j] ,
∂xij
2
para todo X ∈ Rn e todos i, j = 1, . . . , n.
∂ det
Em particular, no ponto X = I, temos (I) = δij , i, j = 1, . . . , n, ou seja, o gradiente da função
∂xij
determinante no ponto I é a matriz identidade.
Seja U = {X ∈ Rn | det X 6= 0} o conjunto aberto formado pelas matrizes n × n invertı́veis. Então

2
∂ det
a restrição det : U −→ R é uma função C∞ sem pontos crı́ticos. De fato, se (X) = 0 para
∂xij
todo i, j = 1, . . . , n, então
X
n
det X = (−1)i+j xij X[i,j] = 0 ,
j=1
e, portanto, X 6∈ U. Logo todo c ∈ R é um valor regular para a função det : U → R.

Em particular,
M = det−1 (1) = (conjunto das matrizes n × n que têm determinante igual a 1)
é uma hipersuperfı́cie de classe C∞ em Rn . M é um grupo relativamente à multiplicação de

2
matrizes, conhecido como o grupo unimodular de Rn .

2
O espaço tangente TI (M) de M no ponto I é o subespaço de dimensão n2 − 1 de Rn formado
pelas matrizes n × n de traço nulo, pois grad(det(I)) = I e, portanto,

2
Xn X
n
TI M = X ∈ Rn hX, Ii = xij δij = xii = traço X = 0 .

i,j=1 i=1
Observação 9.3. Toda hipersuperfı́cie M ⊂ Rn+1 , sendo localmente o gráfico de uma função
xi = ξ(x1 , . . . , xi−1 , xi+1 , . . . , xn+1 ) = ξ(x? ), de n variáveis, é também localmente a imagem
inversa f−1 (0) do valor regular 0 da função f(x) = xi − ξ(x? ), definida no aberto V ⊂ Rn+1 tal que
∂f
V ∩ M é o gráfico de ξ, pois (x) = 1 para todo x ∈ V e f−1 (0) = {x ∈ V | xi = ξ(x? )} = V ∩ M.
∂xi
Y
n+1 Y
Para isso, estamos supondo V = Ij , onde cada Ij é um intervalo aberto, e U = Ij é o
j=1 j6=i
domı́nio da função ξ.
Mas não é verdade que toda hipersuperfı́cie M ⊂ Rn+1 seja globalmente a imagem inversa de
um valor regular, pois se M = f−1 (c), a aplicação ϕ = grad f : M −→ Rn+1 fornece um campo
contı́nuo de vetores normais não-nulos ao longo de M, uma vez que ϕ(p) = grad f(p) ⊥ v para
todo v ∈ Tp M. As hipersuperfı́cies que admitem um campo contı́nuo de vetores normais não-
nulos ϕ : M −→ Rn+1 chamam-se hipersuperfı́cies orientáveis. Mas nem toda hipersuperfı́cie
em Rn+1 é orientável, como a faixa de Möbius em R3 (ver §14, Cap. V).
Portanto, existem hipersuperfı́cies em Rn+1 que não são globalmente a imagem inversa de um
valor regular.
Lema 9.1. Sejam X ⊂ Rm , K ⊂ Rk compacto, f : X × K −→ Rp contı́nua e c ∈ Rp . Se f−1 (c) é

o gráfico de uma aplicação ξ : X −→ K (isto é, para todo x ∈ X existe um único y = ξ(x) ∈ K tal
que f(x, ξ(x)) = c) então ξ é contı́nua.
Prova.
Dado x0 ∈ X, seja y0 = ξ(x0 ) ∈ K e seja {xn } uma sequência de pontos de X tal que xn −→ x0 .
Queremos provar que lim ξ(xn ) = y0 .

n→∞
Como a sequência {ξ(xn )} é limitada, pois ξ(xn ) ∈ K para todo n ∈ N, basta mostrar que toda
subsequência {ξ(xn )}n∈N 0 convergente em Rk tem limite y0 .

Análise
Seja N 0 ⊂ N tal que lim0 ξ(xn ) = y. Então y ∈ K, pois K é compacto. Além disso, como f é
n∈N
contı́nua e f(xn , ξ(xn )) = c para todo n ∈ N, temos c = lim0 f(xn , ξ(xn )) = f(x0 , y).
n∈N
Logo f(x0 , y) = f(x0 , y0 ) e, portanto, pela unicidade, y = y0 .
Observação 9.4. Supondo K apenas limitado, o lema acima nem sempre é válido. Por exem-
plo, seja f : R × [0, 1) −→ R a função contı́nua definida por f(x, y) = (x2 + y2 )(ye|x| − 1). Então,
para cada x ∈ R, existe um único y ∈ [0, 1) tal que f(x, y) = 0, pois se x = 0, então y = 0, uma
vez que 1 6∈ [0, 1), e se x 6= 0, y = e−|x| ∈ [0, 1).
Logo f−1 (0) é o gráfico da função ξ : R −→ [0, 1) dada por ξ(0) = 0 e ξ(x) = e−|x| , se x ∈ R − {0},
que não é contı́nua em x = 0.
No teorema abaixo, representaremos os pontos de Rn+1 por pares (x, y), onde x ∈ Rn e
y ∈ R.
Teorema 9.3. (Teorema da Função Implı́cita)

Seja f : U −→ R uma função de classe Ck , k ≥ 1, definida num aberto U ⊂ Rn+1 . Seja
∂f
p = (x0 , y0 ) ∈ U tal que f(p) = c e (p) 6= 0.
∂y
Então existem uma bola aberta B = Bδ (x0 ) ⊂ Rn e um intervalo aberto J = (y0 − ε, y0 + ε) tais
que B × J ⊂ U e f−1 (c) ∩ (B × J) é o gráfico de uma função ξ : B −→ J de classe Ck (isto é, para
todo x ∈ B existe um único y = ξ(x) ∈ J tal que f(x, y) = c).
Para cada x ∈ B, tem-se:

∂f
− (x, ξ(x))
∂ξ ∂xi
(x) = , i = 1, . . . , n.
∂xi ∂f
(x, ξ(x))
∂y
A função y = ξ(x) diz-se definida implicitamente no aberto U × J pela equação f(x, y) = c.
Fig. 14: Função y = ξ(x) definida implicitamente no aberto U × J.

Prova.
∂f ∂f
Suponhamos que (x0 , y0 ) > 0. Como : U −→ R é contı́nua, existem δ 0 > 0 e ε > 0, tais
∂y ∂y
∂f
que B 0 × J ⊂ U e (x, y) > 0 para todo (x, y) ∈ B 0 × J, onde B 0 = Bδ 0 (x0 ) e J = (y0 − ε, y0 + ε).
∂y
Então, para todo x ∈ B 0 , a função y 7−→ f(x, y) é estritamente crescente no intervalo
J = [y0 − ε, y0 + ε]. Como f(x0 , y0 ) = c, temos que f(x0 , y0 − ε) < c e f(x0 , y0 + ε) > c.
Pela continuidade de f, existe 0 < δ < δ 0 tal que f(x, y0 − ε) < c e f(x, y0 + ε) > c para todo
x ∈ B = Bδ (x0 ). Então, pelo Teorema do Valor Intermediário, existe, para cada x ∈ B, um único
y = ξ(x) ∈ J tal que f(x, y) = c. Logo y = ξ(x) ∈ J e f−1 (c) ∩ (B × J) = f−1 (c) ∩ (B × J) é o
gráfico de uma função ξ : B −→ J a qual, pelo lema anterior, é contı́nua.
Mostraremos agora que, em todo ponto x ∈ B, existem as derivadas parciais de ξ.
Seja x ∈ B e tome k = k(t) = ξ(x + tei ) − ξ(x). Então,

ξ(x + tei ) = ξ(x) + k e f(x + tei , ξ(x) + k) = f(x, ξ(x)) = c ,
para todo t ∈ (−δ0 , δ0 ), onde δ0 foi escolhido de modo que x + tei ∈ B para todo t ∈ (−δ0 , δ0 ).
Pelo Teorema do Valor Médio, para todo t ∈ (−δ0 , δ0 ), existe θ = θ(t) ∈ (0, 1) tal que:
∂f ∂f
0 = f(x + tei , ξ(x) + k) − f(x, ξ(x)) = (x + θtei , ξ(x) + θk)t + (x + θtei , ξ(x) + θk)k.
∂xi ∂y
Logo,
∂f
(x + θtei , ξ(x) + θk)
ξ(x + tei ) − ξ(x) k ∂xi
= =−
t t ∂f
(x + θtei , ξ(x) + θk) .
∂y
Pela continuidade de ξ, lim k(t) = 0. Então, pela continuidade das derivadas parciais de f, a
t→0
∂ξ
derivada parcial (x) existe e é igual a
∂xi
∂f
(x, ξ(x))
∂ξ ∂x
(x) = − i (I)
∂xi ∂f
(x, ξ(x))
∂y
para todo i = 1, . . . , n.
∂ξ
Como f é de classe C1 e ξ é contı́nua, temos, por (I), que é contı́nua para todo i = 1, . . . , n,
∂xi
ou seja, ξ é de classe C1 .
Suponhamos, por indução, que se f é de classe Ck−1 , então ξ é de classe Ck−1 , k − 1 ≥ 1.
Seja f ∈ Ck . Então ξ é de classe Ck−1 e as derivadas parciais de f são de classe Ck−1 .

∂ξ
Assim, por (I), é de classe Ck−1 para todo i = 1, . . . , n, ou seja, ξ é de classe Ck .
∂xi

Análise
Observação 9.5. No teorema da função implı́cita, não há nada especial a respeito da última
variável. Ou seja, vale o seguinte resultado:
Seja f : U −→ R uma função de classe Ck definida no aberto U ⊂ Rn+1 . Se um ponto p =

∂f
(x01 , . . . , x0n+1 ) ∈ U é tal que f(p) = c e (p) 6= 0 para algum i = 1, . . . , n + 1, então existe ε > 0
∂xi
Y
n+1 Y
n+1
tal que V = (x0k − ε, x0k + ε) ⊂ U e uma função ξ : B = (x0k − ε, x0k + ε) −→ (x0i − ε, x0i + ε)
k=1 k=1
k 6= i
de classe Ck cujo gráfico é f−1 (c) ∩ V, ou seja, o conjunto f (c) ∩ V é dado por: −1

(x1 , . . . , xn+1 ) ∈ Rn+1 | (x1 , . . . , xi−1 , xi+1 , . . . , xn+1 ) ∈ B e ξ(x1 , . . . , xi−1 , xi+1 , . . . , xn+1 ) = xi .
Além disso,
∂f
(x1 , . . . , xi−1 , ξ(x? ), xi+1 , . . . , xn+1 )
∂ξ ? ∂xj
(x ) = − ,
∂xj ∂f
(x1 , . . . , xi−1 , ξ(x? ), xi+1 , . . . , xn+1 )
∂xi
para todo x ∈ B e todo j = 1, . . . , n + 1 , j 6= i, onde x? = (x1 , . . . , xi−1 , xi+1 , . . . , xn+1 ).
Corolário 9.1. Seja f : U −→ R uma função de classe Ck , k ≥ 1, no aberto U ⊂ Rn+1 . Se

∂f
ξ : W −→ R é contı́nua no aberto W ⊂ Rn com (x, ξ(x)) ∈ U, (x, ξ(x)) 6= 0 e f(x, ξ(x)) = c
∂y
para todo x ∈ W, então ξ é de classe Ck .
Observação 9.6. No corolário acima, não basta supor que c é um valor regular de f. Por
exemplo, seja a função f : R2 −→ R de classe C∞ , dada por f(x, y) = x − y3 . Então, como
grad f(x, y) = (1, −3y2 ), todo c ∈ R é valor regular de f, mas a função contı́nua ξ : R −→ R,
√
dada por ξ(x) = 3 x, satisfaz f(x, ξ(x)) = 0 para todo x ∈ R e não é diferenciável na origem.
∂f
Observe que (x, 0) = 0 para todo x ∈ R.
∂y
Prova.
(do Teorema Global da Função Implı́cita)
∂f
Seja p ∈ f−1 (c). Como grad f(p) 6= 0, existe i ∈ {1, . . . , n + 1} tal que (p) 6= 0. Logo, pelo
∂xi
teorema da função implı́cita, existe um aberto V ⊂ Rn+1 tal que p ∈ V e V ∩ f−1 (c) é o gráfico de
uma função de classe Ck definida num aberto de Rn . Então M = f−1 (c) é uma hipersuperfı́cie
de classe Ck .
Seja v ∈ Tp M. Então existe uma curva λ : (−ε, ε) −→ M diferenciável em t = 0 tal que

λ(0) = p e λ 0 (0) = v. Logo df(p)v = (f ◦ λ) 0 (0) = 0, pois f(λ(t)) = c para todo t ∈ (−ε, ε). Assim,
hgrad f(p), vi = 0 para todo v ∈ Tp M, ou seja, Tp M ⊂ [grad f(p)]⊥ e, portanto,
Tp M = [grad f(p)]⊥ , pois dim Tp M = dim[grad f(p)]⊥ = n .

Multiplicador de Lagrange
10 Multiplicador de Lagrange
Seja M ⊂ Rn+1 uma hipersuperfı́cie de classe Ck , k ≥ 1, contida num aberto U ⊂ Rn+1 , e

f : U −→ R uma função de classe Ck .
Os pontos crı́ticos de f : U −→ R são, como já definimos anteriormente, os pontos x ∈ U

∂f
tais que grad f(x) = 0, ou seja, (x) = 0 para todo v ∈ Rn+1 . Isto equivale a dizer que
∂v
(f ◦ λ) 0 (0) = 0 para todo caminho λ : (−ε, ε) −→ U diferenciável em t = 0 tal que λ(0) = x.
Por analogia, daremos a seguinte definição:
Definição 10.1. Dizemos que p ∈ M é um ponto crı́tico de f|M se (f ◦ λ) 0 (0) = 0 para todo
∂f
caminho λ : (−ε, ε) −→ M diferenciável em t = 0 com λ(0) = p. Isto significa que (p) = 0
∂v
para todo v ∈ Tp M, ou seja, p ∈ M é um ponto crı́tico de f|M se, e só se, hgrad f(p), vi = 0 para
todo v ∈ Tp M, ou ainda, se, e somente se, o vetor grad f(p) é normal à hipersuperfı́cie M no
ponto p.
Observação 10.1. Se p ∈ M é um ponto de máximo ou de mı́nimo local de f|M , então p

é um ponto crı́tico de f|M, pois para toda curva λ : (−ε, ε) −→ M diferenciável em t = 0 com
λ(0) = p, 0 é ponto de máximo ou de mı́nimo local da função real f ◦ λ : (−ε, ε) −→ R e, portanto,
df(p)v = (f ◦ λ) 0 (0) = 0.
Observação 10.2. Todo ponto crı́tico de f em U que pertence a M é um ponto crı́tico de f|M ,
pois, neste caso, grad f(p) = 0 e, portanto, hgrad f(p), vi = 0 para todo v ∈ Rn+1 .
Mas pode existir um ponto crı́tico de f|M que não é ponto crı́tico de f em U, isto é, no qual grad f
não se anula.
Exemplo 10.1. Sejam f : R2 −→ R a função de classe C∞ dada por f(x, y) = y, e M = S1 =

{(x, y) ∈ R2 | x2 + y2 = 1}. Então f não possui ponto crı́tico, pois grad f(x, y) = (0, 1) 6= (0, 0) para
todo (x, y) ∈ R2 . Mas (0, −1) e (0, 1) são pontos crı́ticos de f|M , pois (0, −1) é o ponto de mı́nimo
e (0, 1) é o ponto de máximo de f|M .
Em geral, se a hipersuperfı́cie M ⊂ Rn+1 é compacta, então f|M admite pelo menos dois pontos
crı́ticos: os pontos onde f|M assume seus valores máximo e mı́nimo.
Teorema 10.1. (do Multiplicador de Lagrange)

Sejam ϕ : U ⊂ Rn+1 −→ R uma função de classe Ck , M = ϕ−1 (c), onde c ∈ ϕ(U) é um valor
regular de ϕ, e f : U −→ R uma função de classe Ck . Um ponto p ∈ M é ponto crı́tico de f|M
se, e só se, existe um número real λ ∈ R tal que grad f(p) = λ grad ϕ(p).

Análise
Prova.
Para todo ponto p ∈ M, temos Tp M = [grad ϕ(p)]⊥ , pois M é uma hipersuperfı́cie de nı́vel
de ϕ. Além disso, p é ponto crı́tico de f|M se, e só se, grad f(p) ⊥ Tp M.
Como Tp M ⊂ Rn+1 é um subespaço vetorial de dimensão n, temos que p ∈ M é ponto crı́tico

de f|M se, e só se, grad f(p) é um múltiplo de grad ϕ(p).
A pesquisa dos pontos crı́ticos de f|M reduz-se, portanto, a resolver o sistema de n + 2

equações 
 ∂f (p) = λ ∂ϕ (p) , i = 1, . . . , n + 1 ,
∂xi ∂xi

ϕ(p) = c ,
nas n + 2 incógnitas λ, x1 , . . . , xn+1 , onde p = (x1 , . . . , xn+1 ). O número λ chama-se o multiplica-
dor de Lagrange.
Observação 10.3. A condição grad f(p) = λ grad ϕ(p) significa que a hipersuperfı́cie M é
tangente à hipersuperfı́cie de nı́vel de f que passa pelo ponto crı́tico p da função f|M . No caso
em que se podem esboçar as superfı́cies de nı́vel da função f, esta observação auxilia a localizar
os pontos crı́ticos (ver exemplo abaixo).
Observação 10.4. Quando a hipersuperfı́cie M não é dada como imagem inversa ϕ−1 (c)
de um valor regular, os pontos crı́ticos de f|M são simplesmente os pontos p ∈ M nos quais
grad f(p) é normal a M, ou seja, grad f(p) ⊥ v para todo v ∈ Tp M.
Exemplo 10.2. Seja f : R2 −→ R a função de classe C∞ dada por f(x, y) = ax + by, com
a2 + b2 6= 0, e seja S1 = ϕ−1 (1), onde ϕ : R2 −→ R é dada por ϕ(x, y) = x2 + y2 . Como 1 é valor
regular de ϕ, os pontos crı́ticos de f|S1 são os
pontos (x, y) ∈ S1 onde grad f(x, y) = (a, b)
e grad ϕ(x, y) = (2x, 2y) são múltiplos. Então
(a, b) = λ(x, y) e x2 + y2 = 1. Isto nos dá
a b
x= p e y= p ,
a2 + b2 a2 + b2
ou
a b
x = −p e y = −p .
a2 + b2 a2 + b2
Nestes pontos, f|S1 assume, respectivamente,
Fig. 15: Pontos crı́ticos de f|S1 .
p
seu valor máximo igual à a2 + b2 , e seu va-
p
lor mı́nimo igual a − a2 + b2 , pois
p
|f(x, y)| ≤ a2 + b2 para todo (x, y) ∈ S1 .

Exemplo 10.3. Dados uma hipersuperfı́cie M ⊂ Rn+1 e um ponto b ∈ Rn+1 tal que b 6∈ M,
determinar o ponto p ∈ M mais próximo a b. No caso em que M é fechada, um tal ponto sempre
existe.
Consideremos a função f : Rn+1 − {b} −→ R de classe C∞ dada por f(x) = kx − bk. Os

pontos onde f|M assume seu valor mı́nimo, caso existam, estão entre os pontos crı́ticos de f|M ,
x−b
isto é, entre os pontos x ∈ M onde grad f(x) é normal a M. Como grad f(x) = , pois
kx − bk
∂f x − bi
(x) = i , para todo i = 1, . . . , n, os pontos crı́ticos de f|M , entre os quais se encontram
∂xi kx − bk
os pontos de M situados a uma distância mı́nima do ponto b, são os pontos x ∈ M tais que
x − b é normal a M.
Fig. 16: x − b é normal a M.
Exemplo 10.4. Seja A : Rn −→ Rn uma transformação linear autoadjunta, isto é, hAx, yi =
hx, Ayi para quaisquer x, y ∈ Rn . Isto equivale a dizer que a matriz (aij ) de A com respeito à
base canônica é simétrica, pois aij = hAej , ei i = hAei , ej i = aji .
Um número real λ é um autovalor de A quando existe um vetor y ∈ Rn − {0} tal que Ay = λy. E
os autovetores associados ao autovalor λ são os vetores x ∈ Rn tais que Ax = λx.
Em geral, uma transformação linear A : Rn −→ Rn não precisa ter autovalores reais, como a
rotação de ângulo θ ∈ (0, π) no plano.
Afirmação: Se A : Rn −→ Rn é uma transformação linear autoadjunta, então existe uma base

ortonormal de Rn formada por autovetores de A.
De fato, seja f : Rn −→ R a forma quadrática dada por f(x) = hAx, xi ou, em termos de
Xn
coordenadas, f(x) = aij xi xj .
i,j=1
Para determinarmos uma base ortonormal de autovetores de A estudaremos os pontos crı́ticos

Análise
de f na esfera unitária Sn−1 ⊂ Rn . Como Sn−1 = ϕ−1 (1), onde 1 é valor regular da função
ϕ(x) = hx, xi, temos que x ∈ Sn−1 é um ponto crı́tico de f|Sn−1 se, e só se, os vetores grad f(x)
∂f Xn
e grad ϕ(x) = 2x são múltiplos. Sendo (x) = 2 aij xj , temos que grad f(x) = 2Ax. Logo
∂xi
j=1
n−1
os pontos crı́ticos de f|Sn−1 são os pontos u ∈ S tais que Au = λu e, num tal ponto, temos
f(u) = hλu, ui = λ, pois hu, ui = 1.
Provamos, assim, que dada a forma quadrática f : Rn −→ R, f(x) = hAx, xi, onde A : Rn −→ Rn
é autoadjunta, um ponto u ∈ Sn−1 é um ponto crı́tico de f|Sn−1 se, e só se, Au = λu, onde
λ = f(u). Ou seja, λ = f(u) é um autovalor de A e u é um autovetor de norma 1 associado ao
autovalor λ.
Em particular, se λ1 é o valor máximo de f no compacto Sn−1 atingido no ponto u1 ∈ Sn−1 , então

λ1 é o maior autovalor de A e Au1 = λ1 u1 .
Seja E = {x ∈ Rn | hx, u1 i = 0} o complemento ortogonal do vetor u1 . Se x ∈ E, então hAx, u1 i =

hx, Au1 i = λ1 hx, u1 i = 0. Logo A(E) ⊂ E e, portanto, por restrição, obtemos uma transformação
linear autoadjunta A : E −→ E.
Seja λ2 o valor máximo da forma quadrática f entre os vetores unitários pertencentes a E, e seja
u2 ∈ E tal que |u2 | = 1 e f(u2 ) = λ2 . Então λ2 é um autovalor de A e Au2 = λ2 u2 .
Prosseguindo desta maneira, obtemos uma base ortonormal de Rn , {u1 , u2 , . . . , un }, formada

por autovetores de A.
Exemplo 10.5. A média geométrica de n números reais positivos x1 , . . . , xn é menor do que

ou igual à média aritmética destes números, isto é,
√ x1 + . . . + xn
n
x1 · . . . · xn ≤ ,
n
e a igualdade vale se, e só se, x1 = . . . = xn .
De fato, sejam x1 , . . . , xn n números reais positivos, f : Rn −→ R a função de classe C∞ dada

por f(y1 , . . . , yn ) = y1 · . . . · yn e c = x1 + . . . + xn .
Vamos determinar o valor máximo de f na hipersuperfı́cie

Mc = {(y1 , . . . , yn ) ∈ Rn | y1 + . . . + yn = c , y1 > 0, . . . , yn > 0} .
Consideremos o aberto U = {(y1 , . . . , yn ) ∈ Rn | y1 > 0, . . . , yn > 0} e a função ϕ : U −→ R de

classe C∞ dada por ϕ(y1 , . . . , yn ) = y1 + . . . + yn .
Então ϕ−1 (c) = Mc é uma hipersuperfı́cie de classe C∞ de Rn , pois grad ϕ(y) = (1, 1, . . . , 1) 6=
(0, 0, . . . , 0) para todo y ∈ U.

Como Mc é compacto, pois Mc ⊂ [0, c] × . . . × [0, c], existe z ∈ Mc tal que f(z) é o valor máximo
de f|Mc . Então z ∈ Mc , pois f(y) = 0 para todo y ∈ Mc − Mc e f(y) > 0 para todo y ∈ Mc .
∂f Y
n
Sendo (y) = yj , para todo i = 1, . . . , n, temos, pelo método do multiplicador de La-
∂yi
j=1
j 6= i
Y
grange, que grad f(z) = λ grad ϕ(z) = (λ, . . . , λ). Então z1 + . . . + zn = c, zi > 0 e zj = λ,
j6=i
para todo i = 1, . . . , n.
Y
n
Afirmação: Se z1 , . . . , zn ∈ R − {0} e zj = λ para todo i = 1, . . . , n, então z1 = . . . = zn .
j=1
j 6= i
Vamos provar esta afirmação por indução sobre n.
Se n = 2, é claro que z1 = z2 .
Suponhamos o resultado válido para n − 1, n − 1 ≥ 2. Sejam z1 , . . . , zn n números reais não-

Y
n
nulos tais que zj = λ para todo i = 1, . . . , n. Como, para todos i, i 0 ∈ {1, . . . , n − 1},
j=1
j 6= i
Y
n Y n Y
n−1 Y
n−1
0
i 6= i , zj = zj , e zn 6= 0, temos zj = zj . Logo, pela hipótese de indução,
j=1 j=1 j=1 j=1
j 6= i j 6= i 0 j 6= i j 6= i 0
z1 = . . . = zn−1 . Além disso, z1 = zn , pois z1 z2 . . . zn−1 = z2 z3 . . . zn−1 zn .
Então z1 = z2 = . . . = zn−1 = zn , provando a afirmação.
c
Como z1 + . . . + zn = c, temos z1 = . . . = zn = .
n
c n
Logo f(x1 , . . . , xn ) ≤ f(z1 , . . . , zn ) = , pois (x1 , . . . , xn ) ∈ Mc . Assim,
n
x + . . . + x n
n
x1 . . . x n ≤ 1 ,
n
ou seja,
√ x1 + . . . + xn
n
x1 . . . x n ≤ ,
n
para quaisquer números reais positivos x1 , . . . , xn , e a igualdade vale se, e só se, x1 = . . . = xn .
Exemplo 10.6. (Desigualdade de Hadamard)

Se X é uma matriz n × n cujas linhas são os vetores Xi = (xi1 , . . . , xin ), então
| det X| ≤ kX1 k . . . kXn k,
onde k k é a norma Euclidiana.

Análise
Se det X = 0, a desigualdade é evidente. Se det X 6= 0, então todos os vetores-linhas são não-

Xi
nulos. Neste caso, podemos considerar os vetores unitários Wi = , i = 1, . . . , n. Então,
kXi k
como Xi = kXi kWi , temos que det X = kX1 k . . . kXn k det W, onde W é a matriz cujas linhas são
os vetores unitários W1 , . . . , Wn . A desigualdade ficará provada se mostrarmos que | det W| ≤ 1.
Mais geralmente:
X
n
Afirmação: Se W = (wij ) é uma matriz n × n tal que w2ij = n então | det W| ≤ 1.
i,j=1
De fato, sejam f, ϕ : Rn −→ R as funções de classe C∞ dadas por f(X) = det X e

2
X
n
∂ϕ ∂f
ϕ(X) = (xij )2 . Então, para todos i, j = 1, . . . , n, (X) = 2xij e (X) = (−1)i+j X[i,j] ,
∂xij ∂xij
i,j=1
onde X[i,j] é o determinante da matriz (n − 1) × (n − 1), obtida de X pela omissão da i−ésima
linha e da j−ésima coluna.
Assim, para todo n ∈ N, ϕ−1 (n) = M é uma hipersuperfı́cie compacta de classe C∞ em Rn .

2
2 √
Mais precisamente, M é a esfera em Rn de centro na origem e raio n.
Então, pelo método do Multiplicador de Lagrange, uma matriz W = (wij ) é um ponto crı́tico de
X
n
f|M se, e só se, w2ij = n e grad f(W) = λ grad ϕ(W) para algum λ real, ou seja,
i,j=1
(−1)i+j W[i,j] = 2λwij , (?)
para quaisquer i, j = 1, . . . , n.
Multiplicando por wij , somando e levando em conta a expansão de um determinante em relação

às entradas de uma linha, temos:
X
n X
n
n det W = (−1)i+j wij W[i,j] = 2λ w2ij = 2λn .
i,j=1 i,j=1
Logo det W = 2λ.
Multiplicando agora (?) por wij , fixando i e somando em relação a j, obtemos:

Xn X
n X
n
i+j 2
det W = (−1) wij W[i,j] = 2λ wij = (det W) w2ij .
j=1 j=1 j=1
Se W é uma matriz onde f|M atinge seu valor máximo ou mı́nimo, então det W 6= 0 e, pela
X
n
2
igualdade acima, kXi k = w2ij = 1 para todo i = 1, . . . , n, ou seja, os vetores-linha têm norma
j=1
igual a 1.
Multiplicando (?) por wkj , k 6= i, e somando em relação a j, temos:

X n Xn
i+j
(−1) wkj W[i,j] = 2λ wkj wij = 2λhWk , Wi i .
j=1 j=1

X
n
Logo hWk , Wi i = 0 para k 6= i, pois (−1)i+j wkj W[i,j] = 0, por ser o desenvolvimento, em
j=1
relação à i−ésima linha, do determinante de uma matriz com duas linhas (a i−ésima e a
k−ésima) iguais a Wk .
Assim, todo ponto W ∈ M onde f|M atinge seu valor máximo ou mı́nimo é uma matriz cujas
linhas são vetores unitários dois a dois ortogonais, ou seja W é uma matriz ortogonal. Logo
det W = +1, se W é um ponto de máximo, e det W = −1, se W é um ponto de mı́nimo. Então
−1 ≤ det W ≤ 1 para todo W ∈ M, ou seja, −kX1 k . . . kXn k ≤ det X ≤ kX1 k . . . kXn k para toda
matriz X.
E a igualdade | det X| = kX1 k . . . kXn k ocorre se, e só se, X1 , . . . , Xn são vetores dois a dois
ortogonais, no caso em que det X 6= 0.
Observação 10.5. O valor absoluto de det X é o volume do paralelepı́pedo n−dimensional

determinado pelos vetores-linha X1 , . . . , Xn da matriz X. Assim, a desigualdade de Hadamard
significa, geometricamente, que se mantivermos constantes (não-nulos) os comprimentos des-
ses vetores, | det X| torna-se máximo quando eles forem 2 a 2 ortogonais e, neste caso, o volume
do paralelepı́pedo é o produto kX1 k . . . kXn k dos comprimentos de suas arestas.

Capı́tulo 4
Aplicações diferenciáveis
1 Diferenciabilidade de uma aplicação
Definição 1.1. Uma aplicação f : U −→ Rn , definida no aberto U ⊂ Rm , é diferenciável no

ponto a ∈ U quando existe uma transformação linear T : Rm −→ Rn tal que, para todo v ∈ Rm ,
com a + v ∈ U, tem-se
f(a + v) = f(a) + Tv + r(v) , (?)

r(v)
onde lim = 0.
v→0 kvk
r(v)
Seja a aplicação ρ : U0 −→ Rn , dada por ρ(v) = , se v 6= 0, e ρ(0) = 0, onde
kvk
U0 = {v ∈ Rm | a + v ∈ U} é um aberto que contém a origem. Então f é diferenciável no ponto a
se, e só se, lim ρ(v) = 0, ou seja, ρ é contı́nua na origem.
v→0
Observação 1.1. O fato de uma aplicação ser ou não diferenciável num determinado ponto
independe das normas tomadas em Rn e Rm .
Observação 1.2. Toda aplicação diferenciável no ponto a é contı́nua neste ponto, pois
r(v)
lim f(a + v) = f(a) + lim Tv + lim kvk = f(a) .
v→0 v→0 v→0 kvk
Definição 1.2. Seja f : U −→ Rn uma função definida num aberto U ⊂ Rm . A derivada

direcional de f num ponto a ∈ U, relativamente a um vetor v ∈ Rm , é o limite
∂f f(a + tv) − f(a)
(a) = lim ∈ Rn ,
∂v t→0 t
quando tal limite existe.
185
Análise
Seja δ > 0 tal que o segmento (a − δv, a + δv) está contido em U e considere o caminho
∂f
retilı́neo λ : (−δ, δ) −→ U, dado por λ(t) = a + tv. Então (a) é o vetor velocidade do caminho
∂v
f ◦ λ : (−δ, δ) −→ Rn no instante t = 0, pois
f ◦ λ(t) − f ◦ λ(0) f(a + tv) − f(a) ∂f
(f ◦ λ) 0 (0) = lim = lim = (a) .
t→0 t t→0 t ∂v
Fig. 1: Derivada direcional de f em a relativamente a v
Se f = (f1 , . . . , fn ) então
∂f
∂f ∂fn

1
(a) = (a), . . . , (a) .
∂v ∂v ∂v
∂f
Quando v = ej é o j−ésimo vetor da base canônica de Rm , escrevemos (a) em vez de
∂xj
∂f
(a). Assim,
∂ej
∂f ∂f1 ∂f
(a) = (a), . . . , n (a) .
∂xj ∂xj ∂xj
Observação 1.3. Seja f diferenciável no ponto a. Então, para todo v ∈ Rm e para t ∈ R

suficientemente pequeno,
f(a + tv) − f(a) = T (tv) + ρ(tv)ktvk ,
com lim ρ(tv) = 0. Como T (tv) = t Tv e ktvk = |t| kvk, temos que
t→0
f(a + tv) − f(a)
lim = Tv ± lim ρ(tv)kvk = Tv ,
t→0 t t→0
∂f
Logo Tv = (a). Em particular, obtemos que a transformação linear que satisfaz (?) é única.
∂v
Esta transformação, designada por f 0 (a) ou Df(a), é chamada a derivada de f no ponto a.
Para n = 1, a derivada f 0 (a) é a diferencial df(a) estudada no capı́tulo anterior.
Definição 1.3. A matriz n × m da transformação linear f 0 (a) : Rm −→ Rn , em relação às

bases canônicas de Rm e Rn , é chamada a matriz Jacobiana de f no ponto a e é indicada pela
notação Jf(a).
As m colunas da matriz Jacobiana Jf(a) são os vetores

0 ∂f ∂f1 ∂fn
f (a)ej = (a) = (a), . . . , (a) ∈ Rn .
∂xj ∂xj ∂xj

Diferenciabilidade de uma aplicação

∂fi
Assim, Jf(a) = (a) , onde f1 , . . . , fn : U ⊂ Rm −→ R são as funções-coordenada de f.
∂xj
Como, para todo v = (α1 , . . . , αm ) ∈ Rm ,

X X X
m m m
!
∂f ∂f1 ∂fn
f 0 (a)v = (a)αj = (a)αj , . . . , (a)αj
∂xj ∂xj ∂xj
j=1 j=1 j=1
e, como f(a + v) = f(a) + f 0 (a) v + r(v), obtemos que

X
m
∂fi
fi (a + v) = fi (a) + (a)αj + ri (v) ,
∂xj
j=1
ri (v)
para todo i = 1, . . . , n. Então lim = 0, para todo i = 1, . . . , n, uma vez que r(v) =
v→0 kvk
r(v)
(r1 (v), . . . , rn (v)) e lim = 0. Ou seja, se f é diferenciável no ponto a, então cada função-
v→0 kvk
coordenada de f é diferenciável no ponto a e f 0 (a)v = (df1 (a)v, . . . , dfn (a)v).
Reciprocamente, se cada função-coordenada de f é diferenciável no ponto a, temos que

X
n
∂fi
fi (a + v) = fi (a) + (a)αj + ri (v) ,
∂xj
j=1
ri (v)
com lim = 0, para todo i = 1, . . . , n.
v→0 kvk
Assim, se r(v) = (r1 (v), . . . , rn (v)),
X X
m m
!
∂f1 ∂fn
f(a + v) = f(a) + (a)αj , . . . , (a)αj + r(v) ,
∂xj ∂xj
j=1 j=1
r(v)
com lim = 0. Logo f é diferenciável no ponto a e
v→0 kvk
X X
m m
!
∂f1 ∂fn
f 0 (a)v = (a)αj , . . . , (a)αj = (df1 (a)v, . . . , dfn (a)v) .
∂xj ∂xj
j=1 j=1
Com isto, provamos o seguinte resultado:
Teorema 1.1. A aplicação f : U ⊂ Rm −→ Rn é diferenciável no ponto a ∈ U se, e só se, cada

uma de suas funções-coordenada fi : U −→ R, i = 1, . . . , n, é diferenciável no ponto a. Neste
caso,
f 0 (a)v = (df1 (a)v, . . . , dfn (a)v) ,
para todo v ∈ Rm .

∂fi ∂f
Observação 1.4. Para cada i = 1, . . . , n, a i−ésima linha (a), . . . , i (a) da ma-
∂x1 ∂xm
triz Jacobiana Jf(a) é a matriz 1 × m da diferencial, dfi (a) : Rm −→ R, da i−ésima função-
coordenada fi de f em relação à base canônica de Rm .

Análise
Corolário 1.1. A aplicação f = (g, h) : U ⊂ Rm −→ Rn × Rp , dada por f(x) = (g(x), h(x)), é

diferenciável no ponto a ∈ U se, e só se, as aplicações coordenadas g : U −→ Rn e h : U −→ Rp
são diferenciáveis no ponto a. Neste caso, f 0 (a) = (g 0 (a), h 0 (a)) : Rm −→ Rn × Rp .
Prova.
Basta observar que as funções-coordenada de f são as funções-coordenada de g seguidas
das funções-coordenada de h.
Observação 1.5. Seja f : U ⊂ Rm −→ Rn uma aplicação diferenciável no ponto a ∈ U. Se

λ : (−ε, ε) −→ U é um caminho qualquer diferenciável em t = 0, com λ(0) = a e λ 0 (0) = v, então
∂f
f 0 (a)v = (a) = (f ◦ λ) 0 (0) .
∂v
∂fi
De fato, pela observação 3.9 do capı́tulo 3, temos que (fi ◦λ) 0 (0) = (a), para todo i = 1, . . . , n.
∂v
Logo, como
∂f
∂f ∂f

0
f (a)v = (a) = (a), . . . , n (a) ,
1
∂v ∂v ∂v
temos que
f 0 (a)v = ((f1 ◦ λ) 0 (0), . . . , (fn ◦ λ) 0 (0)) = (f ◦ λ) 0 (0).
Definição 1.4. Dizemos que uma aplicação f : U ⊂ Rm −→ Rn é diferenciável no aberto U

quando é diferenciável em todos os pontos de U. Neste caso, fica definida a aplicação derivada
f 0 : U −→ L(Rm , Rn ) ,
que associa a cada ponto x ∈ U, a transformação linear f 0 (x) : Rm −→ Rn , derivada de f no

∂f
ponto x. Fica também definida, para todo v ∈ Rm , a aplicação : U −→ Rn , cujo valor num
∂v
∂f
ponto x ∈ U é a derivada direcional (x) = f 0 (x)v.
∂v
Observação 1.6. O espaço vetorial L(Rm ; Rn ) das transformações lineares T : Rm −→ Rn

possui uma norma natural, dada por:
kT k = sup{ kT (x)k | kxk = 1}.
Se identificarmos L(Rm ; Rn ) com Rmn , fazendo corresponder a cada transformação linear

T : Rm −→ Rn sua matriz em relação às bases canônicas de Rm e Rn , as funções-coordenada
de uma aplicação ψ : X −→ L(Rm ; Rn ), definida num conjunto X ⊂ Rp , são as mn funções
ψij : X −→ R tais que, para cada x ∈ X, ψij (x) é a (i, j)−entrada da matriz da transformação
linear ψ(x).
Resulta, então, do teorema 6.11 do capı́tulo 1, que uma aplicação ψ : X −→ L(Rm ; Rn ) é

contı́nua se, e só se, cada uma das funções ψij : U −→ R é contı́nua.

Também, pelo teorema 1.1 acima, uma aplicação ϕ : U −→ L(Rm ; Rn ) é diferenciável no ponto
a ∈ U se, e só se, cada uma das funções ϕij : U −→ R é diferenciável no ponto a.
Teorema 1.2. Seja f : U −→ Rn uma aplicação definida no aberto U ⊂ Rm . As seguintes

afirmações são equivalentes:
(1) f é diferenciável e a aplicação derivada f 0 : U −→ L(Rm ; Rn ) é contı́nua;
(2) As funções-coordenada f1 , . . . , fn : U −→ R da aplicação f possuem derivadas parciais

∂fi
: U −→ R contı́nuas;
∂xj
∂f
m
(3) Para cada v ∈ R , existe a derivada direcional (x) em todo ponto x ∈ U e a aplicação
∂v
∂f
: U −→ Rn é contı́nua.
∂v
Prova.
∂fi
(1)=⇒(2) Por serem as derivadas parciais as funções-coordenada da aplicação f 0 .
∂xj
(2)=⇒(1) Pelo teorema 3.2 do capı́tulo 3, (2) implica que cada função-coordenada fi é dife-
renciável e, portanto, f é diferenciável pelo teorema 1.1 acima. Além disso, f 0 é contı́nua, pois
∂fi
suas funções-coordenada, , são contı́nuas.
∂xj
(2)=⇒(3) Seja v = (α1 , . . . , αn ) ∈ Rm . Pelo provado acima, f é diferenciável. Então
∂f Xm
∂f
= αj .
∂v ∂xj
j=1
∂fi ∂f ∂f
Como cada função-coordenada, , de é contı́nua, temos que é contı́nua para todo
∂xj ∂xj ∂xj
∂f
j = 1, . . . , m. Logo, para todo v ∈ Rm , : U −→ Rn é contı́nua.
∂v
∂f
(3)=⇒(2) Tomando v = ej , temos, por hipótese, que a derivada parcial : U −→ Rn existe e é
∂xj
contı́nua, para todo j = 1, . . . , m.
∂fi
Logo, cada uma das funções-coordenada : U −→ R existe e é contı́nua .
∂xj
Definição 1.5. Dizemos que uma aplicação f : U −→ Rn é de classe C1 no aberto U ⊂ Rm

quando f cumpre uma das (e portanto todas as) condições do teorema acima.
Em particular, f ∈ C1 se, e só se, cada uma das suas funções-coordenada é de classe C1 .
Definição 1.6. Dizemos que uma aplicação f : U −→ Rn , definida no aberto U ⊂ Rm , é

duas vezes diferenciável no ponto a ∈ U quando f é diferenciável em U e satisfaz as condições
abaixo:

Análise
(1) A aplicação derivada f 0 : U −→ L(Rm ; Rn ) é diferenciável no ponto a;

∂fi
(2) Cada derivada parcial : U −→ R é diferenciável no ponto a;
∂xj
∂f
(3) Para cada v ∈ Rm , a aplicação derivada direcional : U −→ Rn é diferenciável no ponto a.
∂v
Como no teorema 1.2, podemos mostrar que as três condições acima são equivalentes.
Então, f satisfaz a uma delas se, e só se, satisfaz a todas. Assim, f é duas vezes diferenciável
no ponto a se, e só se, cada função-coordenada fi é duas vezes diferenciável no ponto a.
Definição 1.7. Quando f : U −→ Rn é duas vezes diferenciável no ponto a ∈ U, sua derivada

segunda no ponto a é a aplicação bilinear
f 00 (a) : Rm × Rm −→ Rn ,
cujo valor no ponto (v, w) ∈ Rm × Rm é o vetor

∂ ∂f
f 00 (a) · v · w = (a) ∈ Rn .
∂v ∂w
∂2 f ∂
∂f
Escrevemos (a) em vez de (a).
∂v ∂w ∂v ∂w
Se v = (α1 , . . . , αm ) e w = (β1 , . . . , βm ), então

X X
m
! m
∂ ∂2 f
∂f ∂ ∂f
00
f (a) · v · w = (a) = βk (a) = (a) βk αj ,
∂v ∂w ∂v ∂xk ∂xj ∂xk
k=1 j,k=1
é o vetor de Rn cujas coordenadas são:

X
m
∂ 2 fi
00
fi (a) · v · w = (a) βk αj , i = 1, . . . , n.
∂xj ∂xk
j,k=1
Pelo teorema de Schwarz para funções, segue que fi00 (a) · v · w = fi00 (a) · w · v para todo
i = 1, . . . , n. Logo,
f 00 (a) · v · w = f 00 (a) · w · v ,
ou seja,
∂2 f ∂2 f
(a) = (a)
∂w ∂v ∂v ∂w
quando f : U −→ Rn é duas vezes diferenciável no ponto a.
Isto prova o seguinte resultado:
Teorema 1.3. (Teorema de Schwarz para aplicações)

Se a aplicação f : U −→ Rn , definida no aberto U ⊂ Rm , é duas vezes diferenciável no ponto
a ∈ U, então a derivada segunda f 00 (a) : Rm × Rm −→ Rn é uma aplicação bilinear simétrica.

Observação 1.7. Na realidade, a derivada segunda de uma aplicação diferenciável

f : U ⊂ Rm −→ Rn no ponto a ∈ U é uma transformação linear f 00 (a) : Rm −→ L(Rm ; Rn ),
pois f 00 (a) = (f 0 ) 0 (a) e f 0 : U ⊂ Rm −→ L(Rm ; Rn ). Mas, como existe um isomorfismo natural
entre L(Rm ; L(Rm ; Rn )) e o espaço L2 (Rm ; Rn ) das transformações bilineares de Rm × Rm em
Rn , que associa a cada transformação linear T : Rm −→ L(Rm ; Rn ) a transformação bilinear
Te : Rm × Rm −→ Rn tal que Te(v, w) = (Tv)w, podemos considerar a derivada segunda como
sendo a transformação bilinear f 00 (a) : Rm × Rm −→ Rn dada por
  
Xm 2
∂ f1 (a) Xm 2
∂ f1 (a) 
 αj · · · αj  β 
 j=1 ∂xj ∂x1 ∂xj ∂xm  1

j=1 
  
 
 
f 00 (a)(v, w) = ((f 0 ) 0 (a) · v) · w = 
 .. .. ..  . 
  .. 
 . . .  
  
 
X ∂2 f (a) X
m m 
2
∂ fn (a) 
n  
 αj · · · αj  βm
∂xj ∂x1 ∂xj ∂xm
j=1 j=1
X
m X X
m X
m m
!
∂2 f1 (a) ∂2 fn (a)
= αj βk , · · · , αj βk
∂xj ∂xk ∂xj ∂xk
k=1 j=1 k=1 j=1
X
m
∂2 f(a)
= αj βk ,
∂xj ∂xk
j,k=1
como foi definida anteriormente, onde v = (α1 , . . . , αm ) e w = (β1 , . . . , βm ).
Definição 1.8. Dizemos que uma aplicação f : U −→ Rn é de classe C2 no aberto U ⊂ Rm

quando f é diferenciável e sua derivada f 0 : U −→ L(Rm ; Rn ) é de classe C1 .
Pelo teorema 1.2, isto equivale a dizer que para i = 1, . . . , n e j = 1, . . . , m arbitrários,

∂2 fi
existem e são contı́nuas as derivadas parciais de segunda ordem : U −→ R das funções-
∂xj ∂xk
∂fi
coordenada de f, ou seja, cada função-coordenada de f 0 é de classe C1 , ou ainda, cada
∂xk
função-coordenada fi de f é de classe C2 .
∂f
E também, f é de classe C2 se, e só se, a derivada direcional : U −→ Rn é de classe
∂v
C1 para todo v ∈ Rm , .
Por indução, dizemos que a aplicação f : U −→ Rn , definida no aberto U ⊂ Rm , é

k−vezes diferenciável no ponto a ∈ U quando f é diferenciável em U e a aplicação derivada
f 0 : U −→ L(Rm ; Rn ) é (k − 1)−vezes diferenciável no ponto a, ou seja, para todo v ∈ Rm , a
∂f
derivada direcional : U −→ Rn é uma aplicação (k − 1)−vezes diferenciável no ponto a, ou
∂v
∂f
ainda, as derivadas parciais i : U −→ R são funções (k − 1)−vezes diferenciáveis no ponto a.
∂xj

Análise
Para verificar as equivalências acima, basta provar, por indução, que uma aplicação
f : U ⊂ Rm −→ Rn é k−vezes diferenciável no ponto a ∈ U se, e só se, cada função-coordenada
fi de f é k−vezes diferenciável no ponto a.
Quando f : U −→ Rn é k−vezes diferenciável no ponto a, definimos a k−ésima derivada

(ou derivada de ordem k) de f no ponto a como sendo a aplicação k−linear
f(k) (a) : Rm × . . . × Rm −→ Rn ,
cujo valor no ponto (v1 , . . . , vk ) ∈ Rm × . . . × Rm é o vetor

∂k f
f(k) (a) · v1 · . . . · vk = (a) ∈ Rn .
∂v1 ∂v2 . . . ∂vk
Como consequência do Teorema de Schwarz (ver observação 7.2 do capı́tulo 3), a k−ésima
derivada f(k) (a) é uma aplicação k−linear simétrica.
Por exemplo, se k = 3, u = (α1 , . . . , αm ), v = (β1 , . . . , βm ) e w = (γ1 , . . . , γm ), temos:

Xm
∂3 f
f(3) (a) · u · v · w = (a) γk βj αi .
∂xi ∂xj ∂xk
i,j,k=1
Definição 1.9. Uma aplicação f : U −→ Rn , definida no aberto U ⊂ Rm , é de classe Ck

quando é diferenciável e sua derivada f 0 : U −→ L(Rm ; Rn ) é uma aplicação de classe Ck−1 .
Pode-se provar, por indução, que uma aplicação f : U −→ Rn é de classe Ck se, e só se, cada
função coordenada fi de f é de classe Ck .
Assim, f é de classe Ck se, e só se, existem e são contı́nuas em U todas as derivadas par-
ciais de ordem ≤ k das funções-coordenada de f, ou ainda, para todo v ∈ Rm , a aplicação
∂f
: U −→ Rn é de classe Ck−1 .
∂v
Para completar, dizemos que f é de classe C0 quando f é contı́nua, e é de classe C∞ quando
f ∈ Ck para todo k = 0, 1, . . ..
Observação 1.8. Se f ∈ Ck então f ∈ Ck−1 , para todo k ≥ 1.
Observação 1.9. Quando v1 = . . . = vk = v, o valor da aplicação k−linear f(k) (a) na k−lista

(v, . . . , v) será indicado f(k) (a) vk .
Observação 1.10. A aplicação f = (g, h) : U −→ Rn × Rp dada por f(x) = (g(x), h(x)),

é k−vezes diferenciável num ponto (ou de classe Ck em U) se, e só se, suas aplicações-
coordenadas g : U −→ Rn e h : U −→ Rp são k−vezes diferenciáveis neste ponto (ou de
classe Ck em U).

Exemplos de aplicações diferenciáveis
2 Exemplos de aplicações diferenciáveis
Exemplo 2.1. Toda aplicação constante é de classe C∞ e sua derivada é nula.
Exemplo 2.2. Toda aplicação linear T : Rm −→ Rn é diferenciável e T 0 (x) = T para todo

x ∈ Rm .
r(v)
De fato, como T (x + v) = Tx + Tv para todo v ∈ Rm , temos que r(v) = 0 e, portanto, lim = 0.
v→0 kvk
Logo T 0 (x) = T para todo x ∈ Rm ou seja, a derivada T 0 : Rm −→ L(Rm ; Rn ) é constante. Em
particular, T é de classe C∞ .
Exemplo 2.3. Toda aplicação bilinear ϕ : Rm × Rn −→ Rp é diferenciável e, em cada ponto

(a, b) ∈ Rm × Rn , sua derivada é a transformação linear ϕ 0 (a, b) : Rm × Rn −→ Rp , definida por:
ϕ 0 (a, b)(v, w) = ϕ(v, b) + ϕ(a, w) .
De fato, como
ϕ(a + v, b + w) = ϕ(a, b) + ϕ(v, b) + ϕ(a, w) + ϕ(v, w),
ϕ(v, w)
basta mostrar que lim = 0.
(v,w)→(0,0) k(v, w)k
Pela observação 6.43 do capı́tulo 1, existe uma constante c > 0 tal que
kϕ(v, w)k ≤ ckvks kwks ,
para todo v ∈ Rm e todo w ∈ Rn . Logo, tomando a norma da soma em Rm , Rn e Rm × Rn , temos

k(v, w)ks = kvks + kwks ,
e, portanto,
kϕ(v, w)k ckvks kwks
≤ ≤ ckvks .
k(v, w)ks kvks + kwks
ϕ(v, w)
Então lim = 0.
(v,w)−→(0,0) k(v, w)ks
Além disso, a aplicação derivada
ϕ 0 : Rm × Rn −→ L(Rm × Rn ; Rp )
(a, b) 7−→ ϕ 0 (a, b) ,
é linear, pois
ϕ 0 (a + λa 0 , b + λb 0 )(v, w) = ϕ(a + λa 0 , w) + ϕ(v, b + λb 0 )
= ϕ(a, w) + λϕ(a 0 , w) + ϕ(v, b) + λϕ(v, b 0 )
= (ϕ 0 (a, b) + λϕ 0 (a 0 , b 0 ))(v, w) ,
para todo (v, w) ∈ Rm × Rn . Então, pelo exemplo anterior, ϕ 0 é de classe C∞ e, portanto, ϕ é
de classe C∞ .

Análise
Assim, a derivada segunda ϕ 00 (a, b) : (Rm × Rn ) × (Rm × Rn ) −→ Rp de ϕ é dada por:

ϕ 00 (a, b)((v1 , w1 ), (v2 , w2 )) = ((ϕ 0 ) 0 (a, b)(v1 , w1 ))(v2 , w2 )
= (ϕ 0 (v1 , w1 ))(v2 , w2 ) = ϕ(v2 , w1 ) + ϕ(v1 , w2 ) .
Casos particulares de aplicações bilineares são o produto interno
ϕ : Rm × Rm −→ R
(x, y) 7−→ ϕ(x, y) = hx, yi ,
e a multiplicação de matrizes
M : Rpn × Rnm −→ Rpm
(X, Y) 7−→ M(X, Y) = XY ,
cujas derivadas são dadas por
ϕ 0 (x, y)(v, w) = hv, yi + hx, wi e M 0 (X, Y)(V, W) = VY + XW ,
respectivamente.
Mais geralmente, se ϕ : Rm1 × . . . × Rmk −→ Rn é uma aplicação k−linear, então ϕ é de

classe C∞ , pois suas funções-coordenada são k−lineares e, portanto, polinômios de grau k de
m1 + . . . + mk variáveis.
Pode-se provar, de modo análogo ao caso bilinear (k = 2), que existe c > 0 tal que
kϕ(v1 , . . . , vk )k ≤ ckv1 ks · . . . · kvk ks .
Então, como
X
n
ϕ(a1 + v1 , . . . , ak + vk ) = ϕ(a1 , . . . , ak ) + ϕ(a1 , . . . , ai−1 , vi , ai+1 , . . . , ak )
i=1
X
+ ϕ(a1 , . . . , ai−1 , vi , ai+1 , . . . , aj−1 , vj , aj+1 , . . . , ak )
i<j
+ . . . + ϕ(v1 , . . . , vk ) ,
temos que ϕ é diferenciável em todo ponto (a1 , . . . , ak ) ∈ Rm1 × . . . × Rmk e

X
k
0
ϕ (a1 , . . . , ak )(v1 , . . . , vk ) = ϕ(a1 , . . . , ai−1 , vi , ai+1 , . . . , ak ) .
i=1
De fato, como
X

ϕ(a1 , . . . , ai−1 , vi , ai+1 , . . . , aj−1 , vj , aj+1 , . . . , ak ) + . . . + ϕ(v1 , . . . , vk )

i<j
X
≤ M(2) kvi ks kvj ks + . . . + M(k) kv1 ks . . . kvk ks ,
i<j
onde M(2) , . . . , M(k) são constantes positivas que dependem de ka1 ks , . . . , kak ks e c, podemos

provar, de modo similar ao caso k = 2, que

X
ϕ(a1 , . . . , ai−1 , vi , ai+1 , . . . , aj−1 , vj , aj+1 , . . . , vk ) + . . . + ϕ(v1 , . . . , vk )
i<j
lim =0
(v1 ,...,vk )−→(0,...,0) k(v1 , . . . , vk )ks
Por exemplo, se k = 3,
ϕ 0 (a, b, c)(u, v, w) = ϕ(u, b, c) + ϕ(a, v, c) + ϕ(a, b, w) .
Um exemplo de aplicação n−linear é a função determinante

det : Rn × . . . × Rn −→ R
X 7−→ det X = det(X1 , . . . , Xn ) ,
onde X1 , . . . , Xn são os vetores-linha da matriz X. Sua derivada no ponto X é o funcional linear
det 0 (X) : Rn −→ R, cujo valor na matriz V = (V1 , . . . , Vn ) é
2
X
n
det 0 (X) · V = det(X1 , . . . , Xk−1 , Vk , Xk+1 , . . . , Xn ) .
k=1
Em particular, se V = Eij =matriz cuja (i, j)−ésima entrada é igual a 1 e as demais são iguais a
zero, então
∂ det
(X) = det 0 (X)Eij = det(X1 , . . . , Xi−1 , ej , Xi+1 , . . . , Xn ) = (−1)i+j X[i,j] ,
∂xij
onde X[i,j] é o determinante da matriz (n − 1) × (n − 1) obtida de X pela omissão da i−ésima
linha e da j−ésima coluna, re-obtendo, assim, um fato já conhecido.
Exemplo 2.4. Seja U = GL(Rn ) ⊂ Rn2 o conjunto aberto formado pelas matrizes n × n que
são invertı́veis.
Mostraremos que a aplicação

2
f : U −→ Rn
X 7−→ f(X) = X−1 ,
2 2
é diferenciável e sua derivada no ponto A ∈ U é a transformação linear f 0 (A) : Rn −→ Rn ,
definida por
f 0 (A)V = −A−1 VA−1 .
De fato, se
r(V) = (A + V)−1 − A−1 + A−1 VA−1 ,
obtemos, multiplicando ambos os membros da igualdade, à esquerda, por A + V, que:

(A + V)r(V) = I − I − VA−1 + VA−1 + VA−1 VA−1 = VA−1 VA−1 = (VA−1 )2 ,
e, portanto,
r(V) = (A + V)−1 (VA−1 )2 .

Análise
Logo
kr(V)k ≤ k(A + V)−1 k kA−1 k2 kVk2 .
r(V)
Assim, pelo lema abaixo, lim = 0.
v→0 kVk
Lema 2.1. Seja A ∈ Rn2 uma matriz invertı́vel. Então existe c > 0 tal que, para toda n × n
1
matriz V, com kVk ≤ c, A + V é invertı́vel e k(A + V)−1 k ≤ .
c
Prova.
1
Seja c = > 0. Então
2kA−1 k
kxk = kA−1 (Ax)k ≤ kA−1 k kA(x)k ,
ou seja, kA(x)k ≥ 2ckxk para todo x ∈ Rn .
Se kVk ≤ c, temos que

k(A + V)(x)k = kAx + Vxk ≥ kAxk − kVxk ≥ 2ckxk − ckxk = ckxk .
Logo, se kVk ≤ c, então A + V é invertı́vel e

kxk = k(A + V)(A + V)−1 (x)k ≥ ck(A + V)−1 (x)k ,
1
ou seja, k(A + V)−1 k ≤ .
c
Em particular, a inversão de matrizes f : X 7−→ X−1 é uma aplicação contı́nua. Como
f(U) = U e f−1 = f, f é um homeomorfismo de U sobre si mesmo.
Mostraremos agora que f é de classe C∞ .

2 ∂f 2
Seja V ∈ Rn fixo. A derivada direcional : U −→ Rn é dada por
∂V
∂f
(X) = −X−1 V X−1 .
∂V
2 2 2
Seja a aplicação bilinear ϕV : Rn × Rn −→ Rn definida por
ϕV (X, Y) = X V Y .
∂f 2 2
Então = −ϕV ◦ (f, f), onde (f, f) : U −→ Rn × Rn é dada por (f, f)(X) = (X−1 , X−1 ) .
∂V
∂f 2 2
Logo : U −→ Rn é contı́nua para todo V ∈ Rn e, portanto, f é de classe C1 .
∂V
Como a aplicação bilinear ϕV é de classe C∞ e a composta de duas aplicações de classe
∂f 2
Ck é de classe Ck (ver seção 3), temos que = −ϕV ◦ (f, f) é de classe C1 para todo V ∈ Rn .
∂V
Logo f é de classe C2 .
Prosseguindo desta maneira, obtemos que f é de classe Ck para todo k ∈ N, ou seja, f é

de classe C∞ .

Definição 2.1. Sejam U ⊂ Rm e V ⊂ Rn conjuntos abertos. Dizemos que uma bijeção f :

U −→ V é um difeomorfismo de U sobre V quando f e f−1 são diferenciáveis (provaremos
depois que n = m).
Dizemos que f : U −→ V é um difeomorfismo de classe Ck se f é um difeomorfismo e f ∈ Ck

(provaremos depois que f é um difeomorfismo Ck se, e só se, f−1 é um difeomorfismo Ck ).
A inversão de matrizes f : U −→ U é um exemplo de difeomorfismo de classe C∞ , pois

f−1 = f e f é de classe C∞ .
Observação 2.1. Existem critérios indiretos, como o Teorema da Função Implı́cita, que per-
mitem concluir que uma certa aplicação é diferenciável, sem que se conheça sua derivada.
Na ausência destes métodos indiretos, fica o problema de obter um candidato razoável para a
derivada, sem o qual não se pode provar a diferenciabilidade da aplicação.
Um processo, quando pode ser aplicado, é o de desenvolver f(a + v) (ou cada uma de suas
funções-coordenada) em série de potências nas coordenadas de v, e destacar a parte de pri-
meiro grau em relação a v, que é a candidata a ser f 0 (a)v.
No exemplo acima,
f(A + V) = (A + V)−1 = ((I + VA−1 )A)−1 = A−1 (I + VA−1 )−1 .
Seja X ∈ Rn tal que kXk < 1. Então I − X é invertı́vel, pois se existisse v ∈ Rn − {0} tal que
2
X(v) = v, terı́amos kXk ≥ 1.

X
∞
Além disso, sabemos que se kXk < 1, a série Xj é absolutamente convergente, pois
j=0
j j
kX k ≤ kXk para todo j ∈ N. Logo, como
lim (I − Xn+1 ) = I, e (I − X)(I + X + . . . + Xn ) = I − Xn+1 ,
n→∞
para todo n ∈ N, temos que

X
∞
(I − X)−1 = Xj (?)
j=0
1
Seja X = −VA−1 tal que kVk < .
kA−1 k
Como kXk < 1, temos, por (?), que
X
∞
(I + VA−1 )−1 = (−1)j (VA−1 )j .
j=0
Logo,
(A + V)−1 = A−1 (I + VA−1 )−1 = A−1 − A−1 VA−1 + r(V) ,

Análise
onde
X X
∞
r(V) = A−1 (−1)j (VA−1 )j = A−1 (VA−1 )2 (−1)j (VA−1 )j ,
j≥2 j=0
1
se kVk < .
kA−1 k
2 1
Para todo V ∈ Rn , com kVk < , temos que
2kA−1 k
kr(V)k ≤ 2kVk2 kA−1 k3 ,
pois
X∞ X
∞

j −1 j 1
(−1) (VA ) ≤ = 2.

2j

j=0 j=0
r(V)
Então lim = 0 e, portanto, f é diferenciável em A e f 0 (A)V = −A−1 VA−1 .
v→0 kVk
Exemplo 2.5. Uma função de variável complexa f : U −→ C, definida no aberto U ⊂ C, pode

ser vista como uma aplicação f : U −→ R2 definida no aberto U ⊂ R2 . A derivada da função
complexa no ponto z = x + iy é o número complexo definido pelo limite
f(z + H) − f(z)
f 0 (z) = lim ,
H→0 H
quando tal limite existe. Isto equivale a dizer que
f(z + H) = f(z) + f 0 (z)H + r(H) ,

r(H)
onde lim = 0.
H→0 |H|
Assim, a função complexa f : U −→ C é derivável no ponto z = x + iy se, e só se, a aplicação
f : U ⊂ R2 −→ R2 é diferenciável no ponto (x, y) e sua derivada f 0 (x, y) : R2 −→ R2 é uma
0
transformação linear no plano que consiste em multiplicar por
!um número complexo a+ib = f (z)
a −b
fixo, ou seja, a matriz Jacobiana Jf(z) tem a forma , que, por sua vez, equivale a dizer
b a
que as partes real e imaginária da função complexa f = u + iv satisfazem as equações de
Cauchy-Riemann:
∂u ∂v ∂u ∂v
(z) = (z) (= a) e − (z) = (z) (= b) .
∂x ∂y ∂y ∂x
Então, se f 0 (z) = a + ib 6= 0, f 0 (z) : R2 −→ R2 é uma transformação linear que preserva
! positiva {e1 , e2 } na base positiva {f (z)e1 , f (z)e2 } = {(a, b), (−b, a)},
0 0
orientação, pois leva a base
a −b
uma vez que det = a2 + b2 > 0.
b a
Além disso, como hf 0 (z)e1 , f 0 (z)e1 i = hf 0 (z)e2 , f 0 (z)e2 i = a2 + b2 = λ2 e hf 0 (z)e1 , f 0 (z)e2 i = 0,

A regra da cadeia
temos que
hf 0 (z)X, f 0 (z)Yi = hx1 f 0 (z)e1 + x2 f 0 (z)e2 , y1 f 0 (z)e1 + y2 f 0 (z)e2 i
= (x1 y1 + x2 y2 )λ2 = λ2 hX, Yi ,
para quaisquer X = (x1 , x2 ), Y = (y1 , y2 ) ∈ R2 .
Logo f 0 (z) : R2 −→ R2 é uma transformação linear que preserva ângulo, pois

hf 0 (z)X, f 0 (z)Yi λ2 hX, Yi hX, Yi
cos(∠(f 0 (z)X, f 0 (z)Y)) = = = = cos(∠(X, Y)) .
0 0
kf (z)Xk kf (z)Yk |λ| kXk |λ| kYk kXk kYk
Uma transformação linear T : R2 −→ R2 do tipo T (z) = Az, onde A é um número complexo

não-nulo, é chamada uma semelhança positiva: trata-se de uma rotação positiva (multiplicação
A
por = eiθ ) seguida de uma homotetia (multiplicação pelo número real |A| > 0).
|A|
Exemplo 2.6. Seja f : I −→ Rn um caminho definido no intervalo aberto I ⊂ R. Pela definição

dada no capı́tulo 2, f é diferenciável no ponto a ∈ I quando existe o vetor velocidade
f(a + t) − f(a)
v = lim .
t→0 t
r(t)
Isto equivale a dizer que lim = 0 , onde r(t) = f(a + t) − f(a) − vt.
t→0 t
Como toda transformação linear T : R −→ Rn é da forma T (t) = t T (1), um caminho é dife-

renciável no sentido do capı́tulo 2 se, e só se, é diferenciável no sentido deste capı́tulo.
3 A regra da cadeia
Teorema 3.1. (Regra da Cadeia)

Sejam U ⊂ Rm , V ⊂ Rn abertos, f : U −→ Rn diferenciável no ponto a, com f(U) ⊂ V, e
g : V −→ Rp diferenciável no ponto f(a). Então g ◦ f : U −→ Rp é diferenciável no ponto a e
(g ◦ f) 0 (a) = g 0 (f(a)) ◦ f 0 (a) : Rm −→ Rp .
Prova.
Sejam g1 , . . . , gp : V −→ R as funções-coordenada de g. Então, pelo teorema 1.1, g1 , . . . , gp
são diferenciáveis no ponto f(a) e, pela Regra da Cadeia para funções, as funções-coordenada
g1 ◦ f, . . . , gp ◦ f da aplicação g ◦ f são diferenciáveis no ponto a e
∂gi ◦ f Xn
∂gi ∂f
(a) = (f(a)) k (a) ,
∂xj ∂yk ∂xj
k=1
para todo i = 1, . . . , p e todo j = 1, . . . , m.

Análise
Logo, pelo teorema 1.1, g ◦ f é diferenciável no ponto a.
Como
(g ◦ f) 0 (a)ej = ((g1 ◦ f) 0 (a)ej , . . . , (gp ◦ f) 0 (a)ej ) ,
e
X
n
∂gi ∂fk
gi0 (f(a))(f 0 (a)ej ) = gi0 (f(a))(f10 (a)ej , . . . , fn0 (a)ej ) = (f(a)) (a) = (gi ◦ f) 0 (a)ej ,
∂yk ∂xj
k=1
para todo i = 1, . . . , p, temos que

(g ◦ f) 0 (a)ej = (g 0 (f(a)) ◦ f 0 (a))ej ,
para todo j = 1, . . . , m.
Logo (g ◦ f) 0 (a) = g 0 (f(a)) ◦ f 0 (a).
Outra maneira de provar que (g ◦ f) 0 (a) = g 0 (f(a)) ◦ f 0 (a).
Sejam v ∈ Rm e λ : (−ε, ε) −→ U um caminho diferenciável em t = 0, com λ(0) = a e

λ 0 (0) = v. Então as funções fi ◦ λ : (−ε, ε) −→ R são diferenciáveis em t = 0, (fi ◦ λ)(0) = fi (a)
e (fi ◦ λ) 0 (0) = dfi (a) · v. Logo o caminho f ◦ λ é diferenciável em t = 0, f ◦ λ(0) = f(a) e
(f ◦ λ) 0 (0) = (df1 (a)v, . . . , dfn (a)v) = f 0 (a)v.
De modo análogo, temos que g ◦ (f ◦ λ) é um caminho em Rp diferenciável em t = 0, com

(g ◦ (f ◦ λ))(0) = g(f(a)) e (g ◦ (f ◦ λ)) 0 (0) = g 0 (f(a)) · (f 0 (a) v).
Por outro lado, (g◦f)◦λ é um caminho diferenciável em t = 0, como ((g◦f)◦λ)(0) = g(f(a))

e ((g ◦ f) ◦ λ) 0 (0) = (g ◦ f) 0 (a) v. Logo (g ◦ f) 0 (a) v = g 0 (f(a))(f 0 (a) v) para todo v ∈ Rn .
Ou seja, (g ◦ f) 0 (a) = g 0 (f(a)) ◦ f 0 (a).

Fig. 2: Representação esquemática da Regra da Cadeia

∂fk ∂gi
Corolário 3.1. Sejam Jf(a) = (a) , Jg(f(a)) = (f(a)) e J(g ◦ f)(a) =
∂xj n×m
∂yk p×n

∂(gi ◦ f)
(a) as matrizes Jacobianas de f, g e g ◦ f nos pontos indicados. Supondo f
∂xj p×m
diferenciável no ponto a e g diferenciável no ponto f(a), tem-se J(g ◦ f)(a) = Jg(f(a)) · Jf(a).

A regra da cadeia
Prova.
Por (?), temos que:
∂(gi ◦ f)(a) X
n
∂gi ∂f
(J(g ◦ f)(a))ij = = (f(a)) k (a) = (Jg(f(a)) · Jf(a))ij ,
∂xj ∂yk ∂xj
k=1
para todo i = 1, . . . , p e todo j = 1, . . . , m. Logo J(g ◦ f)(a) = Jg(f(a)) · Jf(a).
Corolário 3.2. A composta de duas aplicações de classe Ck é uma aplicação de classe Ck .
Prova.
Sejam f : U ⊂ Rm −→ Rn , g : V ⊂ Rn −→ Rp , f(U) ⊂ V, duas aplicações de classe Ck .
Pelo corolário 3.4 do capı́tulo 3, gi ◦ f é de classe Ck para todo i = 1, . . . , p, pois as funções-

coordenada de f e g são de classe Ck .
Outra demonstração: Pela Regra da Cadeia, (g ◦ f) 0 (x) = g 0 (f(x)) ◦ f 0 (x) para todo x ∈ U.
Considerando as aplicações derivadas
f 0 : U −→ L(Rm ; Rn ) , g 0 : V −→ L(Rn ; Rp ) e (g ◦ f) 0 : U −→ L(Rm ; Rp ) ,
a igualdade acima pode ser escrita da seguinte maneira:

(g ◦ f) 0 = (g 0 ◦ f) · f 0 : U −→ L(Rm ; Rp ) ,
onde ◦ indica a composição de aplicações e · significa o produto de transformações lineares.
Considerando a multiplicação de transformações lineares como uma aplicação bilinear

M : L(Rn ; Rp ) × L(Rm ; Rn ) −→ L(Rm ; Rp ) , M(T, S) = T · S ,
a Regra da Cadeia se exprime como:

(g ◦ f) 0 = M ◦ (g 0 ◦ f, f 0 ) ,
onde (g 0 ◦ f, f 0 ) : U −→ L(Rn ; Rp ) × L(Rm ; Rn ) é a aplicação que tem por coordenadas g 0 ◦ f e

f 0 . Sabemos que M ∈ C∞ , isto é, M ∈ Ck para todo k.
Provaremos, por indução, que se f, g ∈ Ck , então g ◦ f é de classe Ck .
Suponhamos que f, g ∈ C1 . Então f 0 , g 0 ∈ C0 .
Logo (g 0 ◦ f, f 0 ) ∈ C0 e, portanto, (g ◦ f) 0 = M ◦ (g 0 ◦ f, f 0 ) ∈ C0 , o que significa que g ◦ f ∈ C1 .
Suponhamos o resultado válido para funções de classe Ck−1 , k − 1 ≥ 1. Sejam f, g ∈ Ck . Então

f 0 , g 0 ∈ Ck−1 e, pela hipótese de indução, g 0 ◦ f ∈ Ck−1 .
Logo (g 0 ◦ f, f 0 ) ∈ Ck−1 e, portanto, M ◦ (g 0 ◦ f, f 0 ) ∈ Ck−1 , isto é, (g ◦ f) 0 ∈ Ck−1 .
Assim, g ◦ f ∈ Ck .

Análise
Corolário 3.3. Se uma aplicação f : U −→ Rn , definida no aberto U ⊂ Rm e diferenciável no

ponto a, admite uma inversa g = f−1 : V −→ Rm definida no aberto V ⊂ Rn e diferenciável no
ponto b = f(a), então f 0 (a) : Rm −→ Rn é um isomorfismo, cujo inverso é g 0 (b) : Rn −→ Rm .
Em particular, m = n.
Prova.
Como g ◦ f = IdU e f ◦ g = IdV temos, pela Regra da Cadeia, que g 0 (b) · f 0 (a) = Id : Rm −→ Rm
e f 0 (a) · g 0 (b) = Id : Rn −→ Rn . Assim, g 0 (b) = (f 0 (a))−1 e m = n.
Observação 3.1. Como consequência do corolário acima, se f : U −→ V é um difeomorfismo

entre os abertos U ⊂ Rm e V ⊂ Rn , então f 0 (x) : Rm −→ Rn é um isomorfismo para todo x ∈ U.
Em particular, m = n, ou seja, U, V ⊂ Rm são abertos do mesmo espaço Euclidiano.
Observação 3.2. O Teorema da invariância da dimensão, devido a L. E. J. Brouwer, diz que

se U ⊂ Rm e V ⊂ Rn são abertos homeomorfos, então m = n
Observação 3.3. Um difeomorfismo não é a mesma coisa que um homeomorfismo dife-

renciável. Por exemplo, a função f : R −→ R, f(x) = x3 , é um homeomorfismo de classe
C∞ cujo inverso não é diferenciável no ponto 0.
Corolário 3.4. Seja f : U −→ V uma bijeção de classe Ck , k ≥ 1, entre os subconjuntos

abertos U, V ⊂ Rm . Se sua inversa g = f−1 : V −→ U é diferenciável então f−1 ∈ Ck . Diz-se
então que f é um difeomorfismo de classe Ck .
Prova.
Sejam GL(Rm ) o conjunto das transformações lineares invertı́veis de Rm em si mesmo e
Inv : GL(Rm ) −→ GL(Rm ) a inversão de transformações lineares que, pelo exemplo 2.4, é
de classe C∞ .
Pelo corolário 3.3, g 0 (y) = [f 0 (g(y))]−1 . Logo a aplicação derivada g 0 : V −→ L(Rm , Rm ) pode
ser escrita como g 0 = Inv ◦ f 0 ◦ g.
Vamos provar, por indução, que se f é de classe Ck , então g = f−1 ’é de classe Ck .
Seja f ∈ C1 . Então f 0 ∈ C0 . Logo Inv ◦ f 0 ◦ g é de classe C0 , isto é, g 0 ∈ C0 . Assim, g ∈ C1 .
Suponhamos o resultado válido para funções de classe Ck−1 , k − 1 ≥ 1. Seja f ∈ Ck . Então

f 0 ∈ Ck−1 e, pela hipótese de indução, g ∈ Ck−1 , pois f ∈ Ck−1 . Logo, pelo corolário 3.2,
g 0 = Inv ◦ f 0 ◦ g ∈ Ck−1 . Assim, g ∈ Ck .

A regra da cadeia
Observação 3.4. Quando f : U −→ Rm é diferenciável no aberto U ⊂ Rm tem sentido, em

cada ponto x ∈ U, considerar o determinante det Jf(x) da matriz Jacobiana Jf(x), chamado o
determinante Jacobiano de f no ponto x. Assim, pelo corolário 3.3, se f é um difeomorfismo,
então det Jf(x) 6= 0 para todo x ∈ U.
O Teorema da Aplicação Inversa, que provaremos mais adiante, fornece uma recı́proca local
para este fato.
Corolário 3.5. Sejam f, g : U −→ Rn aplicações diferenciáveis no ponto a ∈ U ⊂ Rm e c um

número real. Então:
(1) f + g : U −→ Rn é diferenciável no ponto a e (f + g) 0 (a) = f 0 (a) + g 0 (a) .
(2) cf : U −→ Rn é diferenciável no ponto a e (cf) 0 (a) = cf 0 (a) .

f
(3) : U −→ Rn é diferenciável no ponto a, quando g(x) 6= 0 e g(x) ∈ R para todo x ∈ U, e
g
0
f g(a) f 0 (a) − f(a) g 0 (a)
(a) = .
g (g(a))2
(4) Se ϕ : Rn × Rk −→ Rp é uma aplicação bilinear, f : U ⊂ Rm −→ Rn e g : U ⊂ Rm −→ Rk são
diferenciáveis no ponto a ∈ U, então ϕ(f, g) : U −→ Rp , definida por ϕ(f, g)(x) = ϕ(f(x), g(x)),
é diferenciável no ponto a e
(ϕ(f, g)) 0 (a) v = ϕ(f 0 (a) v, g(a)) + ϕ(f(a), g 0 (a) v) .
f
(5) Se f, g ∈ Ck , então f + g, cf, , ϕ(f, g) ∈ Ck .
g
Prova.
As três primeiras propriedades resultam do teorema 4.1 do capı́tulo 3 aplicado às funções-
coordenada de f e g.
(4) Pela Regra da Cadeia e pelo exemplo 2.3, temos, para todo v ∈ Rm ,
[ϕ(f, g)] 0 (a) v = (ϕ ◦ (f, g)) 0 (a) v
= ϕ 0 (f(a), g(a)) (f 0 (a) v, g 0 (a) v))
= ϕ(f 0 (a) v, g(a)) + ϕ(f(a), g 0 (a) v) .
(5) Considere as aplicações (f, g) : U −→ Rn × Rp , α : Rn × Rn −→ Rn , c? : Rn −→ Rn e
q : Rn × (R − {0}) −→ Rn , dadas por
y
(f, g)(x) = (f(x), g(x)), α(y, z) = y + z, c? (y) = c y e q(y, z) = .
z
Então,
f
f + g = α ◦ (f, g) , cf = c? ◦ f , = q ◦ (f, g) e ϕ(f, g) = ϕ ◦ (f, g) .
g

Análise
As aplicações α e c? são de classe C∞ , pois são lineares. A aplicação q é também de classe

C∞ , pois q = m ◦ (Id, Inv), onde Id : Rn −→ Rn é a identidade, Inv : R − {0} −→ R − {0} é
a inversão de números reais não-nulos (matrizes invertı́veis 1 × 1) e m : Rn × R −→ Rn é a
aplicação bilinear dada por m(x, y) = xy. Como m, Inv e Id são C∞ , temos que q também é de
classe C∞ .
f
Logo, se f, g ∈ Ck , temos, pelo corolário 3.2, que f + g, cf, e ϕ(f, g) são de classe Ck .
g
Observação 3.5. Em particular, se ϕ : Rn × R −→ Rn é a multiplicação ϕ(x, y) = xy, temos

que ϕ(f, g) = f g e
(f g) 0 (a) v = g(a) f 0 (a) v + f(a) g 0 (a) v ,
Exemplo 3.1. Sejam f, g : U −→ Rn aplicações diferenciáveis (respectivamente de classe Ck )

definidas no aberto U ⊂ Rm . Então ξ : U −→ R, ξ(x) = hf(x), g(x)i é diferenciável (respectiva-
mente de classe Ck ) e
ξ 0 (x) · v = hf 0 (x) v, g(x)i + hf(x), g 0 (x) vi ,
para todo x ∈ U e todo v ∈ Rm .
Em particular, tomando f = g, temos ξ(x) = kf(x)k2 e
ξ 0 (x) v = 2hf 0 (x) v, f(x)i .
Segue-se também pela Regra da Cadeia que, em cada ponto x ∈ U onde f(x) 6= 0, a função
p
ϕ : U −→ R, dada por ψ(x) = kf(x)k = hf(x), f(x)i , é diferenciável no ponto x e
hf 0 (x) v, f(x)i
ψ 0 (x) v = ,
kf(x)k
4 As fórmulas de Taylor
No caso de uma aplicação f : U −→ Rn , definida no aberto U ⊂ Rm , com a, a + v ∈ U, a

fórmula de Taylor se escreve:
1 00 1
f(a + v) = f(a) + f 0 (a) v + f (a) v2 + . . . + f(p) (a) vp + rp (v) , (?)
2 p!
onde
∂2 f ∂ ∂p f ∂p−1 f
∂f ∂
00 2 (p) p
f (a) · v = 2 (a) = (a), . . . , f (a) v = p (a) = (a) .
∂v ∂v ∂v ∂v ∂v ∂vp−1

As fórmulas de Taylor
(1) Fórmula de Taylor infinitesimal: Se f é p−vezes diferenciável no ponto a, então

rp (v)
lim = 0.
v→0 kvkp
(2) Fórmula de Taylor com resto integral: Se f é de classe Cp+1 e [a, a + v] ⊂ U, então
Z1
1
rp (v) = (1 − t)p fp+1 (a + tv) vp+1 dt .
p! 0
Como, para cada j = 0, 1, . . . , p, f(j) (a) vj é o vetor de Rn cujas coordenadas são os

números d(j) fi (a) vj , onde fi são as funções-coordenada de f, temos que a fórmula de Tay-
lor (?) equivale a n igualdades numéricas que correspondem à fórmula de Taylor para funções
reais. Então, as fórmulas de Taylor (1) e (2) seguem das fórmulas análogas para funções reais,
provadas na seção 8 do capı́tulo 3.
(3) Fórmula de Taylor com resto de Lagrange: Sejam [a, a + v] ⊂ U, f uma aplicação de
classe Cp que é p + 1 vezes diferenciável em todo ponto do segmento aberto (a, a + v), com
kf(p+1) (x) wp+1 k ≤ M kwkp+1 para todo x ∈ (a, a + v) e todo w ∈ Rm . Então
M
krp (v)k ≤ kvkp+1 .
(p + 1)!
Prova.
Seja o caminho ϕ : [0, 1] −→ Rn dado por ϕ(t) = f(a + tv). Então ϕ é de classe Cp , (p + 1)−
vezes diferenciável no intervalo aberto (0, 1),
ϕ 0 (t) = f 0 (a + tv) v , ϕ 00 (t) = f 00 (a + tv) v2 , . . . , ϕ(p) (t) = f(p) (a + tv) vp ,
para todo t ∈ [0, 1], e

ϕ(p+1) (t) = f(p+1) (a + tv) vp+1 ,
com
kϕ(p+1) (t)k ≤ M kvkp+1 ,
para todo t ∈ (0, 1).
Então, pela Fórmula de Taylor com resto de Lagrange para caminhos, provada no capı́tulo 2,
temos
ϕ 00 (0) ϕ(p) (0)
ϕ(1) = ϕ(0) + ϕ 0 (0) + + ... + + rp ,
2! p!
com
M kvkp+1
krp k ≤ ,
(p + 1)!
ou seja,
f 00 (a) v2 f(p) (a) vp
f(a + v) = f(a) + f 0 (a) v + + ... + + rp (v) ,
2! p!
M kvkp+1
com krp (v)k ≤ .
(p + 1)!

Análise
Observação 4.1. (Unicidade da fórmula de Taylor)

Se f : U −→ Rn é uma aplicação p−vezes diferenciável no ponto a ∈ U ⊂ Rm e, para cada
i = 1, 2, . . . , p, é dada uma aplicação i−linear ϕi : Rm × . . . × Rm −→ Rn de modo que
Xp
1
f(a + v) = f(a) + ϕi vi + rp (v) ,
i!
i=1
rp (v)
com lim = 0, então ϕi vi = f(i) (a) vi para todo i = 1, . . . , p e todo v ∈ Rm .
v→0 kvkp
De fato, como cada função-coordenada de ϕi é uma função i−linear, o resultado segue da

unicidade da fórmula de Taylor para funções reais provada no capı́tulo 3 (ver observação 8.5).
5 A desigualdade do valor médio
Assim como para os caminhos, não há para as aplicações f : U ⊂ Rm −→ Rn , n > 1, um

Teorema do Valor Médio sob a forma de igualdade. Vale porém a desigualdade abaixo.
Desigualdade do Valor Médio: Sejam U ⊂ Rm aberto e f : U −→ Rn uma aplicação contı́nua

no segmento fechado [a, a + v] ⊂ U e diferenciável em todos os pontos do segmento aberto
(a, a + v). Se kf 0 (x)k ≤ M para todo x ∈ (a, a + v) então kf(a + v) − f(a)k ≤ Mkvk.
Prova.
O caminho λ : [0, 1] −→ Rn , definido por λ(t) = f(a + tv), é contı́nuo em [0, 1], diferenciável no
intervalo aberto (0, 1), λ(0) = f(a), λ(1) = f(a + v) e, pela Regra da Cadeia, λ 0 (t) = f 0 (a + tv) v.
Logo kλ 0 (t)k ≤ kf 0 (a + tv)k kvk ≤ M kvk para todo t ∈ (0, 1).
Então, pelo Teorema do Valor Médio para caminhos, demonstrado no capı́tulo 2, temos que
kλ(1) − λ(0)k ≤ Mkvk, ou seja, kf(a + v) − f(a)k ≤ M kvk.
Corolário 5.1. Seja U ⊂ Rn aberto e convexo. Se f : U −→ Rn é diferenciável e kf 0 (x)k ≤ M

para todo x ∈ U, então f é Lipschitziana, com kf(x) − f(y)k ≤ Mkx − yk para todos x, y ∈ U.
Prova.
Como U é convexo, dados x, y ∈ U, temos que [x, y] ⊂ U. Logo, como f é contı́nua em [x, y] e
diferenciável em todos os pontos do segmento aberto (x, y), temos, pela Desigualdade do Valor
Médio, que
kf(y) − f(x)k = kf(x + (y − x)) − f(x)k ≤ M ky − xk ,
pois kf 0 (z)k ≤ M para todo z ∈ (x, y).

A desigualdade do valor médio
Observação 5.1. A convexidade de U é essencial para a validade do corolário acima (ver

observação 4.2 do capı́tulo 3).
Corolário 5.2. Se f : U −→ Rn é diferenciável no aberto conexo U ⊂ Rm e f 0 (x) = 0 para todo

x ∈ U, então f é constante.
Prova.
Seja a ∈ U. Consideremos os conjuntos
A = {x ∈ U | f(x) = f(a)} e B = {x ∈ U | f(x) 6= f(a)} .
Como f é contı́nua, B é aberto.
Afirmação: A é aberto.
De fato, dado x ∈ A, existe δ > 0 tal que Bδ (x) ⊂ U. Então, se |v| < δ, temos que [x, x + v] ⊂ U
e, portanto, pela Desigualdade do Valor Médio, kf(x + v) − f(x)k ≤ ε kvk para todo ε > 0, pois
f 0 (y) ≡ 0 para todo y ∈ U. Logo f(x + v) = f(x) = f(a) para todo v com kvk < δ, ou seja
f(y) = f(a) para todo y ∈ Bδ (x).
Assim, U = A ∪ B é uma cisão. Como U é conexo e A 6= ∅, pois a ∈ A, obtemos que U = A, ou

seja, f(x) = f(a) para todo x ∈ U.
O corolário abaixo fornece uma estimativa para o resto r(v) = f(a + v) − f(a) − T v, quando
T = f 0 (a), e representa uma forma mais refinada da Desigualdade do Valor Médio, à qual se
reduz quando T = 0.
Corolário 5.3. Sejam U ⊂ Rm aberto, [a, a + v] ⊂ U, f : U −→ Rn uma aplicação diferenciável

em todos os pontos do segmento aberto (a, a + v) e f|[a,a+v] contı́nua. Seja T : Rm −→ Rn uma
transformação linear tal que kf 0 (x) − T k ≤ M para todo x ∈ (a, a + v). Então
kf(a + v) − f(a) − T vk ≤ M kvk .
Prova.
Seja g : U −→ Rn a aplicação dada por g(x) = f(x) − Tx. Como g 0 (x) = f 0 (x) − T , temos
que
kg 0 (x)k = kf 0 (x) − T k ≤ M ,
para todo x ∈ (a, a + v). Logo, pela Desigualdade do Valor Médio aplicada a g, obtemos que
kg(a + v) − g(a)k ≤ M kvk ,
ou seja
kf(a + v) − f(a) − Tvk ≤ M kvk .

Análise
Definição 5.1. Dizemos que uma aplicação diferenciável f : U −→ Rn é uniformemente dife-

renciável num subconjunto X ⊂ U quando, para todo ε > 0 dado, existe δ > 0 tal que
kvk < δ =⇒ kf(x + v) − f(x) − f 0 (x) vk < ε kvk ,
para todo x ∈ X, com x + v ∈ U.
Corolário 5.4. Uma aplicação f : U −→ Rn de classe C1 é uniformemente diferenciável em

todo compacto K ⊂ U.
Prova.
Pelo corolário 12.3 do capı́tulo 1, existe δ 0 > 0 tal que se x ∈ K e kvk < δ 0 , então [x, x + v] ⊂ U.
Como f 0 : U −→ L(Rm , Rn ) é contı́nua, pelo teorema 11.3 do capı́tulo 1, dado ε > 0 existe
0 < δ < δ 0 tal que
x ∈ K, kvk < δ =⇒ kf 0 (x + v) − f 0 (x)k < ε .
Então,
x ∈ K, kvk < δ, t ∈ [0, 1] =⇒ kf 0 (x + tv) − f 0 (x)k < ε ,
ou seja,
x ∈ K , kvk < δ , y ∈ [x, x + v] =⇒ kf 0 (y) − f 0 (x)k < ε .
Logo, pelo corolário 5.3, tomando T = f 0 (x), obtemos que

kf(x + v) − f(x) − f 0 (x) · vk ≤ ε kvk ,
para todo v com kvk < δ e para todo x ∈ K.
Corolário 5.5. Sejam U ⊂ Rm aberto e c ∈ U. Se a aplicação contı́nua f : U −→ Rn é

diferenciável em U − {c} e existe lim f 0 (x) = T ∈ L(Rm , Rn ) então f é diferenciável no ponto c e
x→c
f 0 (c) = T .
Prova.
Seja δ 0 > 0 tal que se kvk < δ 0 então [c, c + v] ⊂ U. Pela definição de limite, dado ε > 0,
existe 0 < δ < δ 0 tal que
0 < kvk < δ =⇒ kf 0 (c + tv) − T k < ε ,
para todo t ∈ (0, 1).
Então, pelo corolário 5.3, kr(v)k ≤ εkvk para todo 0 < kvk < δ, onde r(v) = f(c + v) − f(c) − T v.
Logo, f é diferenciável no ponto c e f 0 (c) = T .

Sequências de aplicações diferenciáveis
6 Sequências de aplicações diferenciáveis
Definição 6.1. Dizemos que uma sequência de aplicações fk : X −→ Rn , definidas num

conjunto X, converge uniformemente para uma aplicação f : X −→ Rn quando, para todo ε > 0
dado, existe k0 ∈ N tal que
k ≥ k0 =⇒ kfk (x) − f(x)k < ε ,
para todo x ∈ X.
Observação 6.1. Como a afirmação ”lim fk = f uniformemente em X” não depende da norma

que se considera no espaço euclidiano, temos que fk −→ f uniformemente em X se, e só
se, para cada i = 1, . . . , n, fki −→ fi uniformemente em X, onde fk1 , . . . , fkn : X −→ R são
as funções-coordenada da aplicação fk : X −→ Rn e f1 , . . . , fn : X −→ R são as funções-
coordenada de f.
Observação 6.2. Se considerarmos o espaço L(Rm , Rn ) com a norma do sup, uma sequência
de aplicações gk : X −→ L(Rm , Rn ) converge para a aplicação g : X −→ L(Rm , Rn ) uniforme-
mente em X se, e só se, para todo ε > 0 dado, existe k0 ∈ N tal que
k ≥ k0 =⇒ kgk (x) v − g(x) vk ≤ ε kvk ,
para todo x ∈ X e todo v ∈ Rm .
De fato, pela definição da norma do sup, tem-se

kgk (x) − g(x)k ≤ ε ⇐⇒ kgk (x) v − g(x) vk ≤ ε kvk ,
para todo v ∈ Rn .
Definição 6.2. Seja X ⊂ Rm . Dizemos que uma sequência de aplicações fk : X −→ Rn

converge de modo localmente uniforme em X para uma aplicação f : X −→ Rn quando para
todo x ∈ X existe uma bola aberta B de centro x tal que fk −→ f uniformemente em X ∩ B.
Isto equivale a dizer que X está contido numa reunião de abertos U ⊂ Rm tais que fk −→ f
uniformemente em cada U ∩ X.
Observação 6.3. Evidentemente, convergência uniforme =⇒ convergência localmente uni-

forme =⇒ convergência simples (isto é, lim fk (x) = f(x) para todo x ∈ X). As implicações
k→∞
contrárias são falsas.
x
Exemplo 6.1. A sequência de funções fk : R −→ R, dadas por fk (x) = , converge de modo
k
localmente uniforme em R para a função identicamente nula, mas não converge uniformemente
em R.

Análise
Critério de Cauchy: Uma sequência de aplicações fk : X −→ Rn converge uniformemente em X

se, e só se, para todo ε > 0 dado, existe k0 ∈ N tal que
j, k ≥ k0 =⇒ kfk (x) − fj (x)k < ε ,
para todo x ∈ X.
Prova.
Suponhamos que fk −→ f uniformemente em X. Então, dado ε > 0, existe k0 ∈ N tal que
ε
k ≥ k0 =⇒ kfk (x) − f(x)k < ,
2
para todo x ∈ X. Logo, se k, j ≥ k0 , temos que
ε ε
kfk (x) − fj (x)k ≤ kfk (x) − f(x)k + kf(x) − fj (x)k < + = ε,
2 2
para todo x ∈ X.
Reciprocamente, para cada x ∈ X, a sequência de vetores {fk (x)} é de Cauchy e, portanto,

converge para um vetor, que chamaremos de f(x). Isto define uma função f : X −→ R tal que
f(x) = lim fk (x) para todo x ∈ X.
k→∞
Dado ε > 0, existe k0 ∈ N tal que

ε
k, j ≥ k0 =⇒ kfk (x) − fj (x)k < ,
2
ε
para todo x ∈ X. Fixando k ≥ k0 e x ∈ X e fazendo j → ∞, obtemos que kfk (x) − f(x)k ≤ .
2
Logo kfk (x) − f(x)k < ε para todo k ≥ k0 e todo x ∈ X. Ou seja, fk −→ f uniformemente em X.

Como consequência do Critério de Cauchy, obtemos o
X
Teste de Weierstrass: Se, para cada k ∈ N e cada x ∈ X, tem-se kfk (x)k ≤ ck , onde ck
X
é uma série convergente de números reais positivos, então a série fk , cujos termos são as
X
aplicações fk : X −→ Rn , converge uniformemente em X. Além disso, a série fk converge
X
absoluta e uniformemente em X, isto é, a série kfk k converge uniformemente em X.
Teorema 6.1. (da continuidade do limite uniforme)

Seja fk : X −→ Rn uma sequência de aplicações contı́nuas no ponto a ∈ X ⊂ Rm . Se a
sequência fk converge uniformemente em X para a aplicação f : X −→ Rn , então f é contı́nua
no ponto a.
Prova.
ε
k ≥ k0 =⇒ kfk (x) − f(x)k < ,
3

Sequências de aplicações diferenciáveis
para todo x ∈ X.
Como fk0 é contı́nua no ponto a, existe δ > 0 tal que

ε
x ∈ X, kx − ak < δ =⇒ kfk0 (x) − fk0 (a)k < .
3
Logo, se x ∈ X e kx − ak < δ, então
ε ε ε
kf(x) − f(a)k ≤ kf(x) − fk0 (x)k + kfk0 (x) − fk0 (a)k + kfk0 (a) − f(a)k < + + = ε.
3 3 3
Portanto, f é contı́nua no ponto a.
Lema 6.1. Seja U ⊂ Rm um aberto convexo e limitado. Se a sequência de aplicações dife-

renciáveis fk : U −→ Rn converge num ponto c ∈ U e a sequência das aplicações derivadas
fk0 : U −→ L(Rm , Rn ) converge uniformemente em U para uma aplicação g : U −→ L(Rm , Rn ),
então (fk ) converge uniformemente em U para uma aplicação diferenciável f : U −→ Rn , com
f 0 = g.
Prova.
k, j ≥ k0 =⇒ kfj0 (x) − fk0 (x)k < ε 0 (1)

ε ε
para todo x ∈ U, onde ε 0 = min , e M = diam U.
3 2M
Como U é convexo, temos, pelo corolário 5.1, aplicado a fj − fk , que, para quaisquer x, y ∈ U,
j, k ≥ k0 =⇒ k(fj (y) − fk (y)) − (fj (x) − fk (x))k ≤ ε 0 ky − xk . (2)
Tomando x = c, temos que, para todo y ∈ U,

ε
k, j ≥ k0 =⇒ kfj (y) − fk (y)k ≤ kfj (c) − fk (c)k + ky − ck .
2M
Como a sequência (fk (c)) converge, existe k00 ≥ k0 tal que
ε
k, j ≥ k00 =⇒ kfj (c) − fk (c)k < .
2
Logo, para todo y ∈ U,
ε ε
k, j ≥ k00 =⇒ kfj (y) − fk (y)k < + = ε,
2 2
pois ky − xk ≤ M para todos x, y ∈ U. Assim, a sequência (fk ) converge uniformemente para
uma aplicação f : U −→ Rn .
Mostraremos agora que f é diferenciável em todo ponto x0 ∈ U e f 0 (x0 ) = g(x0 ).
De fato, fazendo j −→ ∞ em (2) e tomando y = x0 + v, temos que

k ≥ k0 =⇒ kf(x0 + v) − f(x0 ) − [fk (x0 + v) − fk (x0 )]k ≤ ε 0 kvk . (3)
Como cada fk é diferenciável no ponto x0 , para cada k ∈ N, existe δk (x0 ) > 0 tal que
kvk < δk (x0 ) =⇒ kfk (x0 + v) − fk (x0 ) − fk0 (x0 ) vk < ε 0 kvk . (4)

Análise
Fazendo j → ∞ em (1), obtemos:

k ≥ k0 =⇒ kfk0 (x) − g(x)k ≤ ε 0 , (5)
para todo x ∈ U.
Então, tomando k = k0 e δ = δk0 (x0 ), temos, por (3), (4) e (5), que:
kvk < δ =⇒ kf(x0 + v) − f(x0 ) − g(x0 ) vk
≤ kf(x0 + v) − f(x0 ) − [fk0 (x0 + v) − fk0 (x0 )]k
+kfk0 (x0 + v) − fk0 (x0 ) − fk0 0 (x0 )vk + kfk0 0 (x0 )v − g(x0 )vk
≤ 3ε 0 kvk ≤ εkvk .
Logo f é diferenciável em x0 e f 0 (x0 ) = g(x0 ).
Teorema 6.2. (da derivação termo a termo)

Seja U ⊂ Rm um aberto conexo. Se a sequência de aplicações diferenciáveis fk : U −→ Rn
converge num ponto c ∈ U e a sequência das derivadas fk0 : U −→ L(Rm , Rn ) converge de modo
localmente uniforme para uma aplicação g : U −→ L(Rm , Rn ), então a sequência (fk ) converge
de modo localmente uniforme para uma aplicação f : U −→ Rn diferenciável, com f 0 = g.
Prova.
Como fk0 converge de modo localmente uniforme para g, para todo x ∈ U, existe uma bola
[
aberta Bx ⊂ U tal que fk0 −→ g uniformemente em Bx . Logo U = Bx e, pelo lema 6.1, se (fk )
x∈U
converge em algum ponto de Bx , então (fk ) converge uniformemente em Bx .
Seja A a reunião das bolas Bx nas quais (fk ) converge uniformemente, e B a reunião das bolas
Bx nas quais não há convergência em ponto algum. Como U = A ∪ B é uma cisão de U, U é
conexo e A 6= ∅, pois Bc ⊂ A, temos que U = A, ou seja, (fk ) converge de modo localmente
uniforme em U para uma aplicação f : U −→ Rn . Então, pelo lema 6.1, f é diferenciável e f 0 = g.
Observação 6.4. Mesmo supondo fk0 −→ g uniformemente no aberto conexo U e (fk (c))
convergente para algum c ∈ U, nem sempre é verdadeiro que (fk ) converge uniformemente em
x
U. Por exemplo, seja fk : R −→ R a sequência de funções dadas por fk (x) = .
k
1
Então fk0 ≡ −→ g ≡ 0 uniformemente em R, mas (fk ) não converge uniformemente em R.
k
Mas se existir um número real M > 0 tal que dois pontos quaisquer de U podem ser ligados
por uma poligonal de comprimento ≤ M contida em U, temos (por (2) do lema 6.1) que (fk )
converge uniformemente em U, se (fk0 ) convergir uniformemente em U e (fk (c)) convergir para
algum c ∈ U. Quando U é convexo e limitado isto ocorre.

Aplicações fortemente diferenciáveis
Corolário 6.1. Derivação termo a termo para séries

X
Seja U ⊂ Rm aberto e conexo. Se a série fk , de aplicações diferenciáveis fk : U −→ Rn ,
X
converge num ponto c ∈ U e a série das derivadas fk0 converge de modo localmente uniforme
X X
em U para a soma g = fk0 , então fk converge de modo localmente uniforme em U para
uma aplicação f : U −→ Rn diferenciável, com f 0 = g.
7 Aplicações fortemente diferenciáveis
Existe uma noção de diferenciabilidade, correspondente ao que seria classe C1 , mas onde
se supõe que a aplicação é diferenciável num único ponto. Trata-se da noção de diferenciabili-
dade forte que veremos mais abaixo.
Teorema 7.1. Seja f : U −→ Rn uma aplicação, definida no aberto U ⊂ Rm , diferenciável no

ponto a ∈ U.
(a) Se a transformação linear f 0 (a) : Rm −→ Rn é injetora, então existem c > 0 e δ > 0 tais que
kx − ak < δ =⇒ kf(x) − f(a)k ≥ ckx − ak .
(b) Se f 0 (a) : Rm −→ Rn é sobrejetora, então em qualquer bola de centro a existem pontos x

tais que kf(a)k < kf(x)k e, se f(a) 6= 0, pontos y tais que kf(y)k < kf(a)k.
Prova.
(a) Como a aplicação f 0 (a) : Sm−1 −→ Rn é contı́nua, por ser a restrição de uma aplicação
linear, temos que a função kf 0 (a)k : Sm−1 −→ R é contı́nua. Sendo Sm−1 compacta, existe
v0 ∈ Sm−1 tal que kf 0 (a) vk ≥ kf 0 (a) v0 k para todo v ∈ Sm−1 . Logo 2c = kf 0 (a) v0 k > 0, pois f 0 (a)
é injetora. Além disso, como f é diferenciável no ponto a,
f(x) = f(a) + f 0 (a)(x − a) + R(x) ,
R(x)
com lim = 0. Então, existe δ > 0 tal que
x→a kx − ak
kx − ak < δ =⇒ kR(x)k ≤ ckx − ak .
Logo,
kx − ak < δ =⇒ kf(x) − f(a)k ≥ kf 0 (a)(x − a)k − kR(x)k ≥ 2ckx − ak − ckx − ak = ckx − ak .
(b) Seja Bδ (a) ⊂ U a bola de centro a e raio δ > 0. Suponhamos, por absurdo, que kf(x)k ≤
kf(a)k para todo x ∈ Bδ (a). Então a é um ponto de máximo da função ξ : Bδ (a) −→ R,
ξ(x) = kf(x)k. Além disso, f(a) 6= 0, pois, caso contrário, f(x) = 0 para todo x ∈ Bδ (a) e,

Análise
portanto, f 0 (a) = 0 não seria sobrejetora.

hf 0 (a) v, f(a)i
Como f(a) 6= 0 temos, pelo exemplo 3.1, que ξ é diferenciável em a e ξ 0 (a) v = .
kf(a)k
Logo hf 0 (a) v, f(a)i = 0 para todo v ∈ Rm , pois a é um ponto de máximo.
Em particular, f 0 (a) v 6= f(a) para todo v ∈ Rm , uma contradição, pois f 0 (a) é sobrejetora.
De modo análogo, se f(a) 6= 0 e não existirem pontos y ∈ Bδ (a), para algum δ > 0, com
kf(y)k < kf(a)k, então a seria um mı́nimo para a função ξ(x) = kf(x)k, x ∈ Bδ (a), o que leva a
uma contradição como acima.
Corolário 7.1. Se f : U −→ Rn é diferenciável no ponto a ∈ U ⊂ Rm e f 0 (a) é injetora, então

existe uma bola de centro a tal que:
x ∈ B , x 6= a =⇒ f(x) 6= f(a) .
Observação 7.1. Cabem as perguntas: se f 0 (a) é injetora, existe uma bola B de centro a tal
que f|B é injetora? E se f 0 (a) é sobrejetora, f(a) ∈ int f(U)? A resposta a estas perguntas é
não, sem hipóteses adicionais.
Exemplo 7.1. No caso n = m = 1, f 0 (a) 6= 0 equivale a dizer que f 0 (a) é injetora ou sobreje-
tora.
1 x
Seja f : R −→ R a função dada por f(x) = x2 sen + , se x 6= 0, e f(0) = 0.
x 2
1
Então f é diferenciável em R e f 0 (0) = 6= 0.
2
Mas f não é injetora em intervalo algum da forma (−δ, δ).
De fato, suponhamos que f é injetora em (−δ, δ). Como

f écontı́nua, temos que f é monótona.
1 2 1
Seja k0 ∈ N, tal que < δ. Sendo f(0) = 0 < f = , f é crescente. Logo, para
2π k0 2πk0 2πk0
todo k ≥ k0 par, temos:

2
2 4 1 1
f <f ⇐⇒ + <
(2k + 1) π 2πk ((2k + 1)π)2 (2k + 1)π 2kπ

1 4 1
⇐⇒ +1 <
(2k + 1)π (2k + 1)π 2kπ
4 1
⇐⇒ +1<1+
(2k + 1)π 2k
1 1 1
⇐⇒ 8k < (2k + 1)π ⇐⇒ < + ,
π 4 8k
1 1
e, portanto, ≤ , uma contradição.
π 4

Observação 7.2. Se a função f : I ⊂ R −→ R é contı́nua, derivável no ponto a ∈ I e f 0 (a) > 0,

então existe δ > 0 tal que (a − δ, a + δ) ⊂ I e a − δ < y < a < x < a + δ =⇒ f(y) < f(a) < f(x).
Em particular, f(a) ∈ int f(I). O mesmo terı́amos se f 0 (a) < 0.
O exemplo abaixo exibe uma aplicação f : R2 −→ R2 diferenciável na origem, cuja derivada

f 0 (0) : R2 −→ R2 é a aplicação identidade, mas f não é injetora em vizinhança alguma de 0, nem
f(0) ∈ int f(U), para todo aberto U contendo 0.
Exemplo 7.2. Sejaf : R2 −→ R2 a aplicação dada por

(x, x2 )
se (x, y) ∈ Γ = (x, y) ∈ R2 x > 0 e 0 < y < x2
f(x, y) =
(x, y) se (x, y) 6∈ Γ .
Fig. 3: A parte sombreada transforma-se por f na curva y = x2 , x > 0

Fig. 4: A parte sombreada é a imagem de f
Afirmação: f é descontı́nua nos pontos (x, 0), com x > 0.

1

De fato, seja x > 0 e consideremos a sequência pn = x, . Então existe n0 ∈ N tal que
n
1
< x2 . Logo pn −→ (x, 0), mas f(pn ) não converge para f(x, 0) = (x, 0), pois f(pn ) = (x, x2 )
n0
para todo n ≥ n0 .
É fácil verificar que f é contı́nua nos demais pontos de R2 .
Afirmação: f é diferenciável na origem e f 0 (0, 0) = Id é a transformação identidade.
De fato, para todo v = (x, y) ∈ R2 , f(v) = f(0) + v + r(v), onde r(v) = (0, x2 − y) se x > 0 e
0 < y < x2 , e r(v) = 0 nos demais pontos. Como a primeira coordenada é sempre zero e a
2
segunda está sempre compreendida
entre 0 e x , temos que
= p |r(v)| ≤ p x
r(v) 2

kvk ≤ |x| .
x 2 + y2 x2 + y2

Análise
r(v)
Logo lim = 0. Ou seja, f é diferenciável na origem e f 0 (0) v = v para todo v ∈ R2 .
v→0 kvk
Como em qualquer aberto contendo (0, 0) existe um segmento de reta vertical de extremos
(x, 0) e (x, x2 ), com x > 0, o qual é transformado por f num único ponto (x, x2 ), temos que f
não é injetora em vizinhança alguma de 0. Além disso, como nenhum ponto (x, y), com x > 0
e 0 < y < x2 , pertence à imagem de f, temos que f(0) = 0 não é um ponto interior a f(U) para
todo aberto U ⊂ R2 contendo (0, 0).
Observação 7.3. Podemos modificar um pouco o exemplo acima de modo a obter uma
aplicação contı́nua f : R2 −→ R2 diferenciável na origem, com f 0 (0) = Id, tal que f não é
injetora em nenhuma bola de centro 0 (ver exemplo abaixo).
Mas, com o auxı́lio da Teoria do Grau, é possı́vel mostrar que se f : U −→ Rn é contı́nua no

aberto U ⊂ Rn e possui, no ponto a ∈ U, uma derivada f 0 (a) : Rn −→ Rn que é um isomorfismo,
então f(a) ∈ int f(U). Isto mostra que a descontinuidade da aplicação f do exemplo acima é
essencial para termos f(a) 6∈ int f(U).
Exemplo 7.3. Seja a aplicação f : R2 −→ R2 definida por 

 x2
 4y ,
 0≤y≤
(x, y) 
 4
se (x, y) ∈ R2 − Γ x2 x2
f(x, y) = onde g(x, y) = 4 (x2 − y) , ≤y≤
(x, g(x, y)) 
 3 4 2
se (x, y) ∈ Γ , 
 x2
 2 y + 1 x2 , ≤ y ≤ x2 .
3 3 2
Pode-se provar, com um pouco mais de trabalho que no exemplo anterior, que f é contı́nua
em todos os pontos do plano e que f é diferenciável na origem, com f 0 (0) = Id. Além disso,
f(R2 ) = R2 .
Seja Uum aberto qualquer contendo a origem. Então, para x > 0 suficientemente pequeno,

x2
x, e (x, x2 ) pertencem a U.
4

x2
Logo, como f x, = f(x, x2 ) = (x, x2 ) , temos que f|U não é injetora. Assim, f não é injetora
4
em vizinhança alguma da origem.
Definição 7.1. Dizemos que uma aplicação f : U −→ Rn definida num aberto U ⊂ Rm , é

fortemente diferenciável no ponto a ∈ U quando existe uma transformação linear T : Rm −→ Rn
tal que, para todos x, y ∈ U, vale
f(x) = f(y) + T (x − y) + ρa (x, y) |x − y| ,
onde lim ρa (x, y) = 0.

x,y→a

Observação 7.4. Tomando y = a, obtemos que toda aplicação fortemente diferenciável no

ponto a é diferenciável neste ponto e T = f 0 (a).
Assim, f é fortemente diferenciável no ponto a ∈ U se, e só se, para todo ε > 0 dado, existe
δ > 0 tal que
x, y ∈ Bδ (a) =⇒ |ρa (x, y)| < ε ,
onde ρa (x, y) |x − y| = f(x) − f(y) − f 0 (a)(x − y) .
Observação 7.5. Quando m = n = 1, uma função f : I −→ R, definida no intervalo aberto

I ⊂ R, é fortemente diferenciável no ponto a ∈ I quando, para x 6= y em I, a reta secante ao
gráfico de f que passa pelos pontos (x, f(x)) e (y, f(y)) tende para a reta tangente no ponto
(a, f(a)) quando x → a e y → a.
Na definição usual de derivada, temos apenas que a secante ao gráfico que passa pelos pontos
(a, f(a)) e (x, f(x)) tende à tangente no ponto (a, f(a)) quando x → a.
Observação 7.6. Se f : U −→ Rn é fortemente diferenciável no ponto a, então, para todo

ε > 0 dado, existe δ > 0, tal que
x, y ∈ Bδ (a) =⇒ kf(x) − f(y)k ≤ (kf 0 (a)k + ε) kx − yk .
De fato, dado ε > 0, existe δ > 0 tal que

x, y ∈ Bδ (a) =⇒ kρa (x, y)k < ε
=⇒ kf(x) − f(y)k ≤ kf 0 (a)(x − y)k + kρa (x, y)k kx − yk
≤ (kf 0 (a)k + ε) kx − yk .
Em particular, f é contı́nua, ou melhor, f é Lipschitziana numa bola de centro a.
Teorema 7.2. Se f : U ⊂ Rm −→ Rn é fortemente diferenciável no ponto a e f 0 (a) : Rm −→ Rn

é injetora, então existem c > 0 e δ > 0 tais que
x, y ∈ Bδ (a) =⇒ kf(x) − f(y)k ≥ ckx − yk .
Logo f é um homeomorfismo da bola Bδ (a) sobre sua imagem e, em particular, f é injetora na

bola Bδ (a).
Prova.
Como f 0 (a) é injetora, já sabemos que existe c > 0 tal que kf 0 (a) vk ≥ 2ckvk para todo v ∈ Rm .
Então, para ε = c > 0, existe δ > 0 tal que

x, y ∈ Bδ (a) =⇒ kra (x, y)k < ckx − yk ,
onde ra (x, y) = f(x) − f(y) − f 0 (a) (x − y) .

Análise
Assim,
x, y ∈ Bδ (a) =⇒ kf(x) − f(y)k ≥ kf 0 (a)(x − y)k − kra (x, y)k
≥ 2ckx − yk − ckx − yk
= ckx − yk .
Logo f : Bδ −→ Y = f(Bδ (a)) é uma bijeção e a inversa f−1 : Y −→ Bδ (a) é contı́nua, pois
1
kf−1 (w) − f−1 (z)k ≤ kw − zk para quaisquer z, w ∈ Y. Portanto, f : Bδ (a) −→ Y é um homeo-
c
morfismo.
Observação 7.7. Provaremos na seção 11 (Forma local das submersões) que se f : U ⊂

Rm −→ Rn é fortemente diferenciável no ponto a e f 0 (a) : Rm −→ Rn é sobrejetora, então
f(a) ∈ int f(U).
Teorema 7.3. A aplicação f : U ⊂ Rm −→ Rn é fortemente diferenciável no ponto a ∈ U se,

e só se, é diferenciável no ponto a e, para todo ε > 0, existe δ > 0 tal que o resto ra (x) =
f(x) − f(a) − f 0 (a)(x − a) satisfaz a condição de Lipschitz:
kra (x) − ra (y)k ≤ εkx − yk ,
para todos x, y ∈ Bδ (a).
Prova.
Basta observar que ra (x, y) = ra (x) − ra (y), pois ra (x, y) = f(x) − f(y) − f 0 (a)(x − y),
ra (x) = f(x) − f(a) − f 0 (a)(x − a) e ra (y) = f(y) − f(a) − f 0 (a)(y − a).
O teorema abaixo mostra que a única diferença entre a diferenciabilidade forte e a con-
tinuidade da derivada é que a primeira faz sentido mesmo quando a aplicação é diferenciável
num único ponto
Teorema 7.4. Seja f : U ⊂ Rm −→ Rn uma aplicação diferenciável. Então f é fortemente

diferenciável no ponto a se, e só se, a aplicação derivada f 0 : U −→ L(Rm , Rn ) é contı́nua no
ponto a.
Prova.
Suponhamos que f 0 é contı́nua no ponto a. Seja ra (x) = f(x) − f(a) − f 0 (a)(x − a). Então
ra é diferenciável, com derivada ra0 (x) = f 0 (x) − f 0 (a) contı́nua no ponto a e ra0 (a) = 0.
Logo, para todo ε > 0 dado, existe δ > 0 tal que Bδ (a) ⊂ U e x ∈ Bδ (a) =⇒ kra0 (x)k < ε.
Como Bδ (a) é convexo, temos, pelo corolário 5.1, que se x, y ∈ Bδ (a), então kra (x) − ra (y)k ≤
εkx − yk. Assim, pelo teorema 7.3, f é fortemente diferenciável no ponto a.

Reciprocamente, suponhamos que f é fortemente diferenciável no ponto a.
Somando as igualdades
f(x) − f(y) = f 0 (a)(x − y) + ra (x, y) e f(y) − f(x) = f 0 (x)(y − x) + rx (y) ,
obtemos que
(f 0 (x) − f 0 (a))(y − x) = −(ra (x, y) + rx (y)) . (?)
Dado ε > 0, existe δ > 0 tal que

ε
x, y ∈ B2δ (a) =⇒ kra (x, y)k ≤ kx − yk , (??)
2
e, para todo x ∈ U, existe 0 < δx < δ, tal que
ε
ky − xk < δx =⇒ krx (y)k ≤ ky − xk . (? ? ?)
2
δx
Seja u ∈ Rm um vetor unitário e seja x ∈ U tal que kx − ak < δ. Tome y = x + u.
2
Então ky − ak < 2δ e ky − xk < δx . Logo, por (?), (??) e (? ? ?),
ε ε
k(f 0 (x) − f 0 (a)) (y − x)k ≤ kx − yk + kx − yk .
2 2
δx δx
Assim, k(f 0 (x) − f 0 (a)) uk ≤ ε , ou seja, k(f 0 (x) − f 0 (a)) uk ≤ ε para u ∈ Rm unitário.
2 2
Portanto, kf 0 (x) − f 0 (a)k ≤ ε.
Exemplo 7.4. Daremos agora um exemplo de uma função f : R −→ R fortemente dife-

renciável num ponto a ∈ R que não é diferenciável em vizinhança alguma de a.
Para isso, consideramos a função g : R −→ R de classe C∞ dada por g(x) = x2 e a sequência

1
an = , para todo n ∈ N.
n
Seja f : R −→ R a função definida por:
• f(x) = g(x) para todo x ∈ (−∞, 0] ∪ [a1 , +∞);
• f(an ) = g(an );
a2n − a2n+1
• f|[an+1 ,an ] é linear para todo n ∈ N, ou seja, f(x) = (x − an+1 ) + a2n+1 para todo
an − an+1
x ∈ [an+1 , an ].
Então f não é diferenciável em an para todo n ∈ N, pois

a2n − a2n+1
(x − an+1 + an − an ) + a2n+1 − a2n
f(x) − f(an ) an − an+1 a2 − a2n+1
lim− = lim− = lim− n = an + an+1 ;
x→an x − an x→an x − an x→an an − an+1
a2n−1 − a2n
(x − an ) + a2n − a2n
f(x) − f(an ) an−1 − an
lim = lim+ = an−1 + an ,
x→a+n x − an x→an x − an
e, portanto, f 0 (a− 0 +
n ) = an + an+1 6= an−1 + an = f (an ).

Análise
Mas f é fortemente diferenciável na origem e f 0 (0) = 0.

1 ε 1 1
De fato: Dado ε > 0, existe n0 ∈ N tal que < . Sejam x, y ∈ − , , x < y e
n0 4 n0 n0
ra (x, y) = f(x) − f(y).
• Se x ≤ 0 e y ≤ 0, então
2
|ra (x, y)| = |f(x) − f(y)| = |x2 − y2 | = |x + y| |x − y| ≤ |x − y| < ε |x − y| .
n0
1
h 1 1
i 1 1 1
• Se x ≤ 0 e 0 < y < , existe n ∈ N tal que y ∈ , . Então < ≤ e
n0 n+1 n n+1 n n0
1 1
|ra (x, y)| = |f(x) − f(y)| ≤ f(x) − f + f − f(y)

n+1 n+1

2 1 2 1 1
1

= x − + + y −

n+1 n n+1 n+1

1 1 1 1 1

= x + x − + + y −

n+1 n+1 n n+1 n+1

ε
1 ε 1

< −x + y−
2 n+1 2 n+1
ε ε
= (y − x) = |y − x| < ε |y − x| .
2 2

1 1 1 1
h i
• Se x > 0 e y > 0, existem j, k ∈ N, j ≥ k, tais que x ∈ , ey∈ , .
j+1 j k+1 k
1 1 1 1 1 1
Como < ≤ e < ≤ , temos, no caso j < k, que:
j+1 j n0 k+1 k n0
1 1
1 1

|ra (x, y)| = |f(x) − f(y)| ≤ f(x) − f

+ f − f + f − f(y)

j j k+1 k+1

2
aj − a2j+1
2 2

a − a
(x − aj+1 ) + a2j+1 − a2j + |a2j − a2k+1 | + k
k+1

= (y − ak+1 )
aj − aj+1 ak − ak+1
|a2j − a2j+1 |
= |x − aj | + |aj + ak+1 | |aj − ak+1 | + |ak + ak+1 | |y − ak+1 |
|aj − aj+1 |
= |aj + aj+1 | |x − aj | + |aj + ak+1 | |aj − ak+1 | + |ak + ak+1 | |y − ak+1 |
ε
≤ | (aj − x) + (ak+1 − aj ) + (y − ak+1 )|
2
ε
= (y − x) < ε |y − x| .
2
1 1 1
E quando j = k, ou seja, ≤ x < y ≤ ≤ , temos que:
j+1 j n0
ε
|f(y) − f(x)| = (aj + aj+1 ) (y − x) ≤ (y − x) < ε |y − x| .
2

O teorema da aplicação inversa
8 O teorema da aplicação inversa
Se f : U ⊂ Rn −→ V ⊂ Rn é um difeomorfismo, então sua derivada f 0 (x) : Rn −→ Rn

é um isomorfismo
em todo ponto x ∈ U, ou seja, det Jf(x) 6= 0 para todo x ∈ U, onde Jf(x) =
∂fi
(x) é a matriz Jacobiana de f no ponto x. É natural, então, indagar se a recı́proca é
∂xj ij
válida. Antes de responder a esta pergunta, vamos analisar alguns exemplos.
Exemplo 8.1. Uma função diferenciável f : I −→ J do intervalo aberto I sobre o intervalo

aberto J ⊂ R é um difeomorfismo se, e só se, f 0 (x) 6= 0 para todo x ∈ I.
De fato, se f 0 (x) 6= 0 para todo x ∈ I, então, pelo Teorema de Darboux, temos que ou f 0 (x) > 0
para todo x ∈ I ou f 0 (x) < 0 para todo x ∈ I. No primeiro caso, f é um homeomorfismo crescente,
e, no segundo caso, f é um homeomorfismo decrescente. E, em qualquer caso, pelo Teorema
da Função Inversa para funções reais de uma variável real (ver Curso de Análise, Vol. I de
E. Lima) f−1 : J −→ I é diferenciável. Portanto, para n = 1, a resposta a nossa pergunta é
afirmativa.
Exemplo 8.2. Seja U ⊂ Rn a bola aberta de centro na origem e raio 1. A aplicação g : U −→

x
Rn definida por f(x) = p é um difeomorfismo de classe C∞ , cujo inverso é a aplicação
1 − hx, xi
n y
g : R −→ U dada por g(y) = p .
1 + hy, yi
Exemplo 8.3. Seja f : R2 −→ R2 a aplicação dada por f(x, y) = ex (cos y, sen y), ou, em
termos da variável complexa z = x + iy, f(z) = ez . Então f é de classe C∞ e f 0 (x, y) : R2 −→ R2
é dada por: ! !
ex cos y −ex sen y u
f 0 (x, y)(u, v) = ,
ex sen y ex cos y v
ou seja, f 0 (z) w = ez w é a multiplicação pelo número complexo z
! e , onde w = u + iv. Logo,
ex cos y −ex sen y
det Jf(x, y) = det x x
= e2x 6= 0
e sen y e cos y
para todo (x, y) ∈ R2 .
Mas f não é injetora, pois f(x1 , y1 ) = f(x2 , y2 ) se, e só se, x1 = x2 e y2 = y1 + 2π k , k ∈ Z.
Geometricamente, f transforma cada reta vertical x = a num cı́rculo de raio ea e centro na

origem, e cada reta horizontal y = b numa semi-reta aberta que parte da origem e passa pelo
ponto (cos b, sen b).
Temos, então, que f(R2 ) = R2 − {0}.

Análise
Obteremos, como consequência do Teorema da Aplicação Inversa, que f : R2 −→ R2 − {0} é um

difeomorfismo local.
Definição 8.1. Dizemos que uma aplicação diferenciável f : U −→ Rn , definida no aberto

U ⊂ Rn , é um difeomorfismo local quando para todo x ∈ U existe um aberto Vx , com x ∈ Vx ⊂ U,
tal que a restrição de f a Vx é um difeomorfismo sobre um aberto Wx ⊂ Rn . Se f ∈ Ck , dizemos
que f é um difeomorfismo local de classe Ck . Neste caso, para todo x ∈ U, a aplicação inversa
(f|Vx )−1 : Wx −→ Vx é também de classe Ck pelo corolário 3.4.
Observação 8.1. Se f : U −→ Rn é um difeomorfismo local, então f 0 (x) : Rn −→ Rn é um

isomorfismo para todo x ∈ U. O Teorema da Aplicação Inversa nos dará a recı́proca deste fato,
no caso em que f ∈ Ck (k ≥ 1).
Observação 8.2. Todo difeomorfismo (global) é um difeomorfismo local.

Observação 8.3. f : I −→ R, definida no intervalo aberto I, é um difeomorfismo local se, e só
se, f é um difeomorfismo (global) de f sobre sua imagem J = f(I).
Observação 8.4. Todo difeomorfismo local f : U ⊂ Rn −→ Rn é uma aplicação aberta, isto

é, f(V) é aberto em Rn para todo V ⊂ U aberto em Rn .
De fato, seja V ⊂ U um aberto em Rn . Então, para cada x ∈ V, existe um aberto Vx ⊂ U, x ∈ Vx ,

e um aberto Wx ⊂ Rn tais que f : Vx −→ Wx é um difeomorfismo. Logo f(V ∩ Vx ) é aberto para
[
todo x ∈ V e, portanto, f(V) = f(V ∩ Vx ) é um conjunto aberto de Rn .
x∈V
Em particular, f(U) é um conjunto aberto de Rn .
Observação 8.5. Um difeomorfismo local f : U −→ Rn é um difeomorfismo (global) sobre

sua imagem f(U) = V se, e só se, f é uma aplicação injetora.
De fato, se f é um difeomorfismo local, temos, pela observação acima, que f(U) = V é aberto.
Se, além disso, f : U −→ V é uma bijeção, temos que f−1 : V −→ U é diferenciável, pois f−1
é diferenciável em todos os pontos f(x) ∈ V, uma vez que f−1 |Wx : Wx −→ Vx é diferenciável,
f(x) ∈ Wx e a diferenciabilidade é uma propriedade local.
Para demonstrar o Teorema da Aplicação Inversa utilizaremos o Método das Aproximações

Sucessivas.
Definição 8.2. Seja X ⊂ Rm . Dizemos que uma aplicação f : X −→ Rn é uma contração

quando existem λ ∈ R, 0 ≤ λ < 1, e normas em Rm e Rn ,tais que kf(x) − f(y)k ≤ λ kx − yk para
quaisquer x, y ∈ X.

Observação 8.6. Ao precisarmos especificar a constante λ diremos que f é uma λ−contração.
Observação 8.7. Toda contração é Lipschitziana, e, portanto, uniformemente contı́nua.
Observação 8.8. Seja U ⊂ Rm aberto e convexo. Se f : U −→ Rn é uma aplicação dife-

renciável e kf 0 (x)k ≤ λ < 1 para todo x ∈ U, temos, pelo corolário 5.1, que kf(x) − f(y)k ≤
λkx − yk para quaisquer x, y ∈ U, ou seja, f é uma λ−contração.
Definição 8.3. Um ponto fixo de uma aplicação f : X −→ Rm , X ⊂ Rm , é um ponto x ∈ X tal

que f(x) = x.
Observação 8.9. A busca de uma solução x para uma equação do tipo f(x) = b reduz-se à
procura de um ponto fixo para a aplicação ξ, dada por ξ(x) = f(x) − b + x, pois ξ(x) = x se, e
só se, f(x) = b.
Teorema 8.1. (do ponto fixo para contrações – método das aproximações sucessivas)
Sejam F ⊂ Rm um subconjunto fechado e f : F −→ F uma contração. Então, dado qualquer
x0 ∈ F, a sequência x1 = f(x0 ), x2 = f(x1 ), . . . , xk+1 = f(xk ), . . . converge para um ponto a ∈ F,
que é o único ponto fixo de f.
Prova.
Unicidade: Sejam a, b ∈ F tais que f(a) = a e f(b) = b, e seja 0 ≤ λ < 1 tal que kf(x) − f(y)k ≤
λkx − yk para quaisquer x, y ∈ F. Então
ka − bk = kf(a) − f(b)k ≤ λka − bk ,
ou seja, (1 − λ)ka − bk ≤ 0. Logo a = b, pois 1 − λ > 0 e ka − bk ≥ 0.
Existência: Seja x0 ∈ F e consideremos a sequência {xk } onde xk+1 = f(xk ) para todo k ≥ 0.
Então
kxk+1 − xk k = kf(xk ) − f(xk−1 )k ≤ λkxk − xk−1 k ,
para todo k ≥ 1. Logo, por indução, podemos provar que

kxk+1 − xk k ≤ λk kx1 − x0 k ,
para todo k ≥ 0.
Assim,
X
p−1
X
p−1
λk
kxk+p − xk k ≤ kxk+i+1 − xk+i k ≤ λk+i kx1 − x0 k ≤ kx1 − x0 k ,
1−λ
i=0 i=0
para todos k, p ∈ N.

Análise
Mas, como λk −→ 0, dado ε > 0, existe k0 ∈ N tal que

k ≥ k0 =⇒ kxk+p − xk k < ε ,
para todo p ∈ N. Ou seja, a sequência {xk } é de Cauchy e, portanto, converge para um ponto a,
onde a ∈ F, pois F é fechado.
Além disso, como f é contı́nua, temos que f(a) = lim f(xk ) = lim xk+1 = a, isto é, a é um ponto
k→∞ k→∞
fixo de f.
Exemplo 8.4. O ponto fixo de uma aplicação f : F −→ F pode não existir quando tivermos
apenas kf(x) − f(y)k < kx − yk para quaisquer x, y ∈ F, x 6= y.

1 1 x
p
De fato, seja f : R −→ R a função f(x) = x + 1 + x2 . Como f 0 (x) = 1+ p ,
2 2 1 + x2

x < 1 para todo x ∈ R. Logo |f(x) − f(y)| < |x − y| para

temos que 0 < f 0 (x) < 1, pois p
1 + x2

quaisquer x, y ∈ F, x 6= y, mas f não possui um ponto fixo, pois f(x) > x para todo x ∈ R.
Observação 8.10. Se K ⊂ Rm é compacto e a aplicação f : K −→ K satisfaz a condição

kf(x) − f(y)k < kx − yk para todo par de pontos x 6= y em K, então f possui um único ponto fixo
em K.
Com efeito, seja a ∈ K o ponto onde a função contı́nua ϕ : K −→ R, ϕ(x) = kf(x) − xk, atinge
seu mı́nimo c = kf(a) − ak. Se c 6= 0, ou seja, f(a) 6= a, terı́amos
kf(f(a)) − f(a)k < kf(a) − ak = c ,
uma contradição, pois ϕ(f(a)) seria menor do que o mı́nimo c. Logo f(a) = a, ou seja, a é um
ponto fixo de f.
Suponhamos agora que f(a) = a, f(b) = b e a 6= b. Então ka − bk = kf(a) − f(b)k < ka − bk,
um absurdo. Logo f possui um único ponto fixo.
Para garantir que uma contração f : X −→ Rm possui um ponto fixo, basta encontrar um
subconjunto F ⊂ X fechado em Rm tal que f(F) ⊂ F.
Lema 8.1. Seja f : X −→ Rm uma λ−contração. Se B[a; r] ⊂ X e kf(a) − ak ≤ (1 − λ) r, então

f admite um único ponto fixo em B[a; r].
Prova.
Pelo teorema anterior, basta provar que f(B[a; r]) ⊂ B[a; r], o que ocorre, pois x ∈ B[a; r] =⇒
kx − ak ≤ r =⇒
kf(x) − ak ≤ kf(x) − f(a)k + kf(a) − ak ≤ λkx − ak + (1 − λ)r ≤ λr + (1 − λ)r = r .

Teorema 8.2. (da perturbação da identidade)

Seja ϕ : U −→ Rm uma λ−contração definida no aberto U ⊂ Rm . Então a aplicação f : U −→ Rm
dada por f(x) = x + ϕ(x), é um homeomorfismo de U sobre o conjunto aberto f(U) ⊂ Rm . Além
disso, se U = Rm então f(U) = Rm .
Prova.
Para quaisquer x, y ∈ U, temos
kf(x) − f(y)k = kx − y + ϕ(x) − ϕ(y)k ≥ kx − yk − kϕ(x) − ϕ(y)k
≥ kx − yk − λkx − yk = (1 − λ)kx − yk .
Então f é uma bijeção de U sobre f(U) e a aplicação inversa f−1 : f(U) −→ U satisfaz a condição
de Lipschitz
kf−1 (z) − f−1 (w)k ≤ c kz − wk ,
1
com c = , para todos z, w ∈ f(U). Em particular, f é um homeomorfismo de U sobre f(U).
1−λ
Seja b ∈ f(U). Então existe a ∈ U tal que b = f(a) = ϕ(a) + a.
Afirmação: Existe δ > 0 tal que B(b; δ) ⊂ f(U).
Sejam y ∈ Rm e r > 0 tal que B[a; r] ⊂ U, e consideremos a aplicação ξy : B[a; r] −→ Rm dada

por ξy (x) = y − ϕ(x). Então ξy é uma λ−contração e ξy (x) = x ⇐⇒ y = x + ϕ(x) = f(x).
Sendo ξy (a) − a = y − a − ϕ(a) = y − b, temos que

ky − bk ≤ (1 − λ)r =⇒ kξy (a) − ak ≤ (1 − λ)r ,
Então, pelo lema 8.1, ξy (B[a; r]) ⊂ B[a; r] e portanto, pelo Teorema do Ponto Fixo para Contrações,
existe x ∈ B[a; r] ⊂ U tal que ξy (x) = x, ou seja, existe x ∈ U tal que f(x) = y. Logo,
B[b; (1 − λ)r] ⊂ f(U) e, portanto, b ∈ int f(U). Como b ∈ f(U) é arbitrário, provamos que
f(U) é aberto em Rm .
Finalmente, se U = Rm então B[a; r] ⊂ Rm para todo r > 0. Logo, pelo provado acima,
B[f(a); (1 − λ)r] ⊂ f(U) para todo r > 0.
k
Se tomarmos rk = > 0, k ∈ N, teremos que B[f(a); k] ⊂ f(U) para todo k ∈ N. Assim,
[ 1−λ
Rm = B[f(a); k] ⊂ f(U), ou seja, f(U) = Rm .
k∈N
Corolário 8.1. (Perturbação de um isomorfismo)

Sejam U ⊂ Rm um conjunto aberto e f : U −→ Rm uma aplicação da forma f(x) = Tx + ϕ(x),
onde T : Rm −→ Rm é uma transformação linear invertı́vel e a aplicação ϕ : U −→ Rm satisfaz
kϕ(x) − ϕ(y)k ≤ λkx − yk, com λkT −1 k < 1.

Análise
Então f é um homeomorfismo de U sobre o conjunto aberto f(U) ⊂ Rm . Além disso, se U = Rm ,

tem-se f(U) = Rm .
Prova.
Consideremos as aplicações g : U −→ Rm e ψ : U −→ Rm dadas por
g(x) = (T −1 ◦ f)(x) = x + (T −1 ◦ ϕ)(x) e ψ(x) = (T −1 ◦ ϕ)(x) .
Então ψ é uma µ−contração, com µ = λkT −1 k < 1, pois:

kψ(x) − ψ(y)k = kT −1 (ϕ(x)) − T −1 (ϕ(y))k ≤ kT −1 k kϕ(x) − ϕ(y)k ≤ kT −1 kλkx − yk .
Logo, pelo teorema acima, g = T −1 ◦ f é um homeomorfismo de U sobre o aberto T −1 (f(U))

e T −1 (f(U)) = Rm quando U = Rm . Então, como T : Rm −→ Rm é um homeomorfismo, pois
T é um isomorfismo, temos que f = T ◦ g é um homeomorfismo de U sobre o aberto f(U) e
f(U) = T (T −1 (f(U))) = T (Rm ) = Rm quando U = Rm .
Lema 8.2. (da diferenciabilidade do homeomorfismo inverso)

Seja f : U −→ V um homeomorfismo entre os abertos U, V ⊂ Rm . Se f é diferenciável num ponto
a ∈ U e f 0 (a) : Rm −→ Rm é um isomorfismo, então o homeomorfismo inverso f−1 : V −→ U
é diferenciável no ponto b = f(a). Se f é fortemente diferenciável no ponto a, então f−1 é
fortemente diferenciável no ponto b = f(a).
Prova.
Fazendo g = f−1 e
s(w) = g(b + w) − g(b) − f 0 (a)−1 w , (1)
s(w)
precisamos mostrar que lim = 0.
w→0 kwk
Seja v = g(b + w) − g(b). Então
f(a + v) − f(a) = f(a + g(b + w) − g(b)) − f(a) = f(g(b + w)) − b = b + w − b = w .
Como f e g são contı́nuas, temos que v → 0 se, e só se, w → 0.
Além disso, como f é diferenciável no ponto a,

r(v)
f(a + v) − f(a) = f 0 (a)v + r(v), onde lim = 0. (2)
v→0 kvk
Como v = g(b + w) − g(b) e w = f(a + v) − f(a), temos, por (1) e (2), que
v = (f 0 (a))−1 (f(a + v) − f(a)) + s(w)
= (f 0 (a))−1 (f 0 (a)v + r(v)) + s(w)
= v + (f 0 (a))−1 r(v) + s(w) .
Logo,

s(w) = −(f 0 (a))−1 r(v) , (3)
e
s(w) r(v) kvk
= −(f 0 (a))−1 . (4)
kwk kvk kwk
Pelo Teorema 7.1, existem c > 0 e µ > 0 tais que
kf(a + v) − f(a)k ≥ ckvk ,
para todo v ∈ Rm com kvk < µ. Ou seja,

kvk kvk 1
= ≤ , (5)
kwk kf(a + v) − f(a)k c
quando kvk < µ .
r(v)
Além disso, como lim = 0, dado ε > 0, existe 0 < µ 0 < µ tal que
v→0 kvk
kr(v)k εc
kvk < µ 0 =⇒ ≤ 0
. (6)
kvk k(f (a))−1 k
Por outro lado, como g é contı́nua no ponto b = f(a) e v = g(b + w) − g(b), existe δ > 0 tal que
kwk < δ =⇒ kvk < µ 0 . Logo, por (4), (5), (6),
ks(w)k k(f 0 (a))−1 r(v)k kvk kr(v)k kvk
kwk < δ =⇒ = ≤ k(f 0 (a))−1 k
kwk kvk kwk kvk kwk
εc 1
≤ k(f 0 (a))−1 k = ε.
k(f 0 (a))−1 k c
Logo g = f−1 é diferenciável no ponto b = f(a) e g 0 (b) = (f 0 (a))−1 .
Suponhamos agora que f é fortemente diferenciável no ponto a. Fazendo v = g(b + w) − g(b)

e u = g(b + z) − g(b) temos, por (3), que
s(w) − s(z) = (f 0 (a))−1 [r(u) − r(v)] . (7)
Como f é fortemente diferenciável no ponto a e f 0 (a) : Rm −→ Rm é injetora temos, pelo teorema

7.2, que existem c > 0 e µ > 0 tais que
kuk < µ e kvk < µ =⇒ kf(a + u) − f(a + v)k ≥ cku − vk . (8)
Além disso, dado ε > 0, existe, pelo teorema 7.3, 0 < µ 0 < µ tal que
cε
u, v ∈ B(0; µ 0 ) =⇒ kr(u) − r(v)k ≤ ku − vk . (9)
k(f 0 (a))−1 k
Como g é contı́nua em b e u = g(b + z) − g(b), v = g(b + w) − g(b), existe δ > 0 tal que
kzk < δ , kwk < δ =⇒ kuk < µ 0 , kvk < µ 0 .
Logo, por (7), (9), (8), kwk < δ e kzk < δ =⇒

cε
ks(w) − s(z)k ≤ k(f 0 (a))−1 k kr(u) − r(v)k ≤ k(f 0 (a))−1 k ku − vk
k(f 0 (a))−1 k
cε
≤ kf(a + u) − f(a + v)k = εkz − wk .
c
Finalmente, pelo teorema 7.3, g = f−1 é fortemente diferenciável no ponto b = f(a).

Análise
Teorema 8.3. (da Aplicação Inversa)

Sejam U ⊂ Rm um conjunto aberto e f : U −→ Rm uma aplicação fortemente diferenciável no
ponto a ∈ U tal que f 0 (a) : Rm −→ Rm é um isomorfismo. Então f é um homeomorfismo de um
aberto V contendo a sobre um aberto W contendo f(a), o homeomorfismo inverso f−1 : W −→ V
é fortemente diferenciável no ponto b = f(a) e sua derivada neste ponto é (f 0 (a))−1 . Se f é de
classe Ck , k ≥ 1, então V pode ser tomado de modo que f seja um difeomorfismo de V sobre
W (e pelo corolário 3.4, tem-se que f−1 é, também, de classe Ck ).
Prova.
Seja r(x) = f(x) − f(a) − f 0 (a)(x − a). Como f é fortemente diferenciável no ponto a, temos, pelo
1
teorema 7.3, que dado 0 < λ < , existe δ > 0 tal que
k(f 0 (a))−1 k
x, y ∈ B(a; δ) =⇒ kr(x) − r(y)k ≤ λkx − yk .
Como
• f 0 (a) : Rm −→ Rm é um isomorfismo;
• f(x) = f 0 (a) x + r(x) + f(a) − f 0 (a) · a e kϕ(x) − ϕ(y)k ≤ λkx − yk , para quaisquer
x, y ∈ V = B(a; δ), onde ϕ(x) = r(x) + f(a) − f 0 (a) · a;
• 0 < λ k(f 0 (a))−1 k < 1,
temos, pelo corolário 8.1, que f é um homeomorfismo do aberto V sobre o aberto W = f(V).
Portanto, pelo lema 8.2, a inversa f−1 : W −→ V é fortemente diferenciável no ponto b = f(a).
Suponhamos agora que f é de classe Ck , k ≥ 1, e f 0 (a) : Rm −→ Rm é um isomorfismo. Então,

pelo teorema 7.4, f é fortemente diferenciável no ponto a, e, pelo provado acima, existe δ > 0
tal que f é um homeomorfismo de V = B(a; δ) sobre o aberto W = f(V).
Como a aplicação derivada f 0 : U −→ L(Rm ; Rm ) é contı́nua, o conjunto GL(Rm ) dos isomor-

fismos lineares de Rm é aberto em L(Rm ; Rm ) e f 0 (a) ∈ GL(Rm ), existe 0 < δ 0 < δ tal que
f 0 (x) ∈ GL(Rm ) para todo x ∈ B(a; δ 0 ) = V 0 ⊂ V.
Sendo W 0 = f(V 0 ) aberto em Rm e f : V 0 −→ W 0 um homeomorfismo diferenciável, temos, pelo

lema 8.2, que f−1 : W 0 −→ V 0 é diferenciável em todos os pontos de W 0 .
Logo f : V 0 −→ W 0 é um difeomorfismo.
Corolário 8.2. Uma aplicação f : U ⊂ Rm −→ Rm de classe Ck (1 ≤ k ≤ ∞), definida no

aberto U ⊂ Rm , é um difeomorfismo local se, e só se, para todo x ∈ U, f 0 (x) : Rm −→ Rm é um
isomorfismo (ou seja, det Jf(x) 6= 0).

Aplicação: o Lema de Morse
Corolário 8.3. (Perturbação diferenciável da identidade)

Seja U ⊂ Rm um aberto convexo. Se ϕ : U −→ Rm é de classe C1 , com kϕ 0 (x)k ≤ λ < 1 para
todo x ∈ U, então f : U −→ Rm , dada por f(x) = x + ϕ(x), é um difeomorfismo de U sobre sua
imagem f(U). Se, além disso, U = Rm , então f(U) = Rm .
Prova.
Como U ⊂ Rm é aberto e convexo e kϕ 0 (x)k ≤ λ para todo x ∈ U, temos, pelo corolário
5.1, que ϕ é uma λ−contração. Logo, pelo teorema da perturbação da identidade, f é um
homeomorfismo de U sobre o aberto f(U).
Além disso, como f 0 (x) = Id + ϕ 0 (x) e kϕ 0 (x)k ≤ λ < 1, para todo x ∈ U, temos que f 0 (x) é um
isomorfismo para todo x ∈ U, pois, caso
contrário, existiria v ∈ Rm − {0} tal que ϕ 0 (x) v = −v,
0 v = 1 ≤ kϕ 0 (x)k.
um absurdo, uma vez que ϕ (x) kvk
Portanto, pelo corolário 8.2, f é um difeomorfismo local. Como f : U −→ f(U) é injetora, f é um
difeomorfismo (global).
Exemplo 8.5. Seja f : Rn2 −→ Rn2 a aplicação definida por f(X) = Xk , onde k ∈ N. Então f é
de classe C∞ e
X
k
0
f (X) V = Xi−1 V Xk−i .
i=1
2 2 2
De fato, como f(X) = L(X, . . . , X), onde L : Rn × . . . × Rn −→ Rn é a aplicação k−linear,
não-simétrica dada por L(X1 , . . . , Xk ) = X1 · . . . · Xk , temos, pela observação 8.4 do capı́tulo 3,
que f é de classe C∞ e
(k − 1)! X X
k k
1
0
f (X) V = LS (X, . . . , X, V) = | · .{z
X . . · X} ·V · X
| · .{z
. . · X} = Xi−1 · V · Xk−i .
(k − 1)! (k − 1)!
i=1 i−1 k−i i=1
. . × Rn} é a aplicação de classe C∞ dada

n 2 2 2
Ou ainda, como f = L ◦ h, onde h : Rn −→ R
| × .{z
k
por h(X) = (X, . . . , X), então f é de classe C∞ e, pela Regra da Cadeia e pelo exemplo 2.3,
f 0 (X) · V = L 0 (X, . . . , X) ◦ h 0 (X) · V = L 0 (X, . . . , X) · (V, . . . , V)
Xk X k
= L(X, . . . , X, |{z}
V , X . . . , X) = Xi−1 VXk−i
i=1 i i=1
n2 2
No ponto X = Id, temos f 0 (Id) · V = kV. Logo f 0 (Id) : R −→ Rn é um isomorfismo.
2
Pelo teorema da Aplicação Inversa, existem abertos V, W ⊂ Rn tais que Id ∈ V, f(Id) = Id ∈ W
e f : V −→ W é um difeomorfismo de classe C∞ . Isto é, para todo Y ∈ W, existe uma única
matriz X ∈ V tal que Xk = Y e X (raiz k−ésima de Y) é uma aplicação de classe C∞ de Y.

Análise
9 Aplicação: o Lema de Morse
Como ilustração sobre o emprego do Teorema da Aplicação Inversa, provaremos o Lema

de Morse, segundo o qual, na vizinhança de um ponto crı́tico não-degenerado de uma função f,
é possı́vel tomar um sistema de coordenadas em relação ao qual f se exprime como uma forma
quadrática com coeficientes constantes:
X
f(y) = aij yi yj .
Definição 9.1. Um sistema de coordenadas de classe Ck num aberto U ⊂ Rm é um difeo-

morfismo ξ : V −→ U de classe Ck definido num aberto V ⊂ Rm . As coordenadas de um ponto
p ∈ U no sistema ξ são os números y1 , . . . , yn tais que y = (y1 , . . . , ym ) ∈ V e ξ(y) = p.
Exemplo 9.1. Seja P = {(x, 0) ∈ R2 | x ≥ 0}. Então, no aberto U = R2 − P, podemos introduzir

um sistema de coordenadas ξ : V −→ U de classe C∞ , definido no aberto V = (0, +∞) × (0, 2π)
por ξ(r, θ) = reiθ = (r cos θ, r sen θ).
!
cos θ −r sen θ
De fato, como ξ é injetora, ξ(V) = U e det Jξ(r, θ) = det = r 6= 0, temos,
sen θ r cos θ
pelo Teorema da Aplicação Inversa, que ξ é um difeomorfismo de classe C∞ .
p
Se P = (x, y) = ξ(r, θ) então r = x2 + y2 é a distância de P à origem e θ é o ângulo, em
radianos, que OP faz com o semi-eixo positivo das abscissas. Os números r e θ são chamados
as coordenadas polares do ponto P = (x, y).
Mais geralmente, se P ⊂ R2 é qualquer semi-reta fechada partindo da origem que faz um ângulo
θ0 com o semi-eixo positivo das abscissas, podemos definir um sistema de coordenadas polares
ξ : (0, ∞) × (θ0 , θ0 + 2π) −→ U = R2 − P pela mesma fórmula ξ(r, θ) = reiθ .

Exemplo 9.2. Seja P = (x, 0, z) ∈ R3 | x ≥ 0 e seja V = (0, ∞) × (0, π) × (0, 2π). Então, a
aplicação ξ : V −→ R3 − P definida por
ξ(r, ϕ, θ) = (r sen ϕ cos θ, r sen ϕ sen θ, r cos ϕ) ,
é um sistema de coordenadas de classe C∞ no aberto R3 − P.
De fato, se P = (x, y, z) = ξ(r, ϕ, θ), então r é a distância de P à origem, ϕ é o ângulo que o raio
OP faz com o semi-eixo positivo dos z e θ é o ângulo que (x, y, 0) faz com o semi-eixo positivo
dos x.
Com isto, é fácil verificar que ξ é injetora e ξ(V) = R3 − P. Além disso, como

 
sen ϕ cos θ r cos ϕ cos θ −r sen ϕ sen θ
  2
det Jξ(r, ϕ, θ) = det sen ϕ sen θ r cos ϕ sen θ
 r sen ϕ cos θ = r sen ϕ > 0 ,
cos ϕ −r sen ϕ 0
temos que ξ é um difeomorfismo de classe C∞ .
Se P = (x, y, z) = ξ(r, ϕ, θ), os números r , ϕ , θ são chamados as coordenadas esféricas do

ponto P ∈ R3 − P
Fig. 5: Coordenadas esféricas (r, ϕ, θ) do ponto P = (x, y, z)
Observação 9.1. A introdução de um novo sistema de coordenadas numa região do espaço

euclidiano tem por objetivo simplificar a descrição de certos conjuntos ou funções. Por exemplo,
p
em coordenadas esféricas, a função f(x, y, z) = x2 + y2 + z2 torna-se f ◦ ξ(r, ϕ, θ) = r e a
esfera x2 + y2 + z2 = c2 é descrita pela equação r = c.
O Lema de Morse diz que numa vizinhança de um ponto crı́tico não-degenerado é possı́vel
obter um sistema de coordenadas que simplifica bastante a forma da função.
Lema 9.1. (Lema de Morse)

Seja a um ponto crı́tico não-degenerado de uma função f : U −→ R de classe Ck , k ≥ 3, definida
num aberto U ⊂ Rn . Então existe um sistema de coordenadas ξ : V −→ W de classe Ck−2 , com
a ∈ W ⊂ U, 0 ∈ V e ξ(0) = a, tal que
X
n
f(ξ(y)) − f(a) = aij yi yj ,
i,j=1
1 ∂2 f
para todo y = (y1 , . . . , yn ) ∈ V, onde aij = (a) .
2 ∂xi ∂xj
Prova.
Seja δ > 0 tal que B(a; δ) ⊂ U. Como f é de classe C2 e [a, x] ⊂ U para todo x ∈ B(a; δ),
temos, pela Fórmula de Taylor com resto integral, que

Análise
Z1
x ∈ B(a; δ) =⇒ f(x) = f(a) + (1 − t)d2 f (a + t(x − a))(x − a)2 dt
0
X
n
= f(a) + aij (x)(xi − a)(xj − a) ,
i,j=1
onde, Z1
∂2 f
aij (x) = (1 − t) (a + t(x − a)) dt , i, j = 1, . . . , n.
0 ∂xi ∂xj
∂2 f
Como as funções são de classe Ck−2 , k − 2 ≥ 1, temos, pela Regra de Leibniz, que as
∂xi ∂xj
funções aij : B(a; δ) −→ R são de classe Ck−2 , para todos i, j = 1, . . . , n. E, pelo Teorema de
Schwarz, a matriz A(x) = (aij (x)) é simétrica para todo x ∈ B(a; δ).
Assim, podemos escrever

f(x) = f(a) + hA(x)(x − a), (x − a)i .

1 ∂2 f
Como A0 = A(a) = (a) e a é um ponto crı́tico não-degenerado, temos que A0 é
2 ∂xi ∂xj
uma matriz simétrica invertı́vel.
2
Seja C(x) = A0−1 A(x). Então C : B(a; δ) −→ Rn é de classe Ck−2 , A(x) = A0 C(x) para todo
x ∈ B(a; δ) e C(a) = Id.
2
Pelo exemplo 8.5, existem abertos V1 , V2 ⊂ Rn tais que Id ∈ V1 , Id ∈ V2 e ϕ : V1 −→ V2 ,
ϕ(X) = X2 , é um difeomorfismo de classe C∞ . Como C : B(a; δ) −→ Rn é contı́nua e C(a) = Id,
2
existe 0 < δ 0 < δ tal que C(B(a; δ 0 )) ⊂ V2 .
Logo B = ϕ−1 ◦ C é de classe Ck−2 , B(x)2 = C(x) para todo x ∈ B(a; δ 0 ) e B(a) = Id.
Então, como A(x) = A0 C(x) = A0 B(x)2 e A(x) é simétrica para todo x ∈ B(a; δ), temos, tomando
transpostas, que:
2 2 2
A(x) = A0 B(x)2 = B(x)T A0 =⇒ B(x)2 = A−1
0 B(x)T A0 = A−1 T
0 B(x) A0 .
Como A−1 T
0 B(a) A0 = Id, B(a) = Id e as aplicações
2 2
B : B(a; δ 0 ) −→ Rn e A−1 T 0
0 B(x) A0 : B(a, δ ) −→ R
n
são contı́nuas, existe 0 < δ 00 < δ 0 tal que

x ∈ B(a; δ 00 ) =⇒ A−1 T
0 B(x) A0 ∈ V1 e B(x) ∈ V1 .
Logo B(x) = A0−1 B(x)T A0 para todo x ∈ B(a; δ 00 ), pois ϕ : V1 −→ V2 é um difeomorfismo.
Assim, A0 B(x) = B(x)T A0 e A(x) = A0 B(x)2 = B(x)T A0 B(x) e, portanto,

f(x) − f(a) = hA(x)(x − a), (x − a)i = B(x)T A0 B(x)(x − a), (x − a)
= hA0 B(x)(x − a), B(x)(x − a)i .

Seja ψ : B(a; δ 00 ) −→ Rn a aplicação de classe Ck−2 dada por ψ(x) = B(x)(x − a).
Se φ : L(Rn ; Rn ) × Rn −→ Rn é a aplicação bilinear dada por φ(B, y) = B · y então, pela
Regra da Cadeia, para todo x ∈ B(a; δ 00 ) e v ∈ Rn , temos que
ψ 0 (x) v = φ 0 (B(x), (x − a)) (B 0 (x) v, v)
= φ(B 0 (x) v, (x − a)) + φ(B(x), v)
∂B
= (x)(x − a) + B(x)v .
∂v
Logo, para x = a, ψ 0 (a) · v = B(a) · v = v para todo v ∈ Rn , ou seja, ψ 0 (a) : Rn −→ Rn é a
aplicação identidade.
Então, pelo Teorema da Aplicação Inversa, existe 0 < δ 000 < δ 00 e um aberto V ⊂ Rn tais que
0 = ψ(a) ∈ V e ψ : W −→ V é um difeomorfismo de classe Ck−2 , onde W = B(a; δ 000 ).
Assim, se ξ = ψ−1 : V −→ W, temos que ξ é um sistema de coordenadas de classe Ck−2 no

aberto W tal que ξ(0) = a e
X
n
f(ξ(y)) − f(a) = hA0 y, yi = aij yi yj .
i,j=1
Corolário 9.1. Seja a um ponto crı́tico não-degenerado de uma função f : U −→ R de classe

Ck , k ≥ 3, definida num aberto U ⊂ Rm . Então existe um sistema de coordenadas η : V0 −→ W
de classe Ck−2 , com a ∈ W, 0 ∈ V0 , η(0) = a e
f(η(z)) − f(a) = −z21 − . . . − z2i + z2i+1 + . . . + z2m .
Prova.
1 ∂2 f
Seja A0 = (aij ) a matriz simétrica de entradas aij = (a), dada pelo Lema de Morse.
2 ∂xi ∂xj
Então existe uma base ortonormal {u1 , . . . , um } de Rm tal que A0 uj = λj uj para todo j = 1, . . . , m.
Como A0 é invertı́vel, λj 6= 0 para todo j = 1, . . . , m. Sejam λ1 < 0, . . . , λi < 0 e λi+1 >
0, . . . , λm > 0, os autovalores negativos e positivos de A0 .
uj u
Para j ≤ i, seja vj = p e, para j > i, seja vj = p j .
−λj λj
Então {v1 , . . . , vm } é uma base ortogonal de R
m
tal que

 0 se j 6= k


hA0 vj , vk i = −1 se j = k e j ≤ i



1 se j = k e j > i .
Consideremos agora a transformação linear invertı́vel T : Rm −→ Rm tal que Tej = vj para todo
j = 1, . . . , m. Sendo V0 = T −1 (V), onde V é o aberto que contém a origem obtido no Lema de
Morse, temos que η = ξ ◦ T : V0 −→ W é um difeomorfismo de classe Ck−2 tal que

Análise
f ◦ η(z) − f(a) = (f ◦ ξ)(T (z)) − f(a) = hA0 T (z), T (z)i

X X
* m
! m +
= A0 z j vj , z k vk
j=1 k=1
X
m
= zj zk hA0 vj , vk i
j,k=1
= −z21 − . . . − z2i + z2i+1 + . . . + z2m ,
concluindo a prova do corolário.
Observação 9.2. O número i que aparece no corolário acima chama-se o ı́ndice do ponto
crı́tico a. Quando i = m, a é um ponto de máximo local para f; se i = 0, a é um ponto de mı́nimo
local. Para 0 < i < m, a é um ponto de sela de ı́ndice i.
Observação 9.3. No caso m = 2, seja a ∈ U um ponto crı́tico não-degenerado da função

f : U −→ R de classe Ck , k ≥ 3, definida no aberto U ⊂ R2 . Pelo Lema de Morse, existe um
sistema de coordenadas η : Vo −→ W de classe Ck−2 , com 0 ∈ V0 , a ∈ W ⊂ U, η(0) = a, tal que
f ◦ η(z) − f(a) = ±(z21 + z22 ) ou f ◦ η(z) − f(a) = −z21 + z22 .
Quando a é um ponto de máximo ou de mı́nimo local de f, temos que f ◦ η(z) = f(a) − (z21 + z22 )
e f ◦ η(z) = f(a) + z21 + z22 , respectivamente. Logo as curvas de nı́vel de f próximas de a são
imagens pelo difeomorfismo η dos cı́rculos z21 + z22 = const., tendo, portanto, a forma dada pela
figura 6. E quando a é um ponto de sela, temos que f ◦ η(z) = f(a) − z21 + z22 . Logo, as curvas
de nı́vel de f próximas de a são imagens pelo difeomorfismo η das curvas −y21 + y22 = const.,
tendo a forma dada pela figura 7.
Fig. 6: Curvas de nı́vel de f próximas do ponto crı́tico a Fig. 7: Curvas de nı́vel de f próximas do ponto crı́tico a
Observação 9.4. Os três parágrafos seguintes têm objetivo semelhante ao deste: a partir de
hipóteses sobre a derivada, obter sistemas de coordenadas convenientes, em relação aos quais
a aplicação se exprime por meio de fórmulas simples.

Forma Local das Imersões
10 Forma Local das Imersões
Definição 10.1. Uma imersão do aberto U ⊂ Rm no espaço euclidiano Rn é uma aplicação

diferenciável f : U −→ Rn tal que a derivada f 0 (x) : Rm −→ Rn é uma transformação linear
injetora para todo x ∈ U. Em particular m ≤ n.
Observação 10.1. A composta de duas imersões é uma imersão.
Observação 10.2. Já vimos que a derivada f 0 : U −→ L(Rm ; Rn ) é contı́nua no ponto a se,
e só se, f é fortemente diferenciável no ponto a. E, neste caso, se f 0 (a) : Rm −→ Rn é injetora
então, pelo teorema 7.2, existe δ > 0 tal que f : B(a; δ) −→ f(B(a; δ)) é um homeomorfismo. Em
particular, f|B(a;δ) é injetora.
Exemplo 10.1. Seja f : Rm −→ Rm × Rn a aplicação de inclusão dada por f(x) = (x, 0).
Como f é linear, f 0 (x) = f para todo x ∈ Rm . Logo f é uma imersão C∞ .
Mostraremos que toda imersão de classe Ck , k ≥ 1, coincide localmente, após uma mudança
do sistema de coordenadas, com a imersão f acima.
Exemplo 10.2. Seja I ⊂ R um intervalo aberto. Um caminho diferenciável f : I −→ Rn é uma

imersão se, e só se, seu vetor velocidade f 0 (t) 6= 0 para todo t ∈ I.
Então, para todo t ∈ I, L = {f(t) + sf 0 (t) | s ∈ R} é uma reta tan-

gente à imagem f(I) no ponto f(t). Como uma imersão pode não
ser injetora, então, quando f(t1 ) = f(t2 ), as duas retas tangentes
L1 = {f(t1 ) + sf 0 (t1 ) | s ∈ R} e L2 = {f(t2 ) + sf 0 (t2 ) | s ∈ R} podem
(ou não) ser distintas.
Mas, pelo teorema 7.1, existe δ > 0 tal que f(t) 6= f(t1 ) para todo
t ∈ J = (t1 − δ, t1 + δ) ⊂ I, t 6= t1 . Assim, L1 é a única reta
Fig. 8: Retas L1 e L2 tangentes à curva f
tangente no ponto f(t1 ) para o caminho f|J .
Por exemplo, f : R −→ R2 , f(t) = (t3 − t, t2 ), é uma imersão de classe C∞ da reta no plano tal
que f(1) = f(−1) = (0, 1). Como f 0 (1) = (2, 2) e f 0 (−1) = (2, −2), temos que
L1 = {(0, 1) + s(1, 1) | s ∈ R} 6= L2 = {(0, 1) + s(1, −1) | s ∈ R} .
Exemplo 10.3. Seja o caminho g : R −→ R2 de classe C∞ dado por g(t) = (t−sen t, 1−cos t).
Como g 0 (t) = (1 − cos t, sen t), temos que g não é imersão, pois g 0 (t) = 0 para t = 2πk, k ∈ Z.

Análise
Fig. 9: Ciclóide
A imagem deste caminho é a curva chamada ciclóide. Ela possui uma infinidade de pontos
angulares (cúspides), nos quais o vetor velocidade é igual a zero.
Observação 10.3. Nem sempre podemos identificar os pontos onde a derivada de uma
aplicação não é injetora pela forma geométrica de sua imagem. Por exemplo, a imagem do
caminho f : R −→ R2 , f(t) = (t3 , t3 ), é uma reta. Para t = 0, o vetor velocidade f 0 (0) = (0, 0), o
que não se deve ao aspecto de f(R), mas à maneira como a reta está parametrizada por f.
Teorema 10.1. (Forma Local das Imersões)

Sejam U ⊂ Rm um aberto e f : U −→ Rm+n uma aplicação fortemente diferenciável no ponto
a ∈ U. Se a derivada f 0 (a) : Rm −→ Rm+n é injetora, existe um homeomorfismo h : Z −→ V ×W,
fortemente diferenciável no ponto f(a), de um aberto Z em Rm+n que contém f(a) sobre um
aberto V × W em Rm × Rn que contém (a, 0), tal que
h ◦ f(x) = (x, 0) ,
para todo x ∈ V e h.
Se f é de classe Ck , k ≥ 1, é possı́vel restringir V, W e Z, se necessário, de modo que h seja

um difeomorfismo de classe Ck .
Fig. 10: Representação esquemática do Teorema da Forma Local das Imersões

Prova.
Seja E = f 0 (a)(Rm ). Como f 0 (a) é injetora, dim E = m. Sejam {w1 , . . . , wm } uma base de E,
v1 , . . . , vn vetores linearmente independentes tais que {w1 , . . . , wm , v1 , . . . , vn } é uma base de
Rm+n e F o subespaço gerado pelos vetores v1 , . . . , vn . Então Rm+n = E ⊕ F.
Seja ϕ : U × Rn −→ Rm+n a aplicação definida por

X
n
ϕ(x, y) = f(x) + yi vi ,
i=1
onde y = (y1 , . . . , yn ). Então, se v ∈ R e w = (β1 , . . . , βn ) ∈ Rn ,

m
Xn
0 0
ϕ (a, 0)(v, w) = f (a) v + β i vi . (1)
i=1
Afirmação: ϕ é fortemente diferenciável no ponto (a, 0).
De fato,
X
n
ϕ(x, y) = f(x) + yi vi = ϕ(a, 0) + ϕ 0 (a, 0) · (x − a, y) + rϕ
(a,0) (x, y)
i=1
X
n
= f(a) + f 0 (a) (x − a) + yi vi + rϕ
(a,0) (x, y)
i=1
=⇒ rϕ
(a,0) (x, y) = f(x) − f(a) − f 0 (a) (x − a) = rfa (x) .
Como f é fortemente diferenciável no ponto a, dado ε > 0, existe δ > 0 tal que
x, x 0 ∈ B(a; δ) ⊂ Rm =⇒ krfa (x) − rfa (x 0 )k ≤ εkx − x 0 kS .
Então,
(x, y), (x 0 , y 0 ) ∈ B(a; δ) × Rn =⇒ krϕ ϕ 0 0 f 0 f 0
(a,0) (x, y) − r(a,0) (x , y )k = kra (x ) − ra (x)k ≤ εkx − x kS
≤ ε (kx 0 − xkS + ky 0 − ykS )
= ε k(x, y) − (x 0 , y 0 )kS .
Logo ϕ é fortemente diferenciável no ponto (a, 0), concluindo a prova da afirmação.
Além disso, como f 0 (a) : Rm −→ Rm+n é injetora e Rm+n = f 0 (a)(Rm ) ⊕ F, temos, por (1), que
ϕ 0 (a, 0) : Rm+n −→ Rm+n é um isomorfismo.
Pelo Teorema da Aplicação Inversa, existem um aberto contendo (a, 0), o qual podemos supor
da forma V × W, onde 0 ∈ W ⊂ Rn e a ∈ V ⊂ U, e um aberto Z ⊂ Rm+n , com f(a) ∈ Z, tais que
ϕ : V × W −→ Z é um homeomorfismo e h = ϕ−1 : Z −→ V × W é fortemente diferenciável no
ponto f(a). Como ϕ(x, 0) = f(x), temos que hf(x) = hϕ(x, 0) = (x, 0) para todo x ∈ V.
Quando f é de classe Ck , k ≥ 1, então ϕ também é de classe Ck . Pelo Teorema da Aplicação

Inversa, V, W e Z podem ser tomados de modo que ϕ : V × W −→ Z seja um difeomorfismo de
classe Ck , cujo inverso h é também de classe Ck .

Análise
Exemplo 10.4. Seja f : U ⊂ R2 −→ R3 , f = (f1 , f2 , f3 ) uma aplicação de classe Ck , k ≥ 1, tal

que f 0 (a) : R2 −→ R3 é injetora no ponto a = (a1 , a2 ) ∈ U, ou seja, a matriz Jacobiana de f no
ponto a,
∂f1 ∂f1
 
(a) (a)
 ∂x ∂y 
 ∂f2 ∂f2 
 ∂x (a)
Jf(a) = 
∂y
(a),
 ∂f ∂f3 
3
(a) (a)
∂x ∂y
tem posto 2.
Então Jf(a) possui um menor de ordem 2 não-nulo.
Se, por exemplo,  

∂f1 ∂f1
 ∂x (a) ∂y
(a)
det  ∂f
2 ∂f2  6= 0 ,
(a) (a)
∂x ∂y
então {f 0 (a)e1 , f 0 (a)e2 , e3 }, onde e3 = (0, 0, 1), é uma base de R3 . Nesse caso, deinimos
ϕ : U × R −→ R3 por ϕ(x, y, z) = (f1 (x, y), f2 (x, y), f3 (x, y) + z) .
Observe que
∂f1 ∂f1
 
(a) (a) 0 
∂f1 ∂f1

 ∂x ∂y
 ∂x (a) (a)

 ∂f2 ∂f2  ∂y
 ∂x (a)
det Jϕ(a, 0) = det  (a) 0 = det  ∂f2 ∂f2  6= 0 .
 ∂f ∂y 
(a) (a)
3 ∂f3 
∂x ∂y
(a) (a) 1
∂x ∂y
Pela forma local das imersões, existem abertos V ⊂ R2 , I ⊂ R, Z ⊂ R3 tais que a ∈ V, 0 ∈ I,
f(a) ∈ Z, ϕ : V × I −→ Z é um difeomorfismo de classe Ck e h ◦ f(x, y) = (x, y, 0) para todo
x, y ∈ V, onde h = ϕ−1 : Z −→ V × I é também de classe Ck .
Corolário 10.1. Seja f : U −→ Rm+n definida no aberto U ⊂ Rm , fortemente diferenciável no

ponto a ∈ U, com f 0 (a) : Rm −→ Rm+n injetora. Então, existe um aberto V, com a ∈ V ⊂ U,
tal que f : V −→ f(V) é um homeomorfismo e o homeomorfismo inverso f−1 : f(V) −→ V é a
restrição de uma aplicação contı́nua ξ : Z −→ V definida num aberto Z em Rm+n , f(V) ⊂ Z,
fortemente diferenciável no ponto f(a). Se f é de classe Ck , k ≥ 1, então ξ pode ser tomada de
classe Ck .
Prova.
Seja h : Z −→ V × W a aplicação obtida no teorema acima. Então f(V) ⊂ Z. Seja ξ : Z −→ V a
aplicação definida por ξ(z) = π ◦ h(z), onde π : V × W −→ V, π(x, y) = x, é a projeção sobre a
primeira coordenada.

Então ξ é contı́nua, pois h é contı́nua e π é de classe C∞ . Além disso, ξ é fortemente dife-

renciável no ponto f(a).
De fato,
ξ(f(a)) = π ◦ h(f(a)) = a, ξ 0 (f(a))(w) = π 0 (h(f(a))) ◦ h 0 (f(a))(w) = π(h 0 (f(a))(w)) ,
e, portanto,
ξ(z) = π(h(z)) = ξ(f(a)) + ξ 0 (f(a)) (z − f(a)) + rξf(a) (z)
= π(h(f(a))) + π(h 0 (f(a))(z − f(a))) + rξf(a) (z) .
Então rξf(a) (z) = π(rhf(a) (z)). Como h é fortemente diferenciável em f(a), dado ε > 0, existe δ > 0
tal que
z, w ∈ B(f(a); δ) =⇒ krhf(a) (z) − rhf(a) (w)kS ≤ εkz − wk .
Logo, como
kπk = sup {kπ(x, y)kS | k(x, y)kS = 1} = sup {kxkS | kxkS + kykS = 1} = 1 ,
temos que
z, w ∈ B(f(a); δ) =⇒ krξf(a) (z) − rξf(a) (w)kS = kπ(rhf(a) (z) − rhf(a) (w))kS
≤ krhf(a) (z) − rhf(a) (w)kS
≤ εkz − wk .
Portanto ξ é fortemente diferenciável no ponto f(a).
Se f é de classe Ck , temos, pelo teorema acima, que h é de classe Ck . Logo ξ = π ◦ h é de

classe Ck .
Como ξf(x) = πh(f(x)) = π(x, 0) = x para todo x ∈ V, temos que f : V −→ f(V) é uma bijeção
e ξ|f(V) = f−1 : f(V) −→ V.
Então f : V −→ f(V) é um homeomorfismo, pois, pela observação 7.6, podemos tomar V ⊂ Rm ,

a ∈ V, de modo que f : V −→ f(V) seja contı́nua, uma vez que f é fortemente diferenciável em
a.
Observação 10.4. Como consequência deste corolário, temos que se f é de classe Ck ,

k ≥ 1, e f 0 (a) : Rm −→ Rm+n é injetora, então f 0 (x) : Rm −→ Rm+n é injetora para todo x
num aberto V de Rm que contém a.
De fato, como ξ ◦ f(x) = x para todo x ∈ V, temos que ξ 0 (f(x)) ◦ f 0 (x) = Id : Rm −→ Rm . Logo
f 0 (x) é injetora para todo x ∈ V.
Este resultado pode ser provado diretamente.

Análise
De fato, seja T : Rm −→ Rm+n uma transformação linear injetora.
Então a matriz A = (aij ) de T em relação às bases canônicas de Rm e Rm+n tem m colunas
linearmente independentes e, portanto, m linhas linearmente independentes, pois posto-linha
de uma matriz = posto-coluna da matriz.
Sejam Ai1 = (ai1 1 , . . . , ai1 m ), . . . , Aim = (aim 1 , . . . , aim m ) os m vetores-linha de A linearmente

independentes, i1 , . . . , im ∈ {1, . . . , m + n}.
Como Aik ∈ Rm para todo k = 1, . . . , m, {Ai1 , . . . , Aim } é uma base de Rm e, portanto, o deter-
minante da matriz m × m cujas linhas são Ai1 , . . . , Aim é diferente de zero.
Sendo a aplicação ϕ : L(Rm ; Rm+n ) −→ R, que associa a cada transformação linear S o deter-
minante da matriz m×m cujas linhas são as linhas i1 , . . . , im da matriz de S em relação às bases
canônicas de Rm e Rm+n , é contı́nua e ϕ(T ) 6= 0, existe ε > 0 tal que kS − T k < ε =⇒ ϕ(S) 6= 0.
Além disso, como f 0 : U −→ L(Rm ; Rm+n ) é contı́nua, tomando T = f 0 (a), existe δ > 0 tal que
kx − ak < δ =⇒ kf 0 (x) − f 0 (a)k < ε .
Logo ϕ(f 0 (x)) 6= 0 para todo x ∈ B(a; δ), ou seja, f 0 (x) tem posto m e, portanto, é injetora para
todo x ∈ B(a; δ).
11 Forma Local das Submersões
Definição 11.1. Uma aplicação diferenciável f : U −→ Rn definida num aberto U ⊂ Rm , é

uma submersão quando f 0 (x) : Rm −→ Rn é uma transformação linear sobrejetora para todo
x ∈ U. Em particular, m ≥ n.
Observação 11.1. Como um funcional linear é sobrejetivo ou nulo, temos que uma função
diferenciável f : U ⊂ Rm −→ R é uma submersão se, e só se, df(x) 6= 0 para todo x ∈ U, ou
seja, se, e só se, grad f(x) 6= 0 para todo x ∈ U.
Observação 11.2. A composta de duas submersões é uma submersão.
Definição 11.2. Uma decomposição em soma direta do tipo Rm+n = Rm n

I ⊕ RJ significa que
se fez uma partição {1, . . . , m + n} = I ∪ J, onde I = {i1 , . . . , im } e J = {j1 , . . . , jn } são disjuntos.
Dada a partição, consideramos Rm

I ⊂ R
m+n
como o subespaço gerado por {ei1 , . . . , eim } e
RnJ ⊂ Rm+n como o subespaço gerado por {ej1 , . . . , ejn }.

Forma Local das Submersões
Então todo vetor z ∈ Rm+n se escreve, de modo único, como z = x + y, onde x ∈ Rm n

I e y ∈ RJ .
Assim, Rm+n = Rm n m n
I ⊕ RJ é a soma direta dos subespaços RI e RJ .
Uma vez dada a decomposição em soma direta Rm+n = Rm n

I ⊕ RJ , escrevemos os elementos de
Rm+n como pares z = (x, y), onde x ∈ Rm n
I e y ∈ RJ .
Por exemplo, seja R3 = R2I ⊕ RJ , onde I = {1, 3} e J = {2}, ou seja, R2I é gerado por {e1 , e3 } e RJ é
gerado por {e2 }. Então todo z = (z1 , z2 , z3 ) ∈ R3 se escreve como z = (x, y), onde x = (z1 , 0, z3 )
e y = (0, z2 , 0).
Observação 11.3. Dada uma transformação linear sobrejetora T : Rm+n −→ Rn , existe uma
I ⊕ RJ tal que a restrição T |RJ : RJ −→ R é
decomposição em soma direta do tipo Rm+n = Rm n n
n n
um isomorfismo.
De fato, como os vetores {Te1 , . . . , Tem+n } geram Rn , existe J = {j1 , . . . , jn } ⊂ {1, . . . , m + n} tal
que {Tej1 , . . . , Tejn } é uma base de Rn .
Se I = {i1 , . . . , im } é o conjunto dos ı́ndices restantes, a partição {1, . . . , m + n} = I ∪ J fornece a

decomposição em soma direta Rm+n = Rm n
I ⊕ RJ .
Então T |RnJ : RnJ −→ Rn é um isomorfismo, pois transforma a base {ej1 , . . . , ejn } de RnJ na base
{Tej1 , . . . , Tejn } de Rn .
Seja A = (aij ) a matriz n × (m + n) da transformação linear T em relação às bases canônicas

de Rm+n e Rn .
Então T |RnJ é um isomorfismo se, e só se, a submatriz n × n da matriz A cujas colunas são as n
colunas da matriz A cujos ı́ndices pertencem ao conjunto J tem determinante diferente de zero.
Exemplo 11.1. Dada uma decomposição em soma direta do tipo Rm+n = Rm n

I ⊕ RJ , seja
f : Rm+n −→ Rn a projeção sobre a segunda coordenada, ou seja, f(x, y) = y = (yj1 , . . . , yjn ).
Como f é linear, temos f 0 (x, y) = f para todo z = (x, y) ∈ Rm+n . Logo f é uma submersão e a
matriz Jacobiana de f tem como linhas os vetores ej1 , . . . , ejn da base canônica de Rm+n .
Definição 11.3. Seja f : U −→ Rn definida no aberto U ⊂ Rm e seja E ⊂ Rm um subespaço

vetorial. Dizemos que f é diferenciável ao longo de E no ponto a quando existe uma transformação
linear ∂E f(a) : E −→ Rn , chamada a derivada de f ao longo de E no ponto a, tal que
v ∈ E , a + v ∈ U =⇒ f(a + v) = f(a) + ∂E f(a) · v + r(v) ,
r(v)
com lim = 0.
v→0 kvk
v∈E

Análise
Observação 11.4. Se f é diferenciável no ponto a, então f é diferenciável neste ponto ao

longo de qualquer subespaço E ⊂ Rm com ∂E f(a) = f 0 (a)|E .
Definição 11.4. Dadas uma decomposição em soma direta do tipo Rm+n = Rm n

I ⊕ RJ e uma
aplicação f : U −→ Rp definida no aberto U ⊂ Rm+n , a derivada de f no ponto a ao longo de
Rm n
I , caso exista, é indicada por ∂1 f(a) e a derivada de f no ponto a ao longo de RJ , caso exista,
é representada por ∂2 f(a). Estas são as derivadas parciais de f no ponto a relativamente à
decomposição Rm+n = Rm n
I ⊕ RJ .
Observação 11.5. Se f : U −→ Rp é diferenciável no ponto a, então ∂1 f(a) = f 0 (a)|RmI ,

∂2 f(a) = f 0 (a)|RnJ e, para qualquer u = (v, w) ∈ Rm n
I ⊕ RJ ,
f 0 (a)u = f 0 (a)(v + w) = f 0 (a) v + f 0 (a) w = ∂1 f(a)v + ∂2 f(a)w .
Observação 11.6. Mesmo no caso da decomposição usual R2 = R ⊕ R, uma função

f : U ⊂ R2 −→ R pode ser diferenciável ao longo de cada um dos subespaços R sem ser
diferenciável em R2 .
O teorema abaixo diz que, dada uma submersão f de classe C1 , é possı́vel obter novas
coordenadas em torno de cada ponto do seu domı́nio de modo que f seja a projeção sobre
as n últimas coordenadas, ou seja, o exemplo 11.1 é, localmente, o caso mais geral de uma
submersão.
Teorema 11.1. (Forma Local das Submersões)

Seja f : U −→ Rn uma aplicação definida no aberto U ⊂ Rm+n e fortemente diferenciável no
ponto a ∈ U. Se f 0 (a) : Rm+n −→ Rn é sobrejetora ou, mais precisamente, se é dada uma
decomposição em soma direta do tipo Rm+n = Rm n
I ⊕ RJ tal que a = a1 + a2 = (a1 , a2 ) e a
derivada parcial ∂2 f(a) = f 0 (a)|RnJ : RnJ −→ Rn é um isomorfismo, então existem abertos V, W e
Z, com a ∈ Z ⊂ U ⊂ Rm+n , a
f1 ∈ V ⊂ Rm , f(a) ∈ W ⊂ Rn e um homeomorfismo h : V × W −→ Z
fortemente diferenciável no ponto (f
a1 , f(a)) tal que
f ◦ h(e
x, w) = w ,
f1 = (ai1 , . . . , aim ). Se f é de classe Ck , k ≥ 1, podemos

x, w) ∈ V × W, onde a
para todo (e
restringir V, W e Z, se necessário, de modo que h seja um difeomorfismo de classe Ck .
Prova.
Seja c = f(a) e consideremos a função ϕ : U −→ Rm × Rn definida por
x, f(x, y)) = ((zi1 , . . . , zim ), f(x, y)) ,
ϕ(x, y) = (e
onde z = x + y. Então,

X
m
0 0
ϕ (a)(v, w) = (e v, ∂1 f(a)v + ∂2 f(a)w) , onde v =
v, f (a)(v, w)) = (e vek eik e e
v = (ve1 , . . . , vf
m ).
k=1
Fig. 11: Representação esquemática do teorema da forma local das submersões
Afirmação: ϕ é fortemente diferenciável no ponto a = (a1 , a2 ) = a1 + a2 .
De fato, como
ϕ(x, y) = (e a1 , f(a)) + ((e
x, f(x, y)) = (f f1 ), f 0 (a)(x + y − (a1 + a2 ))) + rϕ
x−a a (x, y) ,
temos que
rϕ f
a (x, y) = (0, ra (x + y)) .
Como f é fortemente diferenciável no ponto a = a1 + a2 , dado ε > 0, existe δ > 0 tal que
z = x + y , z 0 = x 0 + y 0 ∈ B(a; δ) =⇒ krfa (x + y) − rfa (x 0 + y 0 )kS ≤ εkx + y − (x 0 + y 0 )k

= εkz − z 0 k
0 0 0 0
=⇒ krϕ ϕ f f
a (x, y) − ra (x , y )kS = k(0, ra (x + y) − ra (x + y ))kS
= krfa (z) − rfa (z 0 )kS ≤ εkz − z 0 k .

Logo ϕ é fortemente diferenciável no ponto a = (a1 , a2 ).
Além disso, ϕ 0 (a) : Rm+n −→ Rm × Rn é um isomorfismo, pois dado (e

v, z) ∈ Rm × Rn e,
considerando os vetores
Xm
v= vek eik ∈ Rm
I e w = (∂2 f(a))−1 (z − ∂1 f(a)v) ∈ RnJ ,
k=1

Análise
temos, para u = (v, w) = v + w, que:

ϕ 0 (a)u = (e
v, ∂1 f(a)v + ∂2 f(a)w) = (e
v, ∂1 f(a)v + z − ∂1 f(a)v) = (e
v, z) .
Logo ϕ 0 (a) : Rm+n −→ Rm × Rn é sobrejetora e, portanto, um isomorfismo.
Pelo Teorema da Aplicação Inversa, ϕ é um homeomorfismo, com inverso h fortemente

diferenciável no ponto ϕ(a) = (f a1 , c), de um aberto Z ⊂ Rm+n contendo a sobre um
a1 , f(a)) = (f
a1 , c), o qual pode ser tomado da forma V × W, com V aberto em Rm , a
aberto contendo (f f1 ∈ V,
e W aberto em Rn , c ∈ W.
Então
h(e
x, w) = h1 (e
x, w) + h2 (e
x, w) = (h1 (e x, w)) ,
x, w), h2 (e
onde h1 : V × W −→ Rm n
I e h2 : V × W −→ RJ .
X
m
Como (e
x, w) = ϕh(e
x, w) = ϕ(h1 (e x, w)) , temos que h1 (e
x, w) + h2 (e x, w) = x k ei k e
k=1
f(h(e x, w) ∈ V × W, onde e
x, w)) = w para todo (e x = (x1 , . . . , xm ).
Se f é de classe Ck , então ϕ é de classe Ck . Pelo Teorema da Aplicação Inversa, V, W e

Z podem ser tomados de modo que ϕ seja um difeomorfismo de classe Ck de Z sobre V × W
e, portanto, seu inverso h também é de classe Ck .
Corolário 11.1. Seja f : U −→ Rn uma aplicação definida no aberto U ⊂ Rm+n , fortemente

diferenciável no ponto a ∈ U. Se f 0 (a) : Rm+n −→ Rn é sobrejetora, então existe um aberto Z
contendo a em Rm+n tal que f|Z é uma aplicação aberta, ou seja, para todo A ⊂ Z aberto, f(A)
é aberto em Rn . Em particular, f(a) ∈ int f(U).
Prova.
Seja h : V × W −→ Z o homeomorfismo dado pelo teorema acima, e seja A ⊂ Z um con-
junto aberto. Então
f(A) = f ◦ h ◦ h−1 (A) = π ◦ h−1 (A) .
Como h é contı́nua, h−1 (A) é um conjunto aberto e, portanto, π(h−1 (A)) é aberto, pois a projeção
π : V × W −→ W é uma aplicação aberta.
Logo f(A) é aberto para todo aberto A ⊂ Z.
Corolário 11.2. Toda submersão de classe Ck , k ≥ 1, é uma aplicação aberta.

Observação 11.7. Na decomposição Rm+n = Rm n n
I ⊕ RJ , RJ é o subespaço de R
m+n
gerado
pelos vetores ej , j ∈ J = {j1 , . . . , jn } da base canônica de Rm+n . Então a derivada parcial
∂2 f(a) : RnJ −→ Rn é um isomorfismo se, e só se, a matriz


∂fi
(a) , i ∈ {1, . . . , n}, j ∈ {j1 , . . . , jn } ,
∂xj n×n
obtida da matriz Jacobiana de f no ponto a escolhendo as n colunas cujos ı́ndices pertencem a

J, tem determinante diferente de zero.
Observação 11.8. Se f : U ⊂ Rm+n −→ Rn é de classe Ck e f 0 (a) : Rm+n −→ Rn é sobre-

jetora para algum a ∈ U, então f 0 (z) : Rm+n −→ Rn é sobrejetora para todo z num aberto Z
contendo a.
De fato, seja h : V × W −→ Z o difeomorfismo de classe Ck dado pela forma local das sub-
mersões. Como f ◦ h = π, temos, pela Regra da Cadeia, que para todo (x, w) ∈ V × W,
f 0 (h(x, w)) h 0 (x, w) = π 0 (x, w) = π .
Logo f 0 (z) é sobrejetora para todo z ∈ Z, pois Z = h(V × W) e π é uma transformação linear
sobrejetora.
Este resultado também pode ser provado diretamente como no caso das imersões, pois
f 0 (a) : Rm+n −→ Rn é sobrejetora se, e só se, a matriz Jacobiana Jf(a) tem um menor de
ordem n com determinante 6= 0 (ver observação 10.4).
Teorema 11.2. (Teorema da Aplicação Implı́cita)

Seja f : U −→ Rn uma aplicação definida no aberto U ⊂ Rm+n , fortemente diferenciável no
ponto a ∈ U, com f(a) = c. Se f 0 (a) : Rm+n −→ Rn é sobrejetora ou, mais precisamente,
se Rm+n = Rm n
I ⊕ RJ é uma decomposição em soma direta tal que a = (a1 , a2 ) e a derivada
∂2 f(a) : RnJ −→ Rn é um isomorfismo, então existem abertos V ⊂ Rm contendo a
f1 e Z ⊂ U ⊂
Rm+n contendo a, com a seguinte propriedade: para cada e x) ∈ RnJ tal que
x ∈ V há um único ξ(e
X
m
x)) ∈ Z e f(x, ξ(e
(x, ξ(e x)) = c, onde e
x = (x1 , . . . , xm ) e x = xk eik .
i=1
A aplicação ξ : V −→ RnJ assim definida é fortemente diferenciável no ponto a

f1 e sua derivada
neste ponto é
ξ 0 (f v = −(∂2 f(a))−1 ◦ (∂1 f(a)) · v ,
a1 ) · e
X
m
m
v = (v1 , v2 , . . . , vm ) ∈ R , onde v =
para todo e vk e i k .
k=1
Se f é de classe Ck , k ≥ 1, então ξ é de classe Ck e sua derivada num ponto qualquer e

x ∈ V é
ξ 0 (e
x) = −[∂2 f(x, ξ(x))]−1 ◦ [∂1 f(x, ξ(x))] .
Em resumo: f−1 (c) ∩ Z é o gráfico da aplicação ξ : V −→ RnJ fortemente diferenciável no ponto

f1 . Se f é de classe Ck , então ξ é de classe Ck .
a

Análise
A aplicação ξ diz-se definida implicitamente pela equação f(x, y) = c.
X
n
Observação 11.9. Se ξ(ex) = x)ej` , então
ξ` (e
`=1
X X
m m

Graf(ξ) = xk eik + ξ` (e x = (x1 , . . . , xm ) ∈ V .
x)ej` e

k=1 `=1
Prova.
Seja h : V × W −→ Z o homeomorfismo fortemente diferenciável no ponto (f
a1 , f(a)) = (f
a1 , c),
dado pela forma local das submersões, onde h(f a1 , f(a)) = a e
X m
h(ex, w) = (x, h2 (e
x, w)) = xk eik + h2 (e
x, w) .
k=1
Defina a aplicação ξ : V −→ RnJ por ξ(e x, c). Então,

x) = h2 (e
X
m
(x, ξ(e
x)) = x) ∈ Z e
xk eik + ξ(e f(x, ξ(e
x)) = f(h(e
x, c)) = c ,
k=1
x = (x1 , . . . , xk ) ∈ V.
para todo e
X
m X
n
Reciprocamente, se (x, y) = x k ei k + y` ej` ∈ Z, e
x = (x1 , . . . , xk ) ∈ V e f(x, y) = c, então
k=1 `=1
(x, y) = h ◦ ϕ(x, y) = h(e
x, c) = (x, h2 (e
x, c)) = (x, ξ(e
x)) .
Logo y = ξ(e
x).
Então, para cada e x) ∈ RnJ tal que (x, ξ(e

x ∈ V existe um único ξ(e x)) ∈ Z e f(x, ξ(e
x)) = c.
Como ξ(e x ∈ V e h2 : V × W −→ RnJ é fortemente diferenciável no ponto

x, c) para todo e
x) = h2 (e
a1 , c), temos que ξ é fortemente diferenciável no ponto a
(f f1 .
Além disso, se f é de classe Ck , então ξ é de classe Ck , pois h2 é de classe Ck .
x)) = c, quando f é de classe Ck , obtemos, pela Regra

Finalmente, derivando a igualdade f(x, ξ(e
da Cadeia, que:
0 = f 0 (x, ξ(e
x))(v, ξ 0 (e
x)e
v) = ∂1 f(x, ξ(e x)) · ξ 0 (e
x))v + ∂2 f(x, ξ(e x) v ,
X
m
v ∈ Rm , onde v =
para todo e vk eik e e
v = (v1 , . . . , vm ), ou seja,
k=1
ξ 0 (e
x) e x))]−1 [∂1 f(x, ξ(e
v = −[∂2 f(x, ξ(e x))] · v .
Se f é apenas fortemente diferenciável no ponto a = (a1 , a2 ), temos que ξ é fortemente dife-

renciável no ponto a
f1 e (a1 , ξ(f
a1 )) = h(f
a1 , c) = a.
v ∈ Rm :
Logo, pela regra da cadeia, para todo e
ξ 0 (f v = −[∂2 f(a)]−1 [∂1 f(a)] v .

a1 ) e

O Teorema do Posto
Exemplo 11.2. Seja f : U ⊂ R3 −→ R2 , f = (f1 , f2 ), uma aplicação de classe Ck , k ≥ 1, tal

que, no ponto a = (a1 , a2 , a3 ) ∈ U, f 0 (a) : R3 −→ R2 é sobrejetora.
Suponhamos que R3 = RI ⊕ R2J é uma decomposição de R3 , onde I = {2}, J = {1, 3}, ou seja, RI
é gerado por {e2 } e R2J é gerado por {e1 , e3 } e, além disso, f 0 |R2J (a) é um isomorfismo.
Definimos ϕ : U −→ R × R2 por
ϕ(x, y, z) = (y, f1 (x, y, z), f2 (x, y, z)) .
Então ϕ(a) = (a2 , f(a)) 

e 
 0 1 0   
∂f1 ∂f1
 (a) (a)
 
 ∂f ∂f1 ∂f1 ∂x ∂z

1
Jϕ(a) = det  = − det  6 0,
=
 ∂x (a) ∂y (a) ∂z (a)
 
 ∂f ∂f2
2

 ∂f
 (a) (a)
2 ∂f2 ∂f2  ∂x ∂z
(a) (a) (a)
∂x ∂y ∂z
pois estamos supondo que {f 0 (a)e1 , f 0 (a)e3 } é uma base de R2 .
Logo, pela forma local das submersões, existem abertos Z ⊂ R3 , I ⊂ R, W ⊂ R2 , tais que a ∈ Z,
a2 ∈ I, f(a) ∈ W, ϕ : Z −→ I × W é um difeomorfismo de classe Ck , h = ϕ−1 : I × W −→ Z,
(1) (2)
h(x, y, z) = (h2 (x, y, z), x, h2 (x, y, z))
é também de classe Ck , f ◦ h(x, y, z) = (y, z), ou seja,

(1) (2)
f(h2 (x, y, z), x, h2 (x, y, z)) = (y, z)
para todo (x, y, z) ∈ I × W.
Então, se f(a) = c = (c1 , c2 ), temos que

(1) (2)
f(h2 (x, c1 , c2 ), x, h2 (x, c1 , c2 )) = (c1 , c2 ) = c ,
para todo x ∈ I. Logo f−1 (c) ∩ Z é o gráfico da aplicação de classe Ck ξ : I −→ R2J , dada por
(1) (2)
ξ(x) = h2 (x, c1 , c2 )e1 + h2 (x, c1 , c2 )e3 ,
ou seja,

(1) (2)
f−1 (c) ∩ Z = h2 (x, c1 , e2 ), x, h2 (x, c1 , c2 ) x ∈ I .

12 O Teorema do Posto
Definição 12.1. O posto de uma transformação linear T : Rm −→ Rn é a dimensão da ima-

gem T (Rm ), ou seja, o número máximo de vetores LI entre os vetores T (e1 ), . . . , T (em ), ou,
equivalentemente, o número máximo de colunas LI da matriz de T . Portanto, o posto de T é

Análise
também o número máximo de linhas linearmente independentes da matriz de T .
Observação 12.1. O posto de T é igual a r se, e só se, a matriz de T possui um determinante
menor r × r não-nulo, mas qualquer determinante menor de ordem r + 1 é igual a zero.
Definição 12.2. O posto de uma aplicação diferenciável f : U −→ Rn num ponto x ∈ U ⊂ Rm

é o posto da sua derivada f 0 (x) : Rm −→ Rn .
Observação 12.2. O posto de f no ponto x é ≤ m e ≤ n.

• Uma imersão f : U −→ Rn , definida no aberto U ⊂ Rm , tem posto m em todos os pontos x ∈ U
e m ≤ n.
• Uma submersão g : U ⊂ Rm −→ Rn tem posto n em todos os pontos x ∈ U e m ≥ n.
Portanto, imersões e submersões são aplicações de posto máximo.
Observação 12.3. O posto de uma aplicação diferenciável f : U ⊂ Rm −→ Rn , em geral,

varia de ponto para ponto.
Quando n = 1, o posto de f é 1 nos pontos regulares e zero nos pontos crı́ticos de f.
Se f : U ⊂ R2 −→ R2 é holomorfa e f = u + iv, então seu posto em um ponto (x, y) ∈ U só pode

ser 2 ou 0.
De fato, pelas equações de Cauchy-Riemann

 
∂u ∂u
(x, y) (x, y)
Jf(x, y) =  ∂x ∂y
.

∂u ∂u
− (x, y) (x, y)
∂y ∂x
Logo
∂u 2 2
∂u
det Jf(x, y) = (x, y) + (x, y) =0
∂x ∂y
∂u ∂u
se, e só se, (x, y) = (x, y) = 0, ou seja, se, e só se, Jf(x, y) é a matriz nula.
∂x ∂y
2 2 3 2
! ão f : R −→ R , dada por f(x, y) = (x , y ), tem matriz Jacobiana
Finalmente, a aplicaç
3x2 0
Jf(x, y) = .
0 2y
Logo:
• f tem posto 2 nos pontos (x, y), com x 6= 0 e y 6= 0;
• f tem posto 1 nos pontos (x, 0), com x 6= 0 e nos pontos (0, y), com y 6= 0;
• f tem posto 0 na origem.

O Teorema do Posto
Observação 12.4. Se f : U ⊂ Rm −→ Rn é uma aplicação de classe C1 , o posto de f é uma

função semi-contı́nua inferiormente com valores inteiros. Isto é, se posto f(a) = r, então existe
δ > 0 tal que B(a; δ) ⊂ U e o posto de f em x é ≥ r para todo x ∈ B(a; δ).
De fato, como o posto de f em a é igual a r, existe um determinante menor r × r da matriz Jf(a)

que é diferente de zero.
Logo, como f 0 : U −→ L(Rn ; Rm ) é contı́nua, existe δ > 0 tal que este menor é não-nulo em
todos os pontos da bola de centro a e raio δ.
Então, pela observação 12.1, o posto de f em x é ≥ r para todo x ∈ B(a; δ).
Definição 12.3. Dada uma decomposição Rm+n = Rm n

I ⊕ RJ , dizemos que um conjunto
X ⊂ Rm+n é verticalmente convexo quando
(x, y 0 ) , (x, y 00 ) ∈ X =⇒ [(x, y 0 ), (x, y 00 )] ⊂ X ,
ou seja, x + (1 − t)y 0 + ty 00 ∈ X para todo t ∈ [0, 1].
Exemplo 12.1. Se X = V ⊕ W = {x + y | x ∈ V , y ∈ W}, onde V ⊂ Rm n

I e W ⊂ RJ é convexo,
então X é verticalmente convexo.
Lema 12.1. Seja U ⊂ Rm+n = Rm n

I ⊕ RJ um aberto verticalmente convexo. Se f : U −→ R
p
possui segunda derivada parcial ∂2 f, a qual é identicamente nula em U, então f independe da

segunda variável, isto é, f(x, y1 ) = f(x, y2 ) para quaisquer (x, y1 ), (x, y2 ) ∈ U.
Prova.
Sejam (x, y1 ), (x, y2 ) ∈ U, e seja λ : [0, 1] −→ Rp o caminho λ(t) = f(x + (1 − t)y1 + ty2 ).
Então, como y2 − y1 ∈ RnJ ,
f(x + y1 + (t + s)(y2 − y1 )) − f(x + y1 + t(y2 − y1 ))

λ 0 (t) = lim
s→0 s
= ∂2 f(x + y1 + t(y2 − y1 )) (y2 − y1 ) = 0 ,
para todo t ∈ [0, 1]. Logo λ é constante em [0, 1]. Em particular, λ(0) = λ(1), ou seja,
f(x, y1 ) = f(x, y2 ).
Lema 12.2. Seja E ⊂ Rm+p um subespaço vetorial de dimensão m. Então existe uma decom-
p
posição em soma direta Rm+p = Rm
I ⊕ RJ tal que a projeção sobre a primeira coordenada
π : Rm+p −→ Rm m
I , π(x, y) = x, aplica E isomorficamente sobre RI .

Análise
Fig. 12: A projeção π é um isomorfismo de E sobre Rm

I
Prova.
Seja {u1 , . . . , um } uma base de E. Se E = Rm+p , não há nada a demonstrar. Se E 6= Rm+p ,
existe j1 ∈ {1, . . . , m + p} tal que ej1 6∈ E. Então {u1 , . . . , um , ej1 } são LI e geram um subespaço
E1 de Rm+p de dimensão m + 1. Se E1 6= Rm+p , existe j2 ∈ {1, . . . , m + p} tal que ej2 6∈ E1 .
Então {u1 , . . . , um , ej1 , ej2 } são LI e geram um subespaço de Rm+p de dimensão m + 2. Pros-
seguindo desta maneira, obtemos p vetores ej1 , . . . , ejp , da base canônica de Rm+p tais que
{u1 , . . . , um , ej1 , . . . , ejp } é uma base de Rm+p .
I o subespaço gerado por {ei1 , . . . , eim }, onde

Sejam RpJ o subespaço gerado por {ej1 , . . . , ejp } e Rm
{i1 , . . . , im } = {1, . . . , m + p} − {j1 , . . . , jp }.
p
Assim, Rm+p = Rm
I ⊕ RJ e R
m+p
= E ⊕ RpJ .
p
Seja π : Rm m m
I ⊕ RJ −→ RI a projeção sobre a primeira coordenada, ou seja, se z = x + y, x ∈ RI
e y ∈ RpJ , então π(z) = x.
p
Seja x ∈ Rm
I . Então existem x1 ∈ E e y1 ∈ RJ tais que x = x1 + y1 .
Logo x = π(x) = π(x1 + y1 ) = π(x1 ) e, portanto, π|E : E −→ Rm

I é sobrejetora.
Como dim E = m = dim Rm m

I , temos que π|E : E −→ RI é um isomorfismo.
Teorema 12.1. (Teorema do Posto)

Seja f : U −→ Rm+p uma aplicação de classe Ck , k ≥ 1, e posto constante m em cada ponto
do aberto U ⊂ Rm+n . Então, para cada ponto a ∈ U, existem um difeomorfismo α de um aberto
V × W em Rm × Rn sobre um aberto Z ⊂ U contendo o ponto a e um difeomorfismo β de um
aberto Z 0 ⊂ Rm+p , tal que f(Z) ⊂ Z 0 , sobre um aberto V × W 0 em Rm × Rp , ambos de classe
Ck , tais que, para todo (x, y) ∈ V × W:
β ◦ f ◦ α(x, y) = (x, 0) .
Descrição do Teorema do Posto: Cada uma das fibras da vizinhança Z de a é transformada por
f num único ponto, do mesmo modo que cada segmento vertical x×W em V ×W é transformado
por β ◦ f ◦ α no ponto (x, 0).

O Teorema do Posto
Fig. 13: Representação esquematica do Teorema do Posto
Prova.
Seja E = f 0 (a)(Rm+n ) ⊂ Rm+p .
p
Como dim E = m, pelo lema 12.2, existe uma decomposição em soma direta Rm+p = Rm
I ⊕ RJ
tal que a projeção sobre a primeira coordenada π : Rm+p −→ Rm
I , π(x, w) = x, é um isomorfismo
quando restrita a E, ou seja, π : E −→ Rm
I é um isomorfismo.
Seja T : Rm+p −→ Rm+p a transformação linear tal que T (ek ) = eik , k = 1, . . . , m e T (ek ) = ejk−m ,
k = m + 1, . . . , m + p, e seja π = L ◦ T −1 ◦ π, onde L : Rm × {0} −→ Rm é dada por L(x, 0) = x.
Logo (π ◦ f) 0 (a) = π ◦ f 0 (a) : Rm+n −→ Rm é sobrejetora. Então, pela Forma Local das Sub-
mersões, existe um difeomorfismo α de classe Ck de um aberto V0 × W ⊂ Rm × Rn sobre um
aberto Z0 contendo a em Rm+n tal que π ◦ f ◦ α(x, w) = x.
X
m
Assim, f ◦ α(x, y) = xk eik + λ(x, y), onde a aplicação λ : V0 × W −→ RpJ , dada por
k=1
X
p
λ(x, y) = λ` (x, y)ej` , é de classe Ck .
`=1
Observe que T −1 ◦ f ◦ α(x, y) = (x1 , x2 , . . . , xm , λ1 (x, y), . . . , λp (x, y)).
Afirmação: ∂2 λ = 0.
!
Im×m Om×n
De fato, a matriz Jacobiana de T −1 ◦ f ◦ α tem a forma , onde Im×m
Ap×m
Bp×n
(m+p)×(m+n)

∂λi
é a matriz identidade m × m, Om×n é a matriz nula m × n e B = .
∂yk p×n

Análise
Como posto(T −1 ◦ f ◦ α) = posto(f ◦ α) = posto(f) = m, temos que B = 0, ou seja, ∂2 λ = 0,

provando a afirmação.
Além disso, como W pode ser tomado convexo, temos que V0 × W é verticalmente convexo e,
portanto, pelo lema 12.1, λ(x, y) não depende da variável y.
Seja α(a1 , a2 ) = a e consideremos a injeção i : V0 −→ V0 × W dada por i(x) = (x, a2 ). Então a

X
m
m+p
aplicação f ◦ α ◦ i : V0 −→ R , f ◦ α ◦ i(x) = xk eik + λ(x, a2 ), é de classe Ck e sua derivada
k=1
no ponto a1 , (f ◦ α ◦ i) 0 (a1 ) : Rm −→ Rm+p , é injetora, pois
X
m
0 0 0
(f ◦ α) (i(a1 ))(i (a1 )) v = (f ◦ α) (a1 , a2 ) (v, 0) = vk eik + λ 0 (a1 , a2 ) (v, 0).
k=1
Além disso, como λ independe de y, para todo (x, y) ∈ V0 × W:

f ◦ α ◦ i(x) = f ◦ α(x, a2 ) = f ◦ α(x, y) .
Pela Forma Local das Imersões, existe um difeomorfismo β : Z 0 −→ V × W 0 de classe Ck tal

que Z 0 é um aberto contendo f(a) em Rm+p , V ⊂ V0 aberto de Rm com a1 ∈ V, W 0 aberto de
Rp com 0 ∈ W 0 e β ◦ f ◦ α ◦ i(x) = (x, 0) para todo x ∈ V. Logo, β ◦ f ◦ α(x, y) = (x, 0) para todo
(x, y) ∈ V × W .
Corolário 12.1. Seja f : U −→ Rn de classe C1 , com posto constante no aberto U ⊂ Rm .

Então:
(a) f é localmente injetora se, e só se, f é uma imersão.
(b) f é aberta se, e só se, f é uma submersão.
Prova.
(a) (⇐) Se f é uma imersão de classe C1 , então f é fortemente diferenciável no ponto a e
f 0 (a) : Rm −→ Rn é injetora para todo a ∈ U. Logo, pelo teorema 7.2, f é localmente injetora.
Ou ainda, pela Forma Local das Imersões, para cada a ∈ U, existe um aberto V ⊂ Rm , com
V ⊂ U e a ∈ V, e um difeomorfismo β : Z −→ V × W tal que β ◦ f(x) = (x, 0) para todo x ∈ V.
Logo f|V é injetora.
(⇒) Suponhamos que posto(f) = p < m. Então, pelo Teorema do Posto, a aplicação β ◦ f ◦ α :
(x, y) 7−→ (x, 0), definida no produto V × W dos abertos V ⊂ Rp e W ⊂ Rm−p não é injetora.
Como β e α são difeomorfismos, temos que f não é injetora em aberto algum contendo a, um
absurdo.
Logo posto(f) = m, ou seja, f é uma imersão.

O Teorema do Posto
(b) (⇐) Segue do corolário 11.2.
(⇒) Suponhamos que posto(f) = p < n. Sejam os difeomorfismos β e α dados pelo Teorema
do Posto. Então β ◦ f ◦ α(x, y) = (x, 0) para todo x ∈ V, y ∈ W, onde V é um aberto de Rp , W é
um aberto de Rm−p , (x, 0) ∈ Rp × Rn−p .
Logo β ◦ f ◦ α(V × W) = β ◦ f(Z) = V × {0}, onde Z é um aberto de Rm que contém a, mas

f(Z) = β−1 (V × {0}) não é um aberto de Rn , uma contradição.
Assim, posto(f) = n, ou seja, f é uma submersão.
Teorema 12.2. Seja f : U −→ Rn uma aplicação de classe C1 no aberto U ⊂ Rm e, para cada

r = 0, 1, . . . , p = min{m, n}, seja Ar o interior do conjunto dos pontos de U nos quais f tem posto
r. Então o conjunto aberto A = A0 ∪ A1 ∪ . . . ∪ Ap é denso em U.
Prova.
Seja V ⊂ U um aberto não-vazio.
Afirmação: V ∩ A 6= ∅.
De fato, como o posto de f só assume um número finito de valores, existe a ∈ V tal que
r = posto(f(a)) = max{posto(f(x)) | x ∈ V}.
Então, pela observação 12.4, existe δ > 0 tal que B(a; δ) ⊂ V e posto(f(x)) ≥ r para todo
x ∈ B(a; δ). Logo posto(f(x)) = r para todo x ∈ B(a; δ) e, portanto, B(a; δ) ⊂ Ar .
Assim, ∅ 6= B(a; r) ⊂ Ar ∩ V ⊂ A ∩ V.
Observação 12.5. Em geral, Ar = ∅ para alguns r = 0, 1, . . . , p.
Observação 12.6. O conjunto Ap (que é igual a Am se m ≤ n e igual a An se n ≤ m) é o

conjunto dos pontos x ∈ U nos quais o posto de f 0 (x) é igual a p, pois tal conjunto é sempre
aberto, pela observação 12.4. Portanto, no caso r = p, não precisamos tomar o interior.
Corolário 12.2. Seja f : U −→ Rn uma aplicação de classe C1 no aberto U ⊂ Rm . Então

existe um subconjunto aberto e denso A ⊂ U tal que f tem posto constante em cada componente
conexa de A.
Prova.
Seja o conjunto aberto e denso A = A0 ∪ . . . ∪ Ap dado pelo teorema anterior. Como os abertos
A0 , A1 , . . . , Ap são dois a dois disjuntos, temos que se C é uma componente conexa de A e
C ∩ Aj 6= ∅ para algum j = 0, 1, . . . , r, então C ⊂ Aj , pois, caso contrário,

Análise
  
p
 [
C = (Aj ∩ C) ∪  Ak  ∩ C 
 
k=1
k 6= j
seria uma cisão não-trivial de C. Logo f tem posto constante j em C.
Corolário 12.3. Se a aplicação f : U −→ Rn de classe C1 no aberto U ⊂ Rm é localmente

injetora, então m ≤ n e o cojunto dos pontos x ∈ U nos quais f 0 (x) : Rm −→ Rn é injetora é
aberto e denso em U.
Prova.
Seja a decomposição A = A0 ∪ . . . ∪ Ap dada pelo teorema 12.2. Em cada aberto Ai 6= ∅,
i = 0, . . . , p, f é localmente injetora e tem posto constante. Logo, pelo corolário 12.1, f|Ai é uma
imersão. Então m ≤ n e Ai = ∅ para todo i = 0, . . . , m − 1, ou seja, p = m e A = Am . Além
disso, pela observação 12.6, Am = {x ∈ U | f 0 (x) é injetora}.
Portanto, o conjunto dos pontos x ∈ U nos quais f 0 (x) : Rm −→ Rn é injetora é um conjunto

Corolário 12.4. Se a aplicação f : U −→ Rn de classe C1 no aberto U ⊂ Rm é aberta, então

n ≤ m e o conjunto dos pontos x ∈ U nos quais a derivada f 0 (x) : Rm −→ Rn é sobrejetora é
Prova.
Seja a decomposição A = A0 ∪ . . . ∪ Ap dada pelo teorema 12.2. Como em cada aberto
Ai 6= ∅, f|Ai é uma aplicação aberta de posto constante temos, pelo corolário 12.1, que f|Ai é
uma submersão. Logo n ≤ m e Ai = ∅ para todo i = 0, . . . , n − 1. Ou seja, p = n e A = An .
Então, pela observação 12.6, An = {x ∈ U | f 0 (x) é sobrejetora}.
Assim, o conjunto {x ∈ U | f 0 (x) é sobrejetora} é aberto e denso em U.
Observação 12.7. Quando m = 1, o corolário 12.3 pode ser demonstrado sem a ajuda do
Teorema do Posto.
De fato, se f : I −→ Rn é um caminho diferenciável, dizer que f 0 (x) é injetora equivale a dizer

que o vetor velocidade é 6= 0 no ponto x ∈ I.
Como f é de classe C1 , o conjunto A = {x ∈ I | f 0 (x) 6= 0} é aberto.
Além disso, como f é localmente injetora, não pode existir um intervalo aberto J ⊂ I tal que
A ∩ J = ∅, ou seja, não pode existir J ⊂ I tal que f 0 (x) = 0 para todo x ∈ J, pois, neste caso, f
seria constante em J, e assim, f não seria localmente injetora.

O Teorema do Posto
No caso n = 1, o corolário 12.4 também pode ser provado diretamente.
De fato, se f : U ⊂ Rm −→ R é uma função diferenciável, então f 0 (x) é sobrejetora se, e só

se, df(x) 6= 0. Logo, como f é de classe C1 , temos que A = {x ∈ U | df(x) 6= 0} é um conjunto
aberto.
Além disso, se A não fosse denso em U, seu complementar conteria uma bola aberta B. Como
df(x) = 0 para x ∈ B e B é conexo, f seria constante em B e, portanto, f(B) seria um conjunto
formado por apenas um ponto, logo não poderia ser aberto. Assim, A é denso em U.
Apêndice I
Já vimos que o Teorema da Aplicação Implı́cita pode ser obtido a partir do Teorema da
Aplicação Inversa. Vamos provar que a recı́proca também é verdadeira.
Prova.
De fato, seja f : U ⊂ Rm −→ Rm uma aplicação fortemente diferenciável no ponto a ∈ U
(ou de classe Ck ) tal que f 0 (a) : Rm −→ Rm é um isomorfismo.
Como f é fortemente diferenciável no ponto a e f 0 (a) é injetora, existe, pelo teorema 7.2, um
aberto U0 ⊂ U, com a ∈ U0 , tal que f : U0 −→ f(U0 ) é um homeomorfismo.
Consideremos a aplicação F : Rm × U0 −→ Rm dada por F(x, y) = x − f(y).
Se f é de classe Ck então F é de classe Ck , e se f é fortemente diferenciável no ponto a então

F é fortemente diferenciável no ponto (f(a), a).
De fato, como
F(x, y) = x − f(y) = F(f(a), a) + (x − f(a)) − f 0 (a)(y − a) + rF(f(a),a) (x, y) ,
temos que
rF(f(a),a) (x, y) = −f(y) + f(a) + f 0 (a)(y − a) = −rfa (y) .
Logo, dado ε > 0, existe δ > 0 tal que

x, x 0 ∈ B(a; δ) =⇒ krfa (y 0 ) − rfa (y)k ≤ ε ky 0 − ykS
=⇒ krF(f(a),a) (x 0 , y 0 ) − rF(f(a),a) (x, y)k = krfa (y 0 ) − rfa (y)k ≤ ε ky 0 − ykS
≤ ε (ky 0 − ykS + kx 0 − xkS )
= εk(y 0 , x 0 ) − (y, x)kS ,

para todos y, y 0 ∈ Rm .

Análise
Além disso, como g 0 (f(a), a)(v, w) = v − f 0 (a) w , temos que F 0 (f(a), a)(0, w) = −f 0 (a)w e,
portanto, ∂2 F(f(a), a) : Rm −→ Rm é um isomorfismo, uma vez que f 0 (a) : Rm −→ Rm é um
isomorfismo.
Pelo Teorema da Aplicação Implı́cita, existem um aberto V ⊂ Rm e um aberto

Z ⊂ Rm × U0 , f(a) ∈ V e (f(a), a) ∈ Z, com a seguinte propriedade: para cada x ∈ V existe um
único y = ϕ(x) ∈ Rm tal que (x, ϕ(x)) ∈ Z e F(x, ϕ(x)) = x − f(ϕ(x)) = F(f(a), a) = 0, ou seja,
para cada x ∈ V existe um único y = ϕ(x) ∈ U0 tal que (x, ϕ(x)) ∈ Z e f(ϕ(x)) = x.
Então V ⊂ f(U0 ) e, como f : U0 −→ f(U0 ) é um homeomorfismo, U1 = f|−1

U0 (V) é um aberto que
contém o ponto a. Assim, f : U1 −→ V é um homeomorfismo do aberto U1 sobre o aberto V,
cuja inversa ϕ = f−1 é, pelo Teorema da Aplicação Implı́cita, fortemente diferenciável no ponto
f(a). E se f é de classe Ck , ϕ = f−1 é de classe Ck e, portanto, f : U1 −→ V é um difeomorfismo
de classe Ck .
Apêndice II
Lembremos os enunciados dos Teoremas da Aplicação Implı́cita (simplificado) e da Aplicação

Inversa.
Teorema. (da Aplicação Implı́cita)

Seja g : U ⊂ Rm × Rn → Rn uma aplicação de classe Ck , (k ≥ 1). Suponha que g(xo , yo ) = c e
∂2 g(xo , yo ) : Rn → Rn seja um isomorfismo para um certo (xo , yo ) ∈ U. Então existem abertos
Z ⊂ U, com (xo , yo ) ∈ Z, e V ⊂ Rm , com xo ∈ V, tais que g−1 (c) ∩ Z é o gráfico de uma
aplicação ϕ : V → Rn de classe Ck , ou seja, para todo x ∈ V existe um único y = ϕ(x) ∈ Rn tal
que (x, ϕ(x)) ∈ Z e g(x, ϕ(x)) = c.
Teorema. (da Aplicação Inversa)

Seja f : U ⊂ Rn → Rn uma aplicação de classe Ck , k ≥ 1. Suponha que f 0 (a) : Rn → Rn seja
um isomorfismo para um certo a ∈ U. Então existem abertos V e W em Rn , com a ∈ V ⊂ U,
tais que f : V → W é um difeomorfismo de classe Ck .
Provaremos o Teorema da Aplicação Inversa usando duas vezes o Teorema da Aplicação Implı́cita.
Seja F : Rn × U → Rn a aplicação dada por F(x, y) = x − f(y).
Então F é uma aplicação de classe Ck e ∂2 F(b, a) = −f 0 (a) : Rn → Rn é um isomorfismo,

onde b = f(a) e F(b, a) = f(a) − f(a) = 0.

O Teorema do Posto
Pelo Teorema da Aplicação Implı́cita, existem abertos V1 ⊂ Rn e Z1 ⊂ Rn × U, com

b ∈ V1 e (b, a) ∈ Z1 , tais que F−1 (0) ∩ Z1 é o gráfico de uma aplicação ϕ : V1 → Rn de
classe Ck , isto é, para cada x ∈ V1 existe um único y = ϕ(x) ∈ U tal que (x, ϕ(x)) ∈ Z1 e
F(x, ϕ(x)) = x − f(ϕ(x)) = 0. Observe que ϕ(b) = a.
Como f(ϕ(x)) = x para todo x ∈ V1 , temos que ϕ é injetora e f 0 (ϕ(x) · ϕ 0 (x) · v = v para
todos x ∈ V1 e v ∈ Rn . Logo ϕ 0 (b) : Rn → Rn é um isomorfismo.
Considere agora a aplicação G : U × V1 → Rn dada por G(z, w) = z − ϕ(w). Então G é

uma aplicação de classe Ck e ∂2 G(ϕ(b), b) = −ϕ 0 (b) : Rn → Rn é um isomorfismo.
Pelo Teorema da Aplicação Implı́cita, existem abertos V ⊂ Rn e Z ⊂ U × V1 , com ϕ(b) =

a ∈ V e (ϕ(b), b) = (a, f(a)) ∈ Z, tais que G−1 (0) ∩ Z é o gráfico de uma aplicação ξ : V → Rn
de classe Ck , isto é, para cada z ∈ V existe um único w = ξ(z) ∈ Rn tal que (z, ξ(z)) ∈ Z e
G(z, ξ(z)) = z − ϕ(ξ(z)) = 0.
Assim, ξ(a) = f(a), ξ(z) ∈ V1 e ϕ(ξ(z)) = z, para todo z ∈ V. Logo f(ϕ(ξ(z))) = f(z), para
todo z ∈ V.
Como f ◦ ϕ(x) = x, para todo x ∈ V1 , temos que ξ(z) = f(z) e portanto, ϕ(f(z)) = z, para
todo z ∈ V.
Afirmação: f : V → f(V) é um difeomorfismo de classe Ck sobre o aberto f(V).
De fato, sendo ϕ(f(z)) = z, para todo z ∈ V, temos que f é injetora em V.
Como ϕ(f(V) = V, f(V) ⊂ V1 e ϕ : V1 → Rn é uma aplicação contı́nua e injetora, temos

que ϕ−1 (V) = f(V) é um aberto de V1 e, portanto, de Rn .
Além disso, como ϕ : f(V) → V é a inversa de f : V → f(V) e ϕ : f(V) → V é uma

aplicação de classe Ck , temos que f : V → f(V) é um difeomorfismo de classe Ck do aberto V,
que contém a, sobre o aberto W = f(V).
A versão “fortemente diferenciável” do Teorema da Aplicação Inversa se prova de modo

análogo, usando a versão “fortemente diferenciável” do Teorema da Aplicação Implı́cita. Ne-
cessitamos apenas provar que a aplicaçaõ F, definida na demonstração acima, é fortemente
diferenciável em (f(a), a) (ver Apêndice I).
Assim, a aplicação ϕ : V1 → U, neste caso, é fortemente diferenciável em b e, portanto, V1

pode ser tomado de modo que ϕ seja contı́nua em V1 .
FIM

Espaço Euclidiano n-dimensional

Uploaded by

Document Information

Original Description:

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Espaço Euclidiano n-dimensional

Uploaded by

Copyright:

Available Formats

Capı́tulo 1

Topologia do espaço Euclidiano

Seja n ∈ N. O espaço euclidiano n− dimensional é o produto cartesiano de n fatores

Os pontos de Rn são as n−listas x = (x1 , . . . , xn ), cujas coordenadas x1 , . . . , xn são

Dados x = (x1 , . . . , xn ) , y = (y1 , . . . , yn ) ∈ Rn e um número real λ, definimos a soma x + y

Com estas operações, Rn é um espaço vetorial de dimensão n sobre R, no qual

No espaço vetorial Rn , destaca-se a base canônica {e1 , . . . , en } formada pelos vetores

• Sejam L(Rm , Rn ) o conjunto das transformações lineares T : Rm −→ Rn e M(n × m) o

• Existe uma bijeção natural entre L(Rm , Rn ) e M(n × m).

onde {e1 , . . . , en } é a base canônica de Rn .

Reciprocamente, dada A ∈ M(n × m), seja TA ∈ L(Rm , R!n ) definida por

Como TA (ej ) = (a1j , . . . , anj ), temos que a aplicação

Além disso, Φ é injetora, pois se Φ(T ) = Φ(L), então T (ej ) = L(ej ), j = 1, . . . , m, e,

Assim, M(n × m) torna-se um espaço vetorial real de dimens

formam uma base natural.

• No caso particular em que n = 1, L(Rm , R) é o espaço vetorial real de dimensão n formado

0 Instituto de Matemática UFF

O espaço L(Rm , R) = (Rm )? é chamado o espaço dual do espaço euclidiano Rm , e a base

Observe que se f ∈ L(Rm , R) e f(ei ) = ai , i = 1, . . . , m, então

e (a1 · · · am ) é a matriz 1 × m associada ao funcional f.

Definição 1.1. Sejam E, F e G espaços vetoriais reais. Uma aplicação ϕ : E × F −→ G

Observação 1.1. ϕ(x, 0) = ϕ(0, y) = 0 quaisquer que sejam x ∈ E e y ∈ F.

Observação 1.2. Se E = Rm , F = Rn , temos que !

Definição 1.2. Uma aplicação bilinear ϕ : E × E −→ G é simétrica quando

quaisquer que sejam x, y ∈ E.

2 Produto interno e norma

(1) hx, yi = hy, xi ;

(3) hλx, yi = λhx, yi ;

(4) x 6= 0 =⇒ hx, xi > 0 ,

Observação 2.1. hx, xi = 0 ⇐⇒ x = 0 .

Exemplo 2.1. O produto interno canônico do espaço euclidiano Rn é dado por

onde x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ).

Observação 2.2. Se ϕ : Rn × Rn −→ R é um produto interno em Rn , então a matriz

Reciprocamente, se A ∈ M(n × n) é uma matriz simétrica e positiva definida, então

O produto interno canônico corresponde a tomar a matriz identidade I = (δij ), onde

• Se h , i é o produto interno canônico de Rn e {e1 , . . . , en } é a base canônica, então

2 Instituto de Matemática UFF

Proposição 2.1. (Desigualdade de Cauchy-Schwarz)

temos que o discriminante

ou seja, | hx, yi| ≤ kxk kyk.

(1) kλxk = |λ| kxk ;

(2) kx + yk ≤ kxk + kyk ;

(3) x 6= 0 =⇒ kxk > 0 ,

Observação 2.4. k0k = 0 .

Observação 2.5. kxk = 0 ⇐⇒ x = 0 .

Observação 2.6. k − xk = kxk .

Observação 2.7. | kxk − kyk | ≤ kx − yk .

ou seja, | kxk − kyk | ≤ kx − yk .

Proposição 2.2. Se h , i : E × E −→ R é um produto interno em E, então k k : E −→ R,

(1) kλxk = hλx, λxi = λ2 hx, xi = |λ| hx, xi = |λ| kxk .

Logo kx + yk2 ≤ ( kxk + kyk )2 , ou seja, kx + yk ≤ kxk + kyk.

Observação 2.8. kxk + kyk = kx + yk ⇐⇒ ∃ λ > 0 tal que x = λy ou y = λx .

Exemplo 2.2. Se h , i é o produto interno canônico de Rn ,

é chamada de norma euclidiana do vetor x ∈ Rn .

• a norma do máximo: kxkM = max{|x1 |, . . . , |xn |} ,

• a norma da soma: kxkS = |x1 | + . . . + |xn | .

É fácil verificar que k kM e k kS realmente definem normas em Rn (exercı́cio).

Além disso, para todo x ∈ Rn ,

kxkM ≤ kxk ≤ kxkS ≤ nkxkM , (1)

onde k k é a norma euclidiana.

4 Instituto de Matemática UFF

E se kxkM = |xi |, então