You are on page 1of 260

Capı́tulo 1

Topologia do espaço Euclidiano

1 O espaço vetorial Rn

Seja n ∈ N. O espaço euclidiano n− dimensional é o produto cartesiano de n fatores


iguais a R:
Rn = R
| ×R×
{z· · · × R}
n cópias

Os pontos de Rn são as n−listas x = (x1 , . . . , xn ), cujas coordenadas x1 , . . . , xn são


números reais.

Dados x = (x1 , . . . , xn ) , y = (y1 , . . . , yn ) ∈ Rn e um número real λ, definimos a soma x + y


e o produto λx pondo:
x + y = (x1 + y1 , . . . , xn + yn ) λx = (λx1 , . . . , λxn ) .

Com estas operações, Rn é um espaço vetorial de dimensão n sobre R, no qual


0 = (0, . . . , 0) é o elemento neutro para a adição e −x = (−x1 , . . . , −xn ) é o simétrico de
x = (x1 , . . . , xn ).

No espaço vetorial Rn , destaca-se a base canônica {e1 , . . . , en } formada pelos vetores


e1 = (1, 0, . . . , 0) , e2 = (0, 1, . . . , 0) , . . . , en = (0, 0, . . . , 1),

que tem uma coordenada igual a 1 e as outras nulas. Para todo x = (x1 , . . . , xn ) temos:
x = x 1 e1 + x 2 e2 + . . . + x n en .

• Sejam L(Rm , Rn ) o conjunto das transformações lineares T : Rm −→ Rn e M(n × m) o


conjunto das matrizes reais A = (aij ) com n linhas e m colunas.

• Existe uma bijeção natural entre L(Rm , Rn ) e M(n × m).

-1
Análise

De fato, dada T ∈ L(Rm , Rn ), seja AT = (aij ) a matriz cuja j−ésima coluna é o vetor coluna
(Tej )t , onde {e1 , . . . , em } é a base canônica de Rm , ou seja, a matriz AT = (aij ) é definida pelas
igualdades
X
n
Tej = aij ei , j = 1, . . . , m ,
i=1

onde {e1 , . . . , en } é a base canônica de Rn .

Reciprocamente, dada A ∈ M(n × m), seja TA ∈ L(Rm , R!n ) definida por


X
m X
m
TA (x) = a1j xj , . . . , anj xj .
j=1 j=1

Como TA (ej ) = (a1j , . . . , anj ), temos que a aplicação


Φ : L(Rm , Rn ) −→ M(n × m)
T 7−→ AT
é sobrejetora.

Além disso, Φ é injetora, pois se Φ(T ) = Φ(L), então T (ej ) = L(ej ), j = 1, . . . , m, e,


portanto,
T (x) = x1 T (e1 ) + . . . + xm T (em ) = x1 L(e1 ) + . . . + xm L(em ) = L(x) , ∀ x = (x1 , . . . , xm ) ∈ Rm .

Escrevendo as colunas de uma matriz A ∈ M(n × m) uma após a outra numa linha,
podemos identificar A com um ponto do espaço euclidiano Rnm .

Assim, M(n × m) torna-se um espaço vetorial real de dimens


 ão nm, no qual as matrizes
 1 se (i, j) = (k, `)
k` k` k`
A = aij , 1 ≤ k ≤ n , 1 ≤ ` ≤ m, onde aij =
0 se (i, j) 6= (k, `) ,

formam uma base natural.

Além disso, como Φ é uma bijeção, podemos induzir em L(Rm , Rn ) uma estrutura de
espaço vetorial, para a qual T `k , 1 ≤ k ≤ n e 1 ≤ ` ≤ m, onde T `k (e` ) = ek e T `k (ej ) = 0 se
j 6= `, é uma base natural.

Podemos, assim, sempre que for conveniente, substituir L(Rm , Rn ) ora por M(n × m), ora
por Rn m .

• No caso particular em que n = 1, L(Rm , R) é o espaço vetorial real de dimensão n formado


pelos funcionais lineares de Rm em R, para oqual {π1 , . . . , πm } é uma base, onde
1 se i = j
πi (ej ) =
0 se i 6= j ,

ou seja,

0 Instituto de Matemática UFF


Produto interno e norma

X
n
πi (x1 , . . . , xi , . . . , xm ) = xj πi (ej ) = xi ,
j=1
m
é a projeção de R sobre seu i−ésimo fator.

O espaço L(Rm , R) = (Rm )? é chamado o espaço dual do espaço euclidiano Rm , e a base


{π1 , . . . , πm } é chamada base dual da base canônica de Rm .

Observe que se f ∈ L(Rm , R) e f(ei ) = ai , i = 1, . . . , m, então


f(x1 , . . . , xm ) = a1 x1 + . . . + am xm ,

e (a1 · · · am ) é a matriz 1 × m associada ao funcional f.

Definição 1.1. Sejam E, F e G espaços vetoriais reais. Uma aplicação ϕ : E × F −→ G


chama-se bilinear quando é linear em relação a cada uma de suas variáveis, ou seja:
ϕ(λx + x 0 , y) = λϕ(x, y) + ϕ(x 0 , y)
ϕ(x, λy + y 0 ) = λϕ(x, y) + ϕ(x, y 0 ) ,
quaisquer que sejam x, x 0 ∈ E, y, y 0 ∈ F e λ ∈ R.

Observação 1.1. ϕ(x, 0) = ϕ(0, y) = 0 quaisquer que sejam x ∈ E e y ∈ F.

Observação 1.2. Se E = Rm , F = Rn , temos que !


X
m X
n X
ϕ(x, y) = ϕ xi e i , yj ej = xi yj ϕ(ei , ej ) ,
i=1 j=1 ij

de modo que ϕ fica inteiramente determinada pelos mn valores ϕ(ei , ej ) que assume nos pares
ordenados de vetores básicos (ei , ej ), 1 ≤ i ≤ m e 1 ≤ j ≤ n.

Definição 1.2. Uma aplicação bilinear ϕ : E × E −→ G é simétrica quando


ϕ(x, y) = ϕ(y, x) ,

quaisquer que sejam x, y ∈ E.

2 Produto interno e norma

Definição 2.1. Seja E um espaço vetorial real. Um produto interno em E é uma aplicação
h , i : E × E −→ R que satisfaz as seguintes propriedades:

(1) hx, yi = hy, xi ;

(2) hx + x 0 , yi = hx, yi + hx 0 , yi ;

J. Delgado - K. Frensel 1
Análise

(3) hλx, yi = λhx, yi ;

(4) x 6= 0 =⇒ hx, xi > 0 ,

para quaisquer x, x 0 , y ∈ E e λ ∈ R.

Ou seja, um produto interno sobre E é uma função real bilinear, simétrica e positiva defi-
nida.

Observação 2.1. hx, xi = 0 ⇐⇒ x = 0 .

Exemplo 2.1. O produto interno canônico do espaço euclidiano Rn é dado por


hx, yi = x1 y1 + . . . xn yn ,

onde x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ). 

Observação 2.2. Se ϕ : Rn × Rn −→ R é um produto interno em Rn , então a matriz


A = (aij )1≤i,j≤n , onde ϕ(ei , ej ) = aij , é simétrica e positiva definida, ou seja, aij = aji e
xAxt > 0 para todo x ∈ Rn − {0}, já que
X
n
ϕ(x, y) = aij xi yj = xAyt .
i,j=1

Reciprocamente, se A ∈ M(n × n) é uma matriz simétrica e positiva definida, então


Xn
ϕ(x, y) = aij xi yj
i,j=1
n
define um produto interno em R .

O produto interno canônico corresponde a tomar a matriz identidade I = (δij ), onde


1 se i = j
δij =
0 se i 6= j

é a delta de Kronecker.

Definição 2.2. Dizemos que dois vetores x, y são ortogonais em relação ao produto interno
h , i se hx, yi = 0.

Observação 2.3.
• O vetor nulo 0 é ortogonal a todos os vetores do espaço.

• Se h , i é o produto interno canônico de Rn e {e1 , . . . , en } é a base canônica, então


hei , ej i = δij , i, j = 1, . . . , n.

2 Instituto de Matemática UFF


Produto interno e norma

Proposição 2.1. (Desigualdade de Cauchy-Schwarz)


Seja E um espaço vetorial com produto interno h , i. Então
| hx, yi | ≤ kxk kyk , ∀ x, y ∈ E ,
p p
e a igualdade é válida se, e somente se, x e y são LD, onde kxk = hx, xi e kyk = hy, yi.

Prova.
Suponhamos que y 6= 0 e seja λ ∈ R. Como
hx + λy, x + λyi = kxk2 + 2λhx, yi + λ2 kyk2 ≥ 0 , ∀λ ∈ R,

temos que o discriminante


∆ = 4hx, yi2 − 4kxk2 kyk2 ≤ 0 ,

ou seja, | hx, yi| ≤ kxk kyk.

Além disso, | hx, yi| = kxk kyk se, e só se, ∆ = 0, ou seja, se, e só se, existe λ0 ∈ R tal que
x + λ0 y = 0.

Logo | hx, yi| = kxk kyk se, e só se, x e y são LD. 

Definição 2.3. Uma norma num espaço vetorial real E é uma função real k k : E −→ R que
satisfaz as seguintes condições:

(1) kλxk = |λ| kxk ;

(2) kx + yk ≤ kxk + kyk ;

(3) x 6= 0 =⇒ kxk > 0 ,

para quaisquer x, y ∈ E e λ ∈ R.

Observação 2.4. k0k = 0 .

Observação 2.5. kxk = 0 ⇐⇒ x = 0 .

Observação 2.6. k − xk = kxk .

Observação 2.7. | kxk − kyk | ≤ kx − yk .

De fato, como
kxk = k(x − y) + yk ≤ kx − yk + kyk ,

e
kyk = k(x − y) − xk ≤ kx − yk + kxk ,

J. Delgado - K. Frensel 3
Análise

temos que
−kx − yk ≤ kxk − kyk ≤ kx − yk ,

ou seja, | kxk − kyk | ≤ kx − yk .

Proposição 2.2. Se h , i : E × E −→ R é um produto interno em E, então k k : E −→ R,


p
kxk = hx, xi é uma norma em E.

Prova.
Sejam x, y ∈ E e λ ∈ R. Então:

(1) kλxk = hλx, λxi = λ2 hx, xi = |λ| hx, xi = |λ| kxk .


p p p

(2) kx + yk2 = hx + y, x + yi = kxk2 + 2hx, yi + kyk2 ≤ kxk2 + 2kxk kyk + kyk2 , pela desi-
gualdade de Cauchy-Schwarz.

Logo kx + yk2 ≤ ( kxk + kyk )2 , ou seja, kx + yk ≤ kxk + kyk.


p
(3) x 6= 0 =⇒ hx, xi > 0 =⇒ kxk = hx, xi > 0 .

Observação 2.8. kxk + kyk = kx + yk ⇐⇒ ∃ λ > 0 tal que x = λy ou y = λx .


De fato, se y 6= 0, temos que kx + yk = kxk + kyk ⇐⇒ hx, yi = kxk kyk ⇐⇒ ∃λ > 0 ; x = λy.

Exemplo 2.2. Se h , i é o produto interno canônico de Rn ,


p p
kxk = hx, xi = x21 + . . . + x2n ,

é chamada de norma euclidiana do vetor x ∈ Rn . 

Observação 2.9. Há uma infinidade de normas que podem ser definidas no espaço euclidi-
ano Rn . Dentre elas, temos:

• a norma do máximo: kxkM = max{|x1 |, . . . , |xn |} ,

• a norma da soma: kxkS = |x1 | + . . . + |xn | .

É fácil verificar que k kM e k kS realmente definem normas em Rn (exercı́cio).

Além disso, para todo x ∈ Rn ,

kxkM ≤ kxk ≤ kxkS ≤ nkxkM , (1)

onde k k é a norma euclidiana.

De fato, como kxk = x21 + . . . + x2n ≥ |xi | para todo i = 1, . . . , n, temos que kxk ≥ kxkM .
p

4 Instituto de Matemática UFF


Produto interno e norma

E se kxkM = |xi |, então


kxkS = |x1 | + . . . + |xn | ≤ n|xi | = nkxkM .

Finalmente,
X
n
kxk2S = ( |x1 | + . . . + |xn | ) = |x1 | + . . . + |xn | + 2
2 2 2
|xi | |xj | ≥ |x1 |2 + . . . + |xn |2 = kxk2 ,
i, j = 1
i<j

ou seja, kxkS ≥ kxk.

Estas desigualdades servirão para mostrar que as três normas acima são equivalentes.

Definição 2.4. Uma métrica num conjunto M é uma função real d : M × M −→ R que satisfaz
as seguintes condições:

(1) d(x, y) = d(y, x) ;

(2) d(x, z) ≤ d(x, y) + d(y, z) (desigualdade triangular) ;

(3) x 6= y =⇒ d(x, y) > 0 ,

para quaisquer x, y, z ∈ M. O par (M, d) é dito um espaço métrico.

Observação 2.10. Se (E, k k) é um espaço vetorial normado, então d : E × E −→ R definida


por
d(x, y) = kx − yk , x, y ∈ E

é uma métrica em E.

De fato, se x, y, z ∈ E, então:

(1) d(x, y) = kx − yk = ky − xk = d(x, y) ;

(2) d(x, z) = kx − zk = k(x − y) + (y − z)k ≤ kx − yk + ky − zk = d(x, y) + d(y, z) ;

(3) x 6= y =⇒ x − y 6= 0 =⇒ kx − yk > 0 =⇒ d(x, y) > 0.

Exemplo 2.3. Em Rn ,
p
• d(x, y) = (x1 − y1 )2 + . . . + (xn − yn )2 é a métrica que provém da norma euclidiana.

• dM (x, y) = max1≤i≤n { |xi − yi | } é a métrica que provém da norma do máximo.

• dS (x, y) = |x1 − y1 | + . . . + |xn − yn | é a métrica que provém da norma da soma. 

Observação 2.11. Uma norma num espaço vetorial E pode não provir de um produto interno,

J. Delgado - K. Frensel 5
Análise

ou seja, nem sempre existe um produto interno h , i em E tal que


p
kxk = hx, xi .

Com efeito, se a norma k k provém de um produto interno h , i, então vale a identidade do


paralelogramo:

kx + yk2 + kx − yk2 = 2 kxk2 + kyk2 ,

que diz que a soma dos quadrados das diagonais de um paralelogramo é igual à soma dos
quadrados de seus quatro lados.

De fato,
kx + yk2 = hx + y, x + yi = kxk2 + kyk2 + 2hx, yi
kx − yk2 = hx − y, x − yi = kxk2 + kyk2 − 2hx, yi

=⇒ kx + yk2 + kx − yk2 = 2 kxk2 + kyk2 .
Com isso, podemos provar que as normas k kM e k kS em Rn , n ≥ 2, não provêm de um
produto interno, pois:

• ke1 + e2 k2M + ke1 − e2 k2M = 1 + 1 = 2 6= 4 = 2 ke1 k2M + ke2 k2M ,

e

• ke1 + e2 k2S + ke1 − e2 k2S = 4 + 4 = 8 6= 4 = 2 ke1 k2S + ke2 k2S .

3 Bolas e conjuntos limitados

Num espaço métrico (M, d), definimos os seguintes conjuntos:

• Bola aberta de centro a ∈ M e raio r > 0: B(a, r) = {x ∈ M | d(x, a) < r}.

• Bola fechada de centro a ∈ M e raio r > 0: B[a, r] = {x ∈ M | d(x, a) ≤ r}.

• Esfera de centro a ∈ M e raio r > 0: S[a, r] = {x ∈ M | d(x, a) = r}.

Segue-se que B[a, r] = B(a, r) ∪ S[a, r] .

Se a métrica d provém de uma norma k k do espaço vetorial E, temos:


B(a, r) = {x ∈ E | kx − ak < r} ;
B[a, r] = {x ∈ E | kx − ak ≤ r} ;
S[a, r] = {x ∈ E | kx − ak = r} .

Exemplo 3.1. No espaço euclidiano R de dimensão 1, as três normas, definidas anterior-


mente, coincidem, e: B(a, r) = (a − r, a + r) , B[a, r] = [a − r, a + r] e S[a, r] = {a − r, a + r} .

6 Instituto de Matemática UFF


Bolas e conjuntos limitados

Observação 3.1. A forma geométrica das bolas e esferas dependem, em geral, da norma
que se usa.

Por exemplo, se consideramos o plano R2 com a métrica euclidiana, teremos:

• B((a, b), r) = {(x, y) ∈ R2 | (x − a)2 + (y − b)2 < r} (disco aberto de centro (a, b) e raio r > 0).

• B[(a, b), r] = {(x, y) ∈ R2 | (x − a)2 +(y − b)2 ≤ r} (disco fechado de centro (a, b) e raio r > 0).

• S[(a, b), r] = {(x, y) ∈ R2 | (x − a)2 + (y − b)2 = r} (cı́rculo de centro (a, b) e raio r > 0).

Fig. 1: Bola aberta, bola fechada e esfera no plano em relação à métrica euclidiana

E se consideramos R2 com a métrica do máximo, teremos:

• BM ((a, b), r) = {(x, y) ∈ R2 | |x − a| < r e |y − b| < r} = (a − r, a + r) × (b − r, b + r).

• BM [(a, b), r] = {(x, y) ∈ R2 | |x − a| ≤ r e |y − b| ≤ r} = [a − r, a + r] × [b − r, b + r].

• SM [(a, b), r] = {(x, y) ∈ R2 | |x − a| ≤ r e |y − b| = r} ∪ {(x, y) ∈ R2 | |x − a| = r e |y − b| ≤ r}.

Fig. 2: Bola aberta, bola fechada e esfera no plano em relação à métrica do máximo

Finalmente, se tomarmos R2 com a métrica da soma, teremos:

• BS ((a, b), r) = {(x, y) ∈ R2 | |x − a| + |y − b| < r} ,

é a região interior ao quadrado de vértices nos pontos (a, b + r), (a, b − r), (a − r, b), (a + r, b).

• BS [(a, b), r] = {(x, y) ∈ R2 | |x − a| + |y − b| ≤ r} ,

é a união da região limitada pelo quadrado de vértices nos pontos (a, b + r), (a, b − r), (a − r, b),
(a + r, b) com o próprio quadrado.

J. Delgado - K. Frensel 7
Análise

• SS [(a, b), r] = {(x, y) ∈ R2 | |x − a| + |y − b| = r}

é o quadrado de vértices nos pontos (a, b + r), (a, b − r), (a − r, b), (a + r, b).

Fig. 3: Bola aberta, bola fechada e esfera no plano em relação à métrica da soma

Então, temos que:


BS ((a, b), r) ⊂ B((a, b), r) ⊂ BM ((a, b), r) .

Fig. 4: Relação entre as bolas abertas de mesmo centro e raio em relação às métricas euclidiana, da soma e do máximo

Observação 3.2. De um modo geral, a bola aberta BM (a, r) ⊂ Rn , definida pela norma
kxkM = max{ |x1 |, . . . , |xn |}, é o produto cartesiano (a1 − r, a1 + r) × . . . × (an − r, an + r), onde
a = (a1 , . . . , an ).

De fato,
x = (x1 , . . . , xn ) ∈ BM (a, r) ⇐⇒ |x1 − a1 | < r , . . . , |xn − a| < r
⇐⇒ x1 ∈ (a1 − r, a1 + r) , . . . , xn ∈ (an − r, an + r)
⇐⇒ (x1 , . . . , xn ) ∈ (a1 − r, a1 + r) × . . . × (an − r, an + r) .
O fato das bolas de Rn serem produto cartesiano de intervalos da reta, torna esta métrica, em
muitas ocasiões, mais conveniente do que a métrica euclidiana.

• Mostraremos, agora, que as bolas relativas a diferentes normas em Rn têm em comum o fato
de serem convexas.

Definição 3.1. Sejam x, y ∈ Rn . O segmento de reta de extremos x e y é o conjunto


[x, y] = { (1 − t) x + t y | t ∈ [0, 1] } .

8 Instituto de Matemática UFF


Bolas e conjuntos limitados

Definição 3.2. Um subconjunto X ⊂ Rn é convexo quando contém qualquer segmento de reta


cujos extremos pertencem a X, ou seja,
x, y ∈ X =⇒ [x, y] ⊂ X .

Exemplo 3.2. Todo subespaço vetorial E ⊂ Rn é convexo.

Exemplo 3.3. Todo subespaço afim a + E = {a + x | x ∈ E}, onde E ⊂ Rn é um subespaço, é


um conjunto convexo.

Exemplo 3.4. Se X ⊂ Rm e Y ⊂ Rn são conjuntos convexos, então X×Y ⊂ Rm+n é convexo.

Exemplo 3.5. O conjunto X = Rn − {0} ⊂ Rn não é convexo, pois e1 ∈ X, −e1 ∈ X, mas


1 1
[e1 , −e1 ] 6⊂ X, pois e1 + (−e1 ) = 0 ∈
/ X.
2 2

Teorema 3.1. Toda bola aberta ou fechada de Rn , com respeito a qualquer norma, é um
conjunto convexo.

Prova.
Sejam x, y ∈ B(a, r). Então kx − ak < r e ky − ak < r. Logo,
k(1 − t)x + ty − ak = k(1 − t)x + ty − (1 − t)a − tak ≤ k(1 − t)(x − a)k + kt(y − a)k < (1 − t)r + tr = r ,

para todo t ∈ [0, 1], pois 1 − t ≥ 0 e t > 0 ou 1 − t > 0 e t ≥ 0.

De modo análogo, podemos provar que a bola fechada é convexa. 

Definição 3.3. Um subconjunto X ⊂ Rn é limitado com respeito a uma norma k k em Rn


quando existe c > 0 tal que kxk ≤ c para todo x ∈ X, ou seja, quando existe c > 0 tal que
X ⊂ B[0, c] .

Observação 3.3. Um subconjunto X ⊂ Rn é limitado se, e só se, existe a ∈ Rn e r > 0 tal
que X ⊂ B[a, r].

De fato, se X ⊂ B[a, r], então kx − ak ≤ r para todo x ∈ X. Logo,


kxk = kx − a + ak ≤ kx − ak + kak ≤ r + kak ,

para todo x ∈ X, ou seja, X ⊂ B[0, r + kak].

Observação 3.4. Como as três normas usuais de Rn satisfazem as desigualdades


kxkM ≤ kxk ≤ kxkS ≤ nkxkM ,

temos que um subconjunto X ⊂ Rn é limitado em relação a uma dessas normas se, e só se, é
limitado em relação a qualquer das outras duas.

J. Delgado - K. Frensel 9
Análise

Teorema 3.2. Um subconjunto X ⊂ Rn é limitado em relação à norma euclidiana se, e só se,
suas projeções π1 (X), . . . , πn (X) são conjuntos limitados em R.

Prova.
X é limitado com respeito à norma euclidiana k k ⇐⇒ X ⊂ Rn é limitado com respeito à norma
do máximo k kM ⇐⇒ ∃ r > 0 tal que X ⊂ BM [0, r] = [−r, r] × . . . × [−r, r] ⇐⇒ ∃ r > 0 tal que
π1 (X) ⊂ [−r, r], . . . , πn (X) ⊂ [−r, r] ⇐⇒ π1 (X), . . . , πn (X) são limitados em R. 

Observação 3.5. Mostraremos depois que duas normas quaisquer k k1 e k k2 em Rn são


equivalentes, ou seja, existem d, c > 0 tais que
c kxk2 ≤ kxk1 ≤ d kxk2 ,

para todo x ∈ Rn . Assim, se X ⊂ Rn é limitado com respeito a uma norma em Rn , será também
limitado em relação a qualquer outra norma em Rn .

4 Sequências no espaço euclidiano

Salvo menção explı́cita em contrário,estaremos assumindo que a norma considerada em


Rn é a norma euclidiana.

Definição 4.1. Uma sequência em Rn é uma aplicação x : N −→ Rn . O valor x(k) é indicado


com xk , e chama-se o k−ésimo termo da sequência.

Usaremos a notação (xk ), (xk )k∈N ou (x1 , x2 , . . . , xn , . . .) para indicar a sequência cujo k−ésimo
termo é xk .

Definição 4.2. Uma subsequência de (xk ) é a restrição da sequência a um subconjunto infi-


nito N 0 = {k1 < k2 < . . . < ki < . . .} ⊂ N.

A subsequência é indicada pelas notações (xk )k∈N 0 , (xki )i∈N ou (xk1 , xk2 , . . . , xki , . . .).

Definição 4.3. Dizemos que uma sequência (xk )k∈N é limitada quando o conjunto formado
pelos seus termos é limitado, ou seja, quando existe c > 0 tal que kxk k ≤ c para todo k ∈ N.

Observação 4.1. Uma sequência (xk ) em Rn equivale a n sequências (xki )k∈N , i = 1, . . . , n,


de números reais, onde xki = πi (xk ) = i−ésima coordenada de xk , i = 1, . . . , n.

As n sequências (xki )k∈N , i = 1, . . . , n são chamadas as sequências das coordenadas da


sequência (xk ).

10 Instituto de Matemática UFF


Sequências no espaço euclidiano

Pelo teorema 3.2, temos, então, que uma sequência (xk ) é limitada se, e só se, cada uma
de suas sequências de coordenadas (xki )k∈N , i = 1, . . . , n, é limitada em R.

Definição 4.4. Dizemos que o ponto a ∈ Rn é o limite da sequência (xk ) quando, para todo
ε > 0 dado, existe k0 ∈ N tal que k > k0 =⇒ kxk − ak < ε

Neste caso, dizemos que (xk ) converge para a ou tende para a.

Notação:

• lim xk = a , lim xk = a , lim xk = a ou xk −→ a são equivalentes.


k→∞ k∈N

• Quando existe o limite a = lim xk , dizemos que a sequência (xk ) é convergente. Caso contrário,
dizemos que a sequência (xk ) é divergente.

Observação 4.2. O limite de uma sequência (xk ) convergente é único.


Ou seja, se a = lim xk e b = lim xk , então a = b.
ka − bk
De fato, se ε = > 0, existe k0 ∈ N tal que kxk0 − ak < ε e kxk0 − bk < ε. Logo,
2
ka − bk ≤ kxk0 − ak + kxk0 − bk < 2ε = ka − bk ,

uma contradição.

Observação 4.3. lim xk = a ⇐⇒ lim kxk − ak = 0.


k→∞ k→∞

Observação 4.4. lim xk = a ⇐⇒ ∀ ε > 0 ∃ k0 ∈ N ; xk ∈ B(a, ε) ∀ k > k0 , ou seja, qualquer


k→∞
bola aberta de centro a contém todos os termos xk salvo, possivelmente, um número finito de
ı́ndices k.

• Com isto, podemos definir o limite e convergência de uma sequência num espaço métrico
(M, d) qualquer.

Observação 4.5. Toda sequência convergente é limitada.


De fato, seja (xk )k∈N uma sequência convergente.

Dado ε = 1 > 0, existe k0 ∈ N tal que kxk − ak < 1 para todo k > k0 .

Se r = max{ 1, kx1 − ak, . . . , kxk0 − ak } > 0, então, kxk − ak ≤ r para todo k ∈ N, ou seja,
{xk | k ∈ N} ⊂ B[a, r].

• Mas a recı́proca não é verdadeira.

Por exemplo, se a 6= b, a sequência {a, b, a, b, a, . . .} é limitada, mas não é convergente.

J. Delgado - K. Frensel 11
Análise

Observação 4.6. Toda subsequência de uma sequência convergente é convergente e tem o


mesmo limite.

Observação 4.7. Como as três normas usuais de Rn estão relacionadas pelas desigualda-
des
kxkM ≤ kxk ≤ kxkS ≤ nkxkM ,

temos que:
lim kxk − akM = 0 ⇐⇒ lim kxk − ak = 0 ⇐⇒ lim kxk − akS = 0 .
k→∞ k→∞ k→∞

ou seja, a afirmação lim xk = a independe de qual das três normas usuais estamos conside-
k→∞
rando.

Como provaremos depois que duas normas quaisquer de Rn são equivalentes, a noção de
limite de uma sequência em Rn permanece a mesma seja qual for a norma que considerarmos.

Teorema 4.1. Uma sequência (xk ) em Rn converge para o ponto a = (a1 , . . . , an ) se, e só se,
lim xk i = ai para todo i = 1, . . . , n.
k→∞

Prova.
Como |xk i − ai | ≤ kxk − akM , temos que se lim xk = a, ou seja, se lim kxk − akM = 0,
k→∞ k→∞
então lim |xk i − ai | = 0, para todo i = 1, . . . , n, e, portanto, lim xk i = ai , i = 1, . . . , n.
k→∞ k→∞

Suponhamos, agora, que lim xk i = ai , i = 1, . . . , n.


k→∞

Dado ε > 0, existe, para cada i = 1, . . . , n, um número natural ki tal que |xk i − ai | < ε para todo
k > ki .

Seja k0 = max{ k1 , . . . , kn }. Então, k > k0 =⇒ kxk − akM = max { |xk i − ai | } < ε.


1≤i≤n

Logo lim xk = a. 
k→∞

Corolário 4.1. Se (xk ), (yk ) são sequência convergentes em Rn e (λk ) é uma sequência
convergente em R, com a = lim xk , b = lim yk e λ = lim λk , então:

(a) lim (xk + yk ) = a + b ,


k→∞

(b) lim λk xk = λa ,
k→∞

(c) lim hxk , yk i = ha, bi .


k→∞

(d) lim kxk k = kak.


k→∞

12 Instituto de Matemática UFF


Sequências no espaço euclidiano

Prova.
Pelo teorema 4.1, temos que lim xki = ai e lim yki = bi , i = 1, . . . , n.
k→∞ k→∞

Utilizando novamente o teorema 4.1 e os fatos conhecidos sobre limites de somas e de produtos
de sequências de números reais, temos que:

(a) lim (xki + yki ) = ai + bi , i = 1, . . . , n =⇒ lim (xk + yk ) = a + b .


k→∞ k→∞

(b) lim λk xki = λai , i = 1, . . . , n =⇒ lim λk xk = λa .


k→∞ k→∞

(c) lim hxk , yk i = lim ( xk1 yk1 + . . . + xkn ykn ) = a1 b1 + . . . + an bn = ha, bi .


k→∞ k→∞
p p
(d) lim kxk k = lim hxk , xk i = ha, ai = kak .
k→∞ k→∞

Também podemos provar (d) observando que | kxk k − kak | ≤ kxk − ak, que tem a vantagem de
valer para qualquer norma. 

Teorema 4.2. (Bolzano-Weierstrass)


Toda sequência limitada em Rn possui uma subsequência convergente.

Prova.
Caso n = 1: Seja (xk ) uma sequência limitada de números reais, e sejam a < b tais que
xk ∈ [a, b] para todo k ∈ N.

Consideremos o conjunto:
A = { t ∈ R | xk ≥ t para uma infinidade de ı́ndices k } .

Temos que a ∈ A e todo elemento de A é menor ou igual a b. Logo A 6= ∅ e é limitado


superiormente por b. Seja c = sup A.

Então, dado ε > 0 existe tε ∈ A tal que c − ε < tε . Assim, existe uma infinidade de ı́ndices k tais
que xk > c − ε.

Por outro lado, como c + ε 6∈ A, xk ≥ c + ε no máximo para um número finito de ı́ndices.

Assim, c − ε < xk < c + ε para uma infinidade de ı́ndices k, e, portanto, c é o limite de uma
subsequência de (xk ).

Caso geral: Seja (xk ) uma sequência limitada em Rn .

Pelo teorema 3.2, as sequências (xki )k∈N , i = 1, . . . , n, de coordenadas de (xk ) são sequências
limitadas de números reais.

Como (xk1 )k∈N é limitada, existe N1 ⊂ N infinito e a1 ∈ R tal que lim xk1 = a1 . Por sua vez,
k∈N1
como a sequência (xk2 )k∈N1 de números reais é limitada, existe N2 ⊂ N1 infinito e a2 ∈ R tais

J. Delgado - K. Frensel 13
Análise

que lim xk2 = a2 .


k∈N2

Prosseguindo dessa maneira, obtemos n conjuntos infinitos N ⊃ N1 ⊃ . . . ⊃ Nn e n números


reais a1 , . . . , an tais que lim xki = ai , i = 1, . . . , n.
k∈Ni

Sendo a = (a1 , . . . , an ), temos que lim xk = a, o que conclui a demonstração. 


k∈Nn

Definição 4.5. Dizemos que um ponto a ∈ Rn é valor de aderência de uma sequência (xk )
de pontos de Rn quando a é limite de alguma subsequência de (xk ).

Observação 4.8. Uma sequência (xk ) não possui valor de aderência ⇐⇒ (xk ) não possui
subsequência limitada ⇐⇒ para todo número real A > 0 dado, existe k0 ∈ N tal que k > k0 =⇒
kxk k > A.

Observação 4.9. a ∈ Rn é valor de aderência de (xk )k∈N ⇐⇒ dados ε > 0 e k0 ∈ N, existe


k > k0 tal que kxk − ak < ε.

Observação 4.10. Uma sequência convergente possui um único valor de aderência, mas a
recı́proca não vale, pois, por exemplo, a sequência (1, 2, 1, 3, 1, 4, . . .) possui o 1 como único
valor de aderência, mas não converge, já que é ilimitada.

Teorema 4.3. Uma sequência limitada em Rn é convergente se, e somente se, possui um
único valor de aderência.

Prova.
(=⇒) É imediato.

(⇐=) Seja (xk ) uma sequência limitada e seja a ∈ Rn o seu único valor de aderência.

Suponhamos, por absurdo, que a sequência (xk ) não converge para a. Então, existe ε0 > 0 tal
que para todo k ∈ N, existe k 0 > k tal que kxk 0 − ak ≥ ε0 , ou seja, o conjunto N 0 = { k ∈ N | xk ∈
/
B(a, ε0 ) } é ilimitado e, portanto, infinito.

Como a sequência (xk )k∈N 0 é limitada, existe, pelo teorema 4.2, N 00 ⊂ N 0 infinito e b ∈ Rn tais
que lim00 xk = b.
k∈N

Sendo kxk − ak ≥ ε0 > 0 para todo k ∈ N 00 , temos que kb − ak ≥ ε0 > 0. Logo b 6= a e b é valor
de aderência de (xk ), uma contradição, já que (xk ) possui um único valor de aderência. 

Definição 4.6. Dizemos que uma sequência (xk ) é de Cauchy quando para todo ε > 0 existe
k0 ∈ N tal que k, ` > k0 =⇒ kxk − x` k < ε.

14 Instituto de Matemática UFF


Sequências no espaço euclidiano

Observação 4.11. (xk )k∈N é de Cauchy ⇐⇒ para cada i = 1, . . . , n, a sequência (xki )k∈N das
suas i−ésimas coordenadas é uma sequência de Cauchy de números reais.

Teorema 4.4. Uma sequência (xk )k∈N em Rn é de Cauchy se, e só se, é convergente.

Prova.
(⇐=) É imediato.

(=⇒) Seja (xk ) uma sequência de Cauchy em Rn .

Então, para cada i = 1, . . . , n, a sequência (xki )k∈N de suas i−ésimas coordenadas é de Cau-
chy e, portanto, convergente. Sendo ai = lim xki , i = 1, . . . , n, temos, pelo teorema 4.2, que
k∈N
a = (a1 , . . . , an ) = lim xk , ou seja, (xk ) é convergente e tem limite a. 
k∈N

Definição 4.7. Dizemos que duas normas k k1 e k k2 em Rn são equivalentes quando


existem a > 0 e b > 0 tais que
kxk1 ≤ akxk2 e kxk2 ≤ bkxk1 ,

para todo x ∈ Rn .

Observação 4.12. Se, para todo x0 ∈ Rn e todo r > 0, B1 (x0 , r) e B2 (x0 , r) indicarem, res-
pectivamente, a bola aberta de centro x0 e raio r segundo as normas k k1 e k k2 , as desigual-
dades acima significam que:
B2 (x0 , r) ⊂ B1 (x0 , ar) e B1 (x0 , r) ⊂ B2 (x0 , br) .

Observação 4.13. As três normas usuais em Rn são equivalentes, pois


kxkM ≤ kxk ≤ kxkS ≤ nkxkM .

Observação 4.14. A equivalência entre normas é uma relação reflexiva, simétrica e transi-
tiva.

Observação 4.15. Se duas normas k k1 e k k2 são equivalentes, então:


• lim kxk −ak1 = 0 ⇐⇒ lim kxk −ak2 = 0, ou seja, normas equivalentes dão origem à mesma
noção de limite em Rn .

• X ⊂ Rn é limitado em relação à norma k k1 se, e só se, X ⊂ Rn é limitado em relação à


norma k k2 .

Teorema 4.5. Duas normas quaisquer no espaço Rn são equivalentes.

J. Delgado - K. Frensel 15
Análise

Prova.
Por transitividade, basta mostrar que uma norma qualquer k k em Rn é equivalente à norma
X n
da soma kxkS = |xi |.
i=1

Sejam {e1 , . . . , en } a base canônica de Rn e a = max{ke1 k, . . . , ken k}. Então,


kxk = kx1 e1 + . . . + xn en k ≤ |x1 | ke1 k + . . . + |xn | ken k
≤ a ( |x1 | + . . . + |xn | ) ≤ a kxkS ,
para todo x = (x1 , . . . , xn ) ∈ Rn .

Seja F = { kxk | kxkS = 1 } ⊂ R. Então, F 6= ∅ e limitado, pois 0 < kxk ≤ a para todo x ∈ Rn tal
que kxkS = 1.

Seja b = inf F. Então b ≥ 0.

Suponhamos que b = 0.
1
Dado k ∈ N, existe xk ∈ Rn tal que 0 < kxk k < e kxk kS = 1.
k
Como a sequência (xk )k ∈ N é limitada na norma da soma, temos, pelo teorema 4.2, que existe
N 0 ⊂ N infinito e c ∈ Rn tais que lim0 kxk − ckS = 0.
k∈N

Assim, pelo item (d) do corolário 4.1, temos que lim0 kxk kS = kckS . Logo kckS = 1, e, portanto,
k∈N
c 6= 0.

Como kxk − ck ≤ akxk − ckS para todo k ∈ N 0 e lim0 kxk − ckS = 0, temos que lim0 kxk − ck = 0
k∈N k∈N
e, portanto, lim0 kxk k = kck.
k∈N

1
Por outro lado, como kxk k < para todo k ∈ N, temos que lim kxk k = 0, o que é uma
k k∈N
contradição, já que kck =
6 0.

Logo inf F = b > 0. Assim, kxk ≥ b para todo x ∈ Rn tal que kxkS = 1.

x
kxkS ≥ b , para todo x ∈ R − {0}, ou seja, kxk ≥ bkxkS para todo x ∈ R . 
n n
Então,

Aplicação: Uma sequência de polinômios pk (t) = ak0 +ak1 t+. . .+akn tn de grau ≤ n converge
para o polinômio p(t) = a0 + a1 t + . . . + an tn uniformemente no intervalo não-degenerado [α, β]
se, e só se, para cada i = 0, 1, . . . , n, a sequência (aki )k∈N dos coeficientes de ti nos polinômios
pk converge para o coeficiente ai de ti no polinômio p.

De fato, existe um isomorfismo linear Φ entre o espaço vetorial Rn+1 e o espaço vetorial Pn
dos polinômios reais de grau ≤ n dado por Φ((b0 , b1 , . . . , bn )) = pb (t) = b0 + b1 t + . . . + bn tn .

16 Instituto de Matemática UFF


Pontos de acumulação

Seja kxk = sup{ |px (t)| | t ∈ [α, β] }. É fácil verificar que k k define uma norma em Rn+1 ,
pois:

(a) kλxk = sup{ |pλx (t)| | t ∈ [α, β] } = sup{ |λ| |px (t)| | t ∈ [α, β] } = |λ| kxk .

(b) x = (x0 , x1 , . . . , xn ) 6= 0 =⇒ px (t) = 0 no máximo para n valores distintos de t ∈ [α, β]

=⇒ ∃ t0 ∈ [α, β] tal que |px (t0 )| > 0 =⇒ kxk = sup |px (t)| ≥ |px (t0 )| > 0 .
t∈[α,β]

(c) Como px+y (t) = px (t) + py (t), temos que


|px+y (s)| ≤ |px (s)| + |py (s)| ≤ sup |px (t)| + sup |py (t)| , para todo s ∈ [α, β] ,
t∈[α,β] t∈[α,β]

Logo,
|px+y (s)| ≤ kxk + kyk , para todo t ∈ [α, β]

e, portanto, kx + yk ≤ kxk + kyk.

Em relação a esta norma, xk −→ a em Rn+1 ⇐⇒ kxk − ak = sup |pxk (t) − pa (t)| −→ 0


t∈[α,β]
⇐⇒ pxk −→ pa uniformemente em [α, β].

Como duas normas quaisquer são equivalentes em Rn+1 , temos que xki −→ ai para todo
i = 0, 1, . . . , n ⇐⇒ kxk − akM −→ 0 ⇐⇒ kxk − ak −→ 0 ⇐⇒ pxk −→ pa uniformemente em [α, β].

• Na norma k k definida acima, podemos trocar o intervalo [α, β] não-degenerado por um


subconjunto X ⊂ R infinito qualquer. 

5 Pontos de acumulação

Definição 5.1. Seja X ⊂ Rn . Um ponto a ∈ Rn é ponto de acumulação de X quando para


todo ε > 0 temos que X ∩ (B(a, ε) − {a}) 6= ∅, ou seja, para todo ε > 0, existe x ∈ X tal que
0 < kx − ak < ε.

O conjunto dos pontos de acumulação de X será representado por X 0 e chamado o conjunto


derivado de X.

Exemplo 5.1. B[a, r] = (B(a, r)) 0 .


De fato:

(1) S[a, r] ⊂ (B(a, r)) 0


r
Seja b ∈ S[a, r]. Dado ε > 0, podemos supor, sem perda de generalidade, que 0 < ε < .
2

J. Delgado - K. Frensel 17
Análise

ε 1
Tome 0 < t0 = < . Então:
2r 4
ε
• kb − ((1 − t0 )b + t0 a)k = kt0 (b − a)k = |t0 | r = < ε,
2
e

• ka − ((1 − t0 )b + t0 a)k = |1 − t0 | kb − ak = (1 − t0 )r < r, pois 0 < 1 − t0 < 1.

Logo (1 − t0 )a + t0 b ∈ B(b, ε) ∩ (B(a, r) − {a}), ou seja, B(b, ε) ∩ (B(a, r) − {a}) 6= ∅.

Então b ∈ B(a, r) 0 .

(2) B(a, r) ⊂ B(a, r) 0 .

• Seja b ∈ B(a, r), b 6= a. Dado ε > 0, podemos supor, sem perda de generalidade, que
0 < ε < kb − ak.
ε 1
Tome 0 < t0 = < . Então:
2kb − ak 2
ε
• k(1 − t0 )b + t0 a − bk = |t0 | kb − ak = < ε,
2
e

• k(1 − t0 )b + t0 a − ak = |1 − t0 | kb − ak < r , pois kb − ak < r e |1 − t0 | < 1.

Logo (1 − t0 )a + t0 b ∈ B(b, ε) ∩ (B(a, r) − {a}).

Então b ∈ B(a, r) 0 .
ε e1
• Para b = a e 0 < ε < r, tome c = a + .
2 ke1 k
ε ke1 k ε
Assim, kb − ck = ka − ck = = < ε < r. Logo c ∈ B(a, ε) ∩ (B(a, r) − {a}).
2 ke1 k 2
Ou seja, a ∈ B(a, r) 0 .

(3) b 6∈ B[a, r] =⇒ b 6∈ B(a, r) 0 .

Seja b 6∈ B[a, r], isto é, kb − ak > r, e seja ε0 = kb − ak − r > 0.

Então, B(b, ε0 ) ∩ B(a, r) = ∅, pois, caso contrário, existiria x ∈ Rn tal que kx − bk < ε0 e
kx − ak < r =⇒ ka − bk ≤ kx − bk + ka − xk < ε0 + r = kb − ak, uma contradição.

Logo b 6∈ B(a, r) 0 . 

Observação 5.1. Como vimos neste exemplo, um ponto de acumulação de um conjunto X


pode pertencer ou não a X.

E neste exemplo, todo ponto de X é ponto de acumulação de X, mas isso nem sempre acontece.

18 Instituto de Matemática UFF


Pontos de acumulação

Definição 5.2. Um ponto a ∈ X que não é ponto de acumulação de X é chamado ponto


isolado de X.

Ou seja, a ∈ X é um ponto isolado de X se, e só se, existe ε0 > 0 tal que B(a, ε0 ) ∩ X = {a}.

Quando todos os pontos de X são pontos isolados, dizemos que X é um conjunto discreto.

Exemplo 5.2. N é um conjunto discreto. 



1 1
1 1
Exemplo 5.3. No conjunto X = 0, 1, , . . . , , . . . , os pontos 1, , . . . , , . . . são isolados e
2 n 2 n
0 ∈ X 0. 

Teorema 5.1. Dados X ⊂ Rn e a ∈ Rn , as seguintes afirmações são equivalentes:


(1) a ∈ X 0 ;

(2) Existe uma sequência (xk ) de pontos de X com lim xk = a e xk 6= a para todo k ∈ N;

(3) Toda bola aberta de centro a contém uma infinidade de pontos de X.

Prova.  1 1
(1)=⇒(2): Como a ∈ X 0 , dado k ∈ N, existe xk ∈ B a, ∩ (X − {a}), ou seja, 0 < kxk − ak < .
k k
Logo xk 6= a para todo k ∈ N e lim xk = a .
k→∞

(2)=⇒(3): Dado ε > 0, existe k0 ∈ N tal que xk ∈ B(a, ε) para todo k ≥ k0 .

O conjunto {xk | k ≥ k0 } é infinito, porque, caso contrário, (xk ) teria uma subsequência constante,
que convergiria para um limite diferente de a, já que xk 6= a para todo k ∈ N. Logo X ∩ B(a, ε) é
um conjunto infinito.

(3)=⇒(1): É evidente. 

Corolário 5.1. Se X 0 6= ∅, então X é infinito.

Observação 5.2. A recı́proca do corolário acima é falsa. Por exemplo, N é infinito, mas
N 0 = ∅.

Teorema 5.2. (Bolzano-Weierstrass)


Se X ⊂ Rn é um conjunto infinito e limitado, então X 0 6= ∅.

Prova.
Sendo infinito, X contém um subconjunto infinito enumerável {x1 , . . . , xk , . . .}. Assim, (xk ) é uma
sequência limitada de pontos de X tal que xk 6= x` para k 6= `.

J. Delgado - K. Frensel 19
Análise

Pelo teorema 4.4, existe N 0 ⊂ N infinito e a ∈ Rn tais que lim0 xk = a. Como os termos xk são
k∈N
dois a dois distintos, no máximo um deles é igual a a. Eliminando-o, se necessário, obtemos
uma sequência de pontos de X, todos diferentes de a, com limite a.

Então, pelo teorema 5.1, a ∈ X 0 . 

6 Aplicações contı́nuas

Definição 6.1. Seja f : X −→ Rn uma aplicação definida no conjunto X ⊂ Rm . Dizemos que


f é contı́nua no ponto a ∈ X quando, para todo ε > 0 dado, existe δ > 0 tal que se x ∈ X e
kx − ak < δ, então kf(x) − f(a)k < ε.

Ou seja, para toda bola aberta B(f(a), ε) de centro f(a) em Rn , existe uma bola aberta B(a, δ)
de centro a ∈ Rm tal que f(X ∩ B(a, δ)) ⊂ B(f(a), ε).

Se f : X −→ Rn é contı́nua em todos os pontos do conjunto X, dizemos que f é uma aplicação


contı́nua.

Observação 6.1. Se a ∈ Y ⊂ X e f : X −→ Rn é contı́nua em a, então f|Y : Y −→ Rn é


contı́nua em a.

Observação 6.2. Se a ∈ X e r > 0 são tais que f|B(a,r)∩X é contı́nua em a, então f : X −→ Rn


é contı́nua em a, pois, dado ε > 0, existe δ > 0 tal que
f(B(a, r) ∩ X ∩ B(a, δ)) ⊂ B(f(a), ε) .

Então, para δ 0 = min{r, δ} > 0,


f(B(a, δ 0 ) ∩ X) ⊂ B(f(a), ε) .

Portanto, a continuidade de uma aplicação é uma propriedade local.

Observação 6.3. Pela definição de continuidade de uma aplicação f : X ⊂ Rm −→ Rn num


ponto a ∈ X, pela definição de normas equivalentes e pelo teorema 4.5, verifica-se, facilmente,
que a continuidade (ou descontinuidade) de f num ponto a independe das normas consideradas
em Rm e Rn .

Observação 6.4. Se a é um ponto isolado do conjunto X, então toda aplicação f : X −→ Rn


é contı́nua no ponto a.

De fato, seja δ0 > 0 tal que B(a, δ0 ) ∩ X = {a}. Então, dado ε > 0, existe δ = δ0 > 0 tal que
f(B(a, δ) ∩ X) = {f(a)} ⊂ B(f(a), ε) .

20 Instituto de Matemática UFF


Aplicações contı́nuas

Definição 6.2. Dado X ⊂ Rm , uma aplicação f : X −→ Rn é lipschitziana quando existe K > 0


tal que
kf(x) − f(y)k ≤ Kkx − yk ,

para quaisquer x, y ∈ X.

Observação 6.5. Toda aplicação lipschitziana f : X −→ Rn é contı́nua.


ε
De fato, dados ε > 0 e a ∈ X, existe δ = > 0, tal que
K
x ∈ X e kx − ak < δ =⇒ kf(x) − f(a)k ≤ Kkx − ak < K δ = ε.

Observação 6.6. Ser ou não lipschitziana independe das normas tomadas em Rm e Rn .

Observação 6.7. Toda transformação linear A : Rm −→ Rn é lipschitziana.


De fato, sejam {e1 , . . . , em } a base canônica de Rm e K = max{kA(e1 )k, . . . , kA(em )k}. Então,
para todo x ∈ Rm ,
kA(x)k = kA(x1 e1 + . . . + xm em )k = kx1 A(e1 ) + . . . + xm A(em )k
≤ |x1 | kA(e1 )k + . . . + |xm | kA(em )k ≤ K(|x1 | + . . . + |xm |)
= K kxkS .
Logo kA(x) − A(y)k = kA(x − y)k ≤ Kkx − ykS , quaisquer que sejam x, y ∈ Rm .

Observação 6.8. Seja ϕ : Rm × Rn −→ Rp uma aplicação bilinear. Então ϕ|X é lipschitziana,


para todo X ⊂ Rm × Rn limitado.

De fato, se K = max{kϕ(ei , ej )k | i = 1, . . . , m , j = 1, . . . , n}, então


X X X
!
m n
kϕ(x, y)k = ϕ xi e i , yj ej = xi yj ϕ(ei , ej )


i=1 j=1 i,j
X X
≤ |xi | |yj | kϕ(ei , ej )k ≤ K |xi | |yj |
i,j i,j

= K kxkS kykS .

Se consideramos Rm × Rn com a norma da soma, temos que


kϕ(x, y) − ϕ(x 0 , y 0 )k = kϕ(x, y − y 0 ) + ϕ(x − x 0 , y 0 )k
≤ kϕ(x, y − y 0 )k + kϕ(x − x 0 , y 0 )k
≤ K ( kxkS ky − y 0 kS + kx − x 0 kS ky 0 kS ) ,
para quaisquer (x, y), (x 0 , y 0 ) ∈ Rm × Rn .

Como X é limitado em Rm × Rn , existe r > 0 tal que k(x, y)kS = kxkS + kykS ≤ r para todo
(x, y) ∈ X.

J. Delgado - K. Frensel 21
Análise

Logo, se (x, y), (x 0 , y 0 ) ∈ X, temos que kxkS ≤ r e ky 0 kS ≤ r e, portanto,


kϕ(x, y) − ϕ(x 0 , y 0 )k ≤ K r ( kx − x 0 kS + ky − y 0 kS ) = K r ( k(x, y) − (x 0 , y 0 )kS ) .

Portanto, ϕ cumpre uma condição de Lipschitz, com constante Kr, em cada bola BS [0, r] do
espaço Rm × Rn = Rm+n .

Em particular, toda aplicação bilinear é contı́nua.

6.1 Exemplos de aplicações bilineares

(1) A multiplicação de números reais ϕ : R × R −→ R ϕ(x, y) = xy.

(2) A multiplicação de um escalar por um vetor ϕ : R × Rn −→ Rn , ϕ(λ, x) = λx.


X
n
n
(3) O produto interno ϕ : R × R −→ R , ϕ(x, y) = xi yi .
i=1

(4) A multiplicação de matrizes ϕ : M(m × n) × M(n × p) −→ M(m × p) , ϕ(A, B) = A B .

(5) A avaliação ϕ : L(Rm , Rn ) × Rm −→ Rn , ϕ(T, x) = T x .

Observação 6.9. Toda aplicação bilinear não-nula ϕ : Rm × Rn −→ Rp não é lipschitziana


em Rm × Rn .

De fato, seja (x0 , y0 ) ∈ Rm × Rn tal que ϕ(x0 , y0 ) 6= 0. Suponhamos, por absurdo, que existe
K > 0 tal que kϕ(x, y)k ≤ K k(x, y)k para todo (x, y) ∈ Rm × Rn .

Então kϕ(λx0 , λy0 )k ≤ K k(λx0 , λy0 )k para todo λ ∈ R.

Logo λ2 kϕ(x0 , y0 )k ≤ K |λ| k(x0 , y0 )k para todo λ ∈ R.


K k(x0 , y0 )k
Assim, |λ| ≤ para todo λ ∈ R, o que é uma contradição.
kϕ(x0 , y0 )k

Definição 6.3. Uma aplicação f : X ⊂ Rm −→ Rn é uma imersão isométrica quando


kf(x) − f(y)k = kx − yk para quaisquer x, y ∈ X.

Observação 6.10. A noção de imersão isométrica depende das normas consideradas nos
espaços Rm e Rn .

Observação 6.11. Toda imersão isométrica é uma aplicação lipschitziana.

Observação 6.12. Toda imersão isométrica é injetora, pois


f(x) = f(y) =⇒ kx − yk = kf(x) − f(y)k = 0 =⇒ x = y .

22 Instituto de Matemática UFF


Aplicações contı́nuas

Exemplo 6.1. Para m ≥ n a aplicação f : Rn −→ Rm , dada por


f(x1 , . . . , xn ) = (x1 , . . . , xn , 0, . . . , 0) ,

é uma imersão isométrica, se consideramos Rn e Rm com a norma euclidiana, ou com a norma


do máximo ou com a norma da soma, por exemplo. 

Definição 6.4. Uma imersão isométrica f : X ⊂ Rm −→ Rn , com f(X) = Y, chama-se uma


isometria de X sobre Y. Sua inversa f−1 : Y −→ X é, por sua vez, uma isometria de Y sobre X.

Exemplo 6.2. Dado a ∈ Rn , a translação Ta : Rn −→ Rn , Ta (x) = a + x, é uma isometria de


Rn sobre Rn sendo (Ta )−1 = T−a a sua inversa.

Observe que Ta é linear se, e somente se, a = 0. 

Exemplo 6.3. Consideremos Rn com a norma euclidiana. Uma transformação linear


n n
T : R −→ R é uma isometria se, e somente se, é ortogonal, ou seja, hTx, Tyi = hx, yi quaisquer
que sejam x, y ∈ Rn .

De fato, se kTxk = kxk para todo x ∈ Rn , então


1  1 
hTx, Tyi = kTx + Tyk2 − kTx − Tyk2 = kT (x + y)k2 − kT (x − y)k2
4 4
1 
= kx + yk2 − kx − yk2 = hx, yi .
4
E, reciprocamente, se hTx, Tyi = hx, yi para todos x, y ∈ Rn , então
kTx − Tyk2 = kT (x − y)k2 = hT (x − y), T (x − y)i = hx − y, x − yi = kx − yk2 ,

ou seja, kTx − Tyk = kx − yk quaisquer que sejam x, y ∈ Rn .

Uma transformação ortogonal T : Rn −→ Rn também se caracteriza pelo fato de ser {Te1 , . . . , Ten }
uma base ortonormal. Isto equivale a dizer que as colunas da matriz da transformação T em
relação à base canônica são duas a duas ortogonais e unitárias. Isto é, At A = A At = I. 

Observação 6.13. Consideremos Rn com a norma euclidiana.


Toda isometria T : Rn −→ Rn é obtida fazendo a composição de uma translação com uma
transformação ortogonal (ver exercı́cio 7.13).

Definição 6.5. Uma contração fraca f : X ⊂ Rm −→ Rn é uma aplicação lipschitziana com


constante de Lipschitz K = 1. Ou seja, f é uma contração fraca se kf(x) − f(y)k ≤ kx − yk para
quaisquer x, y ∈ X.

Observação 6.14. Se trocarmos a norma de Rm ou de Rn , uma contração fraca continua

J. Delgado - K. Frensel 23
Análise

sendo uma aplicação lipschitziana (e, portanto, contı́nua), mas ela pode deixar de ser uma
contração fraca.

Exemplo 6.4. (Contrações fracas)


(a) A soma de vetores s : Rn × Rn −→ Rn , s(x, y) = x + y, é uma contração fraca.

De fato, tomando em Rn e em Rn × Rn a norma da soma, temos que:


ks(x, y) − s(x 0 , y 0 )kS = k(x + y) − (x 0 + y 0 )kS ≤ kx − x 0 kS + ky − y 0 kS = k(x, y) − (x 0 , y 0 )kS .

(b) A projeção πi : Rn −→ R, definida por πi (x) = xi , onde x = (x1 , . . . , xn ), é uma contração


fraca.

De fato,
|πi (x) − πi (y)| = |xi − yi | ≤ kx − yk ,

podendo-se tomar em Rn qualquer uma das três normas usuais.

(c) A norma k k : Rn −→ R é uma contração fraca.

De fato, para quaisquer x, y ∈ Rn , temos que


| kxk − kyk | ≤ kx − yk .

(d) A distância d : Rn × Rn −→ R, definida por d(x, y) = kx − ykS , também é uma contração


fraca se considerarmos Rn × Rn com a norma da soma, pois:
|d(x, y) − d(x 0 , y 0 )| = | kx − ykS − kx 0 − y 0 kS |
≤ k(x − y) − (x 0 − y 0 )kS
≤ kx − x 0 kS + ky − y 0 kS = k(x, y) − (x 0 , y 0 )kS ,
para quaisquer (x, y), (x 0 , y 0 ) ∈ Rn × Rn . 

Teorema 6.1. Dados X ⊂ Rm , Y ⊂ Rn , f : X −→ Rn contı́nua no ponto a ∈ X, com f(X) ⊂ Y, e


g : Y −→ Rp contı́nua no ponto b = f(a) ∈ Y, então g ◦ f : X −→ Rp é contı́nua no ponto a.

Prova.
Sendo g contı́nua em b = f(a), dado ε > 0, existe η > 0 tal que
y ∈ Y , ky − f(a)k < η =⇒ kg(y) − g(f(a))k < ε .

Por outro lado, sendo f contı́nua em a, existe δ > 0 tal que


x ∈ X , kx − ak < δ =⇒ kf(x) − f(a)k < η .

Então,
x ∈ X , kx − ak < δ =⇒ kg(f(x)) − g(f(a))k < ε .

Isto é, g ◦ f é contı́nua no ponto a. 

24 Instituto de Matemática UFF


Aplicações contı́nuas

Observação 6.15. Dada uma aplicação f : X ⊂ Rm −→ Rn , temos que, para todo x ∈ X,


f(x) = (f1 (x), . . . , fn (x)) , onde fi = πi ◦ f : X ⊂ Rm −→ R, i = 1, . . . , n, são as funções
coordenadas de f.

Teorema 6.2. Uma aplicação f : X ⊂ Rm −→ Rn é contı́nua no ponto a ∈ X se, e só se, cada
uma das suas funções coordenadas fi = πi ◦ f : X −→ R é contı́nua no ponto a.

Prova.
(=⇒) Sendo f contı́nua no ponto a e πi : Rm −→ R contı́nua em Rn , i = 1, . . . , n, temos,
pelo teorema anterior, que fi = πi ◦ f é contı́nua no ponto a, i = 1, . . . , n.

(⇐=) Se cada função coordenada fi = πi ◦ f, i = 1, . . . , n, é contı́nua no ponto a, dado ε > 0,


existem números reais δ1 , . . . , δn > 0 tais que
x ∈ X , kx − ak < δi =⇒ |fi (x) − fi (a)| < ε .

Considerando em Rn a norma do máximo e tomando δ = min{δ1 , . . . , δn } > 0, temos que


x ∈ X , kx − ak < δ =⇒ kf(x) − f(a)kM < ε .

Logo f é contı́nua no ponto a. 

Corolário 6.1. Dadas f : X −→ Rm e g : X −→ Rn , seja (f, g) : X −→ Rm × Rn = Rm+n


a aplicação definida por (f, g)(x) = (f(x), g(x)). Então (f, g) é contı́nua no ponto a se, e só se, f
e g são contı́nuas no ponto a.

Prova.
Se f = (f1 , . . . , fm ) e g = (g1 , . . . , gn ), então, as funções coordenadas de (f, g) são
f1 , . . . , fm , g1 , . . . , gn .

Logo, pelo teorema 6.2, a aplicação (f, g) é contı́nua em a ⇐⇒ as funções coordenadas f1 , . . . , fm , g1 , . . .


são todas contı́nuas no ponto a ⇐⇒ f e g são contı́nuas no ponto a. 

O teorema 6.1 e o corolário 6.1 são de grande utilidade para mostrar a continuidade de
certas aplicações. Vejamos alguns exemplos.

Exemplo 6.5. Sejam X ⊂ Rm e f, g : X −→ Rn , λ : X −→ R aplicações contı́nuas. Então são


também contı́nuas as aplicações:
f + g : X −→ Rn , (f + g)(x) = f(x) + g(x) ;

λ f : X −→ Rn , (λ f)(x) = λ(x) f(x) ;

J. Delgado - K. Frensel 25
Análise

hf, gi : X −→ R , hf, gi(x) = hf(x), g(x)i ;


1
1 1
: X − Zλ −→ R , (x) = ,
λ λ λ(x)
onde Zλ = {x ∈ X | λ(x) = 0}.

De fato, como as aplicações s : Rn × Rn −→ Rn , ϕ : R × Rn −→ Rn , ξ : Rn × Rn −→ R e


1
ρ : R − {0} −→ R, dadas por s(x, y) = x + y, ϕ(t, x) = t x, ξ(x, y) = hx, yi e ρ(t) = , são
t
aplicações contı́nuas, e, pelo corolário 6.1, as aplicações (f, g) e (λ, f) são contı́nuas temos,
1
pelo teorema 6.1, que as aplicações f + g = s ◦ (f, g), λ f = ϕ ◦ (λ, f), hf, gi = ξ ◦ (f, g) e = ρ◦λ
λ
são também contı́nuas. 

Exemplo 6.6. A função f : R2 −→ R dada por f(x, y) = (sen x) ex2 +y3 é contı́nua, pois
f = ϕ ◦ (sen ◦π1 , exp ◦s ◦ (ξ ◦ π1 , η ◦ π2 )) ,

onde ϕ : R × R −→ R , π1 : R × R −→ R, π2 : R × R −→ R, s : R × R −→ R, ξ : R −→ R,
η : R −→ R e exp : R −→ R são as funções contı́nuas dadas por: ϕ(x, y) = x y , π1 (x, y) = x ,
π2 (x, y) = y , s(x, y) = x + y , ξ(x) = x2 , η(x) = x3 e exp(x) = ex . 

Teorema 6.3. Uma aplicação f : X ⊂ Rm −→ Rn é contı́nua no ponto a ∈ X se, e só se, para
toda sequência (xk ) de pontos de X com lim xk = a tem-se lim f(xk ) = f(a) .
k→∞ k→∞

Prova.
(=⇒) Seja f contı́nua no ponto a e (xk ) uma sequência de pontos de X com lim xk = a.

Dado ε > 0, existe δ > 0 tal que x ∈ X e kx − ak < δ =⇒ kf(x) − f(a)k < ε .

Como lim xk = a, existe k0 ∈ N tal que kxk − ak < δ para todo k > k0 . Logo kf(xk ) − f(a)k < ε
para todo k > k0 . Então f(xk ) −→ f(a).

(⇐=) Suponhamos que f não é contı́nua no ponto a. Então existe ε0 > 0 tal que para todo k ∈ N
1
podemos obter xk ∈ X com kxk − ak < e kf(xk ) − f(a)k ≥ ε0 .
k
Assim, xk −→ a, mas (f(xk )) não converge para f(a). 

Definição 6.6. Dizemos que uma aplicação f : Rm −→ Rn é contı́nua em relação à variável


xi , (i = 1, . . . , m) quando, para cada (a1 , . . . , ai−1 , ai+1 , . . . , am ) fixado, a aplicação parcial
t 7−→ f(a1 , . . . , ai−1 , t, ai+1 , . . . , an ) é contı́nua.

• Toda aplicação contı́nua f : Rm −→ Rn é separadamente contı́nua em relação a cada uma de


suas variáveis, pois suas aplicações parciais são compostas de f com uma aplicação contı́nua
do tipo t 7−→ (a1 , . . . , ai−1 , t, ai+1 , . . . , an ).

26 Instituto de Matemática UFF


Aplicações contı́nuas

Mas a recı́proca é falsa.

De fato, a função f : R2 −→ R, dada


 por

 xy
2 2
se (x, y) 6= (0, 0)
f(x, y) = x + y

0 se (x, y) = (0, 0) ,
bx
é contı́nua separadamente em relação a x e a y, pois f(x, b) = se b 6= 0 e f(x, 0) = 0,
x2 + b2
ay
enquanto f(a, y) = se a 6= 0 e f(0, y) = 0 . Mas f não é contı́nua na origem, pois
a2 + y2
1
f ◦ g(t) = se t 6= 0 e f ◦ g(0) = 0 , onde g : R −→ R2 , dada por g(t) = (t, t), é uma aplicação
2
contı́nua em R. Como f ◦ g não é contı́nua em t = 0, temos que f não é contı́nua na origem.

Definição 6.7. Uma aplicação f : X ⊂ Rm −→ Rn é uniformemente contı́nua quando para


todo ε > 0, existe δ > 0 tal que x, y ∈ X e kx − yk < δ =⇒ kf(x) − f(y)k < ε.

Observação 6.16. A noção de continuidade uniforme independe das normas consideradas


em Rm e Rn .

Observação 6.17. Toda aplicação uniformemente contı́nua é contı́nua.

Observação 6.18. Toda aplicação lipschitziana é uniformemente contı́nua.


ε
De fato, se kf(x) − f(y)k ≤ K kx − yk para todos x, y ∈ X, dado ε > 0, existe δ = > 0 tal que
K
x, y ∈ X , kx − yk < δ =⇒ kf(x) − f(y)k ≤ K kx − yk < K δ = ε .

Em particular,

• toda aplicação linear T : Rm −→ Rn é uniformemente contı́nua;

• se X ⊂ Rm × Rn é um subconjunto limitado e ϕ : Rm × Rn −→ Rp é uma aplicação bilinear,


então ϕ|X é uniformemente contı́nua.


Observação 6.19. A função f : [0, +∞) −→ R, dada por f(x) = x , é um exemplo de uma
função uniformemente contı́nua que não é lipschitziana (veja Curso de Análise, Vol. I de E. Lima,
pag. 244).

Observação 6.20. A composta de duas funções uniformemente contı́nuas é uniformemente


contı́nua.

Observação 6.21. Uma aplicação f : X ⊂ Rm −→ Rn é uniformemente contı́nua ⇐⇒ suas


funções coordenadas f1 , . . . , fn : X −→ R são uniformemente contı́nuas.

J. Delgado - K. Frensel 27
Análise

Teorema 6.4. Uma aplicação f : X ⊂ Rm −→ Rn é uniformemente contı́nua se, e só se, para
quaisquer duas sequências (xk ) e (yk ) em X com lim (xk − yk ) = 0, tem-se
k→∞
lim ( f(xk ) − f(yk ) ) = 0.
k→∞

Prova.
(=⇒) Dado ε > 0, existe δ > 0 tal que x, y ∈ X e kx − yk < δ =⇒ kf(x) − f(y)k < ε.

Se (xk ) e (yk ) são sequências em X com lim (xk − yk ) = 0, existe k0 ∈ N tal que kxk − yk k < δ
k→∞
para todo k > k0 .

Logo kf(xk ) − f(yk )k < ε para todo k > k0 , ou seja, lim ( f(xk ) − f(yk ) ) = 0 .
k→∞

(⇐=) Suponhamos que f não é uniformemente contı́nua. Então existe ε0 > 0 tal que, para todo
1
k ∈ N, podemos obter um par de pontos xk , yk ∈ X com kxk − yk k < e kf(xk ) − f(yk )k ≥ ε0 .
k
Logo (xk − yk ) −→ 0, mas ( f(xk ) − f(yk ) ) 9 0. 

Exemplo 6.7. A função f : R −→ R, definida por f(x) = cos(x2 ) não é uniformemente


contı́nua.
p √
De fato, se xk = (k + 1) π e yk = k π , então:
p √  p √ 
(k + 1) π − k π (k + 1) π + k π
xk − yk = p √
(k + 1) π + k π
(k + 1) π − k π
= p √
(k + 1) π + k π
π
= p √ −→ 0 .
(k + 1) π + kπ

Mas, como cos(x2k ) = cos ( (k + 1) π ) = ±1 e cos(y2k ) = cos(kπ) = ∓1 , temos que


kf(xk ) − f(yk )k = 2 para todo k, e, portanto, ( f(xk ) − f(yk ) ) 9 0. 

7 Homeomorfismos

Definição 7.1. Sejam X ⊂ Rm e Y ⊂ Rn . Um homeomorfismo entre X e Y é uma bijeção


contı́nua f : X −→ Y, cuja inversa f−1 : Y −→ X também é contı́nua.

Dizemos que os conjuntos X e Y são homeomorfos se existe um homeomorfismo f : X −→ Y .

Exemplo 7.1. Toda aplicação linear invertı́vel T : Rn −→ Rn é um homeomorfismo de Rn


sobre si próprio, pois sua inversa T −1 : Rn −→ Rn é linear e, portanto, contı́nua. 

28 Instituto de Matemática UFF


Homeomorfismos

Observação 7.1. A aplicação composta de dois homeomorfismos é um homeomorfismo, e o


inverso de um homeomorfismo é um homeomorfismo.

Observação 7.2. Já sabemos (veja Curso de Análise, Vol. I de E. Lima, pag. 237) que se
f : I −→ R é uma função contı́nua injetora definida num intervalo I, então f(I) = J é um intervalo
e f−1 : J −→ R é contı́nua, ou seja, f : I −→ J é um homeomorfismo.

Mas, em geral, uma bijeção f : X ⊂ Rm −→ Y ⊂ Rn pode ser contı́nua sem que sua inversa o
seja.

Exemplo 7.2. Seja f : [0, 2π) −→ S1 ⊂ R2 a aplicação definida por f(t) = (cos t, sen t). Pelo
teorema 6.2, f é contı́nua. Além disso, f é uma bijeção. Mas sua inversa f−1 : S1 −→ [0, 2π) é
descontı́nua no ponto p = (1, 0).
1
De fato, para cada k ∈ N, sejam tk = 2π − e zk = f(tk ). Então lim f(tk ) = lim zk = p, mas
k k→∞ k→∞
lim f−1 (zk ) = lim tk = 2π 6= 0 = f−1 (p).
k→∞ k→∞

• No entanto, f : (0, 2π) −→ S1 − {p} é um homeomorfismo.

De fato, seja (zk ) uma sequência de pontos de S1 − {p} tal que lim zk = q ∈ S1 − {p}.
k→∞

Como f é uma bijeção, para cada k ∈ N, existe um único tk ∈ (0, 2π) tal que f(tk ) = zk .

Afirmação: A sequência (tk ) é convergente e seu limite b pertence ao intervalo (0, 2π).

Com efeito, sendo (tk ) uma sequência limitada, ela possui pelo menos um valor de aderência,
e todos os seus valores de aderência pertencem ao intervalo [0, 2π].

Seja (tk )k∈N 0 uma subsequência convergente e seja b = lim0 tk .


k∈N

Então f(b) = lim0 f(tk ) = lim0 zk = q ∈ S1 − {p}. Logo b ∈ (0, 2π) e, pela injetividade, b = f−1 (q).
k∈N k∈N

Portanto, b = f−1 (q) é o único valor de aderência da sequência limitada (tk ).

Pelo teorema 4.3, (tk ) é convergente e lim tk = f−1 (q), ou seja, lim f−1 (zk ) = f−1 (q).
k∈N k∈N

Assim, do teorema 6.3, obtemos que f −1


: S − {p} −→ (0, 2π)
1
é contı́nua e, portanto,
f : (0, 2π) −→ S1 − {p} é um homeomorfismo.

• De modo análogo, podemos provar que a aplicação f : (a, a + 2π) −→ S1 − {q} , onde
q = (cos a, sen a), é um homeomorfismo. 

Observação 7.3. Os homeomorfismos desempenham na Topologia um papel análogo aos


movimentos rı́gidos na Geometria Euclidiana: dois conjuntos homeomorfos são indistinguı́veis
do ponto de vista topológico.

J. Delgado - K. Frensel 29
Análise

Vejamos, agora, outros exemplos de homeomorfismos.

Exemplo 7.3. As translações Ta : Rn −→ Rn , Ta (x) = a + x, são homeomorfismos, pois Ta e


(Ta )−1 = T−a são isometrias e, portanto, são contı́nuas. 

Exemplo 7.4. As homotetias Hλ : Rn −→ Rn , Hλ (x) = λx, com λ 6= 0, são homeomorfismos,


pois cada Hλ é uma transformação linear invertı́vel com (Hλ )−1 = Hλ−1 . 

Exemplo 7.5. Duas bolas abertas ou duas bolas fechadas ou duas esferas quaisquer no
espaço Rn são homeomorfas.

De fato, dados a, b ∈ Rn e r > 0, s > 0 números reais, temos que a aplicação ϕ = Tb ◦ Hs/r ◦ T−a :
Rn −→ Rn é um homeomorfismo tal que:
ϕ(B(a, r)) = B(b, s) , ϕ(B[a, r]) = B[b, s] e ϕ(S[a, r)] = S[b, s] ,
s s
pois, como ϕ(x) = (x − a) + b, então kϕ(x) − bk = kx − ak e, portanto:
r r
kϕ(x) − bk < s ⇐⇒ kx − ak < r ;

kϕ(x) − bk ≤ s ⇐⇒ kx − ak ≤ r ;

kϕ(x) − bk = s ⇐⇒ kx − ak = r . 

Exemplo 7.6. Toda bola aberta em Rn é homeomorfa ao espaço euclidiano Rn .


Como duas bolas abertas em Rn são homeomorfas, basta mostrar que Rn é homeomorfo à bola
aberta B(0, 1) de centro na origem 0 e raio 1.

Para isso, considere as aplicações f : Rn −→ B(0, 1) e g : B(0, 1) −→ Rn definidas por:


x y
f(x) = , portanto kf(x)k < 1 , e g(y) = .
1 + kxk 1 − kyk
Então f e g são contı́nuas,  
x x/(1 + kxk)
g ◦ f(x) = g = = x,
1 + kxk 1 − kxk/(1 + kxk)
e  
y y/(1 − kyk)
f ◦ g(y) = f = = y , pois 1 − kyk > 0.
1 − kyk 1 + kyk/(1 − kyk)
Logo f : Rn −→ B(0, 1) é uma bijeção contı́nua, cuja inversa é a aplicação contı́nua
g : B(0, 1) −→ Rn . Portanto, f e g são homeomorfismos. 

Exemplo 7.7. Seja f : X ⊂ Rm −→ Rn uma aplicação contı́nua. Seu gráfico é o conjunto


G = Graf(f) = { (x, f(x)) | x ∈ X } ⊂ Rm × Rn = Rm+n .

Afirmação: O domı́nio X e o gráfico G da aplicação contı́nua f são homeomorfos.

30 Instituto de Matemática UFF


Homeomorfismos

Considere a aplicação f : X −→ G, definida por f(x) = (x, f(x)).

Como f e a aplicação identidade Id : Rn −→ Rn são contı́nuas, temos, pelo corolário 6.1, que
f é uma bijeção contı́nua. Sua inversa g : G −→ X, dada por g((x, f(x))) = x, é contı́nua, pois
g = π1 |G , onde π1 : Rm × Rn −→ Rm é a projeção π1 (x, y) = x.

• Em particular, R − {0} é homeomorfo à hipérbole



H = {(x, y) ∈ R2 | xy = 1} = x, x1 | x ∈ R − {0} ,


1
pois H é o gráfico da função contı́nua f : R − {0} −→ R dada por f(x) = .
x
• Também, usando o resultado acima, podemos provar que o hemisfério norte

Sm
+ = x ∈ Rm+1 | kxk = 1 e xm+1 > 0

da esfera m−dimensional é homeomorfo à bola aberta B(0, 1) = { x ∈ Rm | kxk < 1 } ⊂ Rm .

+ = { (x, 1 − kxk2 ) | x ∈ B(0, 1) } e, portanto, Sm


p
De fato, Sm + é o gráfico da aplicação contı́nua
p
f : B(0, 1) ⊂ Rm −→ R dada por f(x) = 1 − kxk2 . 

Exemplo 7.8. (Projeção estereográfica)


Seja Sm = { x ∈ Rm+1 | hx, xi = 1 } a esfera m−dimensional de centro na origem e raio 1 e
p = (0, . . . , 0, 1) ∈ Sm seu pólo norte.

A projeção estereográfica é a aplicação ϕ : Sm − {p} −→ Rm , onde ϕ(x) é o ponto em que a


semi-reta −p→x ⊂ Rm+1 corta o hiperplano xm+1 = 0, o qual identificamos com Rm .

Fig. 5: Projeção estereográfica

Como −p→x = { (1 − t)p + tx | t > 0 } = { p + t(x − p) | t > 0 }, temos que um ponto y = (1 − t)p + tx ∈
−→
p x pertence ao hiperplano Rm × {0} ⊂ Rm+1 se, e só se,

J. Delgado - K. Frensel 31
Análise

ym+1 = πm+1 (p + t(x − p)) = pm+1 + t(xm+1 − pm+1 ) = 1 + t(xm+1 − 1) = 0 .

p→
1
Logo y = (1 − t)p + tx ∈ −x ∩ (Rm × {0}) se, e somente se, t = e, portanto,
1 − xm+1
x0
ϕ(x) = ϕ(x1 , . . . , xm , xm+1 ) = , sendo x 0 = (x1 , . . . , xm ) .
1 − xm+1
Assim, ϕ : Sm − {p} −→ Rm é uma aplicação contı́nua.

Seja agora a aplicação ξ : Rm −→ Sm − {p} definida pelo processo inverso, ou seja, ξ(x) é a
−−→
intersecção de Sm − {p} com a semi-reta p x? , onde x? = (x, 0).

Então ξ(x) = p + t(x? − p), onde t > 0 e kp + t(x? − p)k = 1. Assim,


k(tx1 , . . . , txm , (1 − t))k2 = 1 ⇐⇒ t2 (x21 + . . . + x2m ) + 1 − 2t + t2 = 1
2
⇐⇒ t2 (1 + kxk2 ) − 2t + 1 = 1 ⇐⇒ t((1 + kxk2 )t − 2) = 0 ⇐⇒ t = 0 ou t = .
1 + kxk2
 
2 2x kxk2 − 1
Logo t = 2
e ξ(x) = 2
, 2
.
1 + kxk 1 + kxk 1 + kxk
Como ξ : Rm −→ Sm − {p} é contı́nua,
2x 1
ϕ ◦ ξ(x) = · = x,
1 + kxk2 kxk2 − 1
1−
kxk2 + 1
e
2x 0 1 + xm+1
 
  −1
x0  1 − xm+1 1 − xm+1
ξ ◦ ϕ(x) = ξ = ,  = (x 0 , xm+1 ) = x ,

1 − xm+1 1 + xm+1 1 + xm+1
1+ +1
1 − xm+1 1 − xm+1
pois, 2
x0
= kx 0 k2 1 − x2m+1 1 + xm+1

1 − xm+1 2
= 2
= ,
(1 − xm+1 ) (1 − xm+1 ) 1 − xm+1
temos que ξ é a inversa de ϕ, e, portanto, ϕ : Sm − {p} −→ Rm é um homeomorfismo. 

8 Limites

Definição 8.1. Sejam a aplicação f : X ⊂ Rm −→ Rn e a ∈ X 0 . Dizemos que b ∈ Rn é o limite


de f(x) quando x tende para a, e escrevemos
b = lim f(x) ,
x→a

se, para todo ε > 0 dado, podemos obter δ > 0 tal que
x ∈ X , 0 < kx − ak < δ =⇒ kf(x) − bk < ε .

Ou seja, f( X ∩ (B(a, δ) − {a} ) ⊂ B(b, ε).

32 Instituto de Matemática UFF


Limites

Observação 8.1. Para que tenha sentido a existência do limite b = x→a


lim f(x), não é necessário
que a pertença a X, ou seja, que f esteja definida no ponto a, e mesmo que a ∈ X, o valor f(a)
não desempenha papel algum na definição de limite. Importam apenas os valores f(x) para x
próximo, porém diferente de a.

Observação 8.2. (Unicidade do limite)


Se a ∈ X 0 , lim f(x) = b e lim f(x) = c, então b = c .
x→a x→a

De fato, dado ε > 0, existe δ > 0 tal que


ε ε
x ∈ X e 0 < kx − ak < δ =⇒ kf(x) − bk < e kf(x) − ck < .
2 2
Como a ∈ X 0 , existe xδ ∈ X tal que 0 < kxδ − ak < δ .

Logo,
kb − ck ≤ kf(xδ ) − ck + kb − f(xδ )k < ε ,

para todo ε > 0. Assim, b = c.

Observação 8.3. A continuidade se exprime em termos de limite.


Se a ∈ X é um ponto isolado de X, então toda aplicação f : X ⊂ Rm −→ Rn é contı́nua no ponto
a.

Mas, se a ∈ X ∩ X 0 , f : X ⊂ Rm −→ Rn é contı́nua no ponto a se, e só se, f(a) = lim f(x).


x→a

lim f(x) = b ⇐⇒ para toda sequência (xk ) de pontos de X − {a} com


Observação 8.4. x→a
lim xk = a , tem-se lim f(xk ) = b.
k→∞ k→∞

Este resultado prova-se de modo análogo ao teorema 6.3.

Teorema 8.1. Existe lim f(x) ⇐⇒ para toda sequência (xk ) de pontos de X − {a} com
x→a
lim xk = a , existe lim f(xk ) .
k→∞ k→∞

Prova.
Pela observação anterior, basta mostrar que se (xk ) e (yk ) são duas sequências em X − {a}
com lim xk = lim yk = a, então lim f(xk ) = lim f(yk ).

Sejam b = lim f(xk ) e c = lim f(yk ).

Consideremos a sequência (zk )k∈N = (x1 , y1 , x2 , y2 , . . . , xn , yn , . . .), ou seja, z2k−1 = xk e


z2k = yk , k = 1, . . . , n, . . ..

Como lim z2k = lim z2k−1 = a, temos que lim zk = a. Logo, pela hipótese, a sequência (f(zk )) é
convergente. Assim, b = c, pois lim f(z2k−1 ) = b e lim f(z2k ) = c. 

J. Delgado - K. Frensel 33
Análise

Observação 8.5. No caso em que f : X ⊂ R −→ R é uma função real de variável real e


a ∈ X−0 (ou a ∈ X+0 ) podemos provar que o lim− f(x) (respectivamente, lim+ f(x)) existe se, e
x→a x→a
somente se, para toda sequência (xk ) crescente (respectivamente, decrescente) de pontos de
X − {a} com lim xk = a , o limite lim f(xk ) existe.
k→∞

Observação 8.6. Sejam a ∈ X 0 ⊂ Rm e f : X −→ Rn uma aplicação cujas funções coordena-


das são f1 , . . . , fn : X −→ R. Então, lim f(x) = b = (b1 , . . . , bn ) se, e somente se, lim fi (x) = bi ,
x→a x→a
i = 1, . . . , n.

A demonstração se faz de modo análogo ao teorema 6.2.

Observação 8.7. Sejam X ⊂ Rm , a ∈ X 0 , b, c ∈ Rn , f, g : X −→ Rn e λ : X −→ R tais que


lim f(x) = b, lim g(x) = c e lim λ(x) = λ0 . Então:
x→a x→a x→a

(1) lim (f(x) + g(x)) = b + c ;


x→a

(2) lim λ(x) f(x) = λ0 b ;


x→a

(3) lim hf(x), g(x)i = hb, ci ;


x→a

As afirmações decorrem do corolário 4.1 e da caracterização de limite por meio de sequências


(ver observação 8.4).

Observação 8.8. Seja ϕ : Rn × Rp −→ Rq uma aplicação bilinear. Se f : X ⊂ Rm −→ Rn e


g : X −→ Rp são aplicações com lim f(x) = 0, a ∈ X 0 , e g é limitada, então lim ϕ(f(x), g(x)) = 0.
x→a x→a

De fato, basta observar que


kϕ(f(x), g(x))k ≤ M kf(x)k kg(x)k ,

para todo x ∈ X, onde M é uma constante positiva que depende apenas da aplicação bilinear ϕ
e das normas consideradas em Rn , Rp e Rq .

• Como caso particular, temos que lim hf(x), g(x)i = 0 e lim α(x) f(x) = 0 se um dos fatores é
x→a x→a
limitado e o outro tende para zero.

x2 y
Exemplo 8.1. Se f : R2 − {0} −→ R é a função f(x, y) = , então lim f(x, y) = 0.
x2 + y2 (x,y)−→(0,0)
xy
De fato, a função f(x, y) é o produto de x por , sendo lim x = 0 e a aplicação
x2 + y2 (x,y)−→(0,0)
xy
(x, y) 7−→ limitada, pois, para (x, y) 6= (0, 0),
x2 + y2
|xy| 2 |x| |y| x 2 + y2
≤ ≤ = 1.
x 2 + y2 x2 + y2 x2 + y2


34 Instituto de Matemática UFF


Limites

Observação 8.9. (Relação de limite e composição de aplicações)


Sejam f : X −→ Rm , g : Y −→ Rp , a ∈ X 0 , b ∈ Y 0 e f(X) ⊂ Y. Então:

(1) Se lim f(x) = b, lim g(y) = c e x 6= a =⇒ f(x) 6= b, então lim (g ◦ f) (x) = c.


x→a y→b x→a

De fato, dado ε > 0, existe µ > 0 tal que


y ∈ Y e 0 < ky − bk < µ =⇒ kg(y) − ck < ε .

Como lim f(x) = b e x 6= a =⇒ f(x) 6= b, existe δ > 0 tal que


x→a
x ∈ X e 0 < kx − ak < δ =⇒ 0 < kf(x) − bk < µ.

Logo x ∈ X e 0 < kx − ak < δ =⇒ kg(f(x)) − ck < ε.

(2) Se lim f(x) = b e g é contı́nua no ponto b, então lim g(f(x)) = g(b).


x→a x→a

A demonstração se faz de modo análogo ao resultado anterior.

• Como consequência de (2), temos que se lim f(x) = b então lim kf(x)k = kbk, pois a função
x→a x→a
norma k k : Rn −→ R é contı́nua.

• E como consequência de (1), temos que se lim f(x) = b, então lim f(a+tu) = b, para qualquer
x→a t→0
vetor u 6= 0.
xy
Segue daı́ que não existe lim , pois, para u = (α, β) , o valor do limite
(x,y)→(0,0) x2 + y2
αβ
lim f(tα, tβ) = , que varia com α e β .
t→0 α2 + β2

Observação 8.10. Sejam f, g : X ⊂ Rm −→ R, a ∈ X 0 , tais que f(x) ≤ g(x) para todo


x ∈ X − {a}. Se lim f(x) = b e lim g(x) = c, então b ≤ c.
x→a x→a
b−c
De fato, suponhamos que b > c e seja ε = > 0.
2
Então existe δ > 0 tal que x ∈ X e 0 < kx − ak < δ =⇒ f(x) ∈ (b − ε, b + ε) e g(x) ∈ (c − ε, c + ε).

Como b − ε = c + ε, temos que g(x) < f(x) para todo x ∈ {x ∈ X | 0 < kx − ak < δ} 6= ∅, pois
a ∈ X 0 , uma contradição.

Observação 8.11. Se f : X ⊂ Rm −→ Rn é uma aplicação uniformemente contı́nua e (xk ) é


uma sequência de Cauchy de pontos de X, então (f(xk )) é uma sequência de Cauchy.

De fato, dado ε > 0, existe δ > 0 tal que x, y ∈ X e kx − yk < δ =⇒ kf(x) − f(y)k < ε.

Como (xk ) é de Cauchy, existe k0 ∈ N tal que kxk − x` k < δ para k, ` ≥ k0 .

Logo kf(xk ) − f(x` )k < ε para k, ` ≥ k0 .

J. Delgado - K. Frensel 35
Análise

Teorema 8.2. Seja f : X ⊂ Rm −→ Rn uma aplicação uniformemente contı́nua. Então, para


todo a ∈ X 0 , existe lim f(x).
x→a

Prova.
Seja (xk ) uma sequência de pontos de X − {a}, com lim xk = a. Como (xk ) é uma sequência de
Cauchy e f é uniformemente contı́nua, então (f(xk )) é uma sequência de Cauchy e é, portanto,
convergente. Então, pelo teorema 8.1, existe lim f(x). 
x→a

xy
Observação 8.12. A função contı́nua f : R2 − {(0, 0)} −→ R definida por f(x, y) = não
x2 + y2
é uniformemente contı́nua em qualquer conjunto X ⊂ R2 − {(0, 0)} do qual (0, 0) seja um ponto
de acumulação, pois não existe lim f(x, y).
(x,y)→(0,0)

Corolário 8.1. Seja f : X ⊂ Rm −→ Rn uma aplicação uniformemente contı́nua e seja


X = X ∪ X 0 . Então existe uma única aplicação uniformemente contı́nua f : X −→ Rn tal que
fX = f.

Isto é, toda aplicação uniformemente contı́nua definida em X se estende de modo único a
uma aplicação uniformemente contı́nua em X = X ∪ X 0 .

Prova.
Para cada x ∈ X 0 − X, faça f(x) = lim f(x), o qual existe pelo teorema anterior. E se x ∈ X,
x→x
faça f(x) = f(x).

Então f : X −→ Rn , assim definida, é uma aplicação que estende f.

Observe que se x ∈ X 0 ∩ X, então f(x) = f(x) = lim f(x). Ou seja, f(x) = lim f(x), para todo
x→x x→x
x ∈ X 0.

Afirmação: f : X −→ Rn é uniformemente contı́nua.


ε
Dado ε > 0, existe δ > 0 tal que x, y ∈ X e kx − yk < δ =⇒ kf(x) − f(y)k < .
3
Sejam x, y ∈ X tais que kx − yk < δ. Como X = X ∪ X 0 , lim f(x) = f(x), se x ∈ X 0 , e lim f(x) =
x→x x→y
δ − kx − yk
f(y), se y ∈ X 0 , existem 0 < δ0 < e x, y ∈ X tais que
2
ε ε
kx − xk < δ0 , ky − yk < δ0 , kf(x) − f(x)k < e kf(y) − f(y)k <
3 3
(Se x ∈ X, basta tomar x = x, e se y ∈ X, basta tomar y = y).

Logo,
kx − yk ≤ kx − xk + kx − yk + ky − yk < δ0 + δ0 + |kx − yk < δ − kx − yk + kx − yk = δ ,

e, portanto,

36 Instituto de Matemática UFF


Conjuntos abertos

ε ε ε
kf(x) − f(y)k ≤ kf(x) − f(x)k + kf(x) − f(y)k + kf(y) − f(y)k < + + = ε.
3 3 3
Assim, se x, y ∈ X , kx − yk < δ =⇒ kf(x) − f(y)k < ε.

Unicidade: Seja g : X −→ Rn uniformemente contı́nua tal que g|X = f.

Então, se x ∈ X, g(x) = f(x) = f(x). E se x ∈ X 0 − X, seja (xk ) uma sequência de pontos de X


com lim xk = x.

Logo g(x) = lim g(xk ) = lim f(xk ) = lim f(x) = f(x) . 


k→∞ k→∞ x→x

9 Conjuntos abertos

Definição 9.1. Seja X ⊂ Rn . Um ponto a ∈ X é um ponto interior a X se existe δ > 0 tal que
B(a, δ) ⊂ X.

Observação 9.1. A definição de ponto interior independe da norma considerada em Rn .

Definição 9.2. O interior de X é o conjunto int X formado pelos pontos interiores a X.

Observação 9.2. int X ⊂ X

Definição 9.3. Dizemos que um conjunto V é uma vizinhança do ponto a quando a ∈ int V.

Definição 9.4. Um conjunto X ⊂ Rn é aberto quando todos os seus pontos são pontos interi-
ores a X, ou seja, quando para todo a ∈ X existe δ > 0 tal que B(a, δ) ⊂ X.

Assim, X é aberto ⇐⇒ int X = X.

Observação 9.3. Toda bola aberta B(a, r) é um conjunto aberto de Rn .


De fato, seja b ∈ B(a, r), ou seja, kb − ak < r. Então δ = r − kb − ak > 0 e B(b, δ) ⊂ B(a, r),
pois se kx − bk < δ =⇒ kx − ak ≤ kx − bk + kb − ak < δ + kb − ak = r.

Observação 9.4. O complementar Rn − B[a, r] de uma bola fechada é um conjunto aberto


em Rn .

De fato, dado b ∈ Rn − B[a, r], então kb − ak > r. Seja δ = kb − ak − r > 0.

Então B(b, δ) ⊂ Rn −B[a, r], pois se kx−bk < δ =⇒ kb−ak ≤ kb−xk+kx−ak < δ+kx−ak =⇒
kx − ak > kb − ak − δ = r.

J. Delgado - K. Frensel 37
Análise

Observação 9.5. Para todo X ⊂ Rn , int X é um conjunto aberto.


De fato, se a ∈ int X, existe r > 0 tal que B(a, r) ⊂ X. Seja x ∈ B(a, r).

Então, pondo δ = r − kx − ak > 0, temos que B(x, δ) ⊂ B(a, r) ⊂ X.

Logo, se x ∈ B(a, r) então x ∈ int X, ou seja, B(a, r) ⊂ int X, o que prova que int X é aberto.

Observação 9.6. Se X ⊂ Y então int X ⊂ int Y.


De fato, se x0 ∈ int X, existe r > 0 tal que B(x0 , r) ⊂ X. Logo B(x0 , r) ⊂ Y e, portanto, x0 ∈ int Y.

• Com isso, podemos provar a observação 9.5 da seguinte maneira:

Seja x0 ∈ int X. Então existe r > 0 tal que B(x0 , r) ⊂ X.

Logo, pelo provado acima, int(B(x0 , r)) ⊂ int X, e, portanto, B(x0 , r) ⊂ int X, pois B(x0 , r) é um
conjunto aberto.

Observação 9.7. Uma bola fechada B[a, r] ⊂ Rn não é um conjunto aberto.


De fato, seja x0 ∈ S[a, r]. Então, existe u ∈ Rn vetor unitário (de norma 1) tal que x0 = a + ru.
ε
 
Seja ε > 0 e tome x = a + r + u.
2
ε ε
Então kx − x0 k = ka + ru − a − (r + ε/2)uk = < ε e kx − ak = r + > r , ou seja, x ∈ B(x0 , ε),
2 2
mas x 6∈ B[a, r]. Ou seja, se x0 ∈ S[a, r] então x0 6∈ int B[a, r].

Portanto, int B[a, r] = B(a, r), uma vez que B(a, r) = int B(a, r) ⊂ int B[a, r].

Definição 9.5. Sejam X ⊂ Rn e a ∈ Rn . Dizemos que a é ponto fronteira de X se, para todo
r > 0, B(a, r) ∩ X 6= ∅ e B(a, r) ∩ (Rn − X) 6= ∅.

O conjunto ∂X formado pelos pontos fronteira de X é chamado fronteira de X.

Observação 9.8. ∂X = ∂(Rn − X).

Observação 9.9. Dados X ⊂ Rn e a ∈ X, há três possibilidades que se excluem mutuamente:


a ∈ int X , ou x ∈ int(Rn − X) ou x ∈ ∂X .

Ou seja,
Rn = int X ∪ int(Rn − X) ∪ ∂X ,

sendo int X, int(Rn − X) e ∂X dois a dois disjuntos.

Exemplo 9.1. Como Rn − B[a, r] é aberto e int B[a, r] = B(a, r), temos que ∂B[a, r] = S[a, r].


38 Instituto de Matemática UFF


Conjuntos abertos

Exemplo 9.2. Como Rn − B[a, r] é aberto e Rn − B[a, r] ⊂ Rn − B(a, r), temos que
Rn − B[a, r] ⊂ int(Rn − B(a, r)). Logo,
∂B(a, r) = Rn − (int B(a, r) ∪ int(Rn − B(a, r))) = Rn − (B(a, r) ∪ int(Rn − B(a, r))) ⊂ S[a, r] .

E se x ∈ S[a, r], ou seja, x = a + ru, kuk = 1, então, para todo 0 < ε < r,
x ∈ B(x, ε) ∩ (Rn − B(a, r)) e y = a + (r − ε/2)u ∈ B(x, ε) ∩ B(a, r),
ε ε
pois ky − xk = < ε e ky − ak = r − < r. Logo, S[a, r] ⊂ ∂B(a, r). Assim, ∂B(a, r) = S[a, r]. 
2 2

Observação 9.10. Um conjunto A ⊂ Rn é aberto se, e só se, nenhum de seus pontos é
ponto fronteira de A, ou seja, se, e só se, A ∩ ∂A = ∅.

Teorema 9.1. Os conjuntos abertos do espaço euclidiano Rn possuem as seguintes proprie-


dades:

(1) ∅ e Rn são conjuntos abertos;

(2) A intersecção A = A1 ∩ . . . ∩ Ak de um número finito de conjuntos abertos A1 , . . . , Ak é um


conjunto aberto.
S
(3) A reunião A = λ∈L Aλ de uma famı́lia qualquer (Aλ )λ∈L de conjuntos abertos Aλ é um
conjunto aberto.

Prova.
(1) Rn é obviamente aberto, e ∅ é aberto, pois um conjunto só pode deixar de ser aberto se
contiver algum ponto que não seja interior.

(2) Seja a ∈ A = A1 ∩ . . . ∩ Ak , ou seja, a ∈ Ai , para todo i = 1, . . . , k. Como cada Ai é aberto,


existe δi > 0 tal que B(a, δi ) ⊂ Ai . Seja δ = min{δ1 , . . . , δk } > 0. Então B(a, δ) ⊂ Ai para todo
i = 1, . . . , k e, portanto, B(a, δ) ⊂ A. Logo A é aberto.
S
(3) Seja a ∈ A = λ∈L Aλ . Então existe λ0 ∈ L tal que a ∈ Aλ0 . Como Aλ0 é aberto, existe δ > 0
tal que B(a, δ) ⊂ Aλ0 ⊂ A. Logo A é aberto. 

Definição 9.6. Seja X ⊂ Rn . Dizemos que A ⊂ X é aberto em X quando, para cada a ∈ A,


existe δ > 0 tal que B(a, δ) ∩ X ⊂ A.

Observação 9.11. Um conjunto A ⊂ X é aberto em X se, e só se, existe um aberto B ⊂ Rn


tal que A = B ∩ X.
[
De fato, para cada a ∈ A, existe δa > 0 tal que B(a, δa ) ∩ X ⊂ A. Tome B = B(a, δa ).
a∈A
n
Então B é aberto em R e B ∩ X = A.

J. Delgado - K. Frensel 39
Análise

Reciprocamente, se A = B ∩ X, onde B é aberto em Rn , dado a ∈ A = B ∩ X, existe δ > 0 tal


que B(a, δ) ⊂ B. Logo B(a, δ) ∩ X ⊂ B ∩ X = A. Portanto, A é aberto em X.

Observação 9.12. Se X ⊂ Rn é aberto, então A ⊂ X é aberto em X se, e só se, A é aberto


em Rn .

De fato, se A é aberto em X, existe B aberto em Rn tal que A = X ∩ B. Como X e B são abertos


em Rn , temos que A também é aberto em Rn .

Reciprocamente, se A é aberto em Rn , então A = A ∩ X é aberto em X.

Exemplo 9.3. A = (0, 1] é aberto em X = [0, 1], pois A = (0, 2) ∩ [0, 1], onde (0, 2) é aberto em
R. 

Observação 9.13. Um resultado análogo ao do teorema 9.1 vale para os abertos em X:


(1) ∅ e X são abertos em X, pois ∅ = ∅ ∩ X e X = Rn ∩ X, com ∅ e X abertos em Rn .

(2) Uma intersecção finita A = A1 ∩ . . . ∩ Ak de conjuntos A1 , . . . , Ak abertos em X é um conjunto


aberto em X, pois, para cada Ai , i = 1, . . . , k, existe Bi aberto em Rn tal que Ai = Bi ∩ X. Então
A = (B1 ∩ X) ∩ . . . ∩ (Bk ∩ X) = (B1 ∩ . . . ∩ Bk ) ∩ X, onde B1 ∩ . . . ∩ Bk é aberto em Rn . Logo
A = A1 ∩ . . . ∩ Ak é aberto em X.
S
(3) Uma reunião A = λ∈L Aλ de abertos Aλ em X é um conjunto aberto em X, pois para cada

Aλ , λ ∈ L, existe Bλ aberto em Rn tal que Aλ = Bλ ∩ X. Então A = λ∈L (Bλ ∩ X) =
S S
λ∈L B λ ∩ X,
n
S S
onde λ∈L Bλ é aberto em R . Logo A = λ∈L Aλ é aberto em X.

Teorema 9.2. Uma aplicação f : X ⊂ Rm −→ Rn é contı́nua se, e só se, a imagem inversa
f−1 (A), de todo aberto A ⊂ Rn , é um aberto em X.

Prova.
(=⇒) Seja x0 ∈ f−1 (A). Então f(x0 ) ∈ A. Como A é aberto em Rn , existe ε > 0 tal que
B(f(x0 ), ε) ⊂ A, ou seja, ky − f(x0 )k < ε =⇒ y ∈ A.

Sendo f contı́nua no ponto x0 ∈ X, existe δ > 0 tal que x ∈ X, kx − x0 k < δ =⇒ kf(x) − f(x0 )k < ε.

Logo f(X ∩ B(x0 , δ)) ⊂ B(f(x0 ), ε) ⊂ A, e, portanto, X ∩ B(x0 , δ) ⊂ f−1 (A). Provamos, assim, que
f−1 (A) é aberto em X.

(⇐=) Seja x0 ∈ X e seja ε > 0. Então, como por hipótese, f−1 (B(f(x0 ), ε)) é aberto em X,
existe δ > 0 tal que B(x0 , δ) ∩ X ⊂ f−1 (B(f(x0 ), ε). Logo, se x ∈ X e kx − x0 k < δ =⇒
f(x) ∈ B(f(x0 ), ε) =⇒ kf(x) − f(x0 )k < ε, ou seja, f é contı́nua no ponto x0 ∈ X. Como x0 ∈ X é
arbitrário, f é contı́nua. 

40 Instituto de Matemática UFF


Conjuntos abertos

Observação 9.14. Uma aplicação f : X ⊂ Rm −→ Y ⊂ Rn é contı́nua se, e só se, para todo
conjunto A ⊂ Y aberto em Y, f−1 (A) é aberto em X.

De fato, se A ⊂ Y é aberto em Y, existe B aberto em Rn tal que A = B∩Y. Como f−1 (A) = f−1 (B)
e f é contı́nua, temos, pelo teorema anterior que f−1 (B) = f−1 (A) é aberto em X. Reciproca-
mente, se A é aberto em Rn , então A ∩ Y é aberto em Y. Logo, por hipótese, f−1 (A ∩ Y) = f−1 (A)
é aberto em X. Assim, pelo teorema anterior, f é contı́nua.

Observação 9.15. Se f : Rn −→ R é uma função contı́nua, então, para todo a ∈ R,


f−1 ((−∞, a)) = {x ∈ Rn | f(x) < a} é aberto em Rn , pois (−∞, a) é aberto em R.

Mais geralmente, se f1 , . . . , fk : X ⊂ Rn −→ R são funções contı́nuas, então


1 ((−∞, a1 )) ∩ f2 ((−∞, a2 )) ∩ . . . ∩ fk ((−∞, ak )) = { x ∈ X | f1 (x) < a1 , f2 (x) < a2 , . . . , fk (x) < ak }
f−1 −1 −1

é um conjunto aberto em X, pois cada conjunto f−1


i ( (−∞, ai ) ), i = 1, . . . , k, é aberto em X.

Com isso, podemos provar novamente que a bola aberta B(a, r) é um conjunto aberto de Rn ,
pois
B(a, r) = {x ∈ Rn | kx − ak < r} = { x ∈ Rn | f(x) < r } ,

onde f : Rn −→ R é a função contı́nua dada por f(x) = kx − ak .

Observação 9.16. Se A1 ⊂ Rn1 , . . . , Ak ⊂ Rnk são abertos, então o produto cartesiano


A1 × . . . × Ak ⊂ Rn1 × . . . × Rnk é aberto.

De fato, considerando as projeções πi : Rn1 × . . . × Rnk −→ Rni , i = 1, . . . , k, que são aplicações


contı́nuas, temos que
π−1
i (Ai ) = R
n1
× . . . × Rni−1 × Ai × Rni+1 × . . . × Rnk , i = 1, . . . , k

são conjuntos abertos. Logo,


A1 × . . . × Ak = π−1 −1
1 (A1 ) ∩ . . . ∩ πk (Ak )

é um conjunto aberto.

Definição 9.7. Dados X ⊂ Rm , Y ⊂ Rn , dizemos que f : X −→ Y é uma aplicação aberta


quando para cada A ⊂ X aberto em X, sua imagem f(A) é um subconjunto aberto em Y.

Observação 9.17. As projeções πi : Rn −→ R, i = 1, . . . , n, são funções abertas.


De fato, considerando a norma do máximo em Rn , temos que se A ⊂ Rn é aberto e ai = πi (a),
a = (a1 , . . . , an ) ∈ A, existe δ > 0 tal que
BM (a, δ) = (a1 − δ, a1 + δ) × · · · × (an − δ, an + δ) ⊂ A ,

e, portanto, πi (BM (a, δ)) = (ai − δ, ai + δ) ⊂ πi (A). Logo πi (A) é aberto em R.

J. Delgado - K. Frensel 41
Análise

10 Conjuntos fechados

Definição 10.1. Seja X ⊂ Rn . Dizemos que um ponto a ∈ Rn é aderente a X quando a é


limite de uma sequência de pontos de X.

Observação 10.1. Todo ponto a ∈ X é aderente a X, pois a = lim xk , com xk = a para todo
k ∈ N. Mas um ponto a pode ser aderente a X sem pertencer a X. Neste caso, a ∈ X 0 .

Logo a é aderente a X se, e só se, a ∈ X ou a ∈ X 0 , ou seja, a ∈ X ∪ X 0 .

Observação 10.2. Um ponto a ∈ Rn é aderente a X ⇐⇒ para todo ε > 0, B(a, ε) ∩ X 6= ∅.


De fato, se a ∈ Rn é aderente a X, existe uma sequência (xk ) de pontos de X tal que lim xk = a.

Então, dado ε > 0, existe k0 ∈ N tal que kxk − ak < ε para todo k > k0 , ou seja xk ∈ B(a, ε) ∩ X
para todo k > k0 . Logo B(a, ε) ∩ X 6= ∅.
 1
Reciprocamente, para todo k ∈ N, temos, por hipótese, que existe xk ∈ B a, ∩ X, ou seja,
k
1
existe xk ∈ X com kxk − ak < .
k
Logo (xk ) é uma sequência de pontos de X que converge para a. Portanto, a é aderente a X.

Definição 10.2. O fecho de X é o conjunto X formado pelos pontos aderentes a X.

Observação 10.3. X = X ∪ X 0 (ver observação 10.1).

Observação 10.4. b 6∈ X ⇐⇒ ∃ δ > 0 ; B(b, δ) ∩ X = ∅ ⇐⇒ ∃ δ > 0 ; B(b, δ) ⊂ Rn − X ⇐⇒


b ∈ int(Rn − X).

Como Rn = int X ∪ int(Rn − X) ∪ ∂X (união disjunta), temos que X = int X ∪ ∂X.

• Em particular
B(a, r) = int B(a, r) ∪ ∂B(a, r) = B(a, r) ∪ S[a, r] = B[a, r]
e B[a, r] = int B[a, r] ∪ ∂B[a, r] = B(a, r) ∪ S[a, r] = B[a, r].

Ou seja, B(a, r) = B[a, r] = B[a, r] .

Exemplo 10.1. Se X = Qn , então X = Rn , pois todo número real é o limite de uma sequência
de números racionais, e, portanto, todo ponto (a1 , . . . , an ) ∈ Rn é o limite de uma sequência de
pontos de Qn . 

Observação 10.5. O conceito de ponto aderente a X pode ser reformulado com abertos, em
vez de bolas:

42 Instituto de Matemática UFF


Conjuntos fechados

• a ∈ X ⇐⇒ para todo aberto A, contendo a, tem-se A ∩ X 6= ∅.

• b 6∈ X ⇐⇒ existe um aberto A com b ∈ A e A ∩ X = ∅.

Para provar a primeira afirmação, basta observar que toda bola aberta é um conjunto aberto, e
que todo conjunto aberto A contendo a, contém também uma bola aberta de centro a.

Definição 10.3. Dizemos que um conjunto X ⊂ Rn é fechado quando contém todos os seus
pontos aderentes, ou seja, quando X = X.

Observação 10.6. X ⊂ Rn é fechado ⇐⇒ ”se lim xk = a e xk ∈ X para todo k ∈ N =⇒


a ∈ X”.

Exemplo 10.2. Toda bola fechada B[a, r] é um conjunto fechado, pois, pela observação 10.4,
B[a, r] = B[a, r].

Ou, mais diretamente, se (xk ) é uma sequência de pontos de B[a, r] , e lim xk = b , então
kb − ak ≤ r , pois kxk − ak ≤ r para todo k ∈ N e kb − ak = lim kxk − ak. 
k→∞

Observação 10.7. X ⊂ Y ⊂ Rn =⇒ X ⊂ Y .
De fato, se a ∈ X, existe uma sequência (xk ) de pontos de X tal que lim xk = a. Como X ⊂ Y,
(xk ) é uma sequência de pontos de Y com lim xk = a. Logo a ∈ Y.

Observação 10.8. Se X ⊂ Rn é limitado, então X é limitado.


De fato, como X é limitado, existe r > 0 tal que X ⊂ B[0, r]. Logo X ⊂ B[0, r] = B[0, r] e, portanto,
X é limitado.

Proposição 10.1. Seja X ⊂ Rn . Então Rn − X é aberto em Rn .

Prova.
Seja b ∈ Rn − X, ou seja, b 6∈ X. Então existe δ > 0 tal que B(b, δ) ∩ X = ∅. Seja y ∈ B(b, δ).
Como B(b, δ) é um aberto que contém y tal que B(b, δ) ∩ X = ∅, temos, pela observação 10.5,
que y 6∈ X, ou seja, y ∈ Rn − X. Logo B(b, δ) ⊂ Rn − X, provando, assim, que Rn − X é aberto.


Teorema 10.1. Um conjunto X ⊂ Rn é fechado se, e só se, Rn − X é aberto.

Prova.
(=⇒) Se X é fechado, então X = X. Logo Rn − X = Rn − X é aberto.

J. Delgado - K. Frensel 43
Análise

(⇐=) Suponhamos que Rn − X é aberto e seja a 6∈ X, ou seja, a ∈ Rn − X. Então existe δ > 0


tal que B(a, δ) ⊂ Rn − X. Logo B(a, δ) ∩ X = ∅, e, portanto, a 6∈ X. Assim, todo ponto aderente
a X deve pertencer a X. Então X é fechado. 

Observação 10.9. A ⊂ Rn é aberto ⇐⇒ Rn − A é fechado.

Corolário 10.1. O fecho de todo conjunto é um conjunto fechado. Ou seja, X = X.

Teorema 10.2. Os conjuntos fechados do espaço euclidiano possuem as seguintes proprie-


dades:

(1) ∅ e Rn são conjuntos fechados;

(2) A reunião F = F1 ∪. . .∪Fk de um número finito de conjuntos fechados F1 , . . . , Fk é um conjunto


fechado;
T
(3) A intersecção F = λ∈L Fλ de uma famı́lia qualquer (Fλ )λ∈L de conjuntos fechados Fλ é um
conjunto fechado.

Prova.
(1) ∅ e Rn são conjuntos fechados, pois Rn = Rn − ∅ e ∅ = Rn − Rn são conjuntos aber-
tos.

(2) Se F1 , . . . , Fk são conjuntos fechados, então Rn − F1 , . . . , Rn − Fk são conjuntos abertos. Logo


(Rn − F1 ) ∩ . . . ∩ (Rn − Fk ) é aberto.

Assim, F = F1 ∪ . . . ∪ Fk é um conjunto fechado, pois


Rn − F = Rn − (F1 ∪ . . . ∪ Fk ) = (Rn − F1 ) ∩ . . . ∩ (Rn − Fk )

é um conjunto aberto.

(3) Se (Fλ )λ∈L é uma famı́lia de conjuntos fechados, então (Rn −Fλ )λ∈L é uma famı́lia de conjuntos
[ \
abertos. Logo (Rn − Fλ ) é um conjunto aberto. Assim, F = Fλ é fechado, pois
λ∈L \ [ λ∈L
n n n
R −F=R − Fλ = (R − Fλ )
λ∈L λ∈L

é um conjunto aberto. 

Observaç  10.10. Seja x ∈ R . Então o conjunto unitário {x}


ão n
  De fato, se y 6= x,
 é fechado.
kx − yk kx − yk
B y, ∩ {x} = ∅ (pois kx − yk > kx − yk/2), ou seja, B y, ⊂ Rn − {x}. Logo,
2 2
Rn − {x} é um conjunto aberto e, portanto, {x} é um conjunto fechado.

44 Instituto de Matemática UFF


Conjuntos fechados

Observação 10.11. Uma reunião infinita de conjuntos fechados pode ser um conjunto fe-
[
chado ou não, pois todo conjunto X ⊂ Rn é reunião de seus pontos: X = {x}. Como há
x∈X
conjuntos em Rn que não são fechados, há reuniões infinitas de conjuntos fechados que não
são fechados

Observação 10.12. Se X ⊂ Rn então a ∈ ∂X se, e só se, a ∈ X ∩ Rn − X.


Ou seja, ∂X = X ∩ Rn − X. Em particular, a fronteira de todo conjunto X ⊂ Rn é um conjunto
fechado.

Definição 10.4. Seja X ⊂ Rn . Dizemos que um conjunto F ⊂ X é fechado em X quando F


contém todos os seus pontos aderentes que pertencem a X, ou seja, quando F = F ∩ X.

Observação 10.13. F ⊂ X é fechado em X ⇐⇒ existe G ⊂ Rn fechado tal que F = G ∩ X.


De fato, se F é fechado em X então F = F ∩ X, onde G = F é fechado em Rn .

Reciprocamente, se F = G ∩ X, com G ⊂ Rn fechado, então F ⊂ G e, portanto, F ⊂ G = G. Logo


F ⊂ F ∩ X ⊂ G ∩ X = F, ou seja, F = F ∩ X.

Exemplo 10.3. O intervalo J = (0, 2] é fechado no intervalo I = (0, 3], pois J = [0, 2] ∩ (0, 3] e
[0, 2] ⊂ R é fechado. Mas J não é fechado em R. 

Observação 10.14. Seja X ⊂ Rn fechado. Então F ⊂ X é fechado em X se, e só se, F é


fechado em Rn .

De fato, se F é fechado em X, existe G ⊂ Rn fechado tal que F = G ∩ X. Como G e X são


fechados em Rn , temos que F é fechado em Rn .

Reciprocamente, se F é fechado em Rn , então F é fechado em X, pois F = F ∩ X. A recı́proca é


válida para todo X ⊂ Rn .

Observação 10.15. Os conjuntos fechados em X possuem propriedades análogas às de-


monstradas no teorema 10.2 para os conjuntos fechados em Rn .:

(1) ∅ e X são fechados em X, pois ∅ = ∅ ∩ X e X = Rn ∩ X, onde ∅ e Rn são fechados em Rn .

(2) Uma reunião finita de conjuntos F1 , . . . , Fk fechados em X é um conjunto fechado em X, pois,


para cada i = 1, . . . , k , Fi = Gi ∩ X, onde Gi é fechado em Rn . Logo,
F1 ∪ . . . ∪ Fk = (G1 ∩ X) ∪ . . . ∪ (Gk ∩ X) = (G1 ∪ . . . ∪ Gk ) ∩ X ,

onde G1 ∪ . . . ∪ Gk é fechado em Rn .

J. Delgado - K. Frensel 45
Análise

\
(3) A intersecção F = Fλ de uma famı́lia arbitrária de conjuntos Fλ fechados em X é um
λ∈L
n
conjunto fechado em X, pois, para cada λ ∈ L, Fλ = Gλ ∩ X, com
! Gλ fechado em R . Logo,
\ \ \
F= Fλ = (Gλ ∩ X) = Gλ ∩ X ,
λ∈L λ∈L λ∈L

Gλ é fechado em Rn .
T
onde λ∈L

Observação 10.16. Seja F ⊂ X ⊂ Rn . Então F é fechado em X se, e só se, A = X − F, o


complementar de F em X, é aberto em X.

De fato, se F é fechado em X, então F = G ∩ X, com G fechado em Rn . Logo,


X − F = X − (G ∩ X) = X ∩ ( (Rn − G) ∪ (Rn − X) ) = X ∩ (Rn − G)

é aberto em X, pois Rn − G é aberto em Rn .

Reciprocamente, se X − F é aberto em X, X − F = A ∩ X, onde A é aberto em Rn .

Logo F = (Rn − A) ∩ X. Como Rn − A é fechado em Rn , F é fechado em X.

Teorema 10.3. Uma aplicação f : X ⊂ Rm −→ Rn é contı́nua se, e só se, a imagem inversa
f−1 (F) de todo conjunto fechado F ⊂ Rn é um conjunto fechado em X.

Prova.
(=⇒) Seja f : X −→ Rn contı́nua e seja F ⊂ Rn fechado em Rn . Então A = Rn − F é aberto
em Rn e, portanto, pelo teorema 9.2, f−1 (A) é aberto em X. Mas, como f−1 (A) = f−1 (Rn − F) =
X − f−1 (F), temos, pela observação anterior, que f−1 (F) é fechado em X.

(⇐=) Seja A ⊂ Rn aberto em Rn . Então F = Rn − A é fechado em Rn , e, por hipótese,


f−1 (F) = f−1 (Rn − A) = X − f−1 (A) é fechado em X. Logo f−1 (A) é aberto em X, e pelo teorema
9.2, f é contı́nua. 

Observação 10.17. Uma aplicação f : X ⊂ Rm −→ Y ⊂ Rn é contı́nua se, e só se, para todo
F ⊂ Y fechado em Y, o conjunto f−1 (F) é fechado em X.

De fato, suponhamos f contı́nua e seja F ⊂ Y fechado em Y. Então F = F0 ∩ Y, com F0 fechado


em Rn . Como f−1 (F) = f−1 (F0 ), temos, pelo teorema 10.3, que f−1 (F) é fechado em X.

Reciprocamente, seja F0 ⊂ Rn fechado em Rn . Então F = F0 ∩ Y é fechado em Y e, por hipótese,


f−1 (F) é fechado em X. Mas, como f−1 (F0 ) = f−1 (F), temos que f−1 (F0 ) é fechado em X e,
portanto, pelo teorema 10.3, f é contı́nua.

Observação 10.18. Se f1 , . . . , fk : Rn −→ R são funções contı́nuas e a1 , . . . , ak ∈ R, então


o conjunto

46 Instituto de Matemática UFF


Conjuntos fechados

F = {x ∈ Rn | f1 (x) ≤ a1 , . . . , fk (x) ≤ ak }

é fechado em Rn , pois F = f−1 −1


1 ((−∞, a1 ]) ∩ . . . ∩ fk ((−∞, ak ]) e (−∞, a1 ], . . . , (−∞, ak ] são
conjuntos fechados em R.

Em particular, se f : Rn −→ R é a função contı́nua dada por f(x) = kx − ak e r é um número real


positivo, então B[a, r] = f−1 ((−∞, r]) é fechado em Rn .

Observação 10.19. Se f1 , . . . , fk : Rn −→ R são funções contı́nuas e a1 , . . . , ak são números


reais, então o conjunto
F = {x ∈ Rn | f1 (x) = a1 , . . . , fk (x) = ak }

é fechado em Rn , pois
1 ({a1 }) ∩ . . . ∩ fk ({ak })
F = f−1 {a1 }, . . . , {ak }
−1
e

são fechados em R.

Em particular, se f : Rn −→ R é a função contı́nua dada por f(x) = kx−ak, então S[a, r] = f−1 ({r})
é fechado em Rn .

Observação 10.20. Se F1 ⊂ Rn1 , . . . , Fk ⊂ Rnk são conjuntos fechados, então o produto


cartesiano F1 × . . . × Fk ⊂ Rn1 × . . . × Rnk = Rn1 +...+nk é fechado.

De fato, como as projeções πi : Rn1 × . . . × Rnk −→ Rni , dadas por πi (x1 , . . . , xi , . . . , xk ) = xi ,


são contı́nuas e
π−1
i (Fi ) = R
n1
× . . . × Rni−1 × Fi × Rni+1 × . . . × Rnk , i = 1, . . . , k ,

temos que π−1


i (Fi ) é fechado para todo i = 1, . . . , k e, portanto,
F1 × . . . × Fk = π−1 −1
1 (F1 ) ∩ . . . ∩ πk (Fk )

é fechado em Rn1 +...+nk .

Observação 10.21. Se f : X ⊂ Rm −→ Rn é uma aplicação contı́nua, então seu gráfico


G = { (x, f(x)) | x ∈ X } é um subconjunto fechado de X × Rn , pois, a aplicação g : X × Rn −→ Rn
dada por g(x, y) = y − f(x) é contı́nua e
g−1 ({0}) = { (x, y) ∈ X × Rn | g(x, y) = 0 } = { (x, y) ∈ X × Rn | y = f(x) }
= { (x, f(x)) | x ∈ X } = G .
Em particular, se X ⊂ Rm é fechado, temos que G é fechado em Rm × Rn , pois X × Rn é fechado
em Rm × Rn .

Definição 10.5. Dizemos que uma aplicação f : X ⊂ Rm −→ Y ⊂ Rn é fechada quando f(F) é


fechado em Y para todo F ⊂ X fechado em X.

J. Delgado - K. Frensel 47
Análise

Exemplo 10.4. A função f : R −→ R, f(x) = ex , é contı́nua, mas não é fechada, pois


F = (−∞, 1] é fechado em R, mas f(F) = (0, 1] não é fechado em R. 

Exemplo 10.5. A projeção π1 : Rm ×Rn −→ Rm não transforma necessariamente um conjunto


fechado F ⊂ Rm × Rn num conjunto fechado π1 (F) ⊂ Rm .

Por exemplo, a hipérbole H = {(x, y) ∈ R2 | xy = 1} é um subconjunto fechado de R2 , pois H é


a imagem inversa do fechado {1} ⊂ R pela função contı́nua (x, y) 7−→ xy, mas sua projeção no
eixo das abscissas π1 (H) = R − {0} não é fechada em R. 

Definição 10.6. Sejam Y ⊂ X ⊂ Rn . O fecho de Y relativamente a X é o conjunto YX = Y ∩ X


dos pontos aderentes a Y que pertencem ao conjunto X.

Observação 10.22. Y ⊂ X é fechado em X se, e só se, YX = Y, ou seja, se, e só se, Y = Y∩X.
De fato, se Y = Y ∩ X, temos que Y é fechado em X, pois Y é fechado em Rn .

Reciprocamente, se Y é fechado em X, então Y = G ∩ X, G fechado em Rn . Logo Y ⊂ G e,


portanto, Y ⊂ G = G. Assim, Y ⊂ Y ∩ X ⊂ G ∩ X = Y, ou seja, Y = Y ∩ X = YX .

Definição 10.7. Sejam Y ⊂ X ⊂ Rn . Dizemos que Y é denso em X quando YX = Y ∩ X = X,


isto é, quando o fecho de Y relativamente a X é todo o conjunto X.

Observação 10.23. Y ⊂ X ⊂ Rn é denso em X ⇐⇒ X ⊂ Y ⇐⇒ todo ponto de X é limite de


uma sequência de pontos de Y ⇐⇒ toda bola aberta com centro em algum ponto de X contém
pontos de Y.

Proposição 10.2. Sejam f, g : X ⊂ Rm −→ Rn aplicações contı́nuas e Y ⊂ X um subconjunto


denso em X. Se f(y) = g(y) para todo y ∈ Y, então f(x) = g(x) para todo x ∈ X, ou seja, f = g.

Prova.
Seja x ∈ X. Então existe uma sequência (yk ) de pontos de Y tal que lim yk = x.

Logo f(x) = lim f(yk ) = lim g(yk ) = g(x). 

Proposição 10.3. Todo subconjunto X ⊂ Rn contém um subconjunto enumerável E denso


em X.

Prova.
A coleção B das bolas abertas B(q, r) com centro num ponto q ∈ Qn e raio r > 0 racional,
com B(q, r) ∩ X 6= ∅, é enumerável. Seja B = {B1 , . . . , Bk , . . .} uma enumeração de B.

48 Instituto de Matemática UFF


Conjuntos Compactos

Para cada i ∈ N, escolhemos um ponto xi ∈ Bi ∩ X. O conjunto E dos pontos xi , assim obtidos,


é um subconjunto enumerável de X.

Para mostrar que E é denso em X, basta verificar que B(x0 , ε) ∩ E 6= ∅ para todo x0 ∈ X e para
todo ε > 0.
ε
Seja r > 0, r ∈ Q, tal que r < , e seja q ∈ Qn tal que kq − x0 k < r. Então x0 ∈ B(q, r) ∩ X e,
2
portanto, B(q, r) ∩ X 6= ∅, ou seja, B(q, r) = Bi , para algum i ∈ N. Existe, então, xi ∈ Bi ∩ E.

Logo kxi − x0 k ≤ kxi − qk + kq − x0 k < 2r < ε, ou seja, xi ∈ B(x0 , ε) ∩ E. 

Observação 10.24. E é finito ⇐⇒ X é finito. Neste caso, E = X. De fato, se E é finito, então


E = E e, portanto, X = EX = E ∩ X = E.

Reciprocamente, se X é finito, então E é finito, pois E ⊂ X.

11 Conjuntos Compactos

Definição 11.1. Dizemos que um conjunto K ⊂ Rn é compacto quando ele é limitado e


fechado.

Exemplo 11.1. As bolas fechadas, as esferas e os conjuntos finitos de Rn são conjuntos


compactos. 

Exemplo 11.2. Rn , n ≥ 1, não é compacto, pois não é limitado.

Observação 11.1. K ⊂ Rn é compacto ⇐⇒ toda sequência (xk ) de pontos de K possui uma


subsequência que converge para um ponto de K.

De fato, se K é compacto e (xk ) é uma sequência de pontos de K, então (xk ) é uma sequência
limitada, pois K é limitado.

Pelo teorema de Bolzano-Weierstrass, existe N 0 ⊂ N infinito tal que (xk )k∈N 0 converge. Mais
ainda, lim0 xk ∈ K, pois K é fechado.
k∈N

Reciprocamente, suponhamos que K não é limitado Então, para todo k ∈ N, existe xk ∈ K tal
que kxk k ≥ k. Logo (xk ) é uma sequência de pontos de K que não possui uma subsequência
convergente, pois toda subsequência de (xk ) é ilimitada, o que contradiz a hipótese.

Assim, K é limitado.

Suponhamos agora que K não é fechado.

J. Delgado - K. Frensel 49
Análise

Então existe x ∈ K−K. Como x ∈ K, existe uma sequência (xk ) de pontos de K tal que lim xk = x.
Logo, (xk ) é uma sequência de pontos de K tal que toda subsequência converge para x 6∈ K, o
que contradiz a hipótese. Assim, K é fechado.

Observação 11.2. K1 , . . . , Kp compactos em Rn =⇒ K1 ∪ . . . ∪ Kp compacto.

Observação 11.3. A intersecção de uma famı́lia qualquer de compactos Kλ ⊂ Rn , λ ∈ L, é


um conjunto compacto.

Observação 11.4. K1 ⊂ Rn1 , . . . , Kp ⊂ Rnp compactos =⇒ K1 × . . . × Kp ⊂ Rn1 × . . . × Rnp é


compacto.

De fato, K1 × . . . × Kp é fechado em Rn1 +...+np , pois cada Ki é fechado em Rni , i = 1, . . . , p.

Sendo cada Ki limitado, existe ri > 0 tal que kxkS ≤ ri para todo x ∈ Ki , i = 1, . . . , p.

Logo k(x1 , . . . , xp )kS ≤ kx1 kS + . . . + kxp kS ≤ r1 + . . . + rp para todo (x1 , . . . , xp ) ∈ K1 × . . . × Kp ,


ou seja, K1 × . . . × Kp é limitado.

Teorema 11.1. (Propriedade de Cantor)


Se K1 ⊃ K2 ⊃ . . . ⊃ Kk ⊃ . . . é uma sequência decrescente de compactos não-vazios, então a
\
intersecção Kk é um conjunto compacto não-vazio.
k∈N

Prova.
\ \
Pela observação 11.3, temos que Kk é compacto. Basta, então, mostrar que Kk 6= ∅.
k∈N k∈N
Para isso, tome xk ∈ Kk para cada k ∈ N.

Como xk ∈ K1 para todo k ∈ N, a sequência (xk )k∈N possui uma subsequência (xki )i∈N que
converge para um ponto x ∈ K1 .

Além disso, dado k ∈ N, temos que xki ∈ Kk para todo ki > k. Logo x = lim xki ∈ Kk para todo
\ i∈N
k ∈ N, ou seja, x ∈ Kk . 
k∈N

Teorema 11.2. Seja f : X ⊂ Rm −→ R uma aplicação contı́nua. Se K ⊂ X é compacto então


f(K) é compacto.

Prova.
Seja (yk ) uma sequência de pontos de f(K). Então, para todo k ∈ N, existe xk ∈ K tal que
yk = f(xk ).

50 Instituto de Matemática UFF


Conjuntos Compactos

Como (xk ) é uma sequência de pontos de K e K é compacto, (xk )k∈N possui uma subsequência
(xki )i∈N que converge para um ponto x ∈ K.

Assim, sendo f é contı́nua, temos que lim f(xki ) = f(x), ou seja, (f(xki ))i∈N é uma subsequência
i→∞
de (yk ) que converge para um ponto f(x) ∈ f(K).

Logo, pela observação 11.1, f(K) é compacto. 

Observação 11.5.
• Uma aplicação contı́nua pode transformar um conjunto limitado num conjunto ilimitado.
1
Por exemplo, a função f(x) = leva o intervalo limitado (0, 1) no intervalo ilimitado (1, +∞).
x
• E, também, uma aplicação contı́nua pode transformar um conjunto fechado num conjunto que
não é fechado.
1
Por exemplo, a função f(x) = transforma R, fechado, no intervalo (0, 1) que não é fechado.
1 + x2

Corolário 11.1. (Weierstrass)


Seja K ⊂ Rn um conjunto compacto. Toda função real contı́nua f : K −→ R atinge seu valor
máximo e seu valor mı́nimo em pontos de K, isto é, existem x0 , x1 ∈ K tais que
f(x0 ) ≤ f(x) ≤ f(x1 ) para todo x ∈ K.

Prova.
Como f é contı́nua e K é compacto, f(K) é compacto em R.

Sejam m = inf{f(x) | x ∈ K} e M = sup{f(x) | x ∈ K}. Então existem sequências (xk ) e (yk ) de


pontos de K tais que f(xk ) −→ m e f(yk ) −→ M.

Como K é compacto, existem N 0 ⊂ N e N 00 ⊂ N infinitos, x0 , x1 ∈ K, tais que lim0 xk = x0 e


k∈N
lim00 yk = x1 . Então m = lim0 f(xk ) = f(x0 ) e M = lim00 f(yk ) = f(x1 ).
k∈N k∈N k∈N

Portanto, f(x0 ) ≤ f(x) ≤ f(x1 ) para todo x ∈ K. 


x
Exemplo 11.3. A função contı́nua f : R −→ R dada por f(x) = , tem imagem
1 + |x|
f(R) = (−1, 1). Portanto, nenhum valor f(x) é menor nem maior do que todos os demais valores
de f. Neste exemplo, o domı́nio R é fechado mas não é limitado. 

Observação 11.6. Toda aplicação contı́nua f : K ⊂ Rm −→ Rn definida num compacto K é


limitada, isto é, existe c > 0 tal que kf(x)k ≤ c para todo x ∈ K.

Observação 11.7. Se f : K ⊂ Rn −→ R é uma função contı́nua e f(x) > 0 para todo x ∈ K,


então existe c > 0 tal que f(x) ≥ c para todo x ∈ K.

J. Delgado - K. Frensel 51
Análise

Se K não é compacto, pode não existir c > 0 tal que f(x) ≥ c para todo x ∈ K.
1
Por exemplo, a função f : (0, +∞) −→ R, dada por f(x) = , é contı́nua e positiva, mas
x
f((0, +∞)) = (0, +∞).

Corolário 11.2. Toda aplicação contı́nua f : K −→ Rn definida num compacto K ⊂ Rm é


fechada, isto é, F ⊂ K fechado em K =⇒ f(F) fechado em Rn .

Prova.
Seja F ⊂ K fechado em K. Como K é fechado em Rn , temos que F é fechado em Rn . Além
disso, como K é limitado e F ⊂ K, temos que F é limitado. Portanto, F é compacto. Logo f(F) é
compacto, uma vez que f é contı́nua. Assim, f(F) é fechado em Rn . 

Corolário 11.3. Toda bijeção contı́nua f : K ⊂ Rm −→ L ⊂ Rn definida num compacto K é um


homeomorfismo sobre sua imagem.

Prova.
Seja f : K −→ L uma bijeção contı́nua. Como K é compacto, f(K) = L é compacto.

Seja g = f−1 : L −→ K e seja F ⊂ K fechado em K. Então g−1 (F) = f(F) é fechado em Rn pelo
corolário 11.2 e, portanto, g−1 (F) é fechado em L. Logo, pela observação 10.17, g : L −→ K é
contı́nua e, portanto, f : K −→ L é um homeomorfismo. 

Corolário 11.4. Seja f : K ⊂ Rm −→ L uma aplicação contı́nua do compacto K sobre o


conjunto (necessariamente compacto) L = f(K). Dado F ⊂ L, se sua imagem inversa f−1 (F) é
fechada, então F é fechado.

Prova.
Como f é sobrejetora e F ⊂ L, temos que f(f−1 (F)) = F. Portanto, pelo corolário 11.2, F é
fechado. 

Corolário 11.5. Seja ϕ : K −→ L uma aplicação contı́nua do compacto K ⊂ Rm sobre o


compacto L ⊂ Rn . Então uma aplicação f : L −→ Rp é contı́nua se, e só se, f ◦ ϕ : K −→ Rp é
contı́nua.

Prova.
(=⇒) É evidente.

(⇐=) Suponhamos f ◦ ϕ : K −→ Rp contı́nua e seja F ⊂ Rp fechado. Então o conjunto


ϕ−1 (f−1 (F)) = (f ◦ ϕ)−1 (F) é fechado em K. Logo, pelo corolário 11.4, f−1 (F) é fechado em
L. Assim, pelo teorema 10.3, f : L −→ Rp é contı́nua. 

52 Instituto de Matemática UFF


Conjuntos Compactos

Aplicação: Seja g : [0, 2π] −→ Rn uma aplicação contı́nua com g(0) = g(2π). E seja a
aplicação f : S1 −→ Rn definida por f(eit ) = f(cos t, sen t) = g(t), que está bem definida, pois
g(0) = g(2π).

Como a aplicação ϕ : [0, 2π] −→ S1 , dada por ϕ(t) = (cos t, sen t), é contı́nua do compacto
[0, 2π] sobre o compacto S1 e f◦ϕ = g é contı́nua, temos, pelo corolário anterior, que a aplicação
f : S1 −→ Rn é contı́nua.

Teorema 11.3. Se f : X ⊂ Rm −→ Rn é contı́nua e K ⊂ X é compacto, então, para todo ε > 0,


existe δ > 0, tal que x ∈ X, y ∈ K, kx − yk < δ =⇒ kf(x) − f(y)k < ε.

Prova.
Suponhamos, por absurdo, que existe ε0 > 0 tal que para todo δ > 0 podemos obter xδ ∈ X
e yδ ∈ K tais que kxδ − yδ k < δ e kf(xδ ) − f(yδ )k > ε0 .
1
Então, para todo k ∈ N, existem xk ∈ X e yk ∈ K tais que kxk − yk k < e kf(xk ) − f(yk )k ≥ ε0 .
k
Como (yk ) é uma sequência de pontos do compacto K, existe N 0 ⊂ N infinito tal que a sub-
sequência (yk )k∈N 0 converge para um ponto x ∈ K. Logo (xk )k∈N 0 converge, também, para
x e, portanto, pela continuidade de f, lim0 kf(xk ) − f(yk )k = kf(x) − f(x)k = 0, o que é uma
k∈N
contradição, pois kf(xk ) − f(yk )k ≥ ε0 , para todo k ∈ N. 

Observação 11.8. Toda aplicação contı́nua f : K −→ Rn definida num compacto K ⊂ Rm é


uniformemente contı́nua.

Teorema 11.4. Seja f : X × K −→ Rn contı́nua, onde K é compacto, e seja x0 ∈ X. Então,


para todo ε > 0, existe δ > 0, tal que x ∈ X, kx − x0 k < δ =⇒ kf(x, y) − f(x0 , y)k < ε para todo
y ∈ K.

Prova.
Suponhamos, por absurdo, que existe ε0 > 0 tal que, para todo δ > 0, podemos obter xδ ∈ X e
yδ ∈ K tais que kxδ − x0 k < δ e kf(xδ , yδ ) − f(x0 , yδ )k ≥ ε0 .

Então, para todo k ∈ N, existem xk ∈ X e yk ∈ K tais que


1
kxk − x0 k < e kf(xk , yk ) − f(x0 , yk )k ≥ ε0 .
k
Como xk −→ x0 e (yk ) possui uma subsequência (yk )k∈N 0 que converge para um ponto y0 ∈ K,
temos, pela continuidade de f, que f(xk , yk ) −→0 f(x0 , y0 ) e f(x0 , yk ) −→0 f(x0 , y0 ). Logo,
k∈N k∈N
ε0 ≤ lim0 kf(xk , yk ) − f(x0 , yk )k = 0 ,
k∈N

o que é uma contradição. 

J. Delgado - K. Frensel 53
Análise

Aplicação: Seja f : X × [a, b] −→ R contı́nua.Z Definimos ϕ : X −→ R, para cada x ∈ X, por


b
ϕ(x) = f(x, t) dt .
a

Então ϕ é contı́nua em todo ponto x0 ∈ X. De fato, pelo teorema anterior, dado ε > 0, existe
ε
δ > 0, tal que x ∈ X e kx − x0 k < δ =⇒ kf(x, t) − f(x0 , t)k < para todo t ∈ [a, b]. Logo,
2(b − a)
Zb
ε ε
|ϕ(x) − ϕ(x0 )| ≤ |f(x, t) − f(x0 , t)| dt ≤ × (b − a) = < ε .
a 2(b − a) 2

Definição 11.2. Uma cobertura de um conjunto X ⊂ Rn é uma famı́lia (Cλ )λ∈L de subconjun-
[
tos Cλ ⊂ Rn tal que X ⊂ Cλ .
λ∈L

Uma subcobertura de uma cobertura (Cλ )λ∈L é uma subfamı́lia (Cλ )λ∈L 0 , L 0 ⊂ L, para a qual
[
ainda se tem X ⊂ Cλ .
λ∈L 0
[
Dizemos que a cobertura X ⊂ Cλ é
λ∈L

• aberta, quando os Cλ são todos conjuntos abertos;

• finita, se L é um conjunto finito;

• enumerável, se L é um conjunto enumerável.

Teorema 11.5. (Lindelöf)


[
Seja X ⊂ Rn . Toda cobertura aberta X ⊂ Aλ possui uma subcobertura enumerável
λ∈L
X ⊂ Aλ1 ∪ . . . ∪ Aλk ∪ . . .

Prova.
Se E = {x1 , . . . , xk , . . .} ⊂ X é um subconjunto enumerável denso em X e B é a coleção de
todas as bolas abertas B(x, r), com x ∈ E e r ∈ Q+ , tais que cada uma delas está contida em
algum Aλ , então B é um conjunto enumerável de bolas abertas.
[
Afirmação: X ⊂ B.
B∈B

Dado x ∈ X, existe λ ∈ L tal que x ∈ Aλ . Como Aλ é aberto, existe r > 0 racional tal que
B(x, 2r) ⊂ Aλ , e sendo E denso em X, existe xi ∈ E tal que kx − xi k < r, ou seja, x ∈ B(xi , r).

Se y ∈ B(xi , r), temos que ky − xi k < r =⇒ ky − xk ≤ ky − xi k + kxi − xk < 2r. Logo


y ∈ B(x, 2r) ⊂ Aλ . Ou seja, B(xi , r) ∈ B.

54 Instituto de Matemática UFF


Conjuntos Compactos

Tomando uma enumeração {B1 , . . . , Bk , . . .} de B, e escolhendo para cada i ∈ N, um ı́ndice


[ [
λi ∈ L tal que Bi ⊂ Aλi , temos que X ⊂ Bk ⊂ Aλk . 
k∈N k∈N

Teorema 11.6. (Borel-Lebesgue)


[
Seja K ⊂ Rn compacto. Então toda cobertura aberta K ⊂ Aλ possui uma subcobertura finita
λ∈L
K ⊂ A λ1 ∪ . . . ∪ A λk .

Prova.
Pelo teorema de Lindelöf, podemos obter uma subcobertura enumerável K ⊂ Aλ1 ∪. . .∪Aλk ∪. . ..

Seja Ki = K ∩ (Rn − (Aλ1 ∪ . . . ∪ Aλi ) , i ∈ N. Como Rn − (Aλ1 ∪ . . . ∪ Aλi ) é fechado e K é


compacto, temos que cada Ki é compacto. Além disso, K1 ⊃ K2 ⊃ . . . ⊃ Kk ⊃ . . . é uma
sequência decrescente, pois Rn − (Aλ1 ∪ . . . ∪ Aλi+1 ) ⊂ Rn − (Aλ1 ∪ . . . ∪ Aλi ) para todo i ∈ N.
\
Dado x ∈ K, existe i0 ∈ N tal que x ∈ Ai0 . Logo x 6∈ Kj , para todo j ≥ i0 . Portanto, Ki = ∅.
i∈N

Assim, pela propriedade de Cantor, existe j0 ∈ N tal que Kj0 = ∅, ou seja, K ⊂ Aλ1 ∪ . . . ∪ Aλj0 .

Teorema 11.7. Se toda cobertura aberta do conjunto K ⊂ Rn possui uma subcobertura finita,
então K é compacto, ou seja, K é limitado e fechado.

Prova.
As bolas abertas de raio 1 centradas em pontos de K constituem uma cobertura aberta
[
K⊂ B(x, 1), que, por hipótese, possui uma subcobertura finita K ⊂ B(x1 , 1) ∪ . . . ∪ B(xk , 1).
x∈K
Assim, K é limitado por estar contido numa reunião finita de conjuntos limitados.
[  rx 
Seja x0 ∈ Rn − K. Então, para todo x ∈ K, temos que rx = kx − x0 k > 0 e K ⊂ B x, .
2
x∈K
r r
   
Por hipótese, existem x1 , . . . , xk ∈ K tais que K ⊂ B x1 , x1 ∪ . . . ∪ B xk , xk .
2 2

r r

Seja r = min x1 , . . . , xk > 0.
2 2
rxj  
Então B(x0 , r) ⊂ R − K, pois se y ∈ B(x0 , r) ∩ K, existiria j ∈ {1, . . . , k} tal que y ∈ B xj ,
n
e,
2
portanto,
rxj
rxj = kxj − x0 k ≤ kx0 − yk + ky − xj k < r + ≤ rxj ,
2
ou seja, rxj < rxj , uma contradição.

Provamos, assim, que se x0 ∈ Rn − K, existe r > 0 tal que B(x0 , r) ⊂ Rn − K. Logo Rn − K é


aberto, e, portanto, K é fechado. 

J. Delgado - K. Frensel 55
Análise

Observação 11.9. Os teoremas 11.6 e 11.7 mostram que poderı́amos ter definido um con-
[
junto compacto K pela condição de que toda cobertura aberta K ⊂ Aλ possui uma subcober-
tura finita K ⊂ Aλ1 ∪ . . . ∪ Aλk .
\
Corolário 11.6. Se o aberto U contém a intersecção K = Ki de uma sequência decres-
i∈N
cente K1 ⊃ K2 ⊃ . . . ⊃ Ki ⊃ . . . de conjuntos compactos, então existe i0 ∈ N tal que Ki0 ⊂ U.

Prova.
\ \ [
Como Ki ⊂ U, temos que Rn − U ⊂ Rn − Ki = (Rn − Ki ). Logo os abertos Ui = Rn − Ki ,
i∈N i∈N i∈N
juntamente com U, constituem uma cobertura aberta de K1 , da qual podemos extrair uma sub-
cobertura finita K1 ⊂ U ∪ Ui1 ∪ . . . ∪ Uip .

Seja i = max{i1 , . . . , ip }. Como U1 ⊂ U2 ⊂ . . . temos que Ui = Ui1 ∪ . . . ∪ Uip . Logo K1 ⊂ U ∪ Ui


e, portanto, Ki ⊂ U ∪ Ui . Mas, como Ki ∩ Ui = ∅, temos que Ki ⊂ U, como querı́amos provar. 

• O nosso objetivo, agora, é demonstrar o teorema de Baire. Mas antes precisamos dar algumas
definições e provar alguns resultados preliminares.

Definição 11.3. Sejam Y ⊂ X ⊂ Rn . Dizemos que x0 ∈ Y é um ponto interior de Y em X


quando existe δ > 0 tal que B(x0 , δ) ∩ X ⊂ Y.

O interior de Y em X é o conjunto intX Y formado pelos pontos interiores de Y em X.

Observação 11.10. Y ⊂ X é aberto em X ⇐⇒ intX Y = Y.


De fato, se Y ⊂ X é aberto em X, existe A ⊂ Rn aberto tal que Y = A ∩ X. Logo, dado y0 ∈ Y,
existe δ > 0 tal que B(y0 , δ) ⊂ A, e, portanto, B(y0 , δ) ∩ X ⊂ A ∩ X = Y. Então x0 ∈ intX Y.

Reciprocamente, se intX Y = Y, dado y ∈ Y, existe δy > 0 tal que B(y, δy ) ∩ X ⊂ Y.


!
[ [
Logo Y = B(y, δy ) ∩ X, onde B(y, δy ) é um conjunto aberto de Rn . Assim, Y é aberto
y∈Y y∈Y
em X.

Definição 11.4. Dizemos que um conjunto X ⊂ Rn é completo quando toda sequência de


Cauchy (xk ) de pontos de X converge para um ponto x ∈ X.

Observação 11.11. X ⊂ Rn é completo ⇐⇒ X é fechado em Rn .

Definição 11.5. Sejam X ⊂ Y ⊂ Rn . Dizemos que X é magro em Y se existe uma sequência


[
F1 , . . . , Fk , . . . de subconjuntos de Y fechados com interior vazio em Y tal que X ⊂ Fi
i∈N

56 Instituto de Matemática UFF


Conjuntos Compactos

Observação 11.12. Todo subconjunto de um conjunto magro em Y é também magro em Y.

Observação 11.13. Toda reunião enumerável de conjuntos magros em Y é ainda um con-


junto magro em Y.

Observação 11.14. Nem sempre um conjunto magro em Y tem interior vazio em Y.


Por exemplo, o conjunto Q dos números racionais é magro em Q, pois Q é a reunião enumerável
[
{x}, onde {x} é fechado e intQ {x} = ∅, para todo x ∈ Q. Mas, intQ Q = Q.
x∈Q

Entretanto, Q é magro em R e intR Q = ∅.

Isto ocorre apenas porque Q não é completo (fechado) em R, conforme resulta do teorema de
Baire a seguir.

Observação 11.15. O conjunto unitário {x} ⊂ Y tem interior vazio em Y se, e só se, x não é
isolado em Y.

De fato,
{x} tem interior vazio em Y ⇐⇒ x 6∈ intY {x} ⇐⇒ ∀ δ > 0 , B(x, δ) ∩ Y 6⊂ {x}
⇐⇒ ∀δ > 0 , B(x, δ) ∩ Y 6= {x} ⇐⇒ x não é isolado em Y .

Observação 11.16. Seja X ⊂ Y. Então intY X = ∅ ⇐⇒ Y − X é denso em Y.


De fato, intY X = ∅ ⇐⇒ B(x, δ) ∩ Y 6⊂ X para todo x ∈ X e δ > 0 ⇐⇒ B(y, δ) ∩ (Y − X) 6= ∅ para
todo y ∈ Y e δ > 0 ⇐⇒ Y − X é denso em Y.

Teorema 11.8. (Baire)


Seja Y ⊂ Rn fechado. Todo conjunto magro em Y tem interior vazio em Y.
[
Equivalentemente, se F = Fi , onde Fi é fechado e tem interior vazio em Y, então intY F = ∅.
i∈N

Ou então: toda interseção enumerável de abertos densos em Y é um subconjunto denso em Y.

Prova.
Sejam A1 , . . . , Ai , . . . subconjuntos abertos e densos em Y.
\
Para provar que A = Ai é denso em Y, basta mostrar que B(x, δ) ∩ A 6= ∅ para todo x ∈ Y e
i∈N
todo δ > 0.

Seja B1 = B(x, δ) a bola aberta de centro x ∈ Y e raio δ > 0.

J. Delgado - K. Frensel 57
Análise

Como A1 é aberto e denso em Y, A1 ∩ B1 é não-vazio e aberto em Y. Então existe uma bola


1
aberta B2 de raio < tal que B2 ∩ Y 6= ∅ e B2 ∩ Y ⊂ A1 ∩ B1 (=⇒ B2 ∩ Y ⊂ B1 ∩ Y).
2
Por sua vez, sendo A2 aberto e denso em Y, A2 ∩ B2 é não-vazio e aberto em Y. Logo existe
1
uma bola aberta B3 de raio < tal que B3 ∩ Y 6= ∅ e B3 ∩ Y ⊂ A2 ∩ B2 (=⇒ B3 ∩ Y ⊂ B2 ∩ Y).
3
1
Prosseguindo desta maneira, obtemos uma sequência de bolas fechadas Bi de raio ri < ,
i
i ≥ 2, tais que:
B1 ∩ Y ⊃ B2 ∩ Y ⊃ . . . ⊃ Bi ∩ Y ⊃ . . . ;
Bi+1 ∩ Y ⊂ Ai ∩ Bi e Bi ∩ Y 6= ∅ para todo i ∈ N .
\
Sendo a bola fechada um conjunto compacto, temos, pelo teorema 11.1, que (Bi ∩ Y) 6= ∅.
i∈N

1 \
Como o raio ri da bola Bi é menor do que , i ≥ 2, temos que se a, b ∈ (Bi ∩ Y), então
i
i∈N
2 \
ka − bk ≤ para todo i ≥ 2, e, portanto, (Bi ∩ Y) = {a} é um conjunto unitário.
i
i∈N

Além disso, como Bi+1 ∩ Y ⊂ Ai ∩ Bi para todo i ∈ N, temos que a ∈ Ai para todo i ∈ N, e
a ∈ B1 .
\
Logo a ∈ A = Ai e a ∈ B1 , ou seja, A ∩ B1 6= ∅, como querı́amos provar. 
i∈N
[
Corolário 11.7. Seja F ⊂ Rn fechado. Se F = Fi , onde cada Fi é fechado em F (e, portanto
i∈N
em Rn ), então existe i0 ∈ N tal que intF Fi0 6= ∅.

Prova.
Se intF Fi = ∅ para todo i ∈ N, temos, pelo teorema de Baire, que intF F = ∅, o que é uma
contradição, pois intF F = F. 

Corolário 11.8. Todo conjunto F ⊂ Rn fechado enumerável possui um ponto isolado.

Prova.
[
Como F = {xi }, F = {x1 , . . . , xi , . . .}, temos que F é uma reunião enumerável de conjuntos
i∈N
fechados. Então, pelo corolário 11.7, existe i0 ∈ N tal que intF {xi0 } 6= ∅.

Ou seja, xi0 é um ponto isolado de F. 

Exemplo 11.4. O espaço Rn , n ≥ 1, não é enumerável. 


\
Exemplo 11.5. O conjunto Q dos números racionais não é uma interseção enumerável Ai
i∈N
de conjuntos abertos da reta, pois, caso contrário, cada Ai seria denso em R. Então, o conjunto

58 Instituto de Matemática UFF


Distância entre dois conjuntos; diâmetro de um conjunto

R−Q dos números irracionais seria uma reunião enumerável de conjuntos fechados com interior
vazio em R, ou seja, R − Q seria magro em R.

Como Q é magro em R, terı́amos que R = Q ∪ (R − Q) seria magro em R, e, pelo teorema de


Baire, teria interior vazio em R, uma contradição. 

Definição 11.6. Um conjunto X ⊂ Rn é perfeito quando é fechado e todo ponto de X é ponto


de acumulação de X, ou seja, quando X é fechado e não possui pontos isolados.

Observação 11.17. X é perfeito ⇐⇒ X = X = X ∪ X 0 e X ⊂ X 0 ⇐⇒ X 0 = X.

Corolário 11.9. Todo conjunto X ⊂ Rn perfeito não-vazio é infinito não-enumerável.

Exemplo 11.6. O conjunto de Cantor K é fechado, sem pontos isolados e com interior vazio
(ver Curso de Análise, Vol. I de E. Lima). Logo K é magro e perfeito e, portanto, infinito não-
enumerável. 

12 Distância entre dois conjuntos; diâmetro de um conjunto

Definição 12.1. Sejam S, T ⊂ Rn conjuntos não-vazios. Definimos a distância d(S, T ) entre S


e T por:
d(S, T ) = inf{ kx − yk | x ∈ S e y ∈ T }

Observação 12.1.
• d(S, T ) = d(T, S) ;

• S ∩ T 6= ∅ =⇒ d(S, T ) = 0 ;

• S1 ⊂ S2 e T1 ⊂ T2 =⇒ d(S2 , T2 ) ≤ d(S1 , T1 ) .

Observação 12.2. A distância d(S, T ) é caracterizada pelas duas propriedades abaixo:


(1) d(S, T ) ≤ kx − yk para x ∈ S e y ∈ T arbitrários;

(2) Dado ε > 0, existem x ∈ S e y ∈ T tais que kx − yk < d(S, T ) + ε.

Um caso particular de distância entre dois conjuntos ocorre quando um deles consiste de
um único ponto.

Dados x ∈ Rn e T ⊂ Rn não-vazio, temos:


d(x, T ) = inf{ kx − yk | y ∈ T } .

J. Delgado - K. Frensel 59
Análise

Observação 12.3.
• x ∈ T =⇒ d(x, T ) = 0 ;

• T1 ⊂ T2 =⇒ d(x, T2 ) ≤ d(x, T1 ) ;

• A distância d(x, T ) é caracterizada pelas propriedades:

(1) d(x, T ) ≤ kx − yk para todo y ∈ T ;

(2) Dado ε > 0, existe y ∈ T tal que kx − yk < d(x, T ) + ε.

Observação 12.4.
• d(x, T ) = 0 ⇐⇒ ∀ ε > 0 , ∃ y ∈ T tal que kx − yk < ε ⇐⇒ ∀ ε > 0 , ∃y ∈ T tal que
y ∈ B(x, ε) ⇐⇒ x ∈ T .

• Em particular, se T ⊂ Rn é fechado, temos que d(x, T ) = 0 ⇐⇒ x ∈ T .

Observação 12.5. Como ∂T = T ∩ (Rn − T ), x ∈ ∂T ⇐⇒ d(x, T ) = d(x, Rn − T ) = 0.

Teorema 12.1. d(S, T ) = d(S, T ).

Prova.
Como S ⊂ S e T ⊂ T , temos que d(S, T ) ≤ d(S, T ).

Sejam x ∈ S e y ∈ T . Então existem sequências (xk ) de pontos de S e (yk ) de pontos de T tais


que lim xk = x e lim yk = y.

Como kxk − yk k −→ kx − yk e d(S, T ) ≤ kxk − yk k para todo k ∈ N, temos que d(S, T ) ≤ kx − yk.

Logo d(S, T ) é uma cota inferior do conjunto { kx−yk | x ∈ S e y ∈ T } e, portanto d(S, T ) ≤ d(S, T ).

Assim, d(S, T ) = d(S, T ). 

Corolário 12.1. d(x, T ) = d(x, T ) .

Teorema 12.2. Se K ⊂ Rn é compacto e F ⊂ Rn é fechado, então existem x0 ∈ K e y0 ∈ F


tais que d(K, F) = kx0 − y0 k.

Em particular, d(K, F) = 0 se, e só se, K ∩ F 6= ∅.

Prova.
Como d(K, F) = inf{ kx − yk | x ∈ K e y ∈ F } existem sequências (xk ) de pontos de K e (yk )
de pontos de F tais que d(K, F) = lim kxk − yk k.
k→∞

60 Instituto de Matemática UFF


Distância entre dois conjuntos; diâmetro de um conjunto

Como as sequências (xk ) e (kxk − yk k) são limitadas (pois os seus termos xk pertencerem ao
compacto K e (kxk − yk k) é uma sequência convergente) resulta da desigualdade
kyk k ≤ kyk − xk k + kxk k ,

que a sequência (yk ) também é limitada. Então existe N 0 ⊂ N infinito tal que lim0 xk = x0 e
k∈N
lim0 yk = y0 .
k∈N

Sendo K e F fechados, temos que x0 ∈ K e y0 ∈ F.

Assim, d(K, F) = lim0 kxk − yk k = kx0 − y0 k . 


k∈N

Corolário 12.2. Se x ∈ Rn e F ⊂ Rn é fechado, então existe y0 ∈ F tal que d(x, F) = kx − y0 k.

Corolário 12.3. Sejam K ⊂ Rn compacto e U ⊂ Rn aberto. Se K ⊂ U, existe δ > 0 tal que


x ∈ K =⇒ B(x, δ) ⊂ U, para todo x ∈ K. Em particular,
x ∈ K , y ∈ Rn , kx − yk < δ =⇒ [x, y] ⊂ U .

Prova.
Seja F = Rn − U. Como F é fechado e F ∩ K = ∅, temos, pelo Teorema 12.2, que d(F, K) = δ > 0.

Sejam x ∈ K e y ∈ B(x, δ). Então kx − yk < δ, e, portanto, y 6∈ F, ou seja, y ∈ U.

Logo B(x, δ) ⊂ U para todo x ∈ K.

Em particular, se x ∈ K e y ∈ Rn são tais que kx − yk < δ, então, para todo t ∈ [0, 1], temos:
k(1 − t)x + ty − xk = kt(x − y)k ≤ kx − yk < δ ,

ou seja, (1 − t)x + ty ∈ B(x, δ) ⊂ U para todo t ∈ [0, 1]. Logo [x, y] ⊂ U. 

Corolário 12.4. Sejam S, T ⊂ Rn , com S limitado. Então, existem x0 ∈ S e y0 ∈ T tais que


d(S, T ) = kx0 − y0 k.

Prova.
Como S é compacto, T é fechado e d(S, T ) = d(S, T ), temos, pelo teorema 12.2, que existem
x0 ∈ S e y0 ∈ T tais que d(S, T ) = d(S, T ) = kx0 − y0 k. 

Observação 12.6.
• Em geral, dados um conjunto fechado F ⊂ Rn e um ponto x ∈ Rn , podem existir muitos
pontos de F que estão a uma distância mı́nima do ponto x. Por exemplo, se F = S[a, r], então
d(a, F) = ka − xk para todo x ∈ F.

• Mas, quando F é fechado e convexo e a norma de Rn provém de um produto interno, existe,


para cada x ∈ Rn , um único y0 ∈ F tal que d(x, F) = kx − y0 k.

J. Delgado - K. Frensel 61
Análise

x0 + y0
De fato, sejam x0 , y0 ∈ F tais que d(x, F) = kx − x0 k = kx − y0 k. Então, tomando z0 = ,
2
temos que z0 ∈ F, pois F é convexo,
e, portanto,
x x x y kx − x0 k kx − y0 k
d(x, F) ≤ kx − z0 k = + − 0 − 0 ≤ + = d(x, F) ,
2 2 2 2 2 2
ou seja,
kx − x0 k kx − y0 k
d(x, F) = kx − z0 k = + .
2 2
Como a norma considerada em Rn provém de um produto interno, temos que x − x0 e x − y0
são LD e existe λ ≥ 0 tal que x − x0 = λ(x − y0 ) . Mas, como kx − x0 k = kx − y0 k , temos que
λ = 1 e, portanto, x0 = y0

Observação 12.7. Dados dois conjuntos fechados ilimitados F, G ⊂ Rn , podemos ter


d(F, G) = 0 com F ∩ G = ∅.

De fato, basta tomar F = {(x, 0) | x ∈ R} e G= {(x,


1/x) | x > 0}, pois, como
1 1
(n, 0) − n, = −→ 0 ,

n n
temos que d(F, G) = 0, com F ∩ G = ∅, F e G fechados.

Teorema 12.3. |d(x, T ) − d(y, T )| ≤ kx − yk.

Prova.
Pelo corolário 12.2, existem x0 , y0 ∈ T tais que
d(x, T ) = d(x, T ) = kx − x0 k e d(y, T ) = d(y, T ) = ky − y0 k.

Então,

• d(x, T ) = kx − x0 k ≤ kx − y0 k ≤ kx − yk + ky − y0 k = kx − yk + d(y, T ),

ou seja, d(x, T ) − d(y, T ) ≤ kx − yk;

• d(y, T ) = ky − y0 k ≤ ky − x0 k ≤ ky − xk + kx − x0 k = ky − xk + d(x, T ),

ou seja, d(x, T ) − d(y, T ) ≥ −kx − yk.

Logo −kx − yk ≤ d(x, T ) − d(y, T ) ≤ kx − yk (⇐⇒ |d(x, T ) − d(y, T )| ≤ kx − yk). 

Corolário 12.5. A função f : Rn −→ R definida por f(x) = d(x, T ) é uma contração fraca. Em
particular, f é uniformemente contı́nua.

Observação 12.8. Sejam F, G ⊂ Rn dois subconjuntos fechados, disjuntos e não-vazios. A


função de Urysohn do par (F, G) é a função f : Rn −→ R definida por:
d(x, F)
f(x) = .
d(x, F) + d(x, G)

62 Instituto de Matemática UFF


Distância entre dois conjuntos; diâmetro de um conjunto

Observe que f está bem definida, pois F ∩ G = ∅ =⇒ d(x, F) + d(x, G) > 0 para todo x ∈ Rn ,
uma vez que d(x, F) + d(x, G) = 0 ⇐⇒ d(x, G) = d(x, F) = 0 ⇐⇒ x ∈ F ∩ G.

Além disso: f é contı́nua; f(x) = 0 ⇐⇒ d(x, F) = 0 ⇐⇒ x ∈ F; f(x) = 1 ⇐⇒ d(x, G) = 0 ⇐⇒ x ∈


G.

Logo, A = f−1 ((−∞, 1/2)) e B = f−1 ((1/2, +∞)) são dois abertos disjuntos tais que F ⊂ A e
G ⊂ B.

Provamos, assim, que dados dois fechados disjuntos F, G ⊂ Rn , existem sempre dois abertos
disjuntos A, B ⊂ Rn tais que F ⊂ A e G ⊂ B.

Definição 12.2. Seja T ⊂ Rn um conjunto limitado não-vazio. O diâmetro de T é o número


real dado por:
diam(T ) = sup{ kx − yk | x, y ∈ T }

• O diâmetro de um subconjunto T ⊂ Rn é caracterizado pelas seguintes propriedades:

(1) diam(T ) ≥ kx − yk para quaisquer x, y ∈ T .

(2) Dado ε > 0, existem x, y ∈ T tais que kx − yk > diam(T ) − ε.

Observação 12.9. Existem x0 , y0 ∈ T tais que diam(T ) = kx0 − y0 k.


De fato, como diam(T ) = sup{ kx − yk | x, y ∈ T }, existem sequências (xk ), (yk ) de pontos de T
tais que lim kxk − yk k = diam T .
k→∞

Sendo T limitado, existe N 0 ⊂ N infinito tal que as subsequências (xk )k∈N 0 e (yk )k∈N 0 convergem.
Então lim0 xk = x0 ∈ T , lim0 yk = y0 ∈ T e diam(T ) = lim0 kxk − yk k = kx0 − y0 k.
k∈N k∈N k∈N

• Quando T é compacto, temos que x0 , y0 ∈ T , ou seja, o diâmetro de um conjunto compacto é


a maior distância entre dois dos seus pontos.

Observação 12.10. S ⊂ T =⇒ diam(S) ≤ diam(T ).

Observação 12.11. O diâmetro da bola fechada B[a, r] é igual a 2r.


De fato, x, y ∈ B[a, r] =⇒ kx − ak ≤ r e ky − ak ≤ r =⇒ kx − yk ≤ kx − ak + ka − yk ≤ 2r.
Logo diam(B[a, r]) ≤ 2r.

Seja u ∈ Rn com norma kuk = r. Então a + u e a − u pertencem a B[a, r] e


k(a + u) − (a − u)k = k2 uk = 2 kuk = 2r.

Logo diam(B[a, r]) ≥ 2r. Assim, diam(B[a, r]) = 2r.

J. Delgado - K. Frensel 63
Análise

Observação 12.12. T ⊂ B[a, r] =⇒ diam(T ) ≤ 2r.

Observação 12.13. Se diam(T ) = r e a ∈ T , então kx − ak ≤ r para todo x ∈ T . Logo


T ⊂ B[a, r].

Teorema 12.4. Seja T ⊂ Rn limitado e não-vazio. Então diam(T ) = diam(T ).

Prova.
Como T ⊂ T , temos que diam(T ) ≤ diam(T ).

Sejam x0 , y0 ∈ T tais que diam(T ) = kx0 − y0 k.

Então existem sequências (xk ) e (yk ) de pontos de T tais que lim xk = x0 e lim yk = y0 .

Logo diam(T ) ≥ kxk − yk k para todo k ∈ N e, portanto,


diam(T ) ≥ lim kxk − yk k = kx0 − y0 k = diam(T ) ,

ou seja, diam(T ) ≥ diam(T ). Assim, diam(T ) = diam(T ). 

Teorema 12.5. Sejam K ⊂ Rm compacto, U ⊂ Rn aberto e f : K −→ U uma aplicação


contı́nua. Então existem ε, δ > 0 tais que a imagem f(T ) de qualquer subconjunto T ⊂ K com
diam(T ) < δ está contida em alguma bola aberta B ⊂ U de raio ε.

Prova.
Como f(K) é um conjunto compacto contido no aberto U, existe, pelo corolário 12.3, ε > 0
tal que B(f(x), ε) ⊂ U para todo x ∈ K.

E, pela continuidade uniforme de f, existe δ > 0 tal que x, y ∈ K, kx−yk < δ =⇒ kf(x)−f(y)k < ε.

Seja T ⊂ K um subconjunto com diam(T ) < δ e tome x0 ∈ T .

Então x ∈ T =⇒ kx − x0 k < δ =⇒ kf(x) − f(x0 )k < ε =⇒ f(x) ∈ B(f(x0 ), ε) = B .

Logo f(T ) ⊂ B ⊂ U. 

Definição 12.3. Dizemos que um número δ > 0 é número de Lebesgue de uma cobertura
[
X⊂ Cλ quando todo subconjunto de X com diâmetro < δ está contido em algum Cλ .
λ∈L

Observação 12.14. Uma cobertura, mesmo aberta e finita, pode não ter número de Lebes-
gue algum.

Por exemplo, R − {0} = (−∞, 0) ∪ (0, +∞) é uma cobertura aberta e finita de R − {0}. Dado δ > 0,
o conjunto {−δ/4, δ/4} tem diâmetro < δ, mas não está contido em (0, +∞) nem em (−∞, 0).
Logo não existe número de Lebesgue para tal cobertura.

64 Instituto de Matemática UFF


Conexidade

[
Teorema 12.6. Se K ⊂ Rn é compacto, então toda cobertura aberta K ⊂ Aλ possui um
λ∈L
número de Lebesgue.

Prova.
1
Suponhamos, por absurdo, que para todo k ∈ N, exista um subconjunto Sk ⊂ K com diam Sk <
k
que não está contido em algum Aλ .

Para cada k ∈ N, tome xk ∈ Sk . Como xk ∈ K para todo k ∈ N, existe N 0 ⊂ N infinito tal que a
subsequência (xk )k∈N 0 converge para um ponto a ∈ K.

Logo existe λ0 ∈ L tal que a ∈ Aλ0 . Seja δ > 0 tal que B(a, δ) ⊂ Aλ0 e seja k0 ∈ N 0 tal que
1 δ δ
< e kxk0 − ak < .
k0 2 2
1 δ
Então y ∈ Sk0 =⇒ ky − ak ≤ ky − xk0 k + kxk0 − ak < + < δ =⇒ y ∈ B(a, δ) =⇒ y ∈ Aλ0 .
k0 2
Assim, Sk0 ⊂ Aλ0 , o que é uma contradição. 

13 Conexidade

Definição 13.1. Seja X ⊂ Rn . Uma cisão de X é uma decomposição X = A ∪ B, onde A e B


são abertos em X e A ∩ B = ∅.

Observação 13.1. Todo subconjunto X ⊂ Rn possui pelo menos a cisão trivial X = X ∪ ∅.

Exemplo 13.1. R − {0} = (−∞, 0) ∪ (0, +∞) é uma cisão não-trivial de R − {0}. 

Definição 13.2. Dizemos que um conjunto X ⊂ Rn é conexo quando só admite a cisão trivial.
Ou seja, se X é conexo, X = A ∪ B, com A e B abertos disjuntos em X, então A = ∅ ou B = ∅.

Exemplo 13.2. ∅ e {x} são conjuntos conexos. 

Exemplo 13.3. Todo intervalo aberto da reta é conexo (ver Teorema 13.2). Em particular, R
é conexo. 

Definição 13.3. Dizemos que X é desconexo, quando existir uma cisão não-trivial X = A ∪ B.

Exemplo 13.4. R − {0} é desconexo. 

J. Delgado - K. Frensel 65
Análise

Observação 13.2. Todo subconjunto discreto X ⊂ Rn com mais de um elemento, é desco-


nexo.

De fato, se x ∈ X, então {x} é aberto em X, pois existe δ > 0 tal que B(x, δ) ∩ X = {x}. Assim, todo
subconjunto de X é aberto em X, pois é reunião de seus pontos. Então, se A ⊂ X e ∅ 6= A 6= X,
X = A ∪ (X − B) é uma cisão não-trivial de X.

Observação 13.3. O conjunto Q dos números racionais não é discreto, mas X ⊂ Q é conexo
se, e só se, X possui um único elemento.

De fato, seja X ⊂ Q tal que a, b ∈ X, a < b, e seja ξ um número irracional entre a e b. Então,
X = ( (−∞, ξ) ∩ X ) ∪ ( (ξ, +∞) ∩ X )

é uma cisão não-trivial de X.

Observação 13.4. Se X = A ∪ B é uma cisão de X, então B = X − A e A = X − B, e, portanto,


A e B são, também, fechados em X.

Ou seja, se X = A ∪ B é uma cisão de X, então A e B são abertos e fechados em X. Assim:

• X = A ∪ B é uma cisão de X ⇐⇒ A e B são disjuntos e fechados em X.

• X é conexo ⇐⇒ ∅ e X são os únicos subconjuntos de X que são abertos e fechados em X,


pois se A é aberto e fechado em X e ∅ 6= A 6= X, então X = A ∪ (X − A) é uma cisão não-trivial.

Teorema 13.1. Seja f : X ⊂ Rm −→ Rn uma aplicação contı́nua. Se X é conexo, então f(X) é


conexo.

Prova.
Se A ⊂ f(X) é aberto e fechado em f(X), então f−1 (A) é aberto e fechado em X. Pela co-
nexidade de X temos que f−1 (A) = ∅ ou f−1 (A) = X, e, portanto, A = ∅ ou A = f(X). 

Corolário 13.1. Todo subconjunto homeomorfo a um conjunto conexo é também conexo.

Teorema 13.2. X ⊂ R é conexo se, e só se, X é um intervalo.

Prova.
(=⇒) Seja X ⊂ R conexo e sejam a, b ∈ X, a < b.

Suponhamos, por absurdo, que existe c ∈ R, a < c < b, tal que c 6∈ X.

Então X = ( (−∞, c) ∩ X ) ∪ ( (c, +∞) ∩ X ) é uma cisão não-trivial, pois a ∈ (−∞, c) ∩ X e


b ∈ (c, +∞) ∩ X, o que é uma contradição.

66 Instituto de Matemática UFF


Conexidade

(⇐=) Seja I ⊂ R um intervalo.Suponhamos, por absurdo, que existe uma cisão não-trivial
I = A ∪ B de I.

Sejam a ∈ A, b ∈ B, a < b. Então [a, b] ⊂ I e [a, b] = (A ∩ [a, b]) ∪ (B ∩ [a, b]) é uma cisão
não-trivial de [a, b].

Como K = A ∩ [a, b] e L = B ∩ [a, b] são fechados no compacto [a, b], temos que K e L são
fechados em R e, portanto, compactos, pois K, L ⊂ [a, b].

Logo existem x0 ∈ K e y0 ∈ L tais que d(K, L) = |x0 − y0 |.

Seja c o ponto médio do intervalo de extremos x0 e y0 . Então c ∈ [a, b].

Mas, como |x0 − c| < |x0 − y0 | e |y0 − c| < |x0 − y0 |, temos que c 6∈ K e c 6∈ L, e, portanto, c 6∈ [a, b],
uma contradição.

Assim, I só possui a cisão trivial sendo, portanto, conexo. 

Corolário 13.2. Se X ⊂ Rm é conexo e f : X −→ R é uma aplicação contı́nua, então f(X) é


um intervalo.

• Uma reformulação do corolário acima é o seguinte teorema.

Teorema 13.3. (do valor intermediário)


Seja X ⊂ Rn conexo e f : X −→ R uma aplicação contı́nua. Se existem a, b ∈ X e d ∈ R tais que
f(a) < d < f(b) (ou f(b) < d < f(a)), então existe c ∈ X tal que f(c) = d.

Exemplo 13.5. O cı́rculo S1 = {(x, y) ∈ R2 | x2 + y2 = 1} é conexo, pois f(R) = S1 , onde


f : R −→ R2 é a aplicação contı́nua f(t) = (cos t, sen t), definida no conjunto conexo R. 

Aplicação: Dada f : S1 −→ R contı́nua, existe u ∈ S1 tal que f(u) = f(−u).


De fato, seja g : S1 −→ R a função contı́nua definida no conexo S1 por g(z) = f(z) − f(−z).

Como g(z) = −g(−z), temos, pelo Teorema do Valor Intermediário, que existe u ∈ S1 tal que
g(u) = 0, ou seja, f(u) = f(−u).

Em particular, nenhuma função contı́nua f : S1 −→ R é injetiva e, portanto, S1 não é homeomorfo


a um subconjunto da reta.

Teorema 13.4. (da alfândega)


Seja X ⊂ Rn um conjunto arbitrário e seja C ⊂ Rn conexo. Se C ∩ X 6= ∅ e C ∩ (R − X) 6= ∅,
então C contém algum ponto da fronteira de X.

J. Delgado - K. Frensel 67
Análise

Prova.
Suponhamos, por absurdo, que C ∩ ∂X = ∅. Então X ∩ C é aberto em C, pois X ∩ C = (int X) ∩ C,
e (Rn − X) ∩ C é aberto em C, pois (Rn − X) ∩ C = int(Rn − X) ∩ C .

Como C é conexo e C = (C ∩ X) ∪ (C ∩ (Rn − X)) é uma cisão de C, temos que C ∩ X = ∅ ou


C ∩ (Rn − X) = ∅, ou seja, C ⊂ Rn − X ou C ⊂ X, uma contradição. 

Observação 13.5. Se X ⊂ Y ⊂ Rn e A ⊂ Y é aberto em Y, então A ∩ X é aberto em X.


De fato, como A ⊂ Y é aberto em Y, existe A0 ⊂ Rn aberto em Rn tal que A = A0 ∩ Y.

Logo A ∩ X = A0 ∩ Y ∩ X = A0 ∩ X, e, portanto, A ∩ X é aberto em X.


[
Teorema 13.5. A reunião C = Cλ de uma famı́lia de conjuntos conexos Cλ , λ ∈ L, com um
λ∈L
ponto em comum, é um conjunto conexo.

Prova.
Seja a ∈ Rn tal que a ∈ Cλ para todo λ ∈ L e seja C = A ∪ B uma cisão de C. Sem perda
de generalidade podemos supor a ∈ A.

Como A e B são abertos em C e Cλ ⊂ C temos, pela observação 13.5, que A ∩ Cλ e B ∩ Cλ são


abertos em Cλ para todo λ ∈ L.

Logo Cλ = (A ∩ Cλ ) ∪ (B ∩ Cλ ) é uma cisão de Cλ .

Como Cλ é conexo e A ∩ Cλ 6= ∅, temos que B ∩ Cλ = ∅ para todo λ ∈ L.


!
[ [
Assim, B = B ∩ C = B ∩ Cλ = (B ∩ Cλ ) = ∅.
λ∈L λ∈L

Provamos, então, que C só possui a cisão trivial. Portanto, C é conexo. 

Corolário 13.3. Um conjunto X ⊂ Rn é conexo se, e só se, para quaisquer a, b ∈ X, existe
um conjunto conexo Ca b ⊂ X tal que a, b ∈ Ca b .

Prova.
(=⇒) É evidente.

(⇐=) Seja a ∈ X fixo. Então, para todo x ∈ X existe um conjunto conexo Ca x ⊂ X tal que
[
a, x ∈ Ca x . Logo X = Ca x .
x∈X

Como os conjuntos Ca x são conexos e têm em comum o ponto a, temos, pelo Teorema 13.5,
que C é conexo. 

68 Instituto de Matemática UFF


Conexidade

Corolário 13.4. Dados X ⊂ Rm e Y ⊂ Rn , o produto cartesiano X × Y é conexo se, e só se, X


e Y são conexos.

Prova.
(=⇒) Se X × Y é conexo, temos que X e Y são conexos, pois as projeções π1 : X × Y −→ X e
π2 : X × Y −→ Y são contı́nuas, π1 (X × Y) = X e π2 (X × Y) = Y.

(⇐=) Sejam a = (a1 , a2 ), b = (b1 , b2 ) ∈ X × Y arbitrários e Ca b = ({a1 } × Y) ∪ (X × {b2 }).


Então a, b ∈ Ca b . Além disso, como {a1 } × Y é homeomorfo ao conjunto conexo Y, X × {b2 } é
homeomorfo ao conjunto conexo X e esses conjuntos tem o ponto (a1 , b2 ) em comum, temos,
pelo teorema 13.5, que Ca b é conexo. Logo, pelo corolário 13.3, X × Y é conexo. 

Observação 13.6. O mesmo vale para um produto cartesiano X1 × . . . × Xk de um número


finito de fatores.

Em particular, Rn = R × . . . × R é conexo. Portanto, ∅ e Rn são os únicos subconjuntos de Rn


que são simultaneamente abertos e fechados em Rn .

Observação 13.7. Todo conjunto X ⊂ Rn convexo é conexo.


De fato, seja x0 ∈ X fixo. Então, para todo x ∈ X, [x0 , x] é conexo, pois é a imagem da aplicação
contı́nua αx : [0, 1] −→ X, αx (t) = (1 − t)x0 + tx, definida no conjunto conexo [0, 1] ⊂ R.
[
Como X = [x0 , x] e os conexos [x0 , x], x ∈ X, possuem em comum o ponto x0 , temos, pelo
x∈X
teorema 13.5, que X é conexo.

Em particular, toda bola aberta e toda bola fechada em Rn são conjuntos conexos.

Observação 13.8. A interseção de conjuntos conexos pode não ser um conjunto conexo.
Por exemplo, sejam G1 = {(x, x2 ) | x ∈ R} e G2 = {(x, x) | x ∈ R}. Como G1 é o gráfico da função
contı́nua f1 : R −→ R, f1 (x) = x2 , G2 é o gráfico da função contı́nua f2 : R −→ R, f2 (x) = x, e R
é conexo, temos que G1 e G2 são conexos, pois G1 e G2 são homeomorfos a R.

Mas, G1 ∩ G2 = {(0, 0), (1, 1)}. Logo G1 ∩ G2 é desconexo.



\
Teorema 13.6. A interseção K = Ki de uma sequência decrescente K1 ⊃ K2 ⊃ . . . ⊃ Ki ⊃
i=1
. . . de conjuntos compactos conexos em Rn é um conjunto compacto e conexo.

Prova.
Seja K = A ∪ B uma cisão. Como A e B são fechados em K e K é fechado em Rn , temos que A
e B são fechados em Rn , e, portanto, compactos disjuntos, pois A ⊂ K, B ⊂ K e A ∩ B = ∅.

J. Delgado - K. Frensel 69
Análise

Pela Observação 12.8, existem U e V abertos em Rn tais que A ⊂ U, B ⊂ V e U ∩ V = ∅.


\
Logo K = Ki = A ∪ B ⊂ U ∪ V e, pelo Corolário 11.6, existe i0 ∈ N tal que Ki0 ⊂ U ∪ V.

Portanto, Ki0 = (Ki0 ∩ U) ∪ (Ki0 ∩ V) é uma cisão de Ki0 . Como Ki0 é conexo, temos que
Ki0 ∩ U = ∅ ou Ki0 ∩ V = ∅. Logo A = ∅ ou B = ∅, pois A ⊂ Ki0 ∩ U e B ⊂ Ki0 ∩ V. Ou seja, K
só possui a cisão trivial e, portanto, K é conexo. 

Observação 13.9. O mesmo não vale para uma sequência decrescente F1 ⊃ F2 ⊃ . . . ⊃ Fi ⊃


. . . de conjuntos fechados conexos.

Por exemplo, os conjuntos Fi = R × {0} ∪ R × {1} ∪ [i, +∞) × [0, 1], i = 1, 2, . . ., formam uma
sequência decrescente de conjuntos fechados conexos, pois R × {0}, R × {1} e [i, +∞) × [0, 1]
são produtos cartesianos de dois conjuntos conexos da reta, R × {0} e [i, +∞) × [0, 1] possuem
um ponto em comum e R × {0} ∪ [i, +∞) × [0, 1] e R × {1} possuem um ponto em comum.

Fig. 6: Conjuntos Fi
\
Mas, F = Fi = R × {0} ∪ R × {1} não é conexo, pois F = R × {0} ∪ R × {1} é uma cisão não trivial
de F, uma vez que R × {0} e R × {1} são fechados disjuntos em R2 e, portanto, em F.

Teorema 13.7. Sejam X ⊂ Y ⊂ X em Rn . Se X é conexo, então Y é conexo.

Prova.
Seja A ⊂ Y aberto não-vazio em Y e seja a ∈ A.

Então existe δ > 0 tal que B(a, δ) ∩ Y ⊂ A. Como Y ⊂ X, temos que a ∈ X e, portanto,
B(a, δ) ∩ X 6= ∅. Logo A ∩ X 6= ∅.

Seja Y = A∪B uma cisão. Como A e B são abertos em Y e X ⊂ Y, temos que X = (X∩A)∪(X∩B)
é uma cisão de X. Logo X ∩ A = ∅ ou X ∩ B = ∅. Assim, pelo provado acima, A = ∅ ou B = ∅,
ou seja, Y só possui a cisão trivial e, portanto, é conexo. 

Corolário 13.5. O fecho de um conjunto conexo é conexo.

Exemplo 13.6. A esfera Sn = {x ∈ Rn+1 | hx, xi = 1} é conexa para todo n ≥ 1.

70 Instituto de Matemática UFF


Conexidade

Primeiro observe que todo ponto x ∈ Sn é ponto de acumulação de Sn .

De fato, existe i ∈ {1, . . . , n + 1}, (n + 1 ≥ 2) tal que x e ei não são LD.


ei ei
x+ x+
Portanto, k 6= x para todo k ∈ N, e k −→ x = x.
ei ei kxk
x + x +

k k
Logo, como Sn é fechado, temos que (Sn ) 0 = Sn .

Além disso, como Sn −{pN } (onde pN = (0, 0, . . . , 0, 1) é o pólo norte) é homeomorfo a Rn , através
da projeção estereográfica, temos que Sn − {pN } é um conjunto conexo. Sendo Sn − {pN } = Sn ,
pois Sn − {pN } ⊂ Sn − {pN } ⊂ Sn e pN é ponto de acumulação de Sn , temos, pelo corolário 13.5,
que a esfera Sn é conexa.

Observe que a esfera Snk k = {x ∈ Rn+1 | kxk = 1}, com respeito a qualquer norma k k de Rn+1 , é
x
também conexa, pois f : Sn −→ Snk k , dada por f(x) = é um homeomorfismo, uma vez que
kxk
y
f−1 : Snk k −→ Sn , dada por f−1 (y) = , é contı́nua, onde k k0 é a norma euclidiana. 
kyk0

1
Exemplo 13.7. Seja a função contı́nua f : (0, 1] −→ R dada por f(x) = sen . Como o gráfico

 1
 x
de f, G(f) = x, sen x ∈ (0, 1] , é homeomorfo ao intervalo (0, 1], G(f) é conexo.
x

Temos que G(f) = G(f) ∪ I, onde I = {(0, t) |t ∈ [−1, 1]}.

 ⊂ G(f) 
De fato, G(f) ∪ I, pois se (x0 , y0 ) ∈ G(f), existe uma
1
sequência xk , sen de pontos de G(f) que converge a (x0 , y0 ).
xk
Logo x0 ∈ [0, 1] e y0 ∈ [−1, 1]. Se x0 ∈ (0, 1],temos que
1 1 1
sen −→ sen , ou seja (x0 , y0 ) = x0 , sen ∈ G(f) e,
xk x0 x0
se x0 = 0, (x0 , y0 ) ∈ I.

Seja, agora, y0 ∈ [−1, 1]. Então existe ξ0 ∈ [0, 2π) tal que
sen ξ0 = y0 .
 
1
Logo xk = é uma sequência em (0, 1] tal que
ξ0 + 2πk 
1
xk , sen −→ (0, y0 ).
xk Fig. 7: G(f) se acumulando num segmento

Portanto, (0, y0 ) ∈ G(f). Assim, G(f) ∪ I ⊂ G(f).

Como G(f) é conexo, temos que G(f) é conexo e, também, para todo T ⊂ I, G(f) ∪ T é conexo.
Em particular, G(f) ∪ {(0, 0)} é conexo. 

J. Delgado - K. Frensel 71
Análise

Este exemplo destoa da intuição, que nos sugere um conjunto conexo como aquele for-
mado por ”um só pedaço”. Daremos, por isso, uma noção mais ampla de conexidade.

Definição 13.4. Um caminho em X ⊂ Rn é uma aplicação contı́nua f : I −→ X definida no


intervalo I.

Exemplo 13.8. Dados x, y ∈ Rn , o caminho f : [0, 1] −→ Rn , dado por f(t) = (1 − t)x + ty, é
chamado o caminho retilı́neo que liga x a y. Às vezes, vamos nos referir a ele como o caminho
[x, y]. 

Definição 13.5. Dizemos que a, b ∈ X podem ser ligados por um caminho em X quando
existe um caminho f : I −→ X tal que a, b ∈ f(I).

Exemplo 13.9. Se X ⊂ Rn é convexo, dois pontos quaisquer a, b ∈ X podem ser ligados pelo
caminho retilı́neo [a, b]. 

Observação 13.10. Se a, b ∈ X podem ser ligados por um caminho f : I −→ X, então existe


um caminho g : [0, 1] −→ X tal que g(0) = a e g(1) = b. Basta tomar g(t) = f((1 − t)α + tβ),
onde f(α) = a e f(β) = b.

Definição 13.6. Sejam f, g : [0, 1] −→ X caminhos em X com f(1) = g(0). Definimos o


caminho justaposto h = f ∨ g : [0, 1] −→ X, pondo
 h 1i
f(2t) se t ∈ 0,
h(t) = h 2i
g(2t − 1) se t ∈ 1 , 1 .
2
1
Como f(2t) e g(2t − 1) definem o mesmo valor para h em t = e h|[0, 1 ] , h|[ 1 ,1] são contı́nuas,
2 2 2

então h é contı́nua.

Fig. 8: Caminho h obtido pela justaposição de f com g

Observação 13.11. Sejam a, b, c ∈ X ⊂ Rn . Se a e b podem ser ligados por um caminho


f : [0, 1] −→ X, f(0) = a, f(1) = b, e os pontos b e c podem ser ligados por um caminho
g : [0, 1] −→ X, g(0) = b, g(1) = c, então a e c podem ser ligados pelo caminho f∨g : [0, 1] −→ R.

72 Instituto de Matemática UFF


Conexidade

Definição 13.7. Dizemos que um conjunto X ⊂ Rn é conexo por caminhos quando dois pon-
tos quaisquer a, b ∈ X podem ser ligados por um caminho em X.

Observação 13.12. Todo conjunto convexo X ⊂ Rn é conexo por caminhos. Em particular,


toda bola aberta e toda bola fechada em Rn são conjuntos conexos por caminhos.

Observação 13.13. A esfera Sn = {x ∈ Rn+1 | kxk = 1} é conexa por caminhos.


De fato, dados a, b ∈ Sn pontos não-antı́podas, isto é, a 6= −b, então α(t) = (1 − t)a + t(b) 6= 0
para todo t ∈ [0, 1], pois se existisse t0 ∈ (0, 1) tal que α(t0 ) = 0, terı́amos (1 − t0 )a = −t0 b e,
1
portanto, (1 − t0 ) = (1 − t0 ) kak = t0 = t0 kbk, ou seja, t0 = e a = −b, uma contradição.
2
α(t)
Logo f : [0, 1] −→ Sn dada por f(t) = é um caminho em Sn que liga f(0) = a a f(1) = b.
kα(t)k
Agora, se a = −b, a, b ∈ Sn , tomamos um ponto c ∈ Sn − {a, −a}, ligamos a com c e c com
b = −a pelo processo acima. O caminho justaposto ligará, então, o ponto a com seu antı́poda
b = −a.

Observação 13.14. Se X ⊂ Rn é conexo por caminhos, então X é conexo.


De fato, sejam a, b ∈ X. Então existe um caminho f : [0, 1] −→ X tal que f(0) = a e f(1) = b.
Como f([0, 1]) é conexo e a, b ∈ f([0, 1]), provamos que dados a, b ∈ X, existe um conjunto
conexo Ca b = f([0, 1]) ⊂ X tal que a, b ∈ Ca b . Logo, pelo corolário 13.3, X é conexo.

• A recı́proca é falsa, pois G(f) ∪ {(0, 0)},



onde
1

G(f) = x, sen x ∈ (0, 1]
x
1
é o gráfico da função f(x) = sen , é um conjunto conexo que não é conexo por caminhos.
x
De fato, seja λ : [0, 1] −→ G(f) ∪ {(0, 0)} um caminho com λ(0) = (0, 0). Seja α(t) = π1 (λ(t)), ou
seja, λ(t) = (α(t), f(α(t))), onde estamos fazendo f(0) = 0.

Seja A = {t ∈ [0, 1] | α(t) = 0}. Então A é fechado e não-vazio.

Afirmação: A é aberto em [0, 1].

Seja t0 ∈ A, ou seja, t0 ∈ [0, 1] e α(t0 ) = 0. Como λ é contı́nua em t0 , existe δ > 0 tal que
t ∈ [0, 1] e |t − t0 | < δ =⇒ |λ(t)| = |λ(t) − λ(t0 )| < 1.

Seja J = [0, 1] ∩ (t0 − δ, t0 + δ). Então J é um intervalo que contém t0 .

Além disso, J é aberto em [0, 1].

Logo α(J) é um intervalo que contém 0 = α(t0 ). Se α(J) não é degenerado, existe n ∈ N tal que
1
ξn = ∈ α(J) e, portanto, existe tn ∈ J tal que α(tn ) = ξn .
(2n + 1) π2

J. Delgado - K. Frensel 73
Análise

Então λ(tn ) = (α(tn ) , sen(α(tn ))) = (ξn , ±1).

Assim, |λ(tn )| > 1, uma contradição. Portanto, α(J) = {0}, ou seja, α(t) = 0 para todo t ∈ J.

Como A é não-vazio, aberto e fechado em [0, 1] e [0, 1] é conexo, temos que A = [0, 1], ou seja,
α(t) = 0 para todo t ∈ [0, 1], e, portanto, λ(t) = (0, 0) para todo t ∈ [0, 1].

Então não existe um caminho em G(f) ∪ {(0, 0} que liga (0, 0) a um ponto do gráfico de f.

Definição 13.8. Dizemos que f : [0, 1] −→ X é um caminho poligonal em X quando f é a


justaposição de um número finito de caminhos retilı́neos.

Teorema 13.8. Se A ⊂ Rn é aberto e conexo, então dois pontos quaisquer de A podem ser
ligados por um caminho poligonal contido em A.

Prova.
Seja a ∈ A fixo, e seja U o conjunto formado pelos pontos de A que podem ser ligados ao
ponto a por um caminho poligonal contido em A.

Então U é não-vazio, pois a ∈ U, já que f : [0, 1] −→ A, f(t) = a para todo t ∈ [0, 1], é um
caminho em A que liga o ponto a ao ponto a.

Afirmação: U é aberto.

Seja b ∈ U. Então existe um caminho poligonal que liga o ponto a ao ponto b. Como b ∈ U ⊂ A
e A é aberto, existe δ > 0 tal que B(b, δ) ⊂ A. Dado y ∈ B(b, δ), o caminho retilı́neo que liga b
a y está contido em B(b, δ), pois B(b, δ) é convexo. Logo todo ponto y ∈ B(b, δ) pode ser ligado
ao ponto a por meio de um caminho poligonal em A, ou seja, B(b, δ) ⊂ U.

Afirmação: A − U é aberto.

Seja c ∈ A − U e seja δ > 0 tal que B(c, δ) ⊂ A. Então todo ponto y ∈ B(c, δ) não pode ser
ligado ao ponto a por meio de um caminho poligonal, pois, caso contrário, c poderia ser ligado
ao ponto a, uma vez que o caminho retilı́neo que liga y a c está contido em B(c, δ) e, portanto,
em A. Logo B(c, δ) ⊂ A − U.

Como U é não-vazio, aberto e fechado em A e A é conexo, temos que U = A, ou seja, todo


ponto de A pode ser ligado ao ponto a por meio de um caminho poligonal contido em A. 

Observação 13.15. No enunciado acima, podemos trocar caminhos poligonais por cami-
nhos poligonais formados por segmentos paralelos aos eixos coordenados. Para tanto, basta
verificar que isso é possı́vel para quaisquer dois pontos x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ) per-
tencentes à bola aberta B(a, δ) = (a1 −δ, a1 +δ)×. . .×(an −δ, an +δ) de centro a = (a1 , . . . , an )

74 Instituto de Matemática UFF


Conexidade

e raio δ, na norma do máximo.

De fato, como [xi , yi ] ⊂ (ai − δ, ai + δ) para todo i = 1, . . . n, temos que o caminho formado pela
justaposição dos caminhos retilı́neos
[(x1 , x2 , . . . xn ), (y1 , x2 , . . . , xn )] , [(y1 , x2 , . . . , xn ), (y1 , y2 , x3 , . . . , xn )] ,
. . . , [(y1 , y2 , . . . , yn−1 , xn ), (y1 , y2 , . . . , yn−1 , yn )] ,
é um caminho poligonal em B(a, δ), formado por segmentos paralelos aos eixos coordenados,
que liga o ponto x = (x1 , . . . , xn ) ao ponto y = (y1 , . . . , yn ) .

Corolário 13.6. Um aberto A ⊂ Rn é conexo se, e só se, é conexo por caminhos.

Observação 13.16. O problema central da topologia é determinar se dois conjuntos X e Y


dados são ou não são homeomorfos.

Para afirmar que X e Y são homeomorfos é necessário definir um homeomorfismo entre eles.
Para garantir que X e Y não são homeomorfos, deve-se lançar mão de invariantes topológicos
como a compacidade e a conexidade.

2 y2
2 x
Exemplo 13.10. Sejam C = {(x, y) ∈ R | x +y = 1} um cı́rculo, E = (x, y) ∈ R 2 + 2 = 1
2 2 2

a b
x2 y 2
uma elipse, H = (x, y) ∈ R2 2 − 2 = 1 uma hipérbole e P = {(x, y) ∈ R2 | y = px2 } uma

c d
parábola.

• C e E são homeomorfos e h : C −→ E dada por h(x, y) = (ax, by) é um homeomorfismo entre


eles.

• C e E não são homeomorfos a H nem a P, pois C e E são compactos, enquanto que H e P


não são compactos.

• H e P não são homeomorfos, pois H é desconexo e P é conexo. 

Exemplo 13.11. O intervalo fechado X = [a, b], a < b e a bola fechada Y = B[c, r] ⊂ R2 não
são homeomorfos, apesar de ambos serem compactos e conexos.

De fato, se x ∈ (a, b), então X − {x} = (X ∩ (−∞, x)) ∪ (X ∩ (x, +∞)) é desconexo, mas se
y ∈ B(c, r), B[c, r] − {y} continua sendo conexo, pois se:

• y = c e z0 ∈ S[c, r], então


[
B[c, r] − {c} = (S[c, s] ∪ [zs , z0 ]) ,
s∈(0,r]

s s
 
onde zs = 1 − c+ z0 ∈ S[c, s], é uma reunião de conexos, S[c, s] ∪ [zs , z0 ], s ∈ (0, r], que
r r
possuem em comum o ponto z0

J. Delgado - K. Frensel 75
Análise

Fig. 9: B[c, r] − {c} como reunião de conjuntos conexos com um ponto em comum

r
• y 6= c e y0 = (1 − t0 )c + t0 y, t0 = − , temos que
ky − ck
[
B[c, r] − {y} = ( S[c, s] ∪ [c, y0 ] ) ∪ ( (S[c, s0 ] − {y}) ∪ [c, y0 ] ) ,
s ∈ [0, r]
s 6= s0

onde s0 = ky − ck, é uma reunião de conjuntos conexos que possuem o ponto c em comum.

Fig. 10: B[c, r] − {y} como reunião de conjuntos conexos com um ponto em comum

Logo, se existisse um homeomorfismo f : [a, b] −→ B[c, r], terı́amos que [a, b] − {d}, a < d <
b, e B[c, r] − {f(d)} seriam homeomorfos, uma contradição, já que [a, b] − {d} é desconexo e
B[c, r] − {f(d)} é conexo. 

Observação 13.17. Se tentarmos provar, usando um raciocı́nio análogo ao do exemplo an-


terior, que a bola B[a, r] ⊂ R2 não é homeomorfa à bola B[b, s] ⊂ R3 , não chegarı́amos a nada,
pois as bolas B[a, r] e B[b, s] permanecem conexas ao retirar delas um ponto qualquer.

É verdade que uma bola em Rm só é homeomorfa a uma bola em Rn quando m = n. Mas
a demonstração desse fato requer o uso de invariantes topológicos mais elaborados, que são
estudados na Topologia Algébrica ou na Topologia Diferencial.

Exemplo 13.12. O conjunto X = {(x, y) ∈ R2 | x2 = y2 } (um par de retas que se cortam na


origem) e a parábola Y = {(x, y) ∈ R2 | y = x2 } não são homeomorfos, pois se retirarmos um
ponto a de Y, o conjunto Y − {a} possui dois ”pedaços” conexos, enquanto a retirada da origem

76 Instituto de Matemática UFF


Conexidade

(0, 0) faz com que o conjunto X − {(0, 0)} tenha quatro ”pedaços” conexos. 

Fig. 11: X − {(0, 0)} tem 4 pedaços, enquanto Y − {a} tem apenas 2 pedaços

Na seguinte definição vamos tornar precisa a idéia de dividir um conjunto em ”pedaços”


conexos.

Definição 13.9. Sejam x ∈ X ⊂ Rn . A componente conexa do ponto x no conjunto X é a


reunião Cx de todos os subconjuntos conexos de X que contém o ponto x.

Exemplo 13.13. Se X = Q ⊂ R, então a componente conexa de qualquer ponto x ∈ X é {x},


pois todo subconjunto de Q com mais de um elemento é desconexo. 

Exemplo 13.14. Se X ⊂ Rn é conexo, então Cx = X para todo x ∈ X. 


Exemplo 13.15. Se X = (−∞, 0) ∪ (0, +∞), então a componente conexa de −1 em X é
(−∞, 0) e a componente conexa de 1 em X é (0, +∞), pois qualquer subconjunto de X que
contém pontos de (−∞, 0) e (0, +∞) é desconexo. 

Observação 13.18. Dados x ∈ X ⊂ Rn , a componente conexa Cx é o maior subconjunto


conexo de X que contém o ponto x.

De fato, dado um subconjunto conexo C de X que contém o ponto x, temos que C ⊂ Cx , pois Cx
é a reunião de todos os subconjuntos conexos de X que contém x.

Por outro lado, pelo teorema 13.5, Cx é conexo, pois é uma reunião de conjuntos conexos que
possuem um ponto em comum.

Em particular, nenhum subconjunto conexo de X pode conter Cx propriamente.

Mais ainda, se C ⊂ X é conexo e tem algum ponto em comum com Cx então C ⊂ Cx , pois C ∪ Cx
é um conjunto conexo que contém x e, portanto, C ∪ Cx ⊂ Cx , ou seja, C ⊂ Cx .

Observação 13.19. Sejam x e y dois pontos de X. Então suas componentes conexas Cx e


Cy ou coincidem ou são disjuntas, pois se Cx ∩Cy 6= ∅, então, pela observação anterior, Cy ⊂ Cx
e Cx ⊂ Cy , ou seja, Cx = Cy .

J. Delgado - K. Frensel 77
Análise

Assim, a relação x e y pertencem a um subconjunto conexo de X é uma relação de equivalência


e as classes de equivalência são as componentes conexas dos pontos de X, ou seja, [x] = Cx .

Então x e y pertencem a um subconjunto conexo de X ⇐⇒ Cx = Cy .

Observação 13.20. Toda componente conexa Cx é um conjunto fechado em X.


De fato, como Cx ⊂ Cx ∩ X ⊂ Cx e Cx é conexo, temos, pelo Teorema 13.7, que Cx ∩ X é um
subconjunto conexo de X que contém x.

Então, pela Observação 13.18, Cx = Cx ∩ X e, portanto, Cx é fechado em X.

Observação 13.21. As componentes conexas de um conjunto aberto U ⊂ Rn são subcon-


juntos abertos de Rn .

De fato, sejam x0 ∈ U e y0 ∈ Cx0 .

Então existe δ > 0 tal que B(y0 , δ) ⊂ U. Como B(y0 , δ) ∪ Cx0 é conexo e contém o ponto x0 ,
temos que B(y0 , δ) ∪ Cx0 ⊂ Cx0 , ou seja, B(y0 , δ) ⊂ Cx0 . Logo Cx0 é aberto em Rn .

Observação 13.22. Seja h : X ⊂ Rm −→ Y ⊂ Rn um homeomorfismo. Se Cx é a compo-


nente conexa de x em X, então h(Cx ) é a componente conexa de y = h(x) em Y.

De fato, seja Dy a componente conexa de y em Y. Como, pelo Teorema 13.1, h(Cx ) é conexo
e contém y, temos que h(Cx ) ⊂ Dy . Por outro lado, como h−1 (Dy ) é um conjunto conexo que
contém x, então h−1 (Dy ) ⊂ Cx , ou seja, Dy ⊂ h(Cx ). Logo Dy = h(Cx ).

Assim, o homeomorfismo h : X −→ Y estabelece uma bijeção entre as componentes conexas


de X e as componentes conexas de Y.

14 A norma de uma transformação linear

Fixemos uma norma k k1 em Rm e uma norma k k2 em Rn . Então, dada uma transformação


linear A : Rm −→ Rn , existe c > 0 tal que kAxk2 ≤ ckxk1 para todo x ∈ Rm .

Assim, se x ∈ Rm e kxk1 = 1 =⇒ kAxk2 ≤ c. Ou seja, A transforma a esfera unitária de


Rm num subconjunto limitado de Rn .

• Se A ∈ L(Rm , Rn ) = Rmn , ou seja, se A : Rm −→ Rn é uma transformação linear, então


kAk = sup { kA xk2 | x ∈ Rm ; kxk1 = 1 }

é uma norma em L(Rm , Rn ).

78 Instituto de Matemática UFF


A norma de uma transformação linear

De fato: se A, B ∈ L(Rm , Rn ) e λ ∈ R,
(1) kλ Ak = sup { k(λA)(x)k2 | x ∈ Rm ; kxk1 = 1 } = sup { |λ| kA(x)k2 | x ∈ Rm ; kxk1 = 1 }
= |λ| sup { kA(x)k2 | x ∈ Rm ; kxk1 = 1 } = |λ| kAk .

(2) kA + Bk ≤ kAk + kBk , pois: kA(x)k2 ≤ kAk e kB(x)k2 ≤ kBk ∀ x ∈ Rn ; kxk1 = 1


=⇒ k(A + B)(x)k2 ≤ kA(x)k2 + kB(x)k2 ≤ kAk + kBk ∀ x ∈ Rm ; kxk1 = 1
=⇒ kA + Bk ≤ kAk + kBk .

(3) kAk = 0 ⇐⇒ kA(x)k2 = 0 para todo x ∈ Rm ; kxk1 = 1


⇐⇒ A(x) = 0 para todo x ∈ Rm ; kxk1 = 1
 
x
⇐⇒ A = 0 para todo x ∈ Rm − {0}
kxk1
⇐⇒ A(x) = 0 para todo x ∈ Rm
⇐⇒ A = 0 .
Além disso, a função A 7−→ kAk possui as seguintes propriedades:

(I) kA(x)k2 ≤ kAk kxk1 para todo x ∈ Rm .


 
x
∀ x ∈ Rm − {0} =⇒ kA(x)k2 ≤ kAk kxk1

De fato, A ≤ kAk ∀ x ∈ Rm .
kxk1 2

(II) kABk ≤ kAk kBk, se A ∈ L(Rm , Rn ) e B ∈ L(Rk , Rm ), onde a norma em Rm deve ser
tomada a mesma.

De fato, sejam k k1 , k k2 , k k3 as normas tomadas em Rk , Rm e Rn , respectivamente.

Por (I), kA(y)k3 ≤ kAk kyk2 ∀ y ∈ Rm e kB(x)k2 ≤ kBk kxk1 ∀ x ∈ Rk . Logo,


k(AB)(x)k3 = kA(B(x))k3 ≤ kAk kB(x)k2 ≤ kAk kBk ,

para todo x ∈ Rk ; kxk1 = 1.

Portanto, kABk ≤ kAk kBk.

Observação 14.1. Como duas normas no espaço vetorial L(Rm , Rn ) = Rmn são equivalen-
tes, temos que se Ak ∈ L(Rm , Rn ), k ∈ N, e A ∈ L(Rm , Rn ), então kAk −Ak −→ 0 ⇐⇒ akij −→ aij
para i = 1, . . . , n, j = 1, . . . , m, onde Ak = (akij ) e A = (aij ).

Exemplo 14.1. Considerando Rm e Rn com a norma do máximo, a norma do sup de uma


transformação linear A : Rm −→ Rn é dada por
X
m
!
kAk = max |aij | ,
1≤i≤n
j=1

isto é, é a maior ”norma da soma” entre as linhas.

J. Delgado - K. Frensel 79
Análise

De fato, seja x = (x1 , . . . , xm ) ∈ Rm tal que kxkM = max |xk | = 1. Então,


1≤k≤m

X X
! !
m m
kA(x)kM = max aij xj ≤ max |aij xj |


1≤i≤n 1≤i≤n
j=1 j=1
X m
!
≤ max |aij | ,
1≤i≤n
j=1

pois |xj | ≤ kxkM = 1 para todo j = 1, . . . , m.


Xm
!
Assim, kAk ≤ max |aij | .
1≤i≤n
j=1

X X
m m
!
Seja i0 = 1, . . . , n tal que |ai0 j | = max |aij | , e seja x0 = (x01 , . . . , x0m ) ∈ Rm tal que
1≤i≤n
j=1 j=1
x0j = 1 se ai0 j > 0, e x0j = −1 se ai0 j ≤ 0.

Então kxkM = 1 e
X X X
!
m m m
kA(x0 )kM = max 0
aij xj ≥ 0
ai0 j xj = |ai0 j | ≥ kAk .


1≤i≤n
j=1 j=1 j=1

Logo,
X
m
0
kA(x )kM ≤ kAk ≤ |ai0 j | ≤ kA(x0 )kM ,
j=1

ou seja,
X X
m m
!
kAk = |ai0 j | = max |aij | .
1≤i≤n
j=1 j=1
m n
• Para outras escolhas de normas em R e R , veja a tabela da página 66 do livro Curso de
Análise, Vol II de E. Lima. 

80 Instituto de Matemática UFF


Capı́tulo 2

Caminhos no espaço Euclidiano

1 Caminhos diferenciáveis
Nota: Neste capı́tulo, os
Definição 1.1. Um caminho em Rn é uma aplicação f : I −→ Rn defi- caminhos não serão por
definição, contı́nuos. Mas,
nida num intervalo I ⊂ R. Se f(t) = (f1 (t), . . . , fn (t)), t ∈ I, as n funções
a partir do próximo capı́tulo,
fi : I −→ R são chamadas as funções coordenadas de f. os caminhos voltarão a ser
contı́nuos.
Observação 1.1. f = (f1 , . . . , fn ) : I −→ R é contı́nua no ponto a ∈ I ⇐⇒ fi : I −→ R é
n

contı́nua no ponto a ∈ I, para todo i = 1, . . . , n.

Observação 1.2. Se f = (f1 , . . . , fn ) é definida no conjunto X ⊂ R e a ∈ X 0 , então


lim f(x) = b = (b1 , . . . , bn ) se, e só se, lim fi (x) = bi para todo i = 1, . . . , n.
x→a x→a

Observação 1.3. Se X ⊂ R e a ∈ X+0 , ou seja, a é ponto de acumulação à direita de X,


dizemos que lim+ f(x) = b quando,
x→a
para todo ε > 0, existe δ > 0 tal que x ∈ X, a < x < a + δ =⇒ kf(x) − bk < ε.

De modo análogo, se X ⊂ R e a ∈ X−0 , ou seja, a é ponto de acumulação à esquerda de X,


dizemos que lim− f(x) = b quando,
x→a
para todo ε > 0, existe δ > 0 tal que x ∈ X, a − δ < x < a =⇒ kf(x) − bk < ε.

Assim, podemos provar que se a ∈ X±0 , então lim± f(x) = b = (b1 , . . . , bn ) se, e só se,
x→a
lim± fi (x) = bi , para todo i = 1, . . . , n.
x→a

Definição 1.2. O vetor velocidade do caminho f : I −→ Rn no ponto a ∈ X é, por definição, o


limite

83
Análise

f(a + t) − f(a)
f 0 (a) = lim .
t→0 t
quando tal limite existe. A norma kf 0 (a)k chama-se velocidade escalar de f no ponto a.

• Quando f possui vetor velocidade no ponto a ∈ I, dizemos que f é diferenciável nesse ponto.
E se existe f 0 (a) para todo a ∈ I, dizemos que f é um caminho diferenciável.

• Quando f 0 (a) 6= 0, o vetor velocidade f 0 (a) determina a reta L = { f(a) + t f 0 (a) | t ∈ R }, cha-
mada reta tangente à curva f no ponto a.

Fig. 1: Reta tangente à curva f no ponto a

f(a + t) − f(a)
Observação 1.4. A diferenciabilidade de f no ponto a ∈ I e o limite lim inde-
t→0 t
pendem da norma considerada em Rn .

Observação 1.5. f = (f1 , . . . , fn ) é diferenciável no ponto a ∈ I se, e só se, fi : I −→ R é


fi (a + t) − fi (a)
derivável no ponto a para todo i = 1, . . . , n, pois são as coordenadas do vetor
t
f(a + t) − f(a)
para todo t ∈ I.
t
Neste caso, f 0 (a) = (f10 (a), . . . , fn0 (a)).

Observação 1.6.
• Um caminho f : I −→ Rn é diferenciável no ponto a ∈ I se, e só se, existe um vetor v ∈ Rn tal
que, para a + t ∈ I, temos
f(a + t) = f(a) + t v + r(t) ,
r(t)
onde lim = 0. Neste caso, v = f 0 (a).
t→0 t

De fato, a igualdade acima nos dá, para t 6= 0,


f(a + t) − f(a) r(t)
−v= .
t t
• Equivalentemente, f é diferenciável no ponto a ∈ I se, e só se, existe v ∈ Rn tal que, para
a + t ∈ I,
f(a + t) = f(a) + [v + ρ(t)]t ,

onde lim ρ(t) = 0.


t→0

84 Instituto de Matemática UFF


Caminhos diferenciáveis

r(t)
Basta por ρ(t) = , se t 6= 0, e ρ(0) = 0.
t
Observação 1.7. Se I = [a, b), só podemos definir a derivada lateral de f à direita no ponto
a:
f(a + t) − f(a)
f 0 (a+ ) = lim+ .
t→0 t
E se I = (a, b], só podemos definir a derivada lateral de f à esquerda no ponto b:
f(b + t) − f(b)
f 0 (b− ) = lim− .
t→0 t

Podemos verificar facilmente, que se a ∈ int I, então f : I −→ R é diferenciável no


ponto a se, e só se, existem e são iguais as derivadas laterais de f no ponto a. Neste caso,
f 0 (a) = f 0 (a+ ) = f 0 (a− ).

Exemplo 1.1. Se f : R −→ R2 é o caminho f(t) = (cos(t), sen(t)) = eit , para todo t ∈ R,


então f é diferenciável em R, f 0 (t) = (− sen t, cos t) = i eit , f(R) = S1 e kf 0 (t)k = 1, ou seja, a
velocidade escalar é constante igual a 1. 

Exemplo 1.2. Seja g : R −→ R2 o caminho dado por g(t) = (t, |t|). Então g 0 (t) = (1, 1), para
todo t > 0 e g 0 (t) = (1, −1), para todo t < 0.

Mas g não possui vetor velocidade no ponto t = 0, pois as


derivadas laterais g 0 (0+ ) = (1, 1) e g 0 (0− ) = (1, −1) são dife-
rentes.. A imagem de g é o gráfico da função módulo y = |x|,
que apresenta um ponto anguloso na origem.

Podemos, no entanto, descrever a mesma imagem por meio de


outras ”parametrizações” . Por exemplo, consideremos o cami-
nho h : R −→ R2 dado por h(t) = (t3 , t2 |t|). Então h(R) = g(R), Fig. 2: h(R) = g(R)

h 0 (t) = (3t2 , 3t2 ), t > 0, h 0 (t) = (3t2 , −3t2 ), t < 0 e h 0 (0) = (0, 0), pois h 0 (0+ ) = h 0 (0− ) = (0, 0).

Ou seja, para descrever a rota h(R), o ponto, cuja posição no tempo t é h(t), precisou dar uma
parada instantânea ao atingir o ponto anguloso (0, 0) de sua trajetória (ver exercı́cio 1.15). 

Observação 1.8. Se f, g : I −→ Rn são caminhos diferenciáveis e λ : I −→ R é uma função


diferenciável, temos que:
d d
(1) [f(t) + g(t)] = f 0 (t) + g 0 (t) ; (3) hf(t), g(t)i = hf 0 (t), g(t)i + hf(t), g 0 (t)i ;
dt dt
d d hf(t), f 0 (t)i
(2) [λ(t) f(t)] = λ 0 (t) f(t) + λ(t) f 0 (t) ; (4) kf(t)k = , se f(t) 6= 0 ,
dt dt kf(t)k
p
onde k k é a norma que provém de um produto interno h , i em Rn , ou seja, kxk = hx, xi para
todo x ∈ Rn .

J. Delgado - K. Frensel 85
Análise

As propriedades acima seguem das propriedades usuais da derivada de uma função real
de uma variável real aplicadas às funções coordenadas de um caminho diferenciável.

Observação 1.9. Se uma norma k k não provém de um produto interno, podemos ter um
caminho diferenciável f : I −→ Rn , com f(t) 6= 0 para todo t ∈ I, para o qual a função
ϕ(t) = kf(t)k não é diferenciável.

Por exemplo, seja f : R −→ R2 o caminho diferenciável dado por f(t) = (1, t). Considerando a
norma do máximo em R2 , temos que kf(t)kM = 1, se |t| ≤ 1 e kf(t)kM = |t|, se |t| ≥ 1. Logo a
função t 7−→ kf(t)kM não possui derivada nos pontos t = −1 e t = 1.

Observação 1.10. Sempre que tomarmos a derivada de kf(t)k estaremos considerando que
k k provém de um produto interno h , i.

Observação 1.11. Seja f : I −→ Rn um caminho diferenciável. Então f(t) tem comprimento


constante se, e só se, o vetor velocidade f 0 (t) é perpendicular ao vetor posição f(t) para todo
t ∈ I.

De fato, kf(t)k = a para todo t ∈ I ⇐⇒ hf(t), f(t)i = a2 para todo t ∈ I ⇐⇒ 2hf(t), f 0 (t)i = 0
para todo t ∈ I ⇐⇒ f(t) ⊥ f 0 (t) para todo t ∈ I.

Exemplo 1.3. Seja o caminho diferenciável f : R −→ R2 dado por f(t) = (cos t, sen t). Então
kf(t)k = 1 para todo t ∈ R e f 0 (t) = (− sen t, cos t) é perpendicular a f(t) para todo t ∈ R.

Neste exemplo, temos também kf 0 (t)k = 1 para todo t ∈ R,


mas isso é acidental.

Por exemplo, para o caminho diferenciável g : R −→ R2 , dado


por
g(t) = (cos t2 , sen t2 ),

temos kg(t)k = 1 para todo t ∈ R, g 0 (t) = (−2t sen t2 , 2t cos t2 )


é perpendicular a g(t) para todo t ∈ R, mas kg 0 (t)k = 2 |t| não
é constante.  Fig. 3: f(t) ⊥ f 0 (t) para todo t ∈ R

Definição 1.3. Seja f : I −→ Rn um caminho diferenciável. Se f 0 : I −→ Rn é contı́nuo,


dizemos que f é de classe C1 .

E se f 0 é diferenciável no ponto a ∈ I, dizemos que (f 0 ) 0 (a) = f 00 (a) é a derivada segunda de f


no ponto a ou o vetor aceleração do caminho f no ponto a.

Tem-se f 00 (a) = (f100 (a), . . . , fn00 (a)).

86 Instituto de Matemática UFF


Caminhos diferenciáveis

Se existe f 00 (t) para todo t ∈ I, dizemos que f é duas vezes diferenciável. E se f 00 é contı́nua,
dizemos que f é de classe C2 .

Prosseguindo desta maneira, dizemos que o caminho f : I −→ Rn é p + 1 vezes diferenciável


quando o caminho f(p) : I −→ Rn (derivada de ordem p de f) existe e é derivável. Põe-se, então,
f(p+1) = (f(p) ) 0 . Quando f(p) é de classe C1 , dizemos que f é de classe Cp+1 .

Se existem as derivadas de todas as ordens do caminho f, dizemos que f é de classe C∞ .

Por extensão, dizemos que um caminho contı́nuo é de classe C0 e que f = f(0) é sua própria
derivada de ordem zero.

Definição 1.4. Dizemos que o caminho f : I −→ Rn é p−vezes diferenciável no ponto a ∈ I


quando existe δ > 0 tal que f é p − 1 vezes diferenciável no intervalo J = {t ∈ I | |t − a| < δ} e
f(p−1) é diferenciável no ponto a.

Observação 1.12. Seja 0 ≤ p ≤ ∞. Então f = (f1 , . . . , fn ) ∈ Cp (é de classe Cp ) se, e só se,
fi ∈ Cp para todo i = 1, . . . , n.

Definição 1.5. Seja p > 0. Dizemos que o caminho f : I −→ Rn é de classe Cp por partes
quando f é contı́nua e existem t1 < . . . < tk pertencentes ao interior do intervalo I tais que
f|I∩(−∞,t1 ] , f|[t1 ,t2 ] , . . . , f|[tk−1 ,tk ] , f|I∩[tk ,+∞)

são de classe Cp .

Exemplo 1.4. Para todo p > 0, considere o caminho f : R −→ Rn dado por f(t) = (tp+1 , tp |t|).
Como tp |t| = tp+1 para t ≥ 0 e tp |t| = −tp+1 para t ≤ 0, podemos provar, por indução, que f é
de classe Cp , onde f(p) (t) = ((p + 1)! t, −(p + 1)! t), para t ≤ 0, f(p) (t) = ((p + 1)! t, (p + 1)! t)
para t ≥ 0, e f(p) (0) = (0, 0).

Entretanto f não é p + 1 vezes diferenciável no ponto t = 0, pois f(p+1) (0+ ) = ((p + 1)!, (p + 1)!)
e f(p+1) (0− ) = ((p + 1)!, −(p + 1)!) .

Apesar disso, f é de classe C∞ por partes, pois


 
(j) (p + 1)! (p + 1)!
f|(−∞,0] (t) = tp+1−j , − tp+1−j
((p + 1) − j)! ((p + 1) − j)!
e  
(j) (p + 1)! (p + 1)!
f|[0,+∞) (t) = tp+1−j , tp+1−j
((p + 1) − j)! ((p + 1) − j)!
(j) (j)
são contı́nuas para todo 0 ≤ j ≤ p + 1, e f|(−∞,0] = f|[0,+∞) ≡ 0 são também contı́nuas para todo
j > p + 1. 

J. Delgado - K. Frensel 87
Análise

2 Integral de um caminho

Definição 2.1. Seja f : [a, b] −→ Rn um caminho limitado definido no intervalo compacto


[a, b]. Uma partição de [a, b] é um conjunto finito P = {t0 < t1 < . . . < tk }, onde t0 = a e tk = b,
e a norma da partição P é o número |P| = max (ti − ti−1 ) .
0≤i≤k

Uma partição pontilhada é um par P ? = (P, ξ), onde P é uma partição e ξ = (ξ1 , . . . , ξk ) é tal
que ti−1 ≤ ξi ≤ ti para todo i = 1, . . . , k.

Dados f e uma partição pontilhada P ? = (P, ξ), o somatório


X Xk
?
(f; P ) = (ti − ti−1 ) f(ξi )
i=1

é chamado soma de Riemann.


X
• Dizemos que um vetor v ∈ Rn é o limite das somas de Riemann (f; P ? ) quando a norma de
P tende a zero se, para todo ε > 0 dado, existe
X δ > 0 tal que

|P| < δ =⇒ (f; P ? ) − v < ε .

X
Neste caso, dizemos que f é integrável no intervalo [a, b] e chamamos v = lim (f; P ? )
|P|→a
a integral de f no intervalo [a, b]. Usamos a notação
Zb X
f(t) dt = v = lim (f; P ? ) .
a |P|→0

Observação 2.1. O caminho limitado f = (f1 , . . . , fn ) é integrável se, e só se, fi : [a, b] −→ R
é integrável para todo i = 1, . . . , n. Neste
 Z caso,
Zb b Zb 
f(t) dt = f1 (t) dt, . . . , fn (t) dt .
a a a

Observação 2.2. Se f : [a, b] −→ Rn é integrável e c ∈ [a, b], então f|[a,c] e f|[c,b] são in-
tegráveis e
Zb Zc Zb
f(t) dt = f(t) dt + f(t) dt .
a a c

Observação 2.3. Seja D o conjunto dos pontos de descontinuidade do caminho limitado


f = (f1 , . . . , fn ) : [a, b] −→ Rn e, para cada i = 1, . . . , n, seja Di o conjunto dos pontos de
descontinuidade da i−ésima função coordenada fi : [a, b] −→ R. Então D = D1 ∪ . . . ∪ Dn .

Como fi é integrável se, e só se, Di tem medida nula, temos que f é integrável se, e só se, D
tem medida nula.

De fato, m(D) = 0 ⇐⇒ m(Di ) = 0 para todo i = 1, . . . , n ⇐⇒ fi é integrável para todo


i = 1, . . . , n ⇐⇒ f é integrável.

88 Instituto de Matemática UFF


Integral de um caminho

Zb
Observação 2.4. A integrabilidade de f e o valor f(t) dt não dependem da norma consi-
a
derada em Rn .

Exemplo 2.1. Sejam f : [0, 2π] −→ R2 e g : [0, 1] −→ R2 os caminhos C∞ dados por


f(t) = (cos t, sen t) e g(t) = (t, t2 ) . Então:
Z 2π  Z 2π Z 2π 
f(t) dt = cos t dt , sen t dt = (0, 0) ;
0 0 0
Z1  Z1 Z1  1 1

e g(t) dt = t dt , t2 dt = , .
0 0 0 2 3

Observação 2.5. Sejam f, g : [a, b] −→ Rn caminhos integráveis e α, β ∈ R arbitrários.


Segue-se da definição ou da observação 2.1, que o caminho αf + βg é integrável e
Zb Zb Zb
( αf + βg ) (t) dt = α f(t) dt + β g(t) dt .
a a a

Observação 2.6. Seja k k uma norma qualquer em Rn e seja f : [a, b] −→ Rn um caminho


integrável. Como Dkfk ⊂ Df , temos que kfk : [a, b] −→ R é integrável.

Além disso, Zb Zb

f(t) dt ≤ kfk(t) dt .

a a
X
De fato, dada qualquer partição pontilhada (f; P ? ), temos que:
X X X X

n n
?
(f; P ) = (ti − ti−1 ) f(ξi ) ≤ (ti − ti−1 ) kf(ξi )k = (kfk, P ? ) .



i=1 i=1

Logo,
Zb Zb
X X X

?
? ?
f(t) dt = lim (f; P ) = lim (f; P ) ≤ lim (kfk; P ) = kf(t)k dt .

|P|→0 |P|→0 |P|→0
a a

• Assim, se kf(t)k ≤ M para todo t ∈ [a, b], temos que


Z
b


f(t) dt ≤ M(b − a) .

a
n
• Porém, se n > 1, f : [a, b] −→ R é contı́nuo e kf(t)k ≥ c > 0 para todo t ∈ [a, b], não se pode
Zb
concluir que f(t) dt 6= 0. Veja o exemplo 2.1.
a

Observação 2.7. Segue-se da definição que se f : [a, b] −→ Rm é um caminho integrável e


A : Rm −→ Rn é uma transformação linear, então A ◦ f : [a, b] −→ Rn é integrável e
Zb  Zb 
(A ◦ f)(t) dt = A f(t) dt .
a a

J. Delgado - K. Frensel 89
Análise

3 Os teoremas clássicos do Cálculo

Regra da cadeia

Sejam ϕ : I −→ J uma função real diferenciável no ponto a ∈ I e f : J −→ Rn um caminho


diferenciável no ponto b = ϕ(a). Então f ◦ ϕ : I −→ Rn é um caminho diferenciável no ponto a
e
(f ◦ ϕ) 0 (a) = ϕ 0 (a)f 0 (ϕ(a)) .

• Basta aplicar a regra da cadeia em cada uma das funções coordenadas fi ◦ ϕ do caminho
f ◦ ϕ.

Observação 3.1. A função composta t 7−→ f(ϕ(t)) pode ser interpretada como uma mudança
de variável no caminho f, que equivale a descrever o mesmo percurso de outra maneira, sendo
o vetor velocidade (f◦ϕ) 0 (a) = ϕ 0 (a)f 0 (ϕ(a)) no ponto a um múltiplo escalar do vetor velocidade
de f no ponto ϕ(a).

• Os seis teoremas abaixo se demonstram observando quese f = (f1 , . . . , fn ), então


Zb  Zb Zb
0 0 0
f = (f1 , . . . , fn ) e f(t) dt = f1 (t) dt , . . . , fn (t) dt , e, aplicando às funções
a a a
coordenadas, o teorema correspondente para funções reais de uma variável real.

Mudança de variável na integral

Se f : [a, b] −→ Rn é um caminho contı́nuo e ϕ : [c, d] −→ [a, b] é uma função com derivada


integrável, então
Z ϕ(d) Zd
f(x) dx = f(ϕ(t)) ϕ 0 (t) dt .
ϕ(c) c

Teorema Fundamental do Cálculo

Se f : [a, b] −→ Rn é um caminho com derivada integrável, então


Zb Z1
0
f(b) − f(a) = f (t) dt = f(a + (b − a)t) (b − a) dt .
a 0

Definição 3.1. Seja f : [a, b] −→ Rn um caminho integrável. A integral indefinida de f é o


caminho F : [a, b] −→ Rn definido por Zx
F(x) = f(t) dt .
a

90 Instituto de Matemática UFF


Os teoremas clássicos do Cálculo

Seja M > 0 tal que kf(t)k ≤ M para todo t ∈ [a, b]. Então, pela observação 2.6,
Zx Zy Z x

kF(x) − F(y)k = f(t) dt − f(t) dt = f(t) dt ≤ M kx − yk ,

a a y

e, portanto, F é lipschitziana. Em particular, F é contı́nua.

Derivação da integral indefinida

Se f : [a, b] −→ Rn é um caminho integrável contı́nuo no ponto c ∈ [a, b], então F é diferenciável


neste ponto e F 0 (c) = f(c).

Em particular, se f é um caminho contı́nuo, temos


Zb
F(b) − F(a) = f(t) dt .
a

Fórmula de Taylor infinitesimal

Seja f : I −→ Rn um caminho p vezes diferenciável no ponto a ∈ I e escrevemos, para todo h


tal que a + h ∈ I,
hp
f(a + h) = f(a) + f 0 (a) h + . . . + f(p) (a) + rp (h) .
p!
rp (h)
Então lim = 0.
h→0 hp

Fórmula de Taylor com resto integral

Seja f : [a, a + h] −→ Rn um caminho p vezes diferenciável no intervalo [a, a + h], com f(p)
integrável. Então,
hp−1
f(a + h) = f(a) + f 0 (a) h + . . . + f(p−1) (a) + rp ,
(p − 1)!
onde Z1 Z a+h
hp p−1 (p) 1
rp = (1 − t) f (a + th) dt = (a + h − x)p−1 f(p) (x) dx .
(p − 1)! 0 (p − 1)! a

Definição 3.2. Dizemos que um caminho f : [a, b] −→ Rn é uniformemente diferenciável,


quando, para todo ε > 0 dado, existe δ > 0 tal que
x, x + h ∈ [a, b] , 0 < |h| < δ =⇒ kf(x + h) − f(x) − f 0 (x)hk < ε|h| .

Teorema 3.1. Um caminho f : [a, b] −→ Rn é de classe C1 se, e só se, f é uniformemente


diferenciável.

J. Delgado - K. Frensel 91
Análise

Este teorema decorre do teorema análogo para funções reais.

Realmente:

• A diferenciabilidade uniforme de f não depende da norma considerada, pois duas normas


quaisquer em Rn são equivalentes;

• Um caminho f é uniformemente diferenciável na norma do máximo se, e só se, cada uma de
suas funções coordenadas fi é uniformemente diferenciável;

• Uma função fi : [a, b] −→ R é uniformemente diferenciável se, e só se, fi é de classe C1 (ver
Curso de Análise, Vol. I de E. Lima, pag. 277).

Observação 3.2. O Teorema do Valor Médio não vale para caminhos diferenciáveis em Rn ,
n > 1.

Por exemplo, seja f : [0, 2π] −→ R2 o caminho diferenciável dado por f(t) = (cos t, sen t).
Como f(2π) − f(0) = (0, 0) e |f 0 (t)| = 1 para todo t ∈ [0, 2π], não existe c ∈ (0, 2π) tal que
f(2π) − f(0) = 2π f 0 (c).

Tem-se, no entanto, na forma de desigualdade.

Teorema do Valor Médio

Seja f : [a, b] −→ Rn um caminho contı́nuo em [a, b] e diferenciável em (a, b). Se kf 0 (t)k ≤ M


para todo t ∈ (a, b), então kf(b) − f(a)k ≤ M (b − a) .

1a Demonstração: Suponhamos que, além das hipóteses acima, f 0 é integrável em cada su-
bintervalo compacto [c, d] ⊂ (a, b).

Pelo Teorema Fundamental do Cálculo, temos Zd


f(d) − f(c) = f 0 (t) dt .
c
Logo kf(d) − f(c)k ≤ M(d − c), para todo [c, d] ⊂ (a, b).

Como f é contı́nua em [a, b], e existem sequências (ck ) e (dk ) tais que a < ck < dk < b, com
lim ck = a e lim dk = b, temos que
kf(b) − f(a)k = lim kf(ck ) − f(dk )k ≤ M lim |ck − dk | = M |b − a| ,
k→∞ k→∞

ou seja, kf(b) − f(a)k ≤ M kb − ak . 

2a Demonstração: Suponhamos que a norma k k provém de um produto interno, ou seja,


kxk2 = hx, xi para todo x ∈ Rn .

92 Instituto de Matemática UFF


Os teoremas clássicos do Cálculo

Seja ϕ : [a, b] −→ R a função real dada por ϕ(t) = hf(t), f(b) − f(a)i. Então ϕ é contı́nua em
[a, b], diferenciável em (a, b) e ϕ 0 (t) = hf 0 (t), f(b) − f(a)i para todo t ∈ (a, b).

Logo, pelo Teorema do Valor Médio para funções reais, existe c ∈ (a, b) tal que
ϕ(b) − ϕ(a) = (b − a) hf 0 (c), f(b) − f(a)i.

Então, pela Desigualdade de Cauchy-Schwarz,


kf(b) − f(a)k2 ≤ kf 0 (c)k kf(b) − f(a)k (b − a) ≤ M (b − a) kf(b) − f(a)k,

ou seja,
kf(b) − f(a)k ≤ M (b − a) . 

3a Demonstração: (Caso Geral) Se baseia nos dois lemas abaixo.

Lema 3.1. Seja f : I −→ Rn um caminho diferenciável no ponto c ∈ I. Sejam (ak ) e (bk )


sequências tais que ak , bk ∈ I, ak 6= bk , ak ≤ c ≤ bk , lim ak = lim bk = c. Então,
f(bk ) − f(ak )
f 0 (c) = lim .
k→∞ bk − ak

Prova.
Sejam N 0 = {k ∈ N | ak = c}, N 00 = {k ∈ N | bk = c} e N 000 = {k ∈ N | k ∈ N | ak < c < bk }.
Então N = N 0 ∪ N 00 ∪ N 000 e N 0 , N 00 , N 000 são dois a dois disjuntos.

• Se N 0 ⊂ N é infinito, temos que a subsequência


   
f(bk ) − f(ak ) f(bk ) − f(c)
=
bk − ak k∈N 0
bk − c k∈N 0
0
converge para f (c), pois f é diferenciável em c.

• De modo análogo, se N 00 ⊂ N é infinito, a subsequência


   
f(bk ) − f(ak ) f(c) − f(ak )
=
bk − ak k∈N 00
c − ak k∈N 00
0
também converge para f (c).
 
000 f(bk ) − f(ak )
• Resta, agora, mostrar que se N ⊂ N é infinito, converge para f 0 (c).
bk − ak k∈N 000

Como ak < c < bk , podemos escrever


f(bk ) − f(ak ) f(bk ) − f(c) f(ak ) − f(c)
= (1 − tk ) + tk ,
bk − ak bk − c ak − c
a −c b −c
onde tk = k e, portanto, 1 − tk = k .
ak − bk bk − ak
Logo    
f(bk ) − f(ak ) f(bk ) − f(c) f(ak ) − f(c)
− f 0 (c) = (1 − tk ) − f 0 (c) + tk − f 0 (c) .
bk − ak bk − c ak − c

J. Delgado - K. Frensel 93
Análise

   
f(ak ) − f(c) f(bk ) − f(c)
Assim, como e convergem para f 0 (c) e (tk ), (1 − tk )
ak − c k∈N 000
b k − c
 k∈N 000
f(bk ) − f(ak )
são sequências limitadas, temos que converge para f 0 (c). 
bk − ak k∈N 000

Lema 3.2. Sejam ϕ : [a, b] −→ R e f : [a, b] −→ Rn contı́nuas em [a, b] e diferenciáveis em


(a, b). Se kf 0 (t)k ≤ ϕ 0 (t) e ϕ 0 (t) > 0 para todo t ∈ (a, b), então kf(b) − f(a)k ≤ ϕ(b) − ϕ(a).

Prova.
Suponhamos que f e g são diferenciáveis no intervalo fechado [a, b] e admitamos que
kf(b) − f(a)k > ϕ(b) − ϕ(a).

Então existe A > 1 tal que


kf(b) − f(a)k > A (ϕ(b) − ϕ(a)) (> 0) .

Dividindo o intervalo [a, b] ao meio, em pelo menos em uma das metades, digamos, [a1 , b1 ],
temos que

kf(b1 ) − f(a1 )k > A (ϕ(b1 ) − ϕ(a1 )) .

Analogamente, em pelo menos uma das metades [a2 , b2 ] de [a1 , b1 ] temos que
kf(b2 ) − f(a2 )k > A(ϕ(b2 ) − ϕ(a2 )).

Prosseguindo desta maneira, obtemos uma sequência de intervalos


[a, b] ⊃ [a1 , b1 ] ⊃ . . . ⊃ [ak , bk ] ⊃ . . .

tais que
b−a
bk − ak = e kf(bk ) − f(ak )k > A (ϕ(bk ) − ϕ(ak )) , para todo k ∈ N.
2k
Além disso, as sequências (ak ) e (bk ) convergem para um mesmo ponto c ∈ [a, b], pois (ak ) é
não-decrescente limitada, (bk ) é não-crescente limitada e (bk − ak ) −→ 0.

Como ak 6= bk e ak ≤ c ≤ bk para todo k ∈ N temos, pelo lema 3.1, que


kf(bk ) − f(ak )k ϕ(bk ) − ϕ(ak )
kf 0 (c)k = lim ≥ A lim = A ϕ 0 (c) > ϕ 0 (c) .
k→∞ bk − ak k→∞ bk − ak
• Se ϕ e f são diferenciáveis apenas no intervalo aberto (a, b) temos, pelo provado acima, que

kf(d) − f(c)k ≤ ϕ(d) − ϕ(c) para todo [c, d] ⊂ (a, b).

Como ϕ e f são contı́nuas em [a, b] e existem sequências (ck ) e (dk ) de pontos de (a, b) tais
que ck < dk , lim ck = a e lim dk = b, temos que
kf(b) − f(a)k = lim kf(dk ) − f(ck )k ≤ lim (ϕ(dk ) − ϕ(ck )) = ϕ(b) − ϕ(a) 
k→∞ k→∞

• A desigualdade do valor médio segue-se do lema 3.2, tomando ϕ(t) = M t .

94 Instituto de Matemática UFF


Os teoremas clássicos do Cálculo

Corolário 3.1. Se o caminho f : [a, b] −→ Rn é contı́nuo em [a, b] e possui derivada nula em


todos os pontos de (a, b), então f é constante.

Prova.
1
Sejam x ∈ (a, b] e n ∈ N. Como kf 0 (t)k ≤ para todo t ∈ (a, b), temos, pelo Teorema do
n
1
Valor Médio, que kf(x) − f(a)k ≤ kx − ak. Então,
n
1
kf(x) − f(a)k ≤ kx − ak lim = 0,
n→∞ n

ou seja, f(x) = f(a). 

Observação 3.3. O corolário acima também pode ser demonstrado aplicando-se a cada
função coordenada fi de f o resultado análogo para funções reais.

Fórmula de Taylor com resto de Lagrange

Seja f : [a, a + h] −→ Rn um caminho de classe Cp−1 , p vezes diferenciável no intervalo aberto


(a, a + h). Se kf(p) (t)k ≤ M para todo t ∈ (a, a + h), então:
hp−1 (p−1)
f(a + h) = f(a) + h f 0 (a) + . . . + f (a) + rp ,
(p − 1)!
hp
onde krp k ≤ M .
p!
Ou equivalentemente, fazendo b = a + h,
(b − a)p−1 (p−1)
f(b) = f(a) + (b − a) f 0 (a) + . . . + f (a) + rp ,
(p − 1)!
(b − a)p
onde krp k ≤ M .
p!
Prova.
Seja g : [a, b] −→ Rn o caminho dado por
(b − t)p−1 (p−1)
g(t) = f(t) + (b − t)f 0 (t) + . . . + f (t)
(p − 1)!
(b − t)p−1 (p)
Então g é um caminho contı́nuo em [a, b], diferenciável em (a, b) e g 0 (t) = f (t) .
(p − 1)!
(b − t)p−1
Logo kg 0 (t)k ≤ M .
(p − 1)!
(b − t)p
Fazendo ϕ(t) = −M , temos, pelo lema 3.2, que
p!
(b − a)p
krp k = kg(b) − g(a)k ≤ ϕ(b) − ϕ(a) = M .
p!

J. Delgado - K. Frensel 95
Análise

4 Caminhos retificáveis

Definimos o comprimento de um caminho f : [a, b] −→ Rn como sendo a distância total


percorrida pelo ponto móvel f(t), quando t varia de a até b. Não é o mesmo que o comprimento
da imagem f([a, b]), pois, para ir de f(a) até f(b), o ponto f(t) pode passar pelo mesmo trecho
várias vezes (até infinitas).
√ √
Por exemplo, a imagem do caminho f : [− π, π] −→ R2 dado por f(t) = (cos(t2 ), sen(t2 )),
é o semi-cı́rculo S1+ = {(x, y) ∈ S1 | y ≥ 0}, cujo comprimento é π. Mas como f percorre S1+ duas
√ √
vezes quando t varia de − π a π, temos que o comprimento do caminho f é 2π.

• Seja f : [a, b] −→ Rn um caminho. A cada partição P = {t0 = a < t1 < . . . < tk = b} do


intervalo [a, b], associamos o número real não-negativo
Xk
`(f; P) = kf(ti ) − f(ti−1 )k .
i=1

Intuitivamente, `(f; P) é o comprimento da poligonal inscrita no caminho f com vértices nos


pontos f(ti ), i = 0, . . . , k.

Fig. 4: `(f; P) é o comprimento da poligonal de vértices f(ti ), i = 0, . . . , k.

Definição 4.1. Sejam P e Q partições do intervalo [a, b]. Dizemos que Q é mais fina que P
quando P ⊂ Q.

Teorema 4.1. Se P ⊂ Q, então `(f; P) ≤ `(f; Q).

Prova.
Suponhamos, primeiro, que Q = P ∪ {r}, onde ti−1 < r < ti . Então,

`(f; Q) − `(f; P) = kf(ti ) − f(r)k + kf(r) − f(ti−1 )k − kf(ti ) − f(ti−1 )k .

Como kf(ti ) − f(ti−1 )k ≤ kf(ti ) − f(r)k + kf(r) − f(ti−1 )k, temos que `(f; Q) ≥ `(f; P).

O caso geral prova-se aplicando o processo acima um número finito de vezes. 

Definição 4.2. Seja f : [a, b] −→ Rn um caminho. Se o conjunto { `(f; P) | P é partição de [a, b] }


é limitado, dizemos que o caminho f é retificável e `(f) = sup `(f; P) é chamado o comprimento
P
do caminho f.

96 Instituto de Matemática UFF


Caminhos retificáveis

Então, `(f) é caracterizado por:

(1) `(f) ≥ `(f; P) para toda partição P de [a, b].

(2) Dado ε > 0, existe uma partição P de [a, b] tal que `(f; P) > `(f) − ε.

Observação 4.1. Quando n = 1, um caminho retificável chama-se uma função de variação


limitada e o comprimento `(f) chama-se a variação total da função f no intervalo [a, b].

Observação 4.2. Todo caminho retificável f : [a, b] −→ Rn é limitado.


De fato, seja P = {a, t, b}, onde t ∈ [a, b]. Então,
kf(t) − f(a)k + kf(b) − f(t)k = `(f; P) ≤ `(f).

Logo,
kf(t)k ≤ kf(t) − f(a)k + kf(a)k ≤ `(f) + kf(a)k

para todo t ∈ [a, b] e, portanto, f é limitado.

Lema 4.1. Seja P0 uma partição de [a, b]. Então,


sup `(f; P) = sup `(f; Q) .
P Q⊃P0

Prova.
Como sup `(f; P) ≥ `(f; P) para toda partição P de [a, b], temos que
P
sup `(f; Q) ≤ sup `(f; P) .
Q⊃P0 P

Por outro lado, dada uma partição P, temos que Q 0 = P ∪ P0 é uma partição mais fina do que
P e P0 . Logo, pelo teorema 4.1,

`(f; P) ≤ `(f; Q 0 ) ≤ sup `(f; Q) ,


Q⊃P0

ou seja, sup `(f; Q) é uma cota superior do conjunto { `(f; P) | P é partição de [a, b]}.
Q⊃P0

Assim, sup `(f; P) ≤ sup `(f; Q} e. portanto, sup `(f; P) = sup `(f; Q) . 
P Q⊃P0 P Q⊃P0

Teorema 4.2. Seja c ∈ [a, b]. Então o caminho f : [a, b] −→ Rn é retificável se, e só se, suas
restrições f1 = f|[a,c] e f2 = f|[c,b] são retificáveis. Neste caso, `(f) = `(f1 ) + `(f2 ).

Prova.
Suponhamos que f é retificável.

Seja P2 uma partição de [c, b] fixa e seja P1 uma partição de [a, c]. Então P = P1 ∪ P2 é uma
partição de [a, b] e `(f; P) = `(f1 ; P1 ) + `(f2 ; P2 ) .

J. Delgado - K. Frensel 97
Análise

Logo,
`(f1 ; P1 ) = `(f; P) − `(f2 ; P2 ) ≤ `(f) − `(f2 ; P2 ) ,

e, portanto, f1 é retificável e
`(f1 ) ≤ `(f) − `(f2 ; P2 ) .

Além disso, como `(f2 ; P2 ) ≤ `(f) − `(f1 ) para toda partição P2 de [c, b], temos que f2 é retificável
e `(f2 ) ≤ `(f) − `(f1 ), ou seja, `(f1 ) + `(f2 ) ≤ `(f).

Suponhamos agora que f1 e f2 são retificáveis. Dada uma partição P de [a, b] que contém c,
temos que P = P1 ∪ P2 , onde P1 é uma partição de [a, c] e P2 é uma partição de [c, b].

Como `(f; P) = `(f1 ; P1 ) + `(f2 ; P2 ) ≤ `(f1 ) + `(f2 ) e, pelo lema anterior, sup `(f; Q) = sup `(f; Q),
Q c∈Q
temos que f é retificável e `(f) ≤ `(f1 ) + `(f2 ).

Provamos, assim, que f é retificável se, e só se, f1 e f2 são retificáveis, e, neste caso,
`(f) = `(f1 ) + `(f2 ). 

Observação 4.3.
• Seja f : [0, 1] −→ Rn o caminho retilı́neo f(t) = (1 − t) A + t B, com A, B ∈ Rn , e seja
P = {t0 = 0 < t1 < . . . < tk = 1} uma partição de [0, 1]. Como
kf(ti ) − f(ti−1 )k = k [ (1 − ti )A + ti B ] − [ (1 − ti−1 )A + ti−1 B ] k
= k (ti − ti−1 ) (B − A) k = (ti − ti−1 ) kB − Ak ,
para todo i = 0, . . . , k, temos que
X
k X
k
`(f; P) = kf(ti ) − f(ti−1 )k = kB − Ak (ti − ti−1 ) = kB − Ak .
i=1 i=1

Logo `(f) = kB − Ak. Aqui, k k é uma norma qualquer de Rn .

• Em geral,se um caminho retificável f : [a, b] −→ Rn tem extremidades A = f(a) e B = f(b),


então `(f) ≥ kf(b) − f(a)k = kB − Ak, pois P = {a, b} é uma partição de [a, b].

• Se `(f) = kB − Ak e a norma de Rn provém de um produto interno, então f([a, b]) ⊂ [A, B].

De fato, suponhamos que existe C ∈ f([a, b]) tal que C 6∈ [A, B] e seja c ∈ [a, b] tal que f(c) = C.
Como C 6∈ [A, B], temos que B − C não é múltiplo positivo de C − A, pois, caso contrário, existiria
λ > 0 tal que
λ 1
B − C = λ(C − A) =⇒ λC + C = B + λA =⇒ (1 + λ)C = λA + B =⇒ C = A+ B,
1+λ 1+λ
1
uma contradição, uma vez que C = (1 − t)A + tB, onde t = ∈ (0, 1).
1+λ
Logo, como a norma k k provém de um produto interno, kB − Ck + kC − Ak > kB − Ak.

98 Instituto de Matemática UFF


Caminhos retificáveis

Assim, para a partição P = {a, c, b}, temos que:


`(f; P) = kf(b) − f(c)k + kf(c) − f(a)k = kB − Ck + kC − Ak > kB − Ak ,

uma contradição, pois estamos supondo que `(f) = kB − Ak.

• Suponhamos, agora, que f : [a, b] −→ Rn é contı́nuo, `(f) = kB − Ak = kf(b) − f(a)k e que a


norma k k provém de um produto interno.

Então f([a, b]) = [A, B].

De fato, consideremos a aplicação g : [0, 1] −→ [A, B] dada por g(t) = (1−t) A+t B . A aplicação
g é contı́nua, sobrejetora e injetora, e sua inversa g−1 : [A, B] −→ [0, 1], dada por
kx − Ak
g−1 (x) = ,
kB − Ak
também é contı́nua.

Logo a função g−1 ◦ f : [a, b] −→ [0, 1] é contı́nua e, portanto, g−1 (f[a, b]) é um intervalo contido
no intervalo [0, 1] que contém os extremos 0 e 1, uma vez que f(a) = A e f(b) = B.

Assim, g−1 (f([a, b])) = [0, 1], ou seja, f([a, b]) = g([0, 1]) = [A, B].

• Se a norma não provém de um produto interno, podemos ter kB − Ak = kB − Ck + kC − Ak


sem que C ∈ [A, B], o que permite a existência de um caminho f com `(f) = kf(b) − f(a)k sem
que f([a, b]) esteja contido num segmento de reta.

Por exemplo, consideremos R2 com a norma da soma e


2
 f : [0, 2] −→ R dado por
seja o caminho contı́nuo
(0, 1 − t) se t ∈ [0, 1]
f(t) =
(1 − t, 0) se t ∈ [1, 2]

Então, pelo teorema 4.2, f é retificável e


`(f) = `( f|[0,1] ) + `( f|[1,2] )
= k(0, 1) − (0, 0)kS + k(0, 0) − (−1, 0)kS = 2 ,
uma vez que f|[0,1] e f|[1,2] são caminhos retilı́neos. Fig. 5: `(f) = 2

Portanto, `(f) = 2 = k(0, 1) − (−1, 0)kS = kf(2) − f(0)kS , apesar de f([a, b]) não estar contido
num segmento de reta.

Observação 4.4. `(f) = 0 ⇐⇒ f é um caminho constante.

Observação 4.5. Ser ou não ser retificável é uma propriedade do caminho f que não de-
pende da norma tomada em Rn , uma vez que duas normas quaisquer em Rn são equivalentes,
mas o comprimento `(f) depende da norma. Por exemplo, o segmento de reta que liga os pontos

J. Delgado - K. Frensel 99
Análise

A = (0, 1) e B = (1, 0) no plano tem comprimento 2 na norma da soma, 1 na norma do máximo



e 2 na norma euclidiana.

Observação 4.6. Se f : [a, b] −→ Rn é um caminho poligonal, temos, pelo teorema 4.2, que
`(f) é a soma dos comprimentos dos segmentos de reta que o compõem. Em particular, para
X
k
toda partição P = {t0 = a < t1 < . . . < tk = b} de [a, b], `(f; P) = kf(ti ) − f(ti−1 )k é,
i=1
realmente, o comprimento da poligonal inscrita em f, com vértices nos pontos f(ti ), i = 0, . . . , k.

(t, 0) se t 6= 1
Exemplo 4.1. O caminho f : [0, 2] −→ R2 dado por f(t) = é descontı́nuo,
(1, 1) se t = 1
mas é retificável e `(f) = 4, considerando R2 com a norma euclidiana.

De fato, pelo lema 4.1, basta considerarmos as partições P


de [0, 2] que contém o ponto ti = 1.

Sejam 0 < δ ≤ 1 e 0 < ε ≤ 1 tais que ti−1 = 1−δ e ti+1 = 1+ε.


Então,
p p
`(f; P) = (1 − δ) + 1 + δ2 + 1 + ε2 + 1 − ε ≤ 4 ,
p p
pois 1 − δ + 1 + δ2 ≤ 2 e 1 − ε + 1 + ε2 ≤ 2, uma vez que
p p
Fig. 6: `(f) = 4
1 + δ2 ≤ 1 + δ e 1 + ε2 ≤ 1 + ε.

1 1

Logo f é retificável e `(f) ≤ 4. Mas, dada Pn = 0, 1 − , 1, 1 + , 2 , temos que
r r n n
1 1 1 1
 
`(f; Pn ) = 1 − + 1 + 2 + 1 + 2 + 1 − ≤ `(f) ,
n n n n
para todo n ∈ N e, portanto,
4 = lim `(f; Pn ) ≤ `(f) .
n→∞

Assim, `(f) = 4 . 

Teorema 4.3. O caminho f : [a, b] −→ Rn é retificável se, e só se, cada uma de suas funções
coordenadas fi : [a, b] −→ R, i = 1, . . . , n é retificável, ou seja, tem variação limitada.

Prova.
Como ser ou não ser retificável independe da norma, podemos tomar em Rn a norma da soma.
Logo,
X
n
`(f; P) = `(fi ; P) .
i=1

Portanto, se f é retificável, temos que


`(fi ; P) ≤ `(f; P) ≤ `(f) ,

100 Instituto de Matemática UFF


Caminhos retificáveis

para toda partição P de [a, b] e todo i = 1, . . . , n. Então fi tem variação limitada para todo
i = 1, . . . , n.

Por outro lado, se cada fi tem variação limitada, então


Xn X
n
`(f; P) = `(fi ; P) ≤ `(fi ) ,
i=1 i=1

para toda partição P de [a, b]. Logo f é retificável. 

Observação 4.7. Toda função monótona f : [a, b] −→ R tem variação limitada e


`(f) = |f(b) − f(a)|.

De fato, suponhamos que f é não-decrescente. Dada P = {t0 = a < t1 < . . . < tk = b} uma
partição de [a, b], temos que
Xk X
k
`(f, P) = |f(ti ) − f(ti−1 )| = ( f(ti ) − f(ti−1 ) ) = f(b) − f(a) .
i=1 i=1

Corolário 4.1. Se cada função coordenada do caminho f é monótona, então f é retificável.


π
Exemplo 4.2. O caminho f : [0, 1] −→ R, dado por f(t) = t sen , se t 6= 0 e f(0) = 0, é
2t
contı́nuo, mas não é retificável.

1 1 1 1 1 1

De fato, para todo k = 4m − 1, m ∈ N, seja Pk = 0,, , . . . , , , , , 1 . Então:
k+1 k 5 4 3 2
 1   1  1  
1 (4m − 1)π 1 1
f(0) = 0 ; f =f = 0; f = sen =− =− ;
k+1 4m k 4m − 1 2 4m − 1 k
 1   
1
 1  1 (4m − 3)π 1 1
f = sen(2m − 1)π = 0 ; f = sen = = ,
k−1 4m − 2 k−2 4m − 3 2 4m − 3 k−2
e assim sucessivamente, até
1 1 1 1 1
1
f = ; f = 0; f =− ; f = 0 e f(1) = 1 .
5 5 4 3 3 2
Logo,
1 1 1 1 1 1 1 1
`(f; Pk ) = 0 + + + + + ... + + + + + 1,
k k k−2 k−2 5 5 3 3
e, portanto,
1 1 1 1 1 1 1 1 1
`(f; Pk ) ≥
+ + + + ... + + + + + .
k+1 k k−1 k−2 6 5 4 3 2
X1
Como a série harmônica diverge, temos que o conjunto { `(f; P) ; P partição de [0, 1] } não
n
n≥1
é limitado e, portanto, f não tem variação limitada.

t sen 1 se t 6= 0
De modo análogo, podemos provar que g : [0, 1] −→ R , g(t) = t é uma
0 se t = 0 ,
função contı́nua, mas não é retificável.

J. Delgado - K. Frensel 101


Análise

Então, pelo teorema 4.3, o caminho h : [0, 1] −→ R2 , dado por



 t, t sen 1

se t 6= 0
h(t) = t
(0, 0) se t = 0 ,
é contı́nuo, mas não é retificável. Observe que h é um caminho injetivo (figura 7).

“ ” “ ”
Fig. 7: Caminho h(t) = t, t sen 1t Fig. 8: Caminho ξ(t) = t cos 1t , t sen 1
t

O caminho espiralado ξ : [0, 1] −→ R2 dado por



tei/t = t cos 1 , t sen 1
 
se t 6= 0
ξ(t) = t t
(0, 0) se t = 0 ,
também tem comprimento infinito, ou seja, não é retificável.

Neste exemplo, quando t −→ 0, o ponto ξ(t) tende para a origem (0, 0) dando infinitas voltas
em torno dela.

Observe que o caminho ξ também é injetivo (figura 8). 

Observação 4.8. No exemplo 4.1, vimos que um caminho descontı́nuo pode ser retificável,
mas, como veremos abaixo, a descontinuidade de um caminho retificável f : [a, b] −→ Rn num
ponto c ∈ [a, b] não pode ser arbitrária.

Teorema 4.4. Seja f : [a, b] −→ Rn um caminho tal que, para cada c ∈ [a, b), a restrição f|[a,c]
é retificável. Se existe K > 0 tal que `(f|[a,c] ) ≤ K para todo c ∈ [a, b), então existe lim− f(t).
t→b
n
Analogamente, dado f : (a, b] −→ R tal que f|[c,b] é retificável para todo c ∈ (a, b], com
`(f|[c,b] ) ≤ K seja qual for c ∈ (a, b], então existe lim+ f(t).
t→a

102 Instituto de Matemática UFF


Caminhos retificáveis

Prova.
Vamos provar apenas o primeiro resultado, pois o outro demonstra-se de modo análogo.

Seja t1 < t2 < . . . < tk < . . . uma sequência crescente em [a, b) tal que lim tk = b.
k→∞

X
k
Então, para todo k ∈ N, kf(ti ) − f(ti−1 )k ≤ K, pois P = {a, t1 , . . . , tk } é uma partição de [a, c],
i=2
com c = tk .
X
Logo a série de números reais kf(ti ) − f(ti−1 )k é convergente, pois a sequência de suas
i≥2
reduzidas é não-decrescente e limitada superiormente por K. Assim, a sequência das reduzidas
X
da série de vetores ( f(ti ) − f(ti−1 ) ) é de Cauchy e, portanto, convergente.
i≥2

Como a reduzida de ordem k − 1 desta série é f(tk ) − f(t1 ), temos que existe lim f(tk ). Sendo a
k→∞
sequência crescente tk −→ b arbitrária, segue, pela Observação 8.4 do Capı́tulo 1, que o limite
lim f(t) existe. 
t→b−

Corolário 4.2. Seja f : [a, b] −→ Rn um caminho retificável. Então existem os limites laterais
lim f(t) (se c 6= a) e lim+ f(t) (se c 6= b).
t→c− t→c

Definição 4.3. Dizemos que um caminho f : [a, b] −→ Rn é regulado se, para todo c ∈ [a, b],
existem os limites laterais f(c− ) = lim− f(t) (se c 6= a) e f(c+ ) = lim+ f(t) (se c 6= b), ou seja, se
t→c t→c
f só possui descontinuidade de 1a espécie.

Em particular, o conjunto dos pontos de descontinuidade de um caminho regulado é enu-


merável (ver Curso de Análise, Vol. I de E. Lima, pag. 233, Teorema 11)

Observação 4.9. Todo caminho retificável é regulado.

Definição 4.4. Dizemos que um caminho f : [a, b] −→ Rn é bem regulado quando ele é
regulado e, para todo c ∈ (a, b),
kf(c+ ) − f(c− )k = kf(c+ ) − f(c)k + kf(c) − f(c− )k .

Observação 4.10. Quando a norma provém de um produto interno, temos


kf(c+ ) − f(c− )k = kf(c+ ) − f(c)k + kf(c) − f(c− )k ,

se, e só se, f(c) pertence ao segmento de reta cujos extremos são f(c− ) e f(c+ ).

Mas, para uma norma arbitrária, podemos apenas afirmar que se f(c) ∈ [f(c− ), f(c+ )] para todo
c ∈ (a, b), então f é bem regulado.

J. Delgado - K. Frensel 103


Análise

Observação 4.11. Todo caminho contı́nuo é bem regulado.


Todo caminho regulado, lateralmente contı́nuo, ou seja, f(c+ ) = f(c) ou f(c− ) = f(c) para todo
c ∈ (a, b), é bem regulado.

Observação 4.12. Um caminho f : [a, b] −→ Rn regulado é bem regulado se, e só se, para
todo c ∈ (a, b), tem-se
lim ( kf(t) − f(c)k + kf(c) − f(s)k − kf(t) − f(s)k ) = 0 .
t → c+
s → c−

Exemplo 4.3. O caminho retificável f : [0, 2


 2] −→ R dado por
(t, 0) se t 6= 1
f(t) =
(1, 1) se t = 1 ,
não é bem regulado, pois f(1+ ) = f(1− ) = (1, 0) e, portanto,
kf(1+ ) − f(1− )k = 0 6= kf(1+ ) − f(1)k + kf(1− ) − f(1)k ,

para qualquer norma k k considerada em R2 .

Neste exemplo, não existe lim `(f; P), pois, se a partição P não contém o ponto 1, temos que
|P|→0
`(f; P) = 2, enquanto que, para partições Q que contém 1, temos lim `(f; Q) = 4 . 
|Q|→0

Teorema 4.5. As seguintes afirmações a respeito de um caminho f : [a, b] −→ Rn são equi-


valentes:

(1) f é bem regulado e retificável, com `(f) = L.

(2) existe lim `(f; P) = L.


|P|→0

Prova.
(1)=⇒(2) Dado ε > 0 existe uma partição P0 = {t0 = a, t1 , . . . , tk = b} de [a, b] tal que
ε
L− < `(f; P0 ) ≤ L.
2
Seja 0 < δ < min { (ti − ti−1 ) } tal que
1≤i≤k
ε
ti − δ < s < ti < t < ti + δ =⇒ kf(t) − f(ti )k + kf(ti ) − f(s)k − kf(t) − f(s)k < ,
2k
para todo i = 1, . . . , k − 1 .

Seja P uma partição de [a, b] com |P| < δ. Então:


ε
L− < `(f; P ∪ P0 ) ≤ L ,
2
pois `(f; P0 ) ≤ `(f; P ∪ P0 ) , e 0 ≤ `(f; P ∪ P0 ) − `(f; P) = soma de no máximo k − 1 termos da
forma kf(t) − f(ti )k + kf(ti ) − f(s)k − kf(t) − f(s)k , onde [s, t] é um intervalo de P que contém

104 Instituto de Matemática UFF


Caminhos retificáveis

algum ti em seu interior, pois os demais intervalos de P são também de P ∪ P0 e, portanto,


desaparecem na diferença `(f; P ∪ P0 ) − `(f; P).

Observe que se |P| < δ, então existe no máximo um ti no interior de seus subintervalos, pois
0 < δ < min {ti − ti−1 }.
1≤i≤k

Logo se |P| < δ, então ti − δ < s < ti < t < ti + δ, para todo intervalo [s, t] de P que contém
ε(k − 1) ε
algum ti em seu interior, e, portanto, 0 ≤ `(f; P ∪ P0 ) − `(f; P) < < .
2k 2
Assim,
ε
L ≥ `(f; P) ≥ `(f; P ∪ P0 ) − > L − ε.
2
(2)=⇒(1) Dado ε > 0, existe δ > 0 tal que
|P| < δ =⇒ L − ε < `(f; P) < L + ε .

Seja P0 uma partição de [a, b] fixa com |P0 | < δ.

Então, se P ⊃ P0 , temos que |P| ≤ |P0 | < δ e, portanto,


L − ε < `(f; P) < L + ε .

Logo, como sup {`(f; P)} = sup{`(f; P)}, temos que f é retificável e L − ε < `(f) ≤ L + ε para todo
P⊃P0 P
ε > 0.

Assim, `(f) = L e, pela observação 4.9, f é regulado.

Vamos provar que f é bem regulado, ou seja, que

(kf(c+ ) − f(c)k + kf(c) − f(c− )k − kf(c+ ) − f(c− )k) = 0 ,

para todo c ∈ (a, b).

Dado c ∈ (a, b), seja Qk uma sequência de partições com lim |Qk | = 0 e c 6∈ Qk .
k→∞

Seja Pk = Qk ∪ {c}. Então lim `(f; Pk ) = lim `(f; Qk ) = L e


k→∞ k→∞
0 ≤ `(f; Pk ) − `(f; Qk ) = kf(c) − f(sk )k + kf(tk ) − f(c)k − kf(tk ) − f(sk )k ,

onde [sk , tk ] é o intervalo de Qk que contém c em seu interior.

Como lim |Qk | = 0, temos lim sk = lim tk = c, onde sk < c < tk .


k→∞ k→∞ k→∞

Então lim f(sk ) = f(c ) e lim f(tk ) = f(c+ ) . Logo,



k→∞ k→∞
0 = lim ( `(f; Pk ) − `(f; Qk ) ) = lim ( kf(c) − f(sk )k + kf(tk ) − f(c)k − kf(tk ) − f(sk )k )
k→∞ k→∞
= kf(c) − f(c )k + kf(c ) − f(c)k − kf(c+ ) − f(c− )k ,
− +

e, portanto, f é bem regulado. 

J. Delgado - K. Frensel 105


Análise

Corolário 4.3. Seja f : [a, b] −→ Rn um caminho contı́nuo. Então f é retificável com compri-
mento L se, e só se, lim `(f; P) = L.
|P|→0

Observação 4.13. Seja f : [a, b] −→ Rn um caminho lipschitziano tal que


kf(s) − f(t)k ≤ K |s − t|

para s, t ∈ [a, b] quaisquer. Dada uma partição P = {t0 , t1 , . . . , tk } de [a, b], temos
X
k X
`(f; P) = kf(ti ) − f(ti−1 )k ≤ K (ti − ti−1 ) = K(b − a) .
i=1

Logo f é retificável e `(f) ≤ K(b − a) .

• Em particular, se f : [a, b] −→ Rn é um caminho de classe C1 , então f é lipschitziano, pois:

◦ f 0 ([a, b]) é limitado, ou seja, |f 0 (t)| ≤ M para todo t ∈ [a, b], uma vez que f 0 é contı́nuo e
[a, b] é um intervalo compacto;

◦ e, portanto, pela Desigualdade do Valor Médio, kf(s) − f(t)k ≤ M |s − t| para s, t ∈ [a, b]


quaisquer.

Logo todo caminho de classe C1 é retificável.

Teorema 4.6. Todo caminho f : [a, b] −→ RZn de classe C1 é retificável com


b
`(f) = kf 0 (t)k dt.
a

Prova.
Basta mostrar que Zb
lim `(f; P) = kf 0 (t)k dt .
|P|→0 a

Zεb > 0, existe δ1 > 0 tal que |P| < δ1 , então


Pela definição de integral, dado
X ε
kf 0 (t)k dt − 0
?
(kf k; P ) < 2,
a
?
onde P = (P, ξ), ξ = (t0 , . . . , tk−1 ), ou seja, ξi = ti−1 ∈ [ti−1 , ti ], e
X X
k
0
(kf k; P ) = ?
kf 0 (ti−1 )k (ti − ti−1 ) .
i=1

E, pela diferenciabilidade uniforme de f, existe δ2 > 0 tal que


|P| < δ2 =⇒ f(ti ) − f(ti−1 ) = (f 0 (ti−1 ) + ρi ) (ti − ti−1 ) ,
ε
com |ρi | < , para todo i = 1, . . . , k.
2(b − a)
Logo se |P| < δ2 , então:

106 Instituto de Matemática UFF


O comprimento de arco como parâmetro

X X X

k k k
`(f; P) − kf 0 (ti−1 )k (ti − ti−1 ) = kf(ti ) − f(ti−1 )k − kf 0 (ti−1 )k |ti − ti−1 |


i=1 i=1 i=1
X
k
kf(ti ) − f(ti−1 )k − kf 0 (ti−1 )k |ti − ti−1 |


i=1
Xk
≤ kf(ti ) − f(ti−1 ) − f 0 (ti−1 )(ti − ti−1 )k
i=1
Xk
ε X
k

= kρi (ti − ti−1 )k < ti − ti−1
2(b − a)
i=1 i=1

ε(b − a) ε
= = .
2(b − a) 2
Então se δ = min{ δ1 , δ2 } > 0 e |P| < δ , obtemos que:
Zb X X Zb
ε ε
`(f; P) − kf 0 (t)k dt ≤ `(f; P) − 0 0 0
? ?
(kf k; P ) + (kf k; P ) − kf (t)k dt < + = ε.
2 2

a a

Exemplo 4.4. Seja f : [0, 2π] −→ R2 , f(t) = (cos t, sen t). Então o comprimento de f é
Z 2π Z 2π
0
`(f) = kf (t)k dt = 1 dt = 2π .
0 0
√ √
E se g : [− π, π] −→ R2 , g(t) = (cos t2 , sen t2 ) , temos
Z √π Z √π Z √π √π
`(g) = √ kg (t)k dt = √ |2 t| dt = 2
0 2
2 t dt = 2t = 2π . 
− π − π 0 0

5 O comprimento de arco como parâmetro

Definição 5.1. Seja g : [c, d] −→ Rn um caminho. Uma reparametrização de g é um caminho


g ◦ ϕ : [a, b] −→ Rn , onde ϕ : [a, b] −→ [c, d] é uma função monótona sobrejetora (e, portanto,
contı́nua, pelo teorema 10 da pag. 232 do livro Curso de Análise, Vol. I de E. Lima).

Quando

• ϕ é não-decrescente, ϕ(a) = c e ϕ(b) = d;

• ϕ é não-crescente, ϕ(a) = d e ϕ(b) = c;

• ϕ(s) = ϕ(t) com s < t, ϕ é constante em [s, t].

J. Delgado - K. Frensel 107


Análise

Observação 5.1. A reparametrização f = g ◦ ϕ : [a, b] −→ Rn é contı́nua ⇐⇒ o caminho


g : [c, d] −→ Rn é contı́nuo.

Essa observação segue-se do corolário 11.5 do Capı́tulo 1, pois ϕ : [a, b] −→ [c, d] é uma
função contı́nua do compacto [a, b] sobre o compacto [c, d].

Teorema 5.1. A reparametrização f = g ◦ ϕ : [a, b] −→ Rn é retificável se, e só se, o caminho


g : [c, d] −→ Rn é retificável. Neste caso, `(g ◦ ϕ) = `(g).

Prova.
(⇐=) Suponhamos que g é retificável. Seja P = {s0 , s1 , . . . , sk } uma partição de [a, b]. Se
ϕ(si−1 ) = ϕ(si ), temos que kg(ϕ(si )) − g(ϕ(si−1 ))k = 0.

Logo, para calcularmos o comprimento de g ◦ ϕ, basta considerarmos as partições P de [a, b]


tais que ϕ|P seja injetora. Neste caso, Q = ϕ(P) é uma partição de [c, d] e
X
k
`(g ◦ ϕ; P) = kg(ϕ(si )) − g(ϕ(si−1 ))k = `(g; Q) ≤ `(g) .
i=1

Assim, g ◦ ϕ é retificável e `(g ◦ ϕ) ≤ `(g).

(=⇒) Suponhamos que g ◦ ϕ é retificável e seja Q = {t0 , t1 , . . . , tk } uma partição de [c, d].

Então para todo i = 0, 1, . . . , k, existe si ∈ [a, b] tal que ϕ(si ) = ti .

Se ϕ é não-decrescente, podemos tomar s0 = a, sk = b, e teremos si−1 < si , para todo


i = 0, 1, . . . , k, ou seja, P = {s0 , s1 , . . . , sk } é uma partição de [a, b]. Logo,
X
k X
k
`(g; Q) = kg(ti ) − g(ti−1 )k = kg(ϕ(si )) − g(ϕ(si−1 ))k = `(g ◦ ϕ; P) .
i=1 i=1

Se ϕ é não-crescente, podemos tomar s0 = b, sk = a, e teremos si−1 > si para todo


i = 0, 1, . . . , k.

Então P = {ξ0 , ξ1 , . . . , ξk }, onde ξi = sk−i , é uma partição de [a, b] tal que


X
k X
k
`(g; Q) = kg(ti ) − g(ti−1 )k = kg(ϕ(si )) − g(ϕ(si−1 ))k
i=1 i=1
Xk X
k
= kg ◦ ϕ(ξk−i ) − g ◦ ϕ(ξk−(i−1) )k = kg ◦ ϕ(ξj ) − g ◦ ϕ(ξj−1 )k
i=1 j=1

= `(g ◦ ϕ; P) .

Logo `(g; Q) = `(g ◦ ϕ; P) ≤ `(g ◦ ϕ) para toda partição Q de [c, d].

Então g é retificável e `(g) ≤ `(g ◦ ϕ) e, portanto, `(g) = `(g ◦ ϕ). 

108 Instituto de Matemática UFF


O comprimento de arco como parâmetro

Definição 5.2. Dizemos que um caminho retificável f : [a, b] −→ R é parametrizado pelo


comprimento de arco ou cadenciado, quando `(f|[a,t] ) = t − a para todo t ∈ [a, b].

Neste caso, se s < t, então `(f|[s,t] ) = t − s.

Teorema 5.2. Um caminho f : [a, b] −→ R de classe C1 é parametrizado pelo comprimento


de arco se, e só se, kf 0 (t)k = 1 para todo t ∈ [a, b] .

Prova. Zt
Se f é parametrizado pelo comprimento de arco, então kf 0 (s)k ds = t − a para todo t ∈ [a, b].
Zτ a
d
Logo |f (t)| =
0
kf 0 (s)k ds = 1.
dτ a
Reciprocamente, se kf 0 (t)k = 1 para todo t ∈ [a, b], então
Zt Zt
0
`(f|[a,t] ) = kf (s)k ds = 1 ds = t − a .
a a

Exemplo 5.1. O caminho f : [0, 2π] −→ R2 , f(t) = (cos t, sen t), é parametrizado pelo compri-
mento de arco, pois f ∈ C∞ e kf 0 (t)k = 1 para todo t ∈ [0, 2π]. 

Lema 5.1. Se f : [a, b] −→ Rn é um caminho contı́nuo retificável, então a função σ : [a, b] −→


[0, L], L = `(f), definida por σ(t) = `(f|[a,t] ), é contı́nua. Como σ(b) = L, σ é sobrejetiva.

Prova.
Vamos mostrar que σ é contı́nua no ponto a. Como σ é monótona não-decrescente, existe
A = lim+ σ(t) = inf{ σ(t) | t ∈ (a, b] }
t→a
4A
Suponhamos, por absurdo, que A > 0 = σ(0). Então existe c1 ∈ (a, b] tal que A ≤ σ(c1 ) < .
3
4A A
Logo A ≤ σ(t) ≤ σ(c1 ) < para todo t ∈ (a, c1 ], e, portanto, `(f|[t,c1 ] ) = σ(c1 ) − σ(t) < .
3 3
A
Por outro lado, sendo f contı́nua em a, existe c2 ∈ (a, b) tal que t ∈ [a, c2 ] =⇒ kf(t) − f(a)k < .
3
Seja c = min{ c1 , c2 }. Então, para toda partição P de [a, c], temos
X
k
A A A 2A
`(f|[a,c] ; P) = kf(t1 ) − f(a)k + kf(ti ) − f(ti−1 )k < + `(f|[t1 ,c] ) < + = .
3 3 3 3
i=2
2A
Logo σ(c) = `(f|[a,c] ) ≤ < A , uma contradição.
3
De modo análogo, podemos provar que
sup { σ(t) | t ∈ [a, b) } = L = σ(b) ,

J. Delgado - K. Frensel 109


Análise

e, portanto,
lim σ(t) = sup{ σ(t) | t ∈ [a, b) } = L = σ(b) ,
t→b−

ou seja, σ é contı́nua no ponto b.

No caso geral, tome t0 ∈ (a, b). Como f|[a,t0 ] : [a, t0 ] −→ Rn é um caminho contı́nuo e retificável,
temos, pelo observado acima, que lim− σ(t) = σ(t0 ).
t→t0

E, por outro lado, como f|[t0 ,b] : [t0 , b] −→ Rn é um caminho contı́nuo retificável e
ψ(t) = `(f|[t0 ,t] ) = σ(t) − `(f|[a,t0 ] ) ,

temos, pelo provado acima, que lim+ ψ(t) = ψ(t0 ) = 0 e, portanto,


t→t0

lim+ σ(t) = lim+ ψ(t) + `(f|[a,t0 ] ) = `(f|[a,t0 ] ) = σ(t0 ) . 
t→t0 t→t 0

Teorema 5.3. Todo caminho contı́nuo retificável f : [a, b] −→ Rn é a reparametrização de


um caminho parametrizado pelo comprimento de arco g : [0, L] −→ Rn , L = `(f), o qual é,
necessariamente, contı́nuo.

Prova.
Consideremos o diagrama abaixo:
f
[a, b] - Rn

σ
g
?
[0, L]

Dado s < t em [a, b], temos σ(t) = σ(s) + `(f|[s,t] ) .

Portanto, σ(s) = σ(t) =⇒ `(f|[s,t] ) = 0 =⇒ f é constante em [s, t] =⇒ f(s) = f(t).

Definimos g : [0, L] −→ Rn da seguinte maneira: dado u ∈ [0, L], existe t ∈ [a, b] tal que
σ(t) = u. Pomos, então, g(u) = f(t). O caminho g está bem definido, pois se σ(t) = σ(s) = u,
então f(s) = f(t).

Como f = g ◦ σ, f : [a, b] −→ Rn é contı́nuo e σ : [a, b] −→ [0, L] é contı́nua e sobrejetora, temos,


pelo corolário 11.5 do capı́tulo 1, que g é contı́nuo. E, pelo teorema 5.1, g é retificável, uma vez
que f é retificável.

Para provar que g é parametrizado pelo comprimento de arco, tome s ∈ [0, L] arbitrário. Então
existe t ∈ [a, b] tal que σ(t) = s e, portanto, pelo teorema 5.1,

`(g|[0,s] ) = `(g ◦ σ|[a,t] ) = `(f|[a,t] ) = σ(t) = s . 

110 Instituto de Matemática UFF


O comprimento de arco como parâmetro

Corolário 5.1. Um caminho contı́nuo é retificável se, e só se, é a reparametrização de um


caminho lipschitziano.

Prova.
(⇐=) Como todo caminho lipschitziano é retificável, temos, pelo teorema 5.1, que toda repa-
rametrização de um caminho lipschitziano é retificável.

(=⇒) Se f é um caminho contı́nuo retificável, então f = g ◦ σ, onde g é parametrizado pelo


comprimento de arco.

Como kg(t) − g(s)k ≤ `(g|[s,t] ) = |t − s| , temos que g é lipschitziano. 

Observação 5.2. Seja f : [a, b] −→ Rn um caminho contı́nuo retificável, e seja um caminho


parametrizado pelo comprimento de arco g : [0, L] −→ Rn , do qual f é uma reparametrização.

Então, se f = g ◦ ψ, onde ψ : [a, b] −→ [0, L] é monótona não-decrescente e sobrejetora, temos:

ψ(t) = `(g|[0,ψ(t)] ) = `(g ◦ ψ|[a,t] ) = `(f|[a,t] ) .

Logo ψ é determinada de modo único e, portanto, o caminho g : [0, L] −→ Rn parametrizado


pelo comprimento de arco tal que f = g ◦ ψ, com ψ não-decrescente, também o é.

Agora, se ψ : [a, b] −→ [0, L] é monótona não-crescente e sobrejetora, temos que

ψ(t) = `(g|[0,ψ(t)] ) = `(g ◦ ψ|[t,b] ) = `(f|[t,b] ) = `(f|[a,b] ) − `(f|[a,t] ) = L − σ(t) ,

onde σ(t) = `(f|[a,t] ).

Logo f(t) = g(ψ(t)) = g(L − σ(t)) e, portanto, dado s = σ(t) ∈ [0, L], temos que
g(L − s) = f(t) = g̃(σ(t)) = g̃(s),

onde g̃ : [0, L] −→ Rn é o caminho parametrizado pelo comprimento de arco tal que f = g̃ ◦ σ.

Assim, g(s) = g̃(L − s) para todo s ∈ [0, L], ou seja, g é o caminho g̃ percorrido em sentido
contrário.

Observação 5.3. Um caminho pode ser retificável sem ser lipschitziano. Por exemplo, o

caminho f : [0, 1] −→ R2 , dado por f(t) = (t, t) é retificável, pois suas funções coordenadas

são monótonas, mas não é lipschitziano, uma vez que a função t 7−→ t, t ∈ [0, 1], não é
lipschitziana.

Definição 5.3. Dizemos que um caminho diferenciável f : [a, b] −→ Rn é regular quando


f 0 (t) 6= 0 para todo t ∈ [a, b].

J. Delgado - K. Frensel 111


Análise

Observação 5.4. Seja f : I −→ J uma função regular, ou seja, diferenciável com f 0 (t) 6= 0,
para todo t ∈ I, onde f(I) = J, I, J intervalos da reta.

Então, pelo Teorema do Valor Intermediário para a derivada (teorema de Darboux), temos que
ou f 0 (t) > 0 para todo t ∈ I e f é, então, monótona crescente, ou f 0 (t) < 0 para todo t ∈ I, sendo
f, portanto, monótona decrescente.

Em particular, para n = 1, um caminho f : I −→ Rn regular é injetivo, o que não é verdade, em


geral, quando n > 1.

Por exemplo, o caminho f : [a, b] −→ R2 dado por f(t) = (cos t, sen t), é regular, mas não é
injetivo se b − a > 2π.

Se f : I → J é regular e f(I) = J, temos, pelo Teorema da Função Inversa (ver Curso de Análise,
Vol I de E. Lima, pag. 274, corolário 6), que f−1 : J −→ I é diferenciável e
1
(f−1 ) 0 (y) = ,
f 0 (f−1 (y))
para todo y ∈ J.

E, também, se f ∈ Ck , então f−1 ∈ Ck , pois:


1
• Se f ∈ C1 , então f 0 ◦ f−1 é contı́nua, e, portanto, (f−1 ) 0 = é contı́nua, ou seja, f−1 é de
f0 ◦ f−1
classe C1 .

• Suponhamos, por indução, que se f ∈ Ck−1 , então f−1 ∈ Ck−1 .


1
Assim, se f ∈ Ck , então f 0 ∈ Ck−1 , e, portanto, (f−1 ) 0 = é de classe Ck−1 , ou seja, f−1 é
f0 ◦ f−1
de classe Ck .

Definição 5.4. Dizemos que uma função diferenciável bijetora f : I −→ J é um difeomorfismo


quando f−1 : J −→ I é diferenciável.

Em particular, todo difeomorfismo f : I −→ J é regular, pois f ◦ f−1 = Id e, pela regra da


cadeia, f 0 (f−1 (y))(f−1 ) 0 (y) = 1 para todo y ∈ J.

E, reciprocamente, se f : I −→ J = f(I) é uma função regular, então, pela observação


acima, f é um difeomorfismo.

No teorema abaixo, vamos considerar Rn com a norma euclidiana.

Teorema 5.4. Sejam f : [a, b] −→ Rn um caminho regular de classe Ck (k ≥ 1), L = `(f) e


g : [0, L] −→ Rn um caminho parametrizado pelo comprimento de arco do qual f = g ◦ σ é uma
reparametrização. Então g ∈ Ck e σ : [a, b] −→ [0, L] é um difeomorfismo de classe Ck . Em
particular, g = f ◦ σ−1 é uma reparametrização de f pelo comprimento de arco.

112 Instituto de Matemática UFF


A função-ângulo

Prova.
• Se σ é monótona não-decrescente, temos, pelaZobservação 5.2, que
t
σ(t) = `(f|[a,t] ) = kf 0 (s)k ds .
a

Logo σ (t) = kf (t)k > 0 para todo t ∈ [a, b]. Como k k é a norma euclidiana, temos que σ 0 é
0 0

diferenciável e
hf 00 (t), f 0 (t)i
σ 00 (t) = ,
kf 0 (t)k
caso f ∈ Ck , k ≥ 2.

Então, se f ∈ C1 , σ : [a, b] −→ [0, 1] é um difeomorfismo de classe C1 , pois σ 0 = k k ◦ f 0 é


contı́nua.

E, se f ∈ Ck , k ≥ 2, σ 0 é de classe Ck−1 , ou seja, σ : [a, b] −→ [0, L] é um difeomorfismo de


classe Ck .
hf 00 (t), f 0 (t)i
De fato, se k = 2, σ 00 é contı́nuo, pois σ 00 (t) = , t ∈ [a, b], e as funções f 0 e f 00 são
kf 0 (t)k
contı́nuas. Então σ é de classe C2 .

Suponhamos, por indução, que se f ∈ Ck , k ≥ 2, então σ 0 ∈ Ck−1 .

Seja f ∈ Ck+1 . Então f 0 , f 00 e σ 0 são de classe Ck−1 e, portanto, σ 00 é de classe Ck−1 . Assim, σ 0 é
de classe Ck .

• No caso em que σ é monótona não-crescente,


Z ou seja, t
σ(t) = L − kf 0 (s)k ds ,
a

verifica-se, de modo análogo ao anterior, que σ : [a, b] −→ [0, L] é um difeomorfismo de classe


Ck .

Em qualquer caso, g = f ◦ σ−1 : [0, L] −→ Rn é um caminho de classe Ck , pois f e σ−1 são de


classe Ck . 

6 A função-ângulo

Seja z : [a, b] −→ R2 um caminho tal que kz(t)k = 1 para todo t ∈ [a, b], onde k k é a
norma euclidiana. Podemos, portanto, escrever z : [a, b] −→ S1 .

Uma função-ângulo para o caminho z : [a, b] −→ S1 é uma função θ : [a, b] −→ R tal que
z(t) = (cos θ(t), sen θ(t)) para todo t ∈ [a, b].

J. Delgado - K. Frensel 113


Análise

Seja ξ : R −→ S1 a função exponencial dada por ξ(t) = (cos t, sen t) = eit .

Então θ : [a, b] −→ R é uma função-ângulo para o caminho z se, e só se, z = ξ ◦ θ.

Teorema 6.1. Todo caminho z : [a, b] −→ S1 de classe Cr , r ≥ 1, possui uma função-ângulo


de classe Cr . Mais precisamente, dado θ0 ∈ R tal que z(a) = (cos θ0 , sen θ0 ), z admite uma
única função-ângulo θ : [a, b] −→ R de classe Cr tal que θ(a) = θ0 .

Prova.
Unicidade (válida também para funções-ângulo contı́nuas).

Sejam θ, ϕ : [a, b] −→ R duas funções contı́nuas tais que ξ ◦ θ = ξ ◦ ϕ = z.

Então θ(t) − ϕ(t) é um múltiplo inteiro de 2π para todo t ∈ [a, b].


θ(t) − ϕ(t) θ(t) − ϕ(t)
Como a função t 7−→ é contı́nua e ∈ Z para todo t ∈ [a, b], temos que
2π 2π
θ(t) − ϕ(t) = 2πk para algum k ∈ Z fixo.

Logo, se ϕ(a) = θ(a) = θ0 , temos k = 0 e, portanto, ϕ(t) = θ(t) para todo t ∈ [a, b].

Existência

Seja z : [a, b] −→ S1 um caminho de classe Cr tal que z(a) = ξ(θ0 ).

Então, se z(t) = (x(t), y(t)), as funções coordenadas x, y : [a, b] −→ R são de classe Cr , com
x(a) = cos θ0 e y(a) = sen θ0 .

Como |z(t)| = 1 para todo t ∈ [a, b], temos que


1 d
hz 0 (t), z(t)i = hz(t), z(t)i = 0 ,
2 dt
para todo t ∈ [a, b], ou seja, z 0 (t) ⊥ z(t), para todo t ∈ [a, b].

Portanto, z 0 (t) é um múltiplo do vetor w(t) = (−y(t), x(t)) para todo t ∈ [a, b].

Assim, para todo t ∈ [a, b], existe λ(t) ∈ R tal que z 0 (t) = λ(t) w(t), ou seja, x 0 (t) = −λ(t) y(t)
e y 0 (t) = λ(t) x(t).

Além disso, como λ(t) = hw(t), z 0 (t)i, para todo t ∈ [a, b], temos que λ é de classe Cr−1 .

Seja θ : [a, b] −→ R definida por Zt


θ(t) = θ0 + λ(s) ds .
a

Então θ(a) = θ0 e θ 0 (t) = λ(t) para todo t ∈ [a, b]. Logo θ é de classe Cr .

Agora vamos provar que x(t) = cos θ(t) e y(t) = sen θ(t) para todo t ∈ [a, b].

De fato, como θ 0 = λ, x 0 = −λy e y 0 = λx, temos que:

114 Instituto de Matemática UFF


A função-ângulo

• ( x(t) cos θ(t) + y(t) sen θ(t) ) 0 = x 0 (t) cos θ(t) − x(t) θ 0 (t) sen θ(t)
+y 0 (t) sen θ(t) + y(t) θ 0 (t) cos θ(t)
= −λ(t) y(t) cos θ(t) − x(t) λ(t) sen θ(t)
+λ(t) x(t) sen θ(t) + y(t) λ(t) cos θ(t) = 0

• ( y(t) cos θ(t) − x(t) sen θ(t) ) 0 = y 0 (t) cos θ(t) − y(t) θ 0 (t) sen θ(t)
−x 0 (t) sen θ(t) − x(t) θ 0 (t) cos θ(t)
= λ(t) x(t) cos θ(t) − y(t) λ(t) sen θ(t)
+λ(t) y(t) sen θ(t) − x(t) λ(t) cos θ(t) = 0 ,
para todo t ∈ [a, b]. Então,
• x(t) cos θ(t) + y(t) sen θ(t) = x(a) cos θ(a) + y(a) sen θ(a)
= cos2 θ0 + sen2 θ0 = 1 (I)
e
• y(t) cos θ(t) − x(t) sen θ(t) = y(a) cos θ(a) − x(a) sen θ(a)
= sen θ(a) cos θ(a) − cos θ(a) sen θ(a) = 0 , (II)
para todo t ∈ [a, b].

Como, para todo t ∈ [a, b],


{ ( cos θ(t), sen θ(t) ) , ( − sen θ(t), cos θ(t) ) }

é uma base ortonormal de R2 , temos que


z(t) = (x(t), y(t))
= h(x(t), y(t)), (cos θ(t), sen θ(t))i (cos θ(t), sen θ(t))
+h(x(t), y(t)), (− sen θ(t), cos θ(t))i (− sen θ(t), cos θ(t)) ,
para todo t ∈ [a, b].

Logo, por (I) e (II), obtemos


z(t) = ( cos θ(t), sen θ(t) ) ,

para todo t ∈ [a, b]. 

Corolário 6.1. Seja f : [a, b] −→ R2 − {0} um caminho de classe Cr , r ≥ 1. Dado θ0 ∈ R tal


que f(a) = kf(a)k (cos θ0 , sen θ0 ), existe uma única função de classe Cr , θ : [a, b] −→ R, tal que
θ(a) = θ0 e f(t) = kf(t)k (cos θ(t), sen θ(t)), para todo t ∈ [a, b].

Prova.
f(t)
Basta tomar a função-ângulo θ do caminho z(t) = com θ(a) = θ0 , uma vez que, pela
kf(t)k
observação 1.8, z é de classe Cr . 

J. Delgado - K. Frensel 115


Análise

Corolário 6.2. Seja f : [a, b] −→ R2 −{0} um caminho de classe Cr por partes. Dado θ0 ∈ R tal
que f(a) = kf(a)k (cos θ0 , sen θ0 ), existe uma única função de classe Cr por partes θ : [a, b] −→
R tal que θ(a) = θ0 e f(t) = kf(t)k(cos θ(t), sen θ(t)), para todo t ∈ [a, b].

Prova.
Seja P = {t0 = a < t1 < . . . < tk = b} uam partição do intervalo [a, b] tal que f|[ti−1 ,ti ] é de
classe Cr , para todo i = 1, . . . , k.

Então, pelo teorema anterior, f|[a,t1 ] possui uma função-ângulo θ1 : [a, t1 ] −→ R de classe Cr tal
que θ1 (a) = θ0 . Como f|[t1 ,t2 ] é de classe Cr , existe uma função-ângulo θ2 : [t1 , t2 ] −→ R, com
θ2 (t1 ) = θ1 (t1 ), para o caminho f|[t1 ,t2 ] .

Prosseguindo deste modo, obtemos, para cada i = 2, . . . , k, uma função-ângulo de classe Cr


θi : [ti−1 , ti ] −→ R para o caminho f|[ti−1 ,ti ] , com θi (ti−1 ) = θi−1 (ti−1 ).

Então, a função θ : [a, b] −→ R, definida por θ(t) = θi (t), se t ∈ [ti−1 , ti ], é contı́nua e θ|[ti−1 ,ti ] é
de classe Cr para todo i = 1, . . . , k. Logo θ é de classe Cr por partes e é a única função-ângulo
de classe Cr por partes do caminho f tal que θ(a) = θ0 . 

Observação 6.1. Seja f : [a, b] −→ R2 − {0} um caminho de classe Cr , r ≥ 1. Se uma função


contı́nua θ : [a, b] −→ R é tal que f(t) = kf(t)k (cos θ(t), sen θ(t)) para todo t ∈ [a, b], então θ é
uma função de classe Cr .
f(t)
De fato, seja ϕ : [a, b] −→ R a função-ângulo de classe Cr para o caminho z(t) = tal
kf(t)k
que ϕ(a) = θ(a). Como a unicidade no teorema 6.1 foi provada para funções-ângulo contı́nuas,
temos que θ = ϕ e, portanto, θ é de classe Cr .

Observação 6.2. Se z : [a, b] −→ S1 é um caminho contı́nuo e z(a) = (cos θ0 , sen θ0 ), então


existe uma única função-ângulo θ : [a, b] −→ R contı́nua tal que θ(a) = θ0 e
z(t) = (cos θ(t), sen θ(t)) ,

para todo t ∈ [a, b] (ver exercı́cio 7.1).

116 Instituto de Matemática UFF


Capı́tulo 3

Funções reais de n variáveis

1 Derivadas parciais

Definição 1.1. Seja f : U −→ R uma função real definida num subconjunto aberto U ⊂ Rn .
Dado a ∈ U, a i−ésima derivada parcial de f no ponto a, 1 ≤ i ≤ n, é o limite
∂f f(a + tei ) − f(a)
(a) = lim ,
∂xi t→0 t
quando tal limite existe. Usa-se também a notação ∂i f(a).

Observação 1.1. Dados o ponto a ∈ U e i ∈ {1, . . . , n}, a imagem do caminho de classe C∞


λ : R −→ Rn , λ(t) = a + tei , é a reta que passa por a e é paralela ao i−ésimo eixo. Como U é
aberto e a ∈ U, existe ε > 0 tal que t ∈ (−ε, ε) =⇒ λ(t) = a + tei ∈ U.

A i−ésima derivada parcial de f no ponto a é, portanto, a derivada da função f ◦ λ : (−ε, ε) −→ R


∂f
no ponto t = 0, ou seja, (a) = (f ◦ λ) 0 (0), pois
∂xi
f ◦ λ(t) − f ◦ λ(0) f(a + tei ) − f(a) ∂f
(f ◦ λ) 0 (0) = lim = lim = (a) .
t→0 t t→0 t ∂xi
• Assim, o cálculo prático da i−ésima derivada parcial de uma função real f(x1 , . . . , xn ) se faz
considerando todas as variáveis como se fossem constantes, exceto a i−ésima, e aplicando as
regras usuais de derivação em relação a esta variável.

Observação 1.2. Quando n = 2, o gráfico de f, G = {(x, y, f(x, y)), | (x, y) ∈ Dom(f)} é uma
”superfı́cie” em R3 , e a restrição de f ao segmento de reta que passa por c = (a, b) e é paralelo
ao eixo das abscissas tem como gráfico uma curva plana x 7−→ (x, b, f(x, b)) obtida na superfı́cie
∂f
fazendo y constante igual a b. Portanto, (a, b) é a inclinação da reta tangente a esta curva,
∂x
no ponto (a, b, f(a, b)), em relação ao plano horizontal, uma vez que:

117
Análise

∂f
Fig. 1: ∂x
(a, b) é a inclinação da reta r

 ∂f

 ∂f

r= 1, 0, (a, b) t + (a, b, f(a, b)) | t ∈ R = x, b, (a, b)(x − a) + f(a, b) |x ∈ R .
∂x ∂x
∂f
Observação 1.3. A i-ésima derivada parcial dá informações sobre o comportamento de
∂xi
f ao longo de um segmento de reta contido em U e paralelo ao i−ésimo eixo.

• Por exemplo, se f : U −→ R está definida num aberto U ⊂ R2 , J = {(a, t) | t ∈ [0, 1]} ⊂ U e


∂f
(a, t) > 0 para todo t ∈ [0, 1], então f é crescente ao longo de J, ou seja,
∂y
0 ≤ s < t ≤ 1 =⇒ f(a, s) < f(a, t).

Definição 1.2. Dizemos que uma função f : U ⊂ Rn −→ R não depende da i−ésima variável
quando a, b ∈ U, b = a + tei =⇒ f(a) = f(b).


Neste caso, existe f(a) em todos os pontos a ∈ U e é igual a zero. Mas a recı́proca
∂xi
nem sempre é verdadeira, como veremos abaixo.

Definição 1.3. Um conjunto U ⊂ Rn é chamado i−convexo (1 ≤ i ≤ n) quando:


a, b ∈ U, b = a + tei =⇒ [a, b] = {a + sei | s ∈ [0, t]} ⊂ U.

∂f
• Assim, se U ⊂ Rn é um aberto i−convexo e f : U −→ R é uma função tal que (a) = 0
∂xi
para todo a ∈ U, então f independe da i−ésima variável.

De fato, se a, b ∈ U, b = a + t0 ei , então λ(s) = a + sei ∈ U, para todo s ∈ [0, t0 ], e, portanto,


existe ε > 0 tal que λ(s) ∈ U para todo s ∈ (−ε, t0 + ε).
∂f
Além disso, como f ◦ λ é derivável em (−ε, t0 + ε) e (f ◦ λ) 0 (s) = (a + sei ) = 0 para todo
∂xi
s ∈ (−ε, t0 + ε), então f ◦ λ(s) = f ◦ λ(0) para todo s ∈ (−ε, t0 + ε). Logo f(b) = f(a).

118 Instituto de Matemática UFF


Derivadas parciais

Observação 1.4. Em R2 , dizemos horizontalmente e verticalmente convexo, em vez de


1−convexo e 2−convexo, respectivamente.

Exemplo 1.1. Seja Γ = {(x, 0) ∈ R2 | x ≥ 0} o semi-eixo positivo fechado das abscissas. Então
U = R2 − Γ é aberto, horizontalmente convexo, mas não é verticalmente convexo.

Fig. 2: U = R2 − Γ

Seja f : U −→ R a função definida por f(x, y) = x2 , se x > 0 e y > 0, e f(x, y) = 0, se x ≤ 0 ou


∂f
y ≤ 0. Então f possui derivada parcial (p) = 0 para todo ponto p ∈ U, pois:
∂y
0 = {(0, t) | t > 0} ;
• f|r+0 ≡ 0 , onde r+

0 = {(0, t) | t < 0} ;
• f|r−0 ≡ 0 , onde r−

• f|rx0 ≡ 0 , onde rx0 = {(x0 , t) | t ∈ R} e x0 < 0;

x0 = {(x0 , t) | t > 0} , rx0 = {(x0 , t) | t < 0} e x0 > 0.


• f|r+x ≡ x20 e f|r−x ≡ 0 , onde r+ −
0 0

Mas f não é independente da segunda variável, pois se x > 0 e y > 0, então f(x, y) = x2 > 0 e
f(x, −y) = 0. 

Observação 1.5. A existência apenas das derivadas parciais não permite conclusões sobre
o comportamento n−dimensional da função. Por exemplo, a existência de todas as derivadas
parciais num ponto não implica a continuidade da função nesse ponto.

xy
Exemplo 1.2. Seja f : R2 −→ R, definida por f(x, y) = , se (x, y) 6= (0, 0), e f(0, 0) = 0.
x2 + y2
Se z = (x, y) 6= (0, 0), temos que:
∂f y(x2 + y2 ) − xy(2x) y3 − x 2 y ∂f x(x2 + y2 ) − xy(2y) x3 − xy2
(z) = = e (z) = = .
∂x (x2 + y2 )2 (x2 + y2 )2 ∂y (x2 + y2 )2 (x2 + y2 )2
E, na origem:
∂f f(t, 0) − f(0, 0) ∂f f(0, t) − f(0, 0)
(0, 0) = lim =0 e (0, 0) = lim = 0.
∂x t→0 t ∂y t→0 t
Assim, f possui derivadas parciais em todos os pontos de R2 . Mas f não é contı́nua na origem.

J. Delgado - K. Frensel 119


Análise

ab
Mais ainda, não existe lim f(x, y), pois f(at, bt) = , para todo t ∈ R e todo (a, b) 6=
(x,y)−→(0,0) a2 + b2
1 2
(0, 0), e, portanto, lim f(t, t) = 6= = lim f(t, 2t), por exemplo. 
t→0 2 5 t→0

2 Derivadas direcionais

Definição 2.1. Sejam f : U −→ R uma função definida no aberto U ⊂ Rn , a ∈ U e v ∈ Rn . A


derivada direcional de f no ponto a segundo o vetor v é o limite:
∂f f(a + tv) − f(a)
(a) = lim ,
∂v t→0 t
quando tal limite existe.

∂f
Observação 2.1. Se v = 0, então (a) = 0 para todo a ∈ U.
∂v

Observação 2.2. As derivadas parciais são casos particulares das derivadas direcionais,
∂f ∂f
pois: (a) = (a) é a derivada direcional de f no ponto a segundo o vetor ei .
∂xi ∂ei

Observação 2.3. Dados a ∈ U e v ∈ Rn , existe ε > 0 tal que a + tv ∈ U para todo t ∈ (−ε, ε).
Assim, se λ : (−ε, ε) −→ U é o caminho retilı́neo, com λ(0) = a e λ 0 (t) = v para todo t ∈ (−ε, ε),
∂f
temos que: (a) = (f ◦ λ) 0 (0).
∂v

Fig. 3: f ao longo do caminho retilı́neo λ

xy
Exemplo 2.1. Seja f : R2 −→ R a função dada por f(x, y) = , (x, y) 6= (0, 0), e f(0, 0) =
x2 + y2
∂f
0. Então f possui as derivadas direcionais (0, 0) para todo v = (α, 0) ou v = (0, β), as quais
∂v
são nulas, mas f não possui derivada direcional na origem segundo um vetor v = (α, β), com
α 6= 0 e β 6= 0, pois:

120 Instituto de Matemática UFF


Derivadas direcionais

∂f f(tα, 0) − f(0, 0)
• (0, 0) = lim = 0, v = (α, 0)
∂v t→0 t
∂f f(0, tβ) − f(0, 0)
• (0, 0) = lim = 0, v = (0, β) ,
∂v t→0 t
e o limite
f(αt, βt) − f(0, 0) αβ 1
lim = lim 2
t→0 t t→0 α + β2 t

não existe. 

∂f
Observação 2.4. Se α ∈ R − {0}, então existe (a) num ponto a se, e somente se, existe
∂v
∂f
(a) e, no caso afirmativo, temos:
∂(αv)
∂f f(a + tαv) − f(a) f(a + tαv) − f(a) ∂f
(a) = lim = α lim = α (a) .
∂(αv) t→0 t t→0 αt ∂v
∂f
Mas, pode ocorrer que a derivada direcional exista em todos os pontos do domı́nio de f,
∂v
segundo todos os vetores v ∈ Rn , sem que se tenha necessariamente:
∂f ∂f ∂f
(a) = (a) + (a) .
∂(v + w) ∂v ∂w

Exemplo 2.2. Seja g : R2 −→ R a função dada por


x2 y
g(x, y) = , se (x, y) 6= (0, 0), e g(0, 0) = 0.
x2 + y2
∂g
Pode-se provar, a partir da definição, que existe (a) para todo a ∈ R2 e todo v ∈ R2 . Em
∂v
particular, na origem:
∂g g(tα, tβ) − g(0, 0) α2 β
• (0, 0) = lim = 2 , se v = (α, β) 6= (0, 0).
∂v t→0 t α + β2
e
∂g
• (0, 0) = 0 , se v = (0, 0).
∂v
Evidentemente, para a = (0, 0), não vale
∂g ∂g ∂g
(a) + (a) = (a) .
∂v ∂w ∂(v + w)
Por exemplo, para v = (1, 1) e w = (1, 2):
∂g 1 ∂g 2 ∂g 12
(0, 0) = , (0, 0) = , e (0, 0) = ,
∂v 2 ∂w 5 ∂(v + w) 13
∂g ∂g ∂g
e, portanto, (0, 0) + (0, 0) 6= (0, 0) . 
∂v ∂w ∂(v + w)

∂f
Observação 2.5. Na seção 3, mostraremos que depende linearmente de v se f é dife-
∂v
renciável, uma hipótese mais forte do que possuir derivadas direcionais.

J. Delgado - K. Frensel 121


Análise

A função g do exemplo anterior é contı́nua (ver exercı́cio 8:27, capı́tulo 1), mas não é
verdade, em geral, que a existência de todas as derivadas direcionais implique em continuidade.

x3 y
Exemplo 2.3. Seja h : R2 −→ R a função definida por h(x, y) = , se (x, y) 6= (0, 0), e
x6 + y2
h(0, 0) = 0.

Para (a, b) 6= (0, 0) e v = (α, β) ∈ R2 , temos que, se λ(t) = (a, b) + t(α, β) = (a + tα, b + tβ),
então:
(a + tα)3 (b + tβ)
(h ◦ λ)(t) =
(a + tα)6 + (b + tβ)2
e, portanto, a derivada (h ◦ λ) 0 (t) é dada por:
3(a + tα)2 α(b + tβ) + β(a + tα)3 (a + tα)6 + (b + tβ)2 − (a + tα)3 (b + tβ) 6α(a + tα)5 + 2β(b + tβ)
  
2
( (a + tα)6 + (b + tβ)2 ) .
Logo,
∂h (3a2 bα + βa3 )(a6 + b2 ) − a3 b(6αa5 + 2βb)
(a, b) = (h ◦ λ) 0 (0) =
∂v (a6 + b2 )2
   
−3a8 b + 3a2 b3 a9 − a3 b2
= α+ β,
(a6 + b2 )2 (a6 + b2 )2
E para (a, b) = (0, 0) e v = (α, β) ∈ R2 ,

∂h h(tα, tβ) t4 α3 β tα3 β


(0, 0) = lim = lim 6 6 = lim = 0, se β 6= 0;
∂v t→0 t t→0 t(t α + t2 β2 ) t→0 t4 α6 + β2

∂h h(tα, 0)
e (0, 0) = lim = lim 0 = 0 , se β = 0 .
∂v t→0 t t→0

∂h
Assim, existem as derivadas direcionais (a), para todo a ∈ R2 e todo v ∈ R2 , e dependem
∂v
linearmente de v.
1
Em R2 − {(0, 0)}, a função h é contı́nua, mas h não é contı́nua na origem, pois h(x, x3 ) = para
2
todo x 6= 0. 

• Outra propriedade desejável para um conceito adequado de derivada de uma função é que a
composta de duas funções deriváveis seja também derivável.

x3 y
Exemplo 2.4. Seja ϕ : R2 −→ R dada por ϕ(0, 0) = 0 e ϕ(x, y) = , se (x, y) 6= (0, 0) .
x4 + y2
Em R2 − {(0, 0)}, ϕ é contı́nua, e em (0, 0), ϕ também é contı́nua,
pois, para (x, y) 6= (0, 0),
x 2 y
| ϕ(x, y) | = x p ≤ |x| ,

p
4
x +y 2 4
x +y 2

e, portanto, lim ϕ(x, y) = 0 .


(x,y)→(0,0)

Além disso, para todo v = (α, β) ∈ R2 , β 6= 0,

122 Instituto de Matemática UFF


Derivadas direcionais

∂ϕ ϕ(tα, tβ) tα3 β ∂ϕ ϕ(tα, 0)


(0, 0) = lim = lim 2 4 = 0, e (0, 0) = lim = lim 0 = 0 ,
∂v t→0 t t→0 t α + β2 ∂v t→0 t t→0

para v = (α, 0) ∈ R2 .

Portanto, todas as derivadas direcionais existem na origem e dependem linearmente de v. De


modo análogo ao exemplo anterior, podemos calcular as derivadas direcionais de ϕ num ponto
(a, b) ∈ R2 − {(0, 0)} e verificar que elas dependem linearmente de v.

Entretanto, se considerarmos o caminho derivável λ : R −→ R2 , dado por λ(t) = t, t2 sen 1t , se




t 6= 0, λ(0) = (0, 0), temos que f ◦ λ : R −→ R não é derivável em t = 0, pois o limite


ϕ t, t2 sen 1t t5 sen 1t sen 1t

ϕ(λ(t)) − ϕ(λ(0))
lim = lim = lim 5 = lim ,
t→0 t t→0 t t→0 t + t5 sen 1 t→0 1 + sen 1
t t
não existe, uma vez que:
sen t1n 1
• lim 1
= lim 0 = 0 , quando tn = ,
n→∞ 1 + sen tn
n→∞ nπ

sen t1n 1 1 2
e • lim = lim = , quando tn = .
n→∞ 1 + sen 1
tn
n→∞ 2 2 (4n + 1)π 

• No entanto, a existência de derivadas direcionais permite demonstrar o Teorema do Valor


Médio para funções reais de n variáveis sob a forma de igualdade, como no caso de uma só
variável.

Teorema 2.1. (do Valor Médio)


Seja f : U −→ R uma função definida no aberto U ⊂ Rn . Se [a, a + v] ⊂ U , f|[a,a+v] é contı́nua
∂f
e existe a derivada direcional (x) para todo x ∈ (a, a + v), então existe θ0 ∈ (0, 1) tal que
∂v
∂f
f(a + v) − f(a) = (a + θ0 v)
∂v

Prova.
Seja λ : [0, 1] −→ U o caminho C∞ dado por λ(t) = a + tv, t ∈ [0, 1]. Então a função
f ◦ λ : [0, 1] −→ R é contı́nua em [0, 1] e derivável em (0, 1), pois, para θ ∈ (0, 1),
(f ◦ λ)(θ + t) − f ◦ λ(θ) f(a + (θ + t)v) − f(a + θv)
(f ◦ λ) 0 (θ) = lim = lim
t→0 t t→0 t
f((a + θv) + tv) − f(a + θv) ∂f
= lim = (a + θv)
t→0 t ∂v
Assim, pelo Teorema do Valor Médio, para funções reais de uma variável real, existe θ0 ∈ (0, 1)
tal que (f ◦ λ)(1) − (f ◦ λ)(0) = (f ◦ λ) 0 (θ0 ), ou seja, existe θ0 ∈ (0, 1) tal que
∂f
f(a + v) − f(a) = (a + θ0 v) . 
∂v

J. Delgado - K. Frensel 123


Análise

∂f
Observação 2.6. A existência de em todo ponto de (a, a + v) garante a continuidade de
∂v
f|(a,a+v) .

De fato, como foi provado acima, f◦λ é derivável em (0, 1) e, portanto, se xk = a+tk v, tk ∈ (0, 1),
é uma sequência de pontos de (a, a + v) que converge para o ponto a + t0 v ∈ (a, a + v), então
f(xk ) = f(a + tk v) = f ◦ λ(tk ) −→ f ◦ λ(t0 ) = f(a + t0 v) ,
kxk − ak ka + t0 v − ak
uma vez que tk = −→ = t0 .
kvk kvk

Corolário 2.1. Seja U ⊂ Rn aberto e conexo. Se f : U −→ R possui derivadas direcionais em


∂f
todo ponto x ∈ U e (x) = 0, para todo x ∈ U e todo v ∈ Rn , então f é constante.
∂v

Prova.
Seja a ∈ U fixo.

Afirmação: se [a, b] ⊂ U, então f|[a,b] é contı́nua.

• De fato, como a, b ∈ U e U é aberto, existe ε > 0 tal que o segmento


( a − ε(b − a), a + (1 + ε)(b − a) ) = { a + t(b − a) | t ∈ (−ε, 1 + ε) }

está contido em U.
∂f
Além disso, como existe (x) para todo x ∈ U, temos, pela observação anterior, que a
∂(b − a)
restrição f|(a−ε(b−a),a+(1+ε)(b−a)) é contı́nua.

Portanto, f|[a,b] é contı́nua.

• Resulta, então, do Teorema do Valor Médio, que se [a, b] ⊂ U, existe θ0 ∈ (0, 1) tal que
∂f
f(b) − f(a) = f(a + (b − a)) − f(a) = (a + θ0 (b − a)) = 0 ,
∂(b − a)
ou seja, f(b) = f(a).

Por outro lado, se x ∈ U existe, pelo teorema 13.8 do Capı́tulo 1, uma poligonal contida em U
com vértices a0 = a, a1 , . . . , ak = x.

Temos, então, sucessivamente, que


f(a) = f(a0 ) = f(a1 ) = . . . = f(ak ) = f(x),

ou seja, f(x) = f(a) para todo x ∈ U. Logo f é constante. 


∂f
Observação 2.7. Neste corolário, basta que as derivadas parciais , i = 1, . . . , n, existam
∂xi
e sejam nulas em todos os pontos do aberto conexo U ⊂ Rn , pois, pela observação 13.5 do
Capı́tulo 1, dados a, b ∈ U, existe uma poligonal contida em U ligando os pontos a e b com
lados paralelos a um dos eixos coordenados.

124 Instituto de Matemática UFF


Funções diferenciáveis

3 Funções diferenciáveis

A definição de função diferenciável que daremos abaixo é devida a Maurice Fréchet (França,
1878-1973) e Otto Stolz (Áustria, 1842-1905). Ela é uma extensão adequada do conceito de
função derivável de uma só variável para funções de n variáveis.

Definição 3.1. Seja f : U −→ R uma função definida no aberto U ⊂ Rn . Dizemos que f é


diferenciável no ponto a ∈ U quando existem constantes A1 , . . . , An ∈ R tais que, para todo
vetor v = (α1 , . . . , αn ) ∈ Rn , com a + v ∈ U, temos que:
f(a + v) = f(a) + A1 α1 + . . . + An αn + r(v) ,
r(v)
onde lim = 0.
v→0 kvk

Definição 3.2. Dizemos que f : U −→ R é diferenciável quando f é diferenciável em todos os


pontos de U.

Observação 3.1. Seja f : U ⊂ Rn −→ R diferenciável no ponto a. Então, se v = tei , ou seja,


αj = 0, j 6= i, αi = t, temos que
f(a + tei ) − f(a) r(tei ) r(tei )
= Ai + = Ai ± , i = 1, . . . , n .
t t ktei k
r(tei ) ∂f
Logo, como lim = 0, para todo i = 1, . . . , n, obtemos que a derivada parcial (a) existe
t→0 ktei k ∂xi
e é igual a Ai , para todo i = 1, . . . , n.

• Assim, f : U ⊂ Rn −→ R é diferenciável no ponto a ∈ U se, e só se, as derivadas parciais


∂f
(a), i = 1, . . . , n, existem, e para todo v = (α1 , . . . , αn ) ∈ Rn tal que a + v ∈ U, temos
∂xi
∂f ∂f
f(a + v) = f(a) + (a)α1 + . . . + (a)αn + r(v) ,
∂x1 ∂xn
r(v)
onde lim = 0.
v→0 kvk

Observação 3.2. Se f : U ⊂ Rn −→ R é diferenciável no ponto a ∈ U, então f é contı́nua no


ponto a.
r(v) r(v)
De fato, como lim implica que lim r(v) = lim kvk = 0, temos que
v→0 kvk v→0 v→0 kvk

lim f(x) = lim (f(a) + A1 (x1 − a1 ) + . . . + An (xn − an ) + r(x − a)) = f(a) ,


x→a x→a

uma vez que v = x − a −→ 0 quando x → a.

r(v)
Observação 3.3. A condição lim = 0 significa que r(v) tende a zero mais rapidamente
v→0 kvk

J. Delgado - K. Frensel 125


Análise

do que v. Isto se exprime dizendo-se que r(v) é um infinitésimo de ordem superior a v. Assim, f
é diferenciável no ponto a ∈ U quando f(a + v) − f(a) é igual a um funcional linear
Xn
∂f
(a) αi + (um resto infinitamente pequeno em relação a v).
∂xi
i=1

r(v)
Observação 3.4. Fazendo ρ(v) = se v 6= 0, a + v ∈ U, e ρ(0) = 0, temos que:
kvk
∂f
f : U −→ R é diferenciável no ponto a ∈ U se, e só se, todas as derivadas parciais (a),
∂xi
i = 1, . . . , n, existem no ponto a e, para todo v = (α1 , . . . , αn ) ∈ Rn tal que a + v ∈ U vale:
X
n
∂f
f(a + v) = f(a) + (a)αi + ρ(v) kvk , onde lim ρ(v) = 0.
∂xi v→0
i=1

Ou seja, f é diferenciável no ponto a ∈ U se, e só se, a função real


ρ : Va = {v ∈ Rn | a + v ∈ U} −→ R

é contı́nua no ponto v = 0. Note que o conjunto Va é aberto em Rn e 0 ∈ Va .

Observação 3.5. Ser ou não ser diferenciável, independe da norma considerada em Rn .

Observação 3.6. Para funções f : I −→ R definidas num intervalo aberto I ⊂ R, diferenciabi-


lidade é o mesmo que derivabilidade, pois + At + ρ(t) |t|, ou seja,
 se f(a + t) = f(a) 
f(a + t) − f(a)
ρ(t) = ± −A ,
t
então, lim ρ(t) = 0 se, e só se, f é derivável no ponto a e f 0 (a) = A.
t→0

Observação 3.7. Se f : U ⊂ Rn −→ R é diferenciável no ponto a ∈ U, então f possui


derivada direcional no ponto a segundo qualquer vetor v = (α1 , . . . , αn ) e
∂f X
n
∂f
(a) = (a) αi .
∂v ∂xi
i=1

De fato, seja v ∈ Rn . Então existe ε > 0 tal que a + tv ∈ U para todo t ∈ (−ε, ε), e
Xn
∂f
f(a + tv) = f(a) + (a)tαi + ρ(tv) |t| kvk .
∂xi
i=1

Como lim ρ(tv) = 0, temos que


t→0
∂f f(a + tv) − f(a) X
n
∂f X
n
∂f
(a) = lim = (a)αi + lim (±ρ(tv) kvk) = (a)αi .
∂v t→0 t ∂xi t→0 ∂xi
i=1 i=1
∂f
Então (a) existe e depende linearmente de v, ou seja:
∂v
∂f ∂f
• (a) = α (a) , para todo α ∈ R e v ∈ Rn ,
∂(αv) ∂v
e

126 Instituto de Matemática UFF


Funções diferenciáveis

∂f ∂f ∂f
• (a) = (a) + (a) , para todos v, w ∈ Rn .
∂(v + w) ∂v ∂w

Teorema 3.1. (Regra da cadeia)


Sejam U ⊂ Rm e V ⊂ Rn abertos, f = (f1 , . . . , fn ) : U −→ Rn tal que f(U) ⊂ V e cada função
coordenada fi : U −→ R é diferenciável no ponto a ∈ U. Se g : V −→ R é diferenciável no ponto
b = f(a), então a função composta g ◦ f : U −→ R é diferenciável no ponto a e suas derivadas
parciais são:
∂(g ◦ f) X
n
∂g ∂f
(a) = (f(a)) k (a) , i = 1, . . . , m .
∂xi ∂yk ∂xi
k=1

Prova.
Seja o aberto U0 = {v ∈ Rm | a + v ∈ U} que contém o ponto v = 0.

Para cada v = (α1 , . . . , αm ) ∈ U0 e k = 1, . . . , n, temos que


Xm
∂fk
fk (a + v) = fk (a) + (a) αi + ρk (v) kvk , (I)
∂xi
i=1

onde cada ρk : U0 −→ R é contı́nua no ponto 0 e ρk (0) = 0.

Seja a aplicação ω = (β1 , . . . , βn ) : U0 −→ Rn contı́nua no ponto 0, com ω(0) = 0, cujas funções


coordenadas βk : U0 −→ R são dadas por:
X
m
∂fk
βk (v) = (a)αi + ρk (v) kvk . (II)
∂xi
i=1

|αi |
Considerando Rm com a norma da soma, por exemplo, temos que ≤ 1 para todo
kvkS
v ∈ Rm − {0}.
|βk (v)| kω(v)kS
Logo, cada , k = 1, . . . , n, e, portanto, , é limitada em U1 − {0}, onde U1 é um
kvkS kvkS
aberto contido em U0 tal que 0 ∈ U1 e ρk |U1 limitada para todo k = 1, . . . , n.

Seja V0 = {w ∈ Rn | w + b ∈ V}. Como V0 é um aberto que contém o vetor 0, ω é contı́nua no


ponto 0 e ω(0) = 0, existe um aberto U2 ⊂ U1 tal que 0 ∈ U2 e ω(U2 ) ⊂ V0 .

Seja v ∈ U2 . Então ω(v) + b ∈ V e, como g : V −→ R é diferenciável em b = f(a), temos, por


(I), que
X
n
∂g
g(f(a + v)) = g(f(a) + ω(v)) = g(b + ω(v)) = g(b) + (b)βk (v) + σ(ω(v)) kω(v)k ,
∂yk
k=1

onde σ ◦ ω : U2 −→ R é uma função contı́nua no ponto 0, com σ ◦ ω(0) = 0.

Logo, por (II),


X X
n
" m
#
∂g ∂fk
(g ◦ f)(a + v) = g ◦ f(a) + (b) (a)αi + ρk (v)kvk + σ ◦ ω(v) kω(v)k ,
∂yk ∂xi
k=1 i=1

J. Delgado - K. Frensel 127


Análise

ou seja,
X
m
(g ◦ f)(a + v) = (g ◦ f)(a) + Ai αi + R(v) ,
i=1

X
n
∂g ∂fk X
n
∂g
onde Ai = (b) (a) e R(v) = (b) ρk (v) kvk + σ ◦ ω(v) kω(v)k.
∂yk ∂xi ∂yk
k=1 k=1

Como,
R(v) X
n
∂g kω(v)k
= (b) ρk (v) + σ ◦ ω(v) ,
kvk ∂yk kvk
k=1

R(v) kω(v)k
temos que lim = 0, pois lim ρk (v) = 0, k = 1, . . . , n, lim σ ◦ ω(v) = 0 e é limitado em
v→0 kvk v→0 v→0 kvk
U2 − {0}.

Logo g ◦ f é diferenciável no ponto a e


∂(g ◦ f) X
n
∂g ∂f
(a) = (f(a)) k (a) ,
∂xi ∂yk ∂xi
k=1

para todo i = 1, . . . , m. 

Corolário 3.1. Se f : U ⊂ Rn −→ R é diferenciável no ponto b ∈ U e λ = (λ1 , . . . , λn ) :


(a − ε, a + ε) −→ Rn é um caminho diferenciável com λ(a) = b, então a função composta
f ◦ λ : (a − ε, a + ε) −→ R é diferenciável no ponto a e
Xn
∂f
0
(f ◦ λ) (a) = (b) λi0 (a) .
∂xi
i=1

 dx dxn

1
Observação 3.8. Se escrevemos λ(t) = (x1 (t), . . . , xn (t)), então λ 0 (t) = ,..., .
dt dt
df
Indicando com a derivada da função composta t 7−→ f ◦ λ(t) = f(x1 (t), . . . , xn (t)), a regra da
dt
cadeia nos dá que:
df X
n
∂f dxi
= (notação clássica do Cálculo Diferencial.)
dt ∂xi dt
i=1

Corolário 3.2. Sejam U ⊂ Rn um conjunto aberto, I ⊂ R um intervalo aberto, f : U −→ R uma


função diferenciável no ponto a ∈ U, com f(U) ⊂ I, g : I −→ R diferenciável no ponto b = f(a).

Então g ◦ f : U −→ R é diferenciável no ponto a e


∂(g ◦ f) ∂f
(a) = g 0 (b) (a) ,
∂xi ∂xi
para todo i = 1, . . . , n.

Observação 3.9. Pela Regra da Cadeia, se f : U ⊂ Rn −→ R é diferenciável no ponto a ∈ U,


∂f
para calcularmos a derivada direcional (a) = (f ◦ λ) 0 (0) não é necessário nos restringir ao
∂v

128 Instituto de Matemática UFF


Funções diferenciáveis

caminho retilı́neo λ(t) = a + tv. Ou seja, se λ : (−ε, ε) −→ U é um caminho diferenciável


qualquer com λ(0) = a e λ 0 (0) = v, ainda teremos
∂f f(λ(t)) − f(a)
(a) = (f ◦ λ) 0 (0) = lim .
∂v t→0 t
De fato, pela Regra da Cadeia,
X
n
∂f X
n
∂f ∂f
(f ◦ λ) 0 (0) = (a) λi0 (0) = (a) αi = (a) .
∂xi ∂xi ∂v
i=1 i=1

Mas, o mesmo não é verdade se f possui derivadas direcionais em todos os pontos do domı́nio
segundo qualquer vetor, mas não é diferenciável.
x3 y
Por exemplo, considere a função h : R2 −→ R dada por h(x, y) = , (x, y) 6= (0, 0), e
x6 + y2
h(0, 0) = 0, e seja λ : R −→ R2 o caminho diferenciável, λ(t) = (t, t2 ), com λ(0) = (0, 0) e
λ 0 (0) = (1, 0). Então,
h(λ(t)) − h(0) t5 1 ∂h
(h ◦ λ) 0 (0) = lim = lim 7 = lim 2 = 1 6= (0, 0) = 0 .
t→0 t t→0 t + t5 t→0 t + 1 ∂x
(ver exemplo 2.3).

Observação 3.10. Nenhuma das funções definidas nos exemplos 2.1, 2.2, 2.3 e 2.4:
xy
• f : R2 −→ R , f(x, y) = , f(0, 0) = 0 ;
x2
+ y2
x2 y
• g : R2 −→ R , g(x, y) = 2 , g(0, 0) = 0 ;
x + y2
x3 y
• h : R2 −→ R , h(x, y) = 6 , h(0, 0) = 0 ;
x + y2
x3 y
• ϕ : R2 −→ R , ϕ(x, y) = 4 , ϕ(0, 0) = 0 ,
x + y2
são diferenciáveis na origem de R2 .

De fato:

• f porque não é contı́nua na origem nem possui derivada direcional segundo qualquer vetor na
origem.
∂g
• g porque, embora seja contı́nua na origem e existe (0, 0), para todo v ∈ R2 , as derivadas
∂v
direcionais na origem não dependem linearmente de v.
∂h
• h porque não é contı́nua na origem, embora possua derivadas direcionais (p), para todo
∂v
v ∈ R2 e todo p ∈ R2 , que dependem linearmente de v.
∂ϕ
• ϕ é contı́nua em R2 , possui derivadas direcionais segundo qualquer vetor v ∈ R2 , em todos
∂v
os pontos do plano, que dependem linearmente de v, mas contraria a Regra da Cadeia, pois
ϕ ◦ λ : R −→ R não é derivável na origem, onde λ : R −→ R2 é o caminho diferenciável dado por

J. Delgado - K. Frensel 129


Análise

1
 
λ(t) = t , t2 sen , t 6= 0, e λ(0) = 0.
t
• Diretamente, podemos verificar que, embora cada uma das funções acima possua derivadas
parciais na origem, elas não cumprem a condição:
 
r(v) 1 ∂F ∂F
lim = lim p F(α, β) − (0, 0)α − (0, 0)β = 0 ,
v→(0,0) kvk α→0 α2 + β2 ∂x ∂y
β→0

onde v = (α, β).


∂f ∂f αβ
Por exemplo, para F = f, temos que (0, 0) = (0, 0) = 0 e f(α, β) = 2 . Logo, o limite
∂x ∂y α + β2
r(v) 1 αβ
lim = lim p 2 + β2
v→0 kvk α→0 2
α +β 2 α
β→0

1 1
   
não existe, já que para as sequências αn = e βn = , que convergem para zero, a
  n n
 
1 αn βn  n
sequência q
2 2
= √ não converge.
αn + βn 2 2
α2n + β2n

Observação 3.11. Seja U ⊂ C aberto. Dizemos que uma função complexa f : U −→ C é


derivável no ponto z = x + iy ∈ U, quando existe o limite
f(z + H) − f(z)
lim = A.
H→0 H
Neste caso, A = f 0 (z) chama-se a derivada da função complexa f no ponto z.

A derivabilidade de f no ponto z = x + iy é equivalente a dizer que:


f(z + H) = f(z) + A H + r(H) ,
r(H)
onde lim = 0.
H→0 H
Fazendo A = a + ib, H = h + ik e r = r1 + ir2 , f é derivável no ponto z = x + iy se, e só se,
f(z + H) = f(z) + (ah − bk) + i(bh + ak) + r1 (H) + ir2 (H) , (I)
r1 (H) r (H)
onde lim = lim 2 = 0.
H→0 |H| H→0 |H|

Sejam u, v : U −→ R a parte real e a parte imaginária da função f, ou seja, f(z) = u(z) + iv(z).

Em (I), separando a parte real e a parte imaginária, temos que:


r (h, k)
• u(x + h, y + k) = u(x, y) + ah − bk + r1 (h, k) , onde lim √1 2 = 0,
h + k2
h,k→0

r (h, k)
• v(x + h, y + k) = v(x, y) + bh + ak + r2 (h, k) , onde lim √2 2 = 0.
h,k→0 h + k2

Assim, se f = u + iv é derivável no ponto z = x + iy, então u e v são diferenciáveis no


∂u ∂v ∂u ∂v
ponto (x, y) e valem as identidades: (x, y) = (x, y) (= a) e (x, y) = − (x, y) (= −b),
∂x ∂y ∂y ∂x
chamadas equações de Cauchy-Riemann.

130 Instituto de Matemática UFF


Funções diferenciáveis

Reciprocamente, se u, v : U −→ R são funções diferenciáveis no ponto z = (x, y) e satisfa-


zem as equações de Cauchy-Riemann neste ponto, podemos provar, revertendo cada etapa do
argumento anterior, que a função complexa f = u + iv é derivável no ponto z = x + iy e que:
∂u ∂u ∂v ∂v
f 0 (z) = (z) − i (z) = (z) + i (z) .
∂x ∂y ∂y ∂x
Uma função complexa f : U −→ C é holomorfa quando possui derivada f 0 (z) em todos os
pontos do aberto U.

Definição 3.3. Seja U ⊂ Rn aberto. Dizemos que uma função f : U −→ R é de classe C1


∂f ∂f
quando f possui derivadas parciais (x), . . . , (x) em todos os pontos x ∈ U e as funções
∂x1 ∂xn
∂f
: U −→ R, i = 1, . . . , n, são contı́nuas.
∂xi
Mais geralmente, dizemos que uma função f : U −→ R é de classe Ck , k ≥ 1, quando ela
∂f
possui derivadas parciais em todos os pontos de U e as funções : U −→ R, i = 1, . . . , n,
∂xi
são de classe Ck−1 . Para completar a definição indutiva, dizemos que f é de classe C0 quando
f é contı́nua.

Finalmente, dizemos que f é de classe C∞ quando f é de classe Ck para todo k ≥ 0.

Então C0 ⊃ C1 ⊃ C2 ⊃ . . . ⊃ Ck ⊃ . . . ⊃ C∞ , sendo todas as inclusões estritas (ver Curso de


Análise, Vol. I de E. Lima, pag. 278, ex. 21).

Teorema 3.2. Se uma função f : U ⊂ Rn −→ R possui derivadas parciais em todos os pontos


do aberto U e cada uma delas é contı́nua no ponto c ∈ U, então f é diferenciável no ponto c.

Prova.
Para simplificar a notação, vamos considerar apenas o caso n = 2.

Sejam c = (a, b) e δ > 0 tal que BM (c, δ) = (a − δ, a + δ) × (b − δ, b + δ) ⊂ U.

Seja v = (h, k) um vetor tal que c + v ∈ BM (c, δ) ⊂ U e


∂f ∂f
r(v) = r(h, k) = f(a + h, b + k) − f(a, b) − (c)h − (c)k .
∂x ∂y
Reescrevendo, temos:
∂f ∂f
r(v) = f(a + h, b + k) − f(a, b + k) + f(a, b + k) − f(a, b) − (c)h − (c)k .
∂x ∂y
Pelo Teorema do Valor Médio para funções reais de uma variável real, existem θ1 , θ2 ∈ (0, 1) tais
que:
∂f ∂f ∂f ∂f
r(v) = (a + θ1 h, b + k)h + (a, b + θ2 k)k − (c)h − (c)k .
∂x ∂y ∂x ∂y
De fato, existe ε > 0 tal que (a + th, b + k), (a, b + tk) ⊂ U para todo t ∈ (−ε, 1 + ε).
Como as derivadas parciais da função f existem em todos os pontos de U, as funções reais

J. Delgado - K. Frensel 131


Análise

f1 (t) = f(a + th, b + k) e f2 (t) = f(a, b + tk) são deriváveis em (−ε, 1 + ε) e

f(a + (t0 + t)h, b + k) − f(a + t0 h, b + k)


• f10 (t0 ) = lim
t→0 t
f((a + t0 h, b + k) + ht(1, 0)) − f(a + t0 h, b + k)
= lim h
t→0 th
∂f
= h (a + t0 h, b + k)
∂x
f(a, b + (t0 + t)k) − f(a, b + t0 k)
• f20 (t0 ) = lim
t→0 t
f((a, b + t0 k) + kt(0, 1)) − f(a, b + t0 k)
= lim k
t→0 tk
∂f
= k (a, b + t0 k) .
∂y
Logo,
 
r(v)
 ∂f ∂f h
 ∂f ∂f k
= (a + θ1 h, b + k) − (a, b) √ 2 + (a, b + θ2 k) − (a, b) √ .
kvk ∂x ∂x h + k2 ∂y ∂y h2 + k2
|h| |k| ∂f ∂f
Como √ ≤ 1, √ ≤ 1, e são contı́nuas no ponto c = (a, b), temos que
h2+ b2 + h2 b2 ∂x ∂y
r(v)
lim = 0, ou seja, f é diferenciável no ponto c = (a, b). 
v→0 kvk

Observação 3.12. Na realidade, para que f seja diferenciável no ponto (a, b) é suficiente
∂f ∂f
que exista numa vizinhança deste ponto, que nele seja contı́nua e que (a, b) exista.
∂x ∂y
De fato, escrevendo
∂f ∂f
r(v) = f(a + h, b + k) − f(a, b + k) − (a, b)h + f(a, b + k) − f(a, b) − (a, b)k ,
∂x ∂y
existe, pelo Teorema do Valor Médio para funções reais de uma variável real, θ ∈ (0, 1) tal que
 
r(v)
 ∂f ∂f
 h f(a, b + k) − f(a, b) ∂f k
= (a + θh, b + k) − (a, b) + − (a, b) .
kvk ∂x ∂x kvk k ∂y kvk
r(v) h k ∂f
Logo lim = 0, pois e são limitadas, é contı́nua no ponto (a, b) e
v→0 kvk kvk kvk ∂x
f(a, b + k) − f(a) ∂f
lim = (a, b) .
k→0 k ∂y
• Para funções de n variáveis, a diferenciabilidade de f num ponto é assegurada quando n − 1
das suas derivadas parciais existem numa vizinhança do ponto, são contı́nuas neste ponto e a
derivada parcial restante apenas exista neste ponto.

Corolário 3.3. Toda função de classe C1 é diferenciável.

Mas a recı́proca não é verdadeira.

132 Instituto de Matemática UFF


Funções diferenciáveis

1
Exemplo 3.1. Seja f : R −→ R a função dada por f(x) = x2 sen , x 6= 0 e f(0) = 0. Então
x
1 1 x2 sen x1
f 0 (x) = 2x sen − cos , para x 6= 0 , e f 0 (0) = lim = 0.
x x x→0 x
Logo f é diferenciável em R, mas f não é de classe C1 , pois f 0 não é contı́nua em x = 0. 

Exemplo 3.2. Um polinômio em duas variáveis é uma função f : R2 −→ R dada por


X
f(x, y) = aij xi yj .

Então f é contı́nuo em R2 e possui derivadas parciais


∂f X ∂f X
= iaij xi−1 yj e = jaij xi yj−1 .
∂x ∂y
∂f ∂f
Como e são polinômios e, portanto, funções contı́nuas, temos que f é de classe C1 .
∂x ∂y
Assim, todo polinômio é de classe C1 .
∂f ∂f ∂f ∂f
Como e são polinômios, ∈ C1 e ∈ C1 . Logo f ∈ C2 .
∂x ∂y ∂x ∂y
Podemos provar, usando o argumento acima, que se todo polinômio é de classe Ck , então todo
polinômio é de classe Ck+1 . Assim, concluı́mos, por indução, que todo polinômio é de classe
C∞ .

Do mesmo modo, podemos mostrar que todo polinômio f : Rn −→ R de n variáveis


X
f(x) = ai1 i2 ··· in xi11 · · · xinn ,

é de classe C∞ . 

Observação 3.13. A soma f + g e o produto fg de funções de classe Ck são funções de


classe Ck .

Este resultado segue do fato análogo já provado para funções reais de uma variável real, ou
pode ser provado por indução, primeiro para a soma e depois para o produto.

Corolário 3.4. Sejam U ⊂ Rm , V ⊂ Rn abertos, f = (f1 , . . . , fn ) : U −→ Rn , tal que f(U) ⊂ V


e cada função coordenada fi : U −→ R é de classe Ck . Se g : V −→ R é uma função de classe
Ck , então a composta g ◦ f : U −→ R é de classe Ck .

Prova.
Para k = 0, o resultado é verdadeiro. Suponhamos, por indução, que o corolário vale para
funções de classe Ck−1 , k ≥ 1, e que g, fi , i = 1, . . . , n são funções de classe Ck .

Então, pelo corolário 3.3, g, fi , i = 1, . . . , n são funções diferenciáveis e, pela Regra da Cadeia:

J. Delgado - K. Frensel 133


Análise

∂(g ◦ f) X
n
∂g ∂f
(x) = (f(x)) j (x) ,
∂xi ∂yj ∂xi
j=1

para todo x ∈ U e todo i = 1, . . . , m, ou seja, vale a igualdade de funções:


∂(g ◦ f) X
n 
∂g

∂f
= ◦f · j .
∂xi ∂yj ∂xi
j=1

∂g ∂g
Como e f são de classe Ck−1 temos, pela hipótese de indução, que ◦ f é de classe Ck−1
∂yj  ∂y
 j
∂fj ∂g ∂f
para todo j = 1, . . . , n. Além disso, como k−1
∈ C , o produto ◦ f · j é de classe Ck−1 ,
∂xi ∂yj ∂xi
X
m 
∂g

∂f
para todo j = 1, . . . , n, e portanto, a soma ◦ f · j é de classe Ck−1 .
∂yj ∂xi
j=1

∂(g ◦ f)
Logo ∈ Ck−1 para todo i = 1, . . . , m, ou seja, g ◦ f ∈ Ck . 
∂xi

Observação 3.14. Seja g : U ⊂ Rn −→ R uma função de classe Ck , com g(x) 6= 0 para todo
x ∈ U.
1 1 1
Então a função é de classe Ck , pois = ρ ◦ g, onde ρ : R − {0} −→ R, dada por ρ(x) = , é de
g g x
classe C∞ .
X
n
Exemplo 3.3. O produto interno f : R × R −→ R, f(x, y) =
n n
xi yi , é uma função de classe
i=1
C∞ , pois f é um polinômio de 2n variáveis (de grau 2).
X

n
Também, a função g : R −→ R, g(x) = kxk = 2
x2i , por ser um polinômio de n variáveis, é de
i=1
classe C∞ .
v
uX 2
u n
Então a norma h : Rn − {0} −→ R, h(x) = kxk = t xi é de classe C∞ , pois h = ρ ◦ g, onde
i=1


ρ : (0, ∞) −→ R é a função C dada por ρ(x) = x.

Na origem, a função norma h não possui derivadas parciais, pois:


h(0 + tei ) − h(0) |t| h(0 + tei ) − h(0) |t|
• lim+ = lim+ = 1 , e • lim− = lim− = −1 .
t→0 t t→0 t t→0 t t→0 t

• Pode ocorrer que normas k k que não provém de um produto interno não sejam diferenciáveis
em pontos x 6= 0.
∂ϕ
Por exemplo, se ϕ : R2 −→ R é a norma da soma ϕ(x, y) = |x| + |y|, então não existe nos
∂x
∂ϕ
pontos (0, y) e não existe nos pontos (x, 0).
∂y
ϕ(t, y) − ϕ(0, y) |t| ϕ(x, t) − ϕ(x, 0) |t|
De fato, lim± = lim± = ±1 , e lim± = lim± = ±1 . 
t→0 t t→0 t t→0 t t→0 t

134 Instituto de Matemática UFF


A diferencial de uma função

4 A diferencial de uma função

Definição 4.1. Sejam U ⊂ Rn um aberto e f : U −→ R uma função diferenciável no ponto a.


A diferencial de f no ponto a é o funcional linear df(a) : Rn −→ R dado por
∂f Xn
∂f
df(a)v = (a) = (a)αi ,
∂v ∂xi
i=1

onde v = (α1 , . . . , αn ) ∈ Rn .
 
∂f ∂f
Então (a) · · · (a) é a matriz 1 × n do funcional linear df(a) em relação à base
∂x1 ∂xn
canônica {e1 , . . . , en } de Rn .

Quando f é diferenciável em todo ponto de U, podemos definir a aplicação


df : U −→ L(Rn ; R) = (Rn )?
 
∂f ∂f
que associa a cada x ∈ U o funcional df(x), cuja matriz é (x) · · · (x) .
∂x1 ∂xn
Identificando o funcional df(x) com sua matriz, temos que: df é uma aplicação contı́nua
∂f
⇐⇒ cada uma de suas funções coordenadas : U −→ R é contı́nua ⇐⇒ f é C1 .
∂xi

Exemplo 4.1. Todo funcional linear ϕ : Rn −→ R é diferenciável e dϕ(x) = ϕ, ou seja,


dϕ(x)v = ϕ(v) para quaisquer x, v ∈ Rn .
∂ϕ
De fato, como ϕ(x) = a1 x1 + . . . + an xn , temos (x) = ai para todo x ∈ Rn e todo i = 1, . . . , n.
∂xi
Logo,
X
n
∂ϕ X
n
dϕ(x)v = (x)αi = ai αi = ϕ(v) . 
∂xi
i=1 i=1

Notação.
Seja πi : Rn −→ R, πi (x) = xi , a projeção sobre a i−ésima coordenada, i = 1, . . . , n. Então
{π1 , . . . , πn } é a base de (Rn )? dual da base canônica.

Fazendo πi = xi , temos, pelo exemplo acima, que


dxi (a)v = dπi (a)v = πi (v) = αi ,

para todo v = (α1 , . . . , αn ) ∈ Rn .

Logo, podemos escrever:


X n
∂f X
n
∂f
df(a)v = (a) dxi (a)(v) , ou seja, df = dxi ,
∂xi ∂xi
i=1 i=1

se f é diferenciável em todo ponto a ∈ U.

J. Delgado - K. Frensel 135


Análise

Com a identificação feita acima, temos que {dx1 , . . . , dxn } é a base de (Rn )? dual da base
canônica.

Assim, a expressão formal da regra da cadeia (no caso R −→ Rn −→ R) diz que se cada
coordenada xi é função de um parâmetro real t, então podemos ”dividir” ambos os membros da
igualdade acima por ”dt” e obter:
df X
n
∂f dxi
= .
dt ∂xi dt
i=1

Teorema 4.1. Sejam f, g : U −→ R funções diferenciáveis no ponto a ∈ U. Então:


(a) f + g : U −→ R é diferenciável no ponto a e d(f + g)(a) = df(a) + dg(a).

(b) f · g : U −→ R é diferenciável no ponto a e d(f · g)(a) = f(a) dg(a) + g(a) df(a) .


 
f f g(a) df(a) − f(a) dg(a)
(c) Se g(a) 6= 0, é diferenciável no ponto a e d (a) = 2
.
g g g(a)

Prova.
Como as funções s, m : R2 −→ R, q : R × (R − {0}) −→ R dadas por s(x, y) = x + y ,
x
m(x, y) = xy e q(x, y) = são diferenciáveis, por serem de classe C∞ , e a função F : U −→ R2 ,
y
F(x) = (f(x), g(x)), tem coordenadas diferenciáveis no ponto a, temos, pela Regra da Cadeia,
f
que as funções s ◦ F = f + g, m ◦ F = f · g e q ◦ F = são diferenciáveis no ponto a e, além disso:
g

∂(f + g) ∂f ∂g
(a) = (a) + (a)
∂xi ∂xi ∂xi

∂(f · g) ∂f ∂g
(a) = g(a) (a) + f(a) (a)
∂xi ∂xi ∂xi
∂f ∂g
g(a) (a) − f(a) (a)
∂(f/g) ∂xi ∂xi
(a) = .
∂xi g(a)2
Assim,
X
n
∂(f + g) X
n
∂f X
n
∂g
• d(f + g)(a) = (a) dxi = (a) dxi + (a) dxi = df(a) + dg(a) ;
∂xi ∂xi ∂xi
i=1 i=1 i=1

X
n
∂(f · g) X
n
∂f X
n
∂g
• d(f·g)(a) = (a) dxi = g(a) (a) dxi +f(a) (a) dxi = g(a) df(a)+f(a) dg(a) ;
∂xi ∂xi ∂xi
i=1 i=1 i=1

X
n
∂f X
n
∂g
g(a) (a) dxi − f(a) (a) dxi
X
n
∂(f/g) ∂xi ∂xi g(a) df(a) − f(a) dg(a)
i=1 i=1
• d(f/g)(a) = (a) dxi = = .
∂xi g(a)2 g(a)2
i=1


136 Instituto de Matemática UFF


A diferencial de uma função

Teorema 4.2. (do Valor Médio)


Seja f : U −→ R uma função diferenciável em todos os pontos do segmento aberto (a, a + v) e
contı́nua no segmento fechado [a, a + v] ⊂ U. Então existe θ ∈ (0, 1) tal que
∂f Xn
∂f
f(a + v) − f(a) = (a + θv) = df(a + θv) v = (a + θv) αi ,
∂v ∂xi
i=1

onde v = (α1 , . . . , αn ).

Corolário 4.1. Seja U ⊂ Rn aberto conexo. Se f : U −→ R é diferenciável e df(x) = 0 (isto é,


∂f
(x) = 0, i = 1, . . . , n) para todo x ∈ U, então f é constante.
∂xi

Corolário 4.2. Sejam U ⊂ Rn aberto convexo e f : U −→ R uma função diferenciável. Se


kdf(x)k ≤ M para todo x ∈ U, então
|f(x) − f(y)| ≤ M kx − yk ,

para quaisquer x, y ∈ U.

Prova.
Neste corolário, estamos assumindo que
∂f
kdf(x)k = sup { |df(x)v| | v ∈ R , kvk = 1 } = sup (x) v ∈ R , kvk = 1 .
n n

∂v
Logo, se x, y ∈ U, o segmento fechado [x, x + (y − x)] ⊂ U, uma vez que U é convexo.

Assim, pelo Teorema do Valor Médio, existe θ ∈ (0, 1) tal que


f(y) − f(x) = df(x + θ(y − x)) (y − x) ,

e, portanto,

|f(y) − f(x)| = |df(x + θ(y − x)) (y − x)| ≤ M ky − xk . 

Observação 4.1. Se tomarmos em Rn a norma euclidiana, ou a norma da soma, ou a norma


kdf(x)k assume, respectivamente, os valores:
do máximo, então v

uX ∂f
u n  2 X n
∂f ∂f
t (x) , (x) , ou max (x) .
∂xi ∂xi 1≤i≤n ∂xi
i=1 i=1

De fato, se k k é a norma euclidiana, por exemplo, temosvque:


v v
X uX 2 uX
uX ∂f
n u n  n u n  2
∂f ∂f
|df(x)v| =
u 2
(x) αi ≤ (x) t αi ≤ t (x) ,
t
∂xi ∂xi ∂xi
i=1 i=1 i=1 i=1
v
uX
u n
n
para todo v = (α1 , . . . , αn ) ∈ R com kvk = t α2i = 1.
i=1

J. Delgado - K. Frensel 137


Análise

v
uX ∂f X
u n  2 n  2
∂f
Logo kdf(x)k ≤ t (x) . Por outro lado, se (x) 6= 0, podemos tomar o vetor
∂xi ∂xi
i=1 i=1
 
∂f ∂f
(x), . . . , (x)
∂x1 ∂xn
v= v .
uX ∂f
u n  2
t (x)
∂xi
i=1

Então, como kvk = 1 , temos que:


Xn 
∂f
2
(x)
v
uX ∂f
u n  2
∂xi
kdf(x)k ≥ |df(x)v| = vi=1
= t (x) ,
uX
u n
 2 ∂xi
∂f i=1
t (x)
∂xi
i=1
v v
uX ∂f uX ∂f
u n   2 u n  2
ou seja, kdf(x)k ≥ t (x) . Assim, kdf(x)k = t (x) .
∂xi ∂xi
i=1 i=1

Observação 4.2. Se V não é convexo, uma função g : V −→ R pode ser diferenciável, com
diferencial dg limitada em V, sem ser Lipschitziana.

Por exemplo, sejam U = R2 − X, onde X = {(x, 0) | x ≥ 0}, e V = {(x, y) ∈ U |


p
x2 + y2 < 2}.

Seja g = f|V , onde f : U −→ R é a função definida por f(x, y) = x2 se x > 0 e y > 0 e f(x, y) = 0
se x ≤ 0 ou y ≤ 0.
∂f ∂f ∂f
Então (x, y) = 0 para todo (x, y) ∈ U; (x, y) = 2x se x > 0, y > 0; (x, y) = 0 se
∂y ∂x ∂x
∂f
(x, y) ∈ U − {(x, y) ∈ R2 | x ≥ 0 , y > 0}, pois f ≡ 0 neste aberto e, também, (0, y) = 0 para
∂x
y > 0, uma vez que
f(t, y) − f(0, y) t2 f(t, y) − f(0, y) 0
• lim+ = lim+ = 0 , e • lim− = lim− = 0 .
t→0 t t→0 t t→0 t t→0 t
∂f ∂f
Logo f é diferenciável, pois e são contı́nuas em U, ou seja, f é de classe C1 em U. Além
∂x ∂y
disso, como |x| < 2 para todo (x, y) ∈ s
V,
 ∂f 2  ∂f 2
kdf(x, y)k = (x, y) + (x, y) ≤ 4 ,
∂x ∂y
para todo (x, y) ∈ V.
1
 
Mas, f não é uniformemente contı́nua em V, pois, para as sequências zn = 1, e
n
1
 
wn = 1, − de pontos de V, temos que:
n  2
zn − wn = 0, −→ (0, 0) e f(zn ) − f(wn ) = 1 −→ 1 .
n
Em particular, f não é Lipschitziana em V.

138 Instituto de Matemática UFF


O gradiente de uma função diferenciável

Observação 4.3. Como consequência do corolário 4.2, temos que se U ⊂ Rn é aberto e


convexo e f : U −→ R é uma função diferenciável com derivadas parciais limitadas em U, então
f é uniformemente contı́nua em U. Em particular, f é a restrição de uma função uniformemente
contı́nua g : U −→ R.

5 O gradiente de uma função diferenciável

O produto interno canônico induz um isomorfismo entre Rn e seu dual (Rn )? dado por:
Rn −→ (Rn )?
v 7−→ v? : Rn −→ R
x 7−→ hv, xi ,
pois dado ϕ ∈ (Rn )? , ϕ = v? , onde v = (ϕ(e1 ), . . . , ϕ(en )), uma vez que
ϕ(x1 , . . . , xn ) = ϕ(e1 )x1 + . . . + ϕ(en )xn .
 
Além disso, como v (ei ) = αi , i = 1, . . . , n, α1 . . . αn é a matriz 1 × n do funcional v?
?

em relação à base canônica.

Definição 5.1. Seja f : U −→ R uma função diferenciável no aberto U ⊂ Rn . O gradiente de f


no ponto a ∈ U é o vetor grad f(a) que corresponde ao funcional df(a) segundo o isomorfismo
acima, ou seja,
∂f X
n
∂f
hgrad f(a), vi = df(a)v = (a) = (a) αi ,
∂v ∂xi
i=1
n
para todo v = (α1 , . . . , αn ) ∈ R .
 
∂f ∂f
Logo grad f(a) = (a), . . . , (a) .
∂x1 ∂xn

Observação 5.1. As coordenadas de grad f(a) em relação à base canônica são iguais às
X
n
∂f
coordenadas de df(a) = (a) dxi em relação à base {dx1 , . . . , dxn } de (Rn )? , dual da base
∂xi
i=1
canônica.

• Veremos agora as três propriedades mais importantes do gradiente de uma função dife-
renciável f : U −→ R. Para isso, seja a ∈ U tal que grad f(a) 6= 0.

Primeira propriedade. O gradiente aponta para uma direção segundo a qual a função f é
crescente.

De fato, se w = grad f(a), então

J. Delgado - K. Frensel 139


Análise

∂f
df(a) w = (a) = hgrad f(a), wi = k grad f(a)k2 > 0 .
∂w
Assim, se λ : (−ε, ε) −→ U é um caminho diferenciável tal que λ(0) = a e λ 0 (0) = grad f(a),
então
(f ◦ λ) 0 (0) = df(λ(0)) λ 0 (0) > 0 .

Então, se f e λ são de classe C1 , existe ε > 0 tal que (f ◦ λ) 0 (t) > 0 para todo t ∈ (−ε, ε),
e, portanto, f ◦ λ é crescente. Isto é, f cresce na direção do gradiente.

Fig. 4: Gradiente de f no ponto a

Segunda propriedade. Dentre todas as direções ao longo das quais a função f cresce, a
direção do gradiente é a de crescimento mais rápido.

De fato, não se tem df(a)v = hgrad f(a), vi > 0 apenas quando v = grad f(a), pois
hgrad f(a), vi > 0 para todo v que faz um ângulo agudo com grad f(a). Então f cresce ao
longo destas direções, mas grad f(a) é a direção segundo a qual o crescimento de f é o mais
rápido.

Ou seja, se v é um vetor tal que kvk = k grad f(a)k, então


∂f ∂f
(a) ≤ (a) ,
∂v ∂(grad f(a))
pois, pela desigualdade de Cauchy-Schwarz,
∂f ∂f
(a) = hgrad f(a), vi ≤ k grad f(a)k kvk = k grad f(a)k2 = (a) .
∂v ∂(grad f(a))
Observe, ainda, que a igualdade ocorre se, e só se, v = grad f(a).

Terceira propriedade. O gradiente de f no ponto a é perpendicular à ”superfı́cie” de nı́vel de f


que passa por esse ponto.

Dado c ∈ R, chamamos f−1 (c) = {x ∈ U | f(x) = c} conjunto de nı́vel de f e se f(x) = c, isto


é, x ∈ f−1 (c), dizemos que x está no nı́vel c ou que x tem nı́vel c.

O Teorema da Função Implı́cita, que provaremos depois, garante que f−1 (c) é uma su-

140 Instituto de Matemática UFF


O gradiente de uma função diferenciável

perfı́cie (se n ≥ 3), ou uma curva (se n = 2), quando grad f(x) 6= 0 para todo x ∈ f−1 (c).

Dizer que w = grad f(a) é perpendicular ao conjunto de nı́vel f−1 (c), onde f(a) = c, sig-
nifica que w é perpendicular ao vetor velocidade λ 0 (0) de qualquer caminho diferenciável em
t = 0, com λ(0) = a e λ(t) ∈ f−1 (c) para todo t ∈ (−ε, ε). De fato, como f(λ(t)) = c para todo
t ∈ (−ε, ε),
0 = (f ◦ λ) 0 (0) = df(λ(0)) λ 0 (0) = hgrad f(a), λ 0 (0)i .

Exemplo 5.1. Sejam f, g, h : R2 −→ R dadas por: f(x, y) = ax + by, a2 + b2 6= 0; g(x, y) =


x2 + y2 e h(x, y) = x2 − y2 .

• As curvas de nı́vel de f são as retas ax+by = c para qualquer c ∈ R e grad f(x, y) = (a, b) para
todo (x, y) ∈ R2 . Assim, (a, b) é o vetor normal às retas ax + by = c, e {(x, y) ∈ R2 | ax + by > c}
é o semi-plano para o qual o vetor (a, b) aponta.

Fig. 5: Gradiente de f

• Seja c ∈ R e seja g−1 (c) = {(x, y) ∈ R2 | x2 + y2 = c} a curva de nı́vel c da função g. Então:



g−1 (c) = ∅ se c < 0, g−1 (0) = {(0, 0)}, g−1 (c) é o cı́rculo de centro na origem e raio c, e
grad f(x, y) = (2x, 2y) é um vetor paralelo ao raio e, portanto, perpendicular ao vetor tangente
ao cı́rculo naquele ponto.

Fig. 6: Gradiente de g

J. Delgado - K. Frensel 141


Análise

• As curvas de nı́vel c da função h são:


h−1 (0) = {(x, y) ∈ R2 | x2 = y2 } = {(x, y) ∈ R2 | x = ±y}

que consiste de duas retas, x = y e x = −y, perpendiculares que se cortam na origem; ou


h−1 (c) = {(x, y) ∈ R2 | x2 − y2 = c}

que é uma hipérbole cuja reta focal é o eixo x, se c > 0, e uma hipérbole cuja reta focal é o eixo
y, se c < 0.

Fig. 7: Gradiente de h

O gradiente de h, grad h(x, y) = (2x, −2y), é perpendicular às curvas de nı́vel e indica a direção
de crescimento de h. 

• Nos pontos onde o gradiente se anula ocorre uma quebra de regularidade na disposição das
curvas de nı́vel. Um ponto onde o gradiente de uma função é o vetor nulo é chamado singular
ou crı́tico.

Exemplo 5.2. Considere, agora, as funções definidas no espaço R3 tridimensional:


f(x, y, z) = ax + by + cz ; g(x, y, z) = x2 + y2 + z2 e h(x, y, z) = x2 + y2 − z2 .

As superfı́cies de nı́vel de f são planos de equação ax + by + cz = d, d ∈ R, todos perpendicu-


lares ao vetor (a, b, c), que é o gradiente de f em qualquer ponto.

A superfı́cie de nı́vel c da função g é o conjunto vazio, se c < 0; consiste apenas da origem,



se c = 0 e é a esfera de centro na origem e raio c, se c > 0, sendo grad g(x, y, z) = 2(x, y, z)
perpendicular à superfı́cie de nı́vel c que passa pelo ponto (x, y, z) 6= (0, 0, 0).

A superfı́cie de nı́vel c da função h é o cone de revolução z2 = x2 +y2 de vértice na origem e eixo


z, o hiperbolóide de revolução de uma folha x2 + y2 − z2 = c de eixo z, se c > 0, e o hiperbolóide
de revolução de duas folhas x2 +y2 −z2 = c de eixo z, se c < 0, sendo grad h(x, y, z) = 2(x, y, −z)
perpendicular à superfı́cie de nı́vel que passa por (x, y, z). 

142 Instituto de Matemática UFF


A regra de Leibniz

6 A regra de Leibniz

Teorema 6.1. (Regra de Leibniz – derivação sob o sinal de integral)


Sejam U ⊂ Rn aberto e f : U × [a, b] −→ R uma função com as seguintes propriedades:

(1) Para todo x ∈ U, a função t 7−→ f(x, t) é integrável em [a, b].


∂f
(2) A i−ésima derivada parcial (x, t) existe para todo (x, t) ∈ U × [a, b] e a função
∂xi
∂f
: U × [a, b] −→ R é contı́nua.
∂xi
Zb
Então a função ϕ : U −→ R, dada por ϕ(x) = f(x, t) dt, possui i−ésima derivada parcial em
a
todo ponto x ∈ U, sendo Zb
∂ϕ ∂f
(x) = (x, t) dt .
∂xi a ∂xi
Ou seja, pode-se derivar sob o sinal de integral, desde que o integrando resultante seja uma
função contı́nua.

Prova.
Dado x0 ∈ U, existe δ0 > 0 tal que [x0 , x0 + sei ] ⊂ U, para todo s ∈ R com |s| < δ0 . Então,
pelo Teorema do Valor Médio, existe θ ∈ (0, 1) tal que:
Zb Zb  
ϕ(x0 + sei ) − ϕ(x0 ) ∂f f(x0 + sei , t) − f(x0 , t) ∂f
− (x0 , t) dt = − (x0 , t) dt
s a ∂xi a s ∂xi
Zb  
∂f ∂f
= (x0 + θsei , t) − (x0 , t) dt .
a ∂xi ∂xi
∂f
Como : U × [a, b] −→ R é contı́nua, temos, pelo teorema 11.4 do capı́tulo 1, que dado ε > 0,
∂xi
existe 0 < δ < δ0 tal que:
∂f ∂f ε
|s| < δ =⇒

(x0 + sθei , t) − (x0 , t) < ,
∂xi ∂xi 2(b − a)
para todo t ∈ [a, b]. Então, se 0 < |s| < δ,
Zb
ϕ(x0 + sei ) − ϕ(x) ∂f
− (x0 , t) dt < ε .
s ∂xi a

Provamos, então, que ϕ possui i−ésima derivada parcial no ponto x0 e


Zb
∂ϕ ∂f
(x0 ) = (x0 , t) dt . 
∂xi a ∂xi

Corolário 6.1. Se f : U × [a, b] −→ R é contı́nua e possui as n derivadas


Zb
parciais
∂f
: U × [a, b] −→ R contı́nuas, então ϕ : U −→ R, dada por ϕ(x) = f(x, t) dt, é de
∂xi a
classe C1 .

J. Delgado - K. Frensel 143


Análise

Prova. Zb
∂ϕ ∂f
Pelo teorema anterior, ϕ possui as n derivadas parciais e (x) = (x, t) dt para todo
∂xi a ∂xi
∂f
x ∈ U, i = 1, . . . , n. Além disso, como : U × [a, b] −→ R é contı́nua, para todo i = 1, . . . , n,
∂xi
∂ϕ
temos, pela aplicação do teorema 11.4 do capı́tulo 1, que : U −→ R é contı́nua para todo
∂xi
i = 1, . . . , n. 

Observação 6.1. Se f : [a, b] × [c, d] −→ R é uma função contı́nua,


Z
temos, pela aplicação
d
do teorema 11.4 do capı́tulo 1, que a função ξ : [a, b] −→ R, ξ(s) = f(s, t) dt , é contı́nua e,
c
portanto, integrável.
Zb
A integral ξ(s) ds se escreve como:
a Zb  Zd  Zb Zd
f(s, t) dt ds ou ds f(s, t) dt .
a c a c

Teorema 6.2. (da Inversão da Ordem nas Integrais Repetidas)


Se f : [a, b] × [c, d] −→ R é uma função contı́nua, então
Zb Zd Zd Zb
ds f(s, t) dt = dt f(s, t) ds .
a c c a

Prova. Zx
Seja g : [a, b] × [c, d] −→ R definida por g(x, t) = f(s, t) ds .
a
Zx
Para cada x ∈ [a, b] fixo, a função t 7−→ f(s, t) ds é contı́nua e, portanto, integrável. Além
a
∂g
disso, (x, t) = f(x, t) para todo (x, t) ∈ [a, b] × [c, d], pois o integrando s 7−→ f(s, t) é contı́nuo
∂x
para todo t ∈ [c, d].
∂g
Como = f : [a, b] × [c, d] −→ R é contı́nua, temos, pela Regra de Leibniz, que a função
∂x
ϕ : [a, b] −→ R, dada por
Zd Z d Z x 
ϕ(x) = g(x, t) dt = f(s, t) ds dt ,
c c a
Zd Zd
∂g
é derivável e ϕ 0 (x) = (x, t) dt = f(x, t) dt.
c ∂x c

Como ϕ 0 : [a, b] −→ R é integrável (por ser contı́nua), temos, pelo Teorema Fundamental do
Cálculo, que Zb Z b Z d 
0
ϕ(b) − ϕ(a) = ϕ (s) ds = f(s, t) dt ds .
a a c
Z d Z b 
Sendo ϕ(a) = 0 e ϕ(b) = f(s, t) ds dt, obtemos
c a

144 Instituto de Matemática UFF


A regra de Leibniz

Z d Z b  Z b Z d 
f(s, t) ds dt = f(s, t) dt ds . 
c a a c

Corolário 6.2. Seja f : U×[a, b] −→ R uma função contı́nua, com derivadas parciais contı́nuas
∂f ∂f
,..., : U × [a, b] −→ R, e seja g : U −→ [a, b] uma função de classe C1 , onde U ⊂ Rn
∂x1 ∂xn
Z g(x)
é aberto. Então a função ϕ : U −→ R, definida por ϕ(x) = f(x, t) dt, é de classe C1 e suas
a
derivadas parciais são:
Z g(x)
∂ϕ ∂f ∂g
(x) = (x, t) dt + (x) f(x, g(x)) ,
∂xi a ∂xi ∂xi
para todo x ∈ U.

Prova. Zu
Seja ξ : U × [a, b] −→ R a função dada por ξ(x, u) = f(x, t) dt. Então, como a função
a
∂ξ
t 7−→ f(x, t) é contı́nua, (x, u) = f(x, u) para todo (x, u) ∈ U × [a, b].
∂u
Zu
∂ξ ∂f
Além disso, pela Regra de Leibniz, (x, u) = (x, t) dt .
∂xi a ∂xi
∂ξ
Afirmação: : U × [a, b] −→ R é contı́nua, para i = 1, . . . , n.
∂xi
∂f
De fato, como : U × [a, b] −→ R é contı́nua, temos, pelo teorema 11.4 do capı́tulo 1, que
∂xi
dados x0 ∈ U, u0 ∈ [a, b] e ε > 0, existe δ >
0 tal que
∂f ∂f
kx − x0 k < δ =⇒ (x, t) − (x0 , t) < ε 0 ,
∂xi ∂xi
ε ε
para todo t ∈ [a, b], onde ε 0 = se u0 = a e ε 0 = se u0 6= a.
2 2(u0 − a)

∂f ∂f
Sendo t 7−→

(x0 , t) contı́nua no compacto [a, b], existe M > 0 tal que (x0 , t) ≤ M para
∂xi ∂xi
∂f
todo t ∈ [a, b]. Assim, (x, t) ≤ N = ε 0 + M, para todo t ∈ [a, b] e x ∈ B(x0 , δ).
∂xi
ε
Então, se |u − u0 | < e kx − x0 k < δ,
2N
Zu Z u0
∂ξ ∂ξ ∂f ∂f

∂xi (x, u) − (x 0 , u0 ) = (x, t) dt − (x 0 , t) dt
∂xi ∂xi
a a ∂xi

Z u0 Z u0 Zu
∂f ∂f ∂f
≤ (x, t) dt − (x0 , t) dt + (x, t) dt
∂xi
a ∂xi a ∂xi u0

ε ε
≤ ε 0 |u0 − a| + N |u0 − u| < + = ε.
2 2
∂ξ ∂ξ
Logo ξ é de classe C1 , pois =fe , i = 1, . . . , n são contı́nuas.
∂u ∂xi

J. Delgado - K. Frensel 145


Análise

Sendo g e ξ são de classe C1 e, portanto, diferenciáveis, temos, pela Regra da Cadeia, que a
função composta ϕ(x) = ξ(x, g(x)) é diferenciável e, para todo i = 1, . . . , n,
Z g(x)
∂ϕ ∂ξ ∂ξ ∂g ∂f ∂g
(x) = (x, g(x)) + (x, g(x)) (x) = (x, t) dt + (x) f(x, g(x)) .
∂xi ∂xi ∂u ∂xi a ∂xi ∂xi
∂ϕ
Logo é contı́nua para todo i = 1, . . . , n, ou seja, ϕ é de classe C1 . 
∂xi

Observação 6.2. De modo análogo, podemos provar que se f : U × [a, b] −→ R satisfaz as


hipóteses do corolário acima e g, h : U −→ [a, b] são de classe C1 , então as funções
Zb Z h(x)
ψ(x) = f(x, t) dt , e λ(x) = f(x, t) dt ,
g(x) g(x)
1
são de classe C e
Zb
∂ψ ∂f ∂g
• (x) = (x, t) dt − (x) f(x, g(x)) ;
∂xi g(x) ∂xi ∂xi
Z h(x)
∂λ ∂f ∂h ∂g
• (x) = (x, t) dt + (x) f(x, h(x)) − (x) f(x, g(x)) ,
∂xi g(x) ∂xi ∂xi ∂xi
Zb Z g(x) Zb Zb Z g(x) Zb Z h(x)
uma vez que, − = , e − − = .
a a g(x) a a h(x) g(x)

Observação 6.3. Seja f : I −→ R uma função contı́nua definida no intervalo I, com 0 ∈ I.


Seja F0 = f e Fn : I −→ R, n ≥ 1, definida por
Zx
(x − t)n−1
Fn (x) = f(t) dt .
0 (n − 1)!
(n−1) (n)
Então Fn é de classe Cn , Fn (0) = Fn0 (0) = . . . = Fn (0) = 0 e Fn (x) = f(x) para todo x ∈ I.

De fato, para n = 1, F1 é de classe C1 , F1 (0) = 0 e F10 (x) = f(x) para todo x ∈ I.

Suponhamos o resultado válido para n − 1, n − 1 ≥ 1. Sejam as funções G : I × I −→ R e


g : I −→ I dadas por
(x − t)n−1
G(x, t) = f(t) , e g(x) = x .
(n − 1)!
Então Fn (0) = 0 e, pelo corolário acima, Fn é de classe C1 e
Zx Zx
0 (x − t)n−2 0 (x − t)n−2
Fn (x) = f(t) dt + G(x, x) g (x) = f(t) dt = Fn−1 (x) ,
0 (n − 2)! 0 (n − 2)!
pois G(x, x) = 0.
(n−2) (n−1)
Como, por indução, Fn−1 é de classe Cn−1 e Fn−1 (0) = . . . = Fn−1 (0) = 0 e Fn−1 (x) = f(x) ,
(n−1) (n)
temos que Fn é de classe Cn , Fn (0) = Fn0 (0) = . . . = Fn (0) = 0 e Fn (x) = f(x) para todo
x ∈ I.

146 Instituto de Matemática UFF


O Teorema de Schwarz

7 O Teorema de Schwarz

Definição 7.1. Seja f : U −→ R uma função diferenciável no aberto U ⊂ Rn . Se as derivadas


∂f
parciais : U −→ R, i = 1, . . . , n, são diferenciáveis num ponto a ∈ U, dizemos que f é duas
∂xi
vezes diferenciável no ponto a. Neste caso, existem as derivadas parciais de segunda ordem
 
∂ ∂f ∂2 f
(a) = (a) ,
∂xj ∂xi ∂xj ∂xi
para todo i, j = 1, . . . , n.

Se f : U −→ R é duas vezes diferenciável em U, ficam definidas n2 funções


∂2 f
: U −→ R , 1 ≤ i, j ≤ n .
∂xj ∂xi
Se todas estas funções são diferenciáveis num ponto a ∈ U, dizemos que f é três vezes
diferenciável nesse ponto. E assim por diante.

Observação 7.1. Já sabemos que se f ∈ C1 , então f é diferenciável.


Suponhamos, por indução, que se uma função é de classe Ck , então ela é k−vezes dife-
renciável.
∂f
Seja f ∈ Ck+1 . Então suas derivadas parciais , i = 1, . . . , n, são de classe Ck .
∂xi
∂f
Logo, por indução, , i = 1, . . . , n, são k−vezes diferenciáveis, e, portanto, f é (k + 1)−vezes
∂xi
diferenciável.

Cabe, então, determinar sob quais hipóteses a ordem em que são tomadas as derivadas
parciais repetidas não influi no resultado final.

Teorema 7.1. (de Schwarz)


Se f : U −→ R é duas vezes diferenciável num ponto c ∈ U ⊂ Rn , então
∂2 f ∂2 f
(c) = (c) ,
∂xi ∂xj ∂xj ∂xi
para quaisquer 1 ≤ i, j ≤ n.

Prova.
Vamos supor, para simplificar a notação, que U ⊂ R2 e c = (a, b). Devemos, então, provar
∂2 f ∂2 f
que (a, b) = (a, b).
∂x ∂y ∂y ∂x
Seja ε > 0 tal que (a − ε, a + ε) × (b − ε, b + ε) ⊂ U. Para todo t ∈ (−ε, ε) e x ∈ (a − ε, a + ε),
sejam:

J. Delgado - K. Frensel 147


Análise

• ϕ(t) = f(a + t, b + t) − f(a + t, b) − f(a, b + t) + f(a, b) .

• ξ(x) = f(x, b + t) − f(x, b).

Então ϕ(t) = ξ(a + t) − ξ(a). Pelo Teorema do Valor Médio para funções de uma variável real,
existe θ ∈ (0, 1) tal que ϕ(t) = ξ 0(a + θt)t, ou seja,
∂f ∂f

ϕ(t) = (a + θt, b + t) − (a + θt, b) t.
∂x ∂x
∂f
Como a função : U −→ R é diferenciável no ponto c = (a, b) temos que:
∂x
∂f ∂f ∂2 f ∂2 f
• (a + θt, b + t) = (a, b) + 2 (a, b)θt + (a, b)t + ρ1 t , com lim ρ1 = 0 .
∂x ∂x ∂x ∂y ∂x t→0

e
∂f ∂f ∂2 f
• (a + θt, b) = (a, b) + 2 (a, b)θt + ρ2 t , com lim ρ2 = 0.
∂x ∂x ∂x t→0

∂2 f
Logo ϕ(t) = (a, b)t2 + (ρ1 − ρ2 )t2 , e, portanto,
∂y ∂x
ϕ(t) ∂2 f
lim 2 = (a, b) . (I)
t→0 t ∂y ∂x
Seja, agora, η(y) = f(a + t, y) − f(a, y). Então ϕ(t) = η(b + t) − η(b). Pelo teorema do Valor
0
Médio, existe θ ∈ (0, 1) tal que ϕ(t)
 = η (b + θt) t, ou seja, 
∂f ∂f
ϕ(t) = (a + t, b + θt) − (a, b + θt) t .
∂y ∂y
∂f
Como a função : U −→ R é diferenciável no ponto c = (a, b), temos que:
∂y
∂f ∂f ∂2 f ∂2 f
• (a + t, b + θ t) = (a, b) + (a, b)t + 2 (a, b)θt + ρ3 t , com lim ρ3 = 0 ,
∂y ∂y ∂x ∂y ∂y t→0

e
∂f ∂f ∂2 f
• (a, b + θt) = (a, b) + 2 (a, b)θt + ρ4 t , com lim ρ4 = 0.
∂y ∂y ∂ y t→0
 
∂2 f
Logo ϕ(t) = (a, b) + (ρ3 − ρ4 ) t2 , e, portanto,
∂x∂y
ϕ(t) ∂2 f
lim 2 = (a, b) . (II)
t→0 t ∂x ∂y
∂2 f ∂2 f
Assim, por (I) e (II), (a, b) = (a, b) . 
∂y ∂x ∂x ∂y

∂2 f ∂2 f
Corolário 7.1. Se f : U −→ R é de classe C2 no aberto U ⊂ Rn , então (x) = (x)
∂xi ∂xj ∂xj ∂xi
para todo x ∈ U e para todo 1 ≤ i, j ≤ n.

xy(x2 − y2 )
Exemplo 7.1. Seja f : R2 −→ R a função dada por f(x, y) = , se (x, y) 6= (0, 0), e
x 2 + y2
f(0, 0) = 0.

148 Instituto de Matemática UFF


O Teorema de Schwarz

A função f é de classe C∞ em R2 − {(0, 0)}. Além disso, temos que:


∂f f(x + t, 0) − f(x, 0)
• (x, 0) = lim = 0, x ∈ R;
∂x t→0 t
∂f ∂f
∂2 f (t, 0) − (0, 0)
• 2 (0, 0) = lim ∂x ∂x = 0;
∂x t→0 t
∂f f(0, y + t) − f(0, y)
• (0, y) = lim = 0, y ∈ R;
∂y t→0 t
∂f ∂f
(0, t) − (0, 0)
∂2 f ∂y ∂y
• 2 (0, 0) = lim = 0;
∂y t→0 t
∂f f(t, y) − f(0, y) ty(t2 − y2 )
• (0, y) = lim = lim = −y , y ∈ R ;
∂x t→0 t t→0 t(t2 + y2 )

∂f ∂f
∂2 f (0, t) − (0, 0) −t
• (0, 0) = lim ∂x ∂x = lim = −1 ;
∂y ∂x t→0 t t→0 t

∂f f(x, t) − f(x, 0) xt(x2 − t2 )


• (x, 0) = lim = lim = x, x ∈ R;
∂y t→0 t t→0 t(x2 + t2 )

∂f ∂f
(t, 0) − (0, 0)
∂2 f ∂y ∂y t
• (0, 0) = lim = lim = 1 .
∂x ∂y t→0 t t→0 t

Logo f possui derivadas parciais de segunda ordem em todos os pontos do plano, mas
∂2 f ∂2 f
(0, 0) 6= (0, 0) .
∂x, ∂y ∂y ∂x
∂f ∂f
Pode-se verificar também que e são contı́nuas em R2 , ou seja, f é de classe C1 em R2 ,
∂x ∂y
∂f ∂f
mas e não são diferenciáveis na origem. Logo f é diferenciável na origem, mas não é
∂x ∂y
duas-vezes diferenciável na origem.
∂2 f ∂2 f
Além disso, apesar das derivadas de segunda ordem e existirem em todos os pontos
∂x ∂y ∂y ∂x
do plano, elas não são contı́nuas na origem.

De fato, como para (x, y) 6= (0, 0),


∂f (y(x2 − y2 ) + xy 2x)(x2 + y2 ) − 2x xy(x2 − y2 )
(x, y) =
∂x (x2 + y2 )2
((3x2 y − y3 ))(x2 + y2 ) − 2x2 y(x2 − y2 )
=
(x2 + y2 )2
x4 y − y5 + 4x2 y3
= ;
(x2 + y2 )2
∂2 f (x4 − 5y4 + 12x2 y2 )(x2 + y2 )2 − (x4 y − y5 + 4x2 y3 )2(x2 + y2 )2y
(x, y) =
∂y ∂x (x2 + y2 )4
(x4 − 5y4 + 12x2 y2 )(x2 + y2 ) − 4y(x4 y − y5 + 4x2 y3 )
= ,
(x2 + y2 )3

J. Delgado - K. Frensel 149


Análise

∂2 f 8t4 · 2t2 − 16t6 ∂2 f ∂2 f


temos que (t, t) = = 0 e, portanto, lim (t, t) = 0 6
= (0, 0) = −1 .
∂y ∂x 8t6 t→0 ∂y ∂x ∂y ∂x
Como f é de classe C∞ em R2 −{(0, 0)}, e, portanto, duas vezes diferenciável em todos os pontos
∂2 f ∂2 f
(x, y) 6= (0, 0), temos que (x, y) = (x, y) para todo (x, y) 6= (0, 0).
∂x ∂y ∂y ∂x
∂2 f ∂2 f
Logo lim (t, t) = 0 6= (0, 0) = 1 . 
t→0 ∂x ∂y ∂x ∂y

Daremos, agora, outra versão do Teorema de Schwarz que decorre da Regra de Leibniz.

∂f ∂2 f
Teorema 7.2. Seja f : U ⊂ Rn −→ R uma função tal que existem e em todos os
∂xi ∂xi ∂xj
∂f ∂2 f ∂2 f
pontos de U, e as funções , : U −→ R são contı́nuas. Então, a derivada existe
∂xj ∂xi ∂xj ∂xj ∂xi
∂2 f ∂2 f
em todos os pontos de U e ≡ .
∂xj ∂xi ∂xi ∂xj

Prova.
Vamos supor n = 2 para simplificar a notação.

Dado (x0 , y0 ) ∈ U, existe ε > 0 tal que I × J ⊂ U, onde I = (x0 − ε, x0 + ε) e J = (y0 − ε, y0 + ε).
Seja b ∈ J. Pelo Teorema Fundamental do Cálculo,
Z temos que y
∂f
f(x, y) = f(x, b) + (x, t) dt ,
b ∂y
∂f
para todo (x, y) ∈ I × J, uma vez que é contı́nua, e, portanto, integrável.
∂y
∂f ∂2 f
Como , : I × J −→ R são contı́nuas, por hipótese, temos, pela Regra de Leibniz, que:
∂y ∂x ∂y Zy 2
∂f ∂f ∂ f
(x, y) = (x, b) + (x, t) dt .
∂x ∂x b ∂x ∂y
Zy
∂2 f ∂2 f
Logo, como o integrando é contı́nuo, temos, também, que a função (x, t) dt é
∂x ∂y b ∂x ∂y
derivável em relação a y e Z y 
∂ ∂2 f ∂2 f
(x, t) dt = (x, y) .
∂y b ∂x ∂y ∂x ∂y
∂f ∂2 f ∂2 f
Assim, possui derivada em relação a y e (x, y) = (x, y) para todo (x, y) ∈ I × J. 
∂x ∂y ∂x ∂x ∂y

Observação 7.2. Seja f : U ⊂ R2 −→ R uma função três vezes diferenciável. Então as seis
derivadas mistas de terceira ordem satisfazem:
∂3 f ∂3 f ∂3 f ∂3 f ∂3 f ∂3 f
= = e = = .
∂x ∂x ∂y ∂x ∂y ∂x ∂y ∂x ∂x ∂y ∂y ∂x ∂y ∂x ∂y ∂x ∂y ∂y
De fato, pelo Teorema de Schwarz,    2 
∂3 f ∂ ∂2 f ∂ ∂ f ∂3 f
= = = ,
∂x ∂x ∂y ∂x ∂x ∂y ∂x ∂y ∂x ∂x ∂y ∂x

150 Instituto de Matemática UFF


Fórmula de Taylor; pontos crı́ticos.

∂f
e, fazendo g = , temos que
∂x
  ∂f 
∂3 f ∂ ∂ ∂2 g ∂2 g ∂ ∂3 f
 ∂  ∂f 
= = = = = ,
∂x ∂y ∂x ∂x ∂y ∂x ∂x ∂y ∂y ∂x ∂y ∂x ∂x ∂y ∂x ∂x
uma vez que f e g são duas vezes diferenciáveis.

Analogamente, podemos provar as outras três igualdades acima.

No caso geral, se f : U ⊂ Rn −→ R é uma função p−vezes diferenciável no aberto U, então


para toda sequência de inteiros não-negativos i1 , . . . , in , com i1 + . . . + in = α ≤ p, a derivada
∂α
de ordem α, , que consiste em derivar i1 vezes em relação à variável x1 , . . ., in vezes
∂xi11 . . . ∂xinn
em relação à variável xn , não depende da ordem em que essas derivações foram efetuadas.

Para demonstrar o caso geral, basta sabermos que podemos trocar a ordem de duas deriva-
das sucessivas e que qualquer mudança de ordem numa sequência finita pode ser obtida por
transposições sucessivas entre dois termos consecutivos da sequência.

8 Fórmula de Taylor; pontos crı́ticos.

Seja f : U ⊂ Rn −→ R uma função p−vezes diferenciável no ponto a. Para cada vetor


v = (α1 , . . . , αn ) ∈ Rn , escrevemos:
X
n
∂f
df(a) v = (a)αi ;
∂xi
i=1
X
n
∂2 f
d2 f(a) v2 = (a)αi αj ;
∂xi ∂xj
i,j=1
.. ..
. .
X
n
∂p f
dp f(a) vp = (a)αi1 . . . αip ;
∂xi1 . . . ∂xip
i1 ,...,ip =1

Para cada p > 0, a forma dp f(a) : Rn −→ R chama-se p−ésima diferencial da função f no


ponto a.

Observação 8.1. dfp (a)(tv)p = tp dp f(a) vp , ou seja, dfp (a) é um polinômio homogêneo de
grau p nas coordenadas de v.

Observação 8.2. Usando a notação acima, a Regra da Cadeia enuncia-se do seguinte modo:
Seja f = (f1 , . . . , fn ) : U ⊂ Rm −→ Rn uma aplicação tal que fi : U −→ R é diferenciável em a

J. Delgado - K. Frensel 151


Análise

para todo i = 1, . . . , n, e seja g : V ⊂ Rn −→ R diferenciável em f(a) = b, com f(U) ⊂ V. Então


g ◦ f : U −→ R é diferenciável em a e, para todo v ∈ Rn ,
d(g ◦ f)(a) v = dg(f(a)) · (df1 (a) v, . . . , dfn (a) v) = dg(f(a)) df(a) v ,

De fato,
X X X
m m n
!
∂(g ◦ f) ∂g ∂f
d(g ◦ f)(a) v = (a) αi = (f(a)) k (a) αi
∂xi ∂yk ∂xi
i=1 i=1 k=1
X
n X
m
∂g ∂fk X
m
∂g
= (f(a)) (a) αi = (f(a)) dfk (a) v
∂yk ∂xi ∂yk
k=1 i=1 k=1

= dg(f(a))(df1 (a) v, . . . , dfn (a) v) .

Teorema 8.1. (Fórmula de Taylor com resto de Lagrange)


Seja f : U ⊂ Rn −→ R uma função de classe Cp , (p + 1)−vezes diferenciável no segmento
aberto (a, a + v), com [a, a + v] ⊂ U. Então existe θ ∈ (0, 1) tal que:
1
rp (v) = df(p+1) (a + θv) vp+1 ,
(p + 1)!
onde rp (v) é dado pela igualdade:
1 2 1
f(a + v) = f(a) + df(a) v + d f(a) v2 + . . . + dp f(a) vp + rp (v) .
2! p!

Prova.
Seja ε > 0 tal que a + tv ∈ U para todo t ∈ (−ε, 1 + ε), e seja λ : (−ε, 1 + ε) −→ Rn o ca-
minho C∞ dado por λ(t) = a + tv. Então a função ϕ = f ◦ λ : (−ε, 1 + ε) −→ R é de classe Cp
em (−ε, 1 + ε) e é (p + 1)−vezes diferenciável em (0, 1).

Logo, pela Fórmula de Taylor com resto de Lagrange para uma função real de uma variável real,
existe θ ∈ (0, 1), tal que
ϕ 00 (0) ϕ(p) (0)
ϕ(1) = ϕ(0) + ϕ 0 (0) + + ... + + rp ,
2! p!
ϕ(p+1) (θ)
onde rp = . (I)
(p + 1)!
Afirmação: ϕ(i) (t) = d(i) f(a + tv) vi , 1 ≤ i ≤ p + 1 , t ∈ (0, 1).

De fato,
∂f X
n
∂f
0
ϕ (t) = (a + tv) = df(a + tv) v = (a + tv) αi .
∂v ∂xi
i=1

Suponhamos, por indução, o resultado válido para uma função p−vezes diferenciável.
∂f
Seja f : U −→ R uma função (p + 1)−vezes diferenciável em (a, a + v). Então : U −→ R é
∂xi
p−vezes diferenciável, para todo i = 1, . . . , n.

152 Instituto de Matemática UFF


Fórmula de Taylor; pontos crı́ticos.

 
(i) i ∂f
Portanto, pela hipótese de indução, λj (t) = d (a + tv)vi , i = 1, . . . , p, onde
∂xj
∂f
λj (t) = (a + tv). Assim,
∂xj
X
n
(k)
Xn   
∂f

(k+1) k k
ϕ (t) = λj (t)αj = d (a + tv) v αj
∂xj
j=1  j=1 
 
∂f
X
n
 X
n ∂k
∂xj 
=  (a + tv) αj1 . . . αjk 
 αj
 ∂xj1 . . . ∂xjk
j=1 j1 ,...,jk =1

X
n
∂k+1 f
= (a + tv) αj1 . . . αjk αj
∂xj1 . . . ∂xjk ∂xj
j,j1 ,...,jk =1

= dk+1 f(a + tv) vk+1

para todo k = 1, . . . , p e todo v ∈ Rn .

• Como ϕ(1) = f(a + v) , ϕ(0) = f(a) , ϕ(i) (0) = di f(a) vi e ϕp+1 (θ) = df(p+1) (a + θv) vp+1 ,
temos, por (I), que a fórmula de Taylor com resto de Lagrange também é válida para funções
reais de n−variáveis. 

Teorema 8.2. (Fórmula de Taylor com resto integral)


Se f : U −→ R é uma função de classe Cp+1 e [a, a + v] ⊂ U, então
Z1
1
rp (v) = (1 − t)p dp+1 f(a + tv)vp+1 dt .
p! 0

Prova.
Como ϕ = f ◦ λ é de classe Cp+1 em (−ε, 1 + ε), temos, pela Fórmula de Taylor com resto
integral para funções reais de uma variável real, que
ϕ(p) (0)
ϕ(1) = ϕ(0) + ϕ 0 (0) + . . . + + rp ,
p!
Z1
1
onde rp = (1 − t)p ϕ(p+1) (t) dt .
p! 0
Logo,
1 (p)
f(a + v) = f(a) + df(a) v + . . . + d (a) vp + rp (v) ,
p!
onde
Z1
1
rp (v) = (1 − t)p dp+1 f(a + tv) vp+1 dt . 
p! 0

Antes de provarmos a Fórmula de Taylor Infinitesimal, faremos algumas considerações de

J. Delgado - K. Frensel 153


Análise

caráter geral.

Definição 8.1. Seja Rn × . . . × Rn o produto cartesiano de k−cópias do espaço Rn e seja


L : Rn × . . . × Rn −→ R uma transformação k−linear. Dizemos que L é simétrica se
L(v1 , . . . , vbi , . . . , vbj , . . . , vk ) = L(v1 , . . . , vbj , . . . , vbi , . . . , vk ) ,

para quaisquer v1 , . . . , vk ∈ Rn e todo par i, j = 1, . . . , n, com i < j.

Então, se vj = (αj1 , . . . , αjn ), j = 1, . . . , k, temos


X
L(v1 , . . . , vk ) = ai1 ,...,ik α1i1 . . . αkik ,

onde ai1 ,...,ik = L(ei1 , . . . , eik ) independe da ordem dos ı́ndices i1 , . . . , ik = 1, . . . , n.

Observação 8.3. Se f : U ⊂ Rn −→ R é uma função p−vezes diferenciável no ponto a, a


transformação k−linear dk f(a) : Rn × . . . × Rn −→ R definida por:
X
n
∂k f(a)
dk f(a)(v1 , . . . , vk ) = α1 . . . αkik ,
∂xi1 . . . ∂xik i1
i1 ,...,ik =1

chama-se k−ésima diferencial da função f no ponto a, para k = 1, . . . , p.

Por Schwarz, temos que dk f(a) é simétrica, 1 ≤ k ≤ p.

Observe que dk f(a)vk = dk f(a)(v, . . . , v) é a forma associada à aplicação k−linear dk f(a).

Definição 8.2. Dizemos que uma função f : Rn −→ R é k−homogênea quando f(tx) = tk f(x)
para todo x ∈ Rn e t ∈ R.

Exemplo 8.1. Se L : Rn × . . . × Rn −→ R é k−linear, então g : Rn −→ R definida por


g(x) = L(x, . . . , x) é k−homogênea, ou melhor, g é um polinômio homogêneo de grau k e,
portanto, g é C∞ . 

Observação 8.4. Seja f : Rn −→ R uma função k−homogênea de classe Ck , k ≥ 1.


∂j f
Afirmação 1: é uma função (k − j)−homogênea para todo 1 ≤ j ≤ k e para quaisquer
∂xi1 . . . ∂xij
i1 , . . . , ij = 1, . . . , n.

Como f(tx) = tk f(x), temos, pela Regra da Cadeia, que


∂f ∂f
(tx) t = tk (x) ,
∂xi ∂xi
para todo x ∈ Rn , t ∈ R, i = 1, . . . , n.
∂f ∂f
Logo, se t 6= 0, (tx) = tk−1 (x) para todo x ∈ Rn . Como f ∈ Ck , k ≥ 1, temos que
∂xi ∂xi
∂f ∂f
(tx) = tk−1 (x) para todo x ∈ Rn , t ∈ R.
∂xi ∂xi

154 Instituto de Matemática UFF


Fórmula de Taylor; pontos crı́ticos.

Suponhamos, por indução, que o resultado é válido para funções k − 1 homogêneas, k − 1 ≥ 1.


∂f
Sendo f ∈ Ck , temos que : Rn −→ R são de classe Ck−1 e (k − 1)−homogêneas, para todo
∂xi
i = 1, . . . , n.

Logo, pela hipótese de indução, para cada i = 1, . . . , n, temos que:


   
∂f ∂f
∂j ∂j
∂xi k−1−j ∂xi
(tx) = t (x) ,
∂xi1 . . . ∂xij ∂xi1 . . . ∂xij
para quaisquer i1 , . . . , ij = 1, . . . , n e para todo j = 1, . . . , k − 1. Ou seja,
∂j+1 f ∂j+1 f
(tx) = tk−1−j (x) ,
∂xi1 . . . ∂xij ∂xi ∂xi1 . . . ∂xij ∂xi
para todo j + 1 = 2, . . . , k, e para quaisquer i1 , . . . , ij , i = 1, . . . , n.

• Logo, se f : Rn −→ R é uma função k−homogênea de classe Ck , então


dj f(tx)(v1 , . . . , vj ) = tk−j dj f(x)(v1 , . . . , vj )

para todo j = 1, . . . , k.

Assim, dk f(tx)(v1 , . . . , vk ) = dk f(x)(v1 , . . . , vk ) para todo t ∈ R e todo x ∈ Rn . Em particular,


dk f(x) = dk f(0) independe do ponto x ∈ Rn .
∂k f ∂k f
Como (x) = (0) para todo x ∈ R e para quaisquer i1 , . . . , ik = 1, . . . , n,
∂xi1 . . . ∂xik ∂xi1 . . . ∂xik
temos que todas as derivadas parciais de ordem k de f são constantes.

Logo f é de classe C∞ e dj f(x) = 0 para todo j > k e para todo x ∈ Rn .

Afirmação 2: dk f(0)xk = k! f(x) e dj f(0)xj = 0 , se j 6= k. (II)

De fato, seja ϕ(t) = f(tx) = tk f(x). Então, como foi provado no Teorema 8.1, temos:
ϕ(i) (t) = di f(tx)xi , para todo i ∈ N.
k!
Mas, por outro lado, ϕ(i) (t) = tk−i f(x), para todo 1 ≤ i ≤ k, e ϕ(j) (t) = 0 para j > k.
(k − i)!
Logo di f(0)xi = 0 para i 6= k e dk f(0)xk = k! f(x).
1 k
Então f(x) = L(x, . . . , x), onde L = d f(0) é uma transformação k−linear simétrica.
k!
Como dk f(x) = dk f(0) para todo x ∈ Rn , temos que dk f(x) = k! L para todo x ∈ Rn .

• Se f não é de classe Ck , f não é necessariamente a forma associada a uma transformação


k−linear simétrica.

x2 − y2
Exemplo 8.2. Seja f : R2 −→ R a função definida por f(x, y) = xy , (x, y) 6= (0, 0), e
x2 + y2
f(0, 0) = 0.

J. Delgado - K. Frensel 155


Análise

Então f(tx, ty) = t2 f(x, y) para todo t ∈ R e todo (x, y) ∈ R2 , ou seja, f é uma função
2−homogênea. Mas, f não é a forma quadrática de uma transformação bilinear. Isso ocorre
porque f é de classe C1 , mas f não é duas vezes diferenciável na origem (verifique!). 

1
Afirmação 3: dj f(x)(v1 , . . . , vj ) = dk f(0)(x, . . . , x, v1 , . . . , vj ) para todo 1 ≤ j ≤ k.
(k − j)!
∂j f
Sejam 1 ≤ j ≤ k e g(x) = (x) , onde i1 , . . . , ij ∈ {1, . . . , n}. Como
∂xi1 . . . ∂xij

∂j f ∂j f
(tx) = tk−j (x),
∂xi1 . . . ∂xij ∂xi1 . . . ∂xij
temos que g é (k − j)−homogênea e, portanto, por (II), d(k−j) g(0)xk−j = (k − j)! g(x), ou seja,
 jf

∂ ∂j f
dk−j (0)xk−j = (k − j)! (x) ,
∂xi1 . . . ∂xij ∂xi1 . . . ∂xij
n
para todo x ∈ R e quaisquer i1 , . . . , ij = 1, . . . , n.

Logo, sendo v` = (α`1 , . . . , α`n ), ` = 1, . . . , j, temos que:


X
n
∂j f
j
d f(x)(v1 , . . . , vj ) = (x) α1i1 . . . αjij
∂xi1 . . . ∂xij
i1 ,...,ij =1
 
1 X
n X
n
∂k f(0)
=  x`1 . . . x`k−j  α1i1 . . . αjij
(k − j)! ∂x`1 . . . ∂x`k−j ∂xi1 . . . ∂xij
i1 ,...,ij =1 `1 ,...,`k−j =1

1
= dk f(0)(x, . . . , x, v1 , . . . , vj ) .
(k − j)!
• Em particular, seja T : Rn × . . . × Rn −→ R uma transformação k−linear e f : Rn −→ R dada
por f(x) = T (x, . . . , x). Então, como f é k−homogênea e de classe C∞ , temos, por (II), que
1
f(x) = T (x, . . . , x) = dfk (0)(x, . . . , x) ,
k!
ou seja,
dfk (0)(x, . . . , x) = k! T (x, . . . , x) . (III)

• Dada uma transformação k−linear T : Rn × . . . × Rn −→ R, a transformação k−linear TS =


X
Tσ , onde P é o conjunto de todas as permutações de {1, . . . , k} e Tσ (v1 , . . . , vk ) = T (vσ(1) , . . . , vσ(k) ),
σ∈P
é chamada simetrização da transformação T .

Observe que TS é k−linear simétrica e TS (x, . . . , x) = k! T (x, . . . , x).

Então, por (III),


dk f(0)(x, . . . , x) = TS (x, . . . , x) . (IV)

Afirmação 4: dk f(x) = dk f(0) = TS . Em particular dk f(x) = dk f(0) = k! T , se T é simétrica.

156 Instituto de Matemática UFF


Fórmula de Taylor; pontos crı́ticos.

De fato, por (IV), basta mostrar que se U : Rn × . . . × Rn −→ R é uma transformação k−linear


simétrica tal que g(x) = U(x, . . . , x) = 0 para todo x ∈ Rn , então U ≡ 0.

Vamos fazer a prova deste fato usando indução em k ∈ N.

Se k = 1, a afirmação é evidente.

Suponhamos o resultado válido para transformações (k − 1)−lineares, k − 1 ≥ 1.

Seja U : Rn × . . . × Rn −→ R uma transformação k−linear simétrica tal que U(x, . . . , x) = 0 para


todo x ∈ Rn .

Sejam v, w ∈ Rn e t ∈ R. Então,
 
k k−1
0 = U(v + tw, v + tw, . . . , v + tw) = t U(v, w, . . . , w)
k−1
   
k−2 k k
+t U(v, v, w, . . . , w) + . . . + t U(v, . . . , v, w) ,
k−2 1
para todo t ∈ R.

Logo U(v, w, . . . , w) = 0 para quaisquer v, w ∈ Rn .

Seja v ∈ Rn e defina U1 : Rn × . . . × Rn −→ R por U1 (v1 , . . . , vk−1 ) = U(v, v1 , . . . , vk−1 ). Então U1


é uma transformação (k − 1)−linear simétrica tal que U1 (w, . . . , w) = U(v, w, . . . , w) = 0 para
todo w ∈ Rn .

Logo, pela hipótese de indução, U1 ≡ 0, ou seja, U1 (v1 , . . . , vk−1 ) = 0 para quaisquer k − 1


vetores v1 , . . . , vk−1 ∈ Rn . Então U(v, v1 , . . . , vk−1 ) = 0 para quaisquer v, v1 , . . . , vk−1 ∈ Rn .
Assim U ≡ 0.

• Resumindo, se T : Rn × . . . × Rn −→ R é uma transformação k−linear e


f(x) = T (x, . . . , x), então para todo x ∈ Rn :

◦ dk f(x) = dk f(0) = TS ;

◦ dj f(x) = 0, se j > k.
1
◦ dj f(x)(v1 , . . . , vj ) = TS (x, . . . , x, v1 , . . . , vj ), se 1 ≤ j ≤ k, quaisquer que sejam
(k − j)!
v1 , . . . , vj ∈ Rn .

◦ dj f(0) = 0, se 1 ≤ j < k. 

• Passamos, agora, a analisar a Fórmula de Taylor Infinitesimal.


rp (v)
Se f : U −→ R é p−vezes diferenciável no ponto a ∈ U, então lim = 0, onde
v→0 kvkp
rp : U0 = {v ∈ Rn ; a + v ∈ U} −→ R é dada por:

J. Delgado - K. Frensel 157


Análise

1 2 1
rp (v) = f(a + v) − f(a) − df(a) v − d f(a)v2 − . . . − dp f(a)vp .
2! p!
De fato, seja g : U0 −→ R dada por g(v) = f(a + v). Então g é p−vezes diferenciável na origem,
pois a função v 7−→ a + v é de classe C∞ e f é p−vezes diferenciável em a.

Afirmação: dj g(0) = dj f(a), 1 ≤ j ≤ p.


∂k g ∂k f
Basta mostrar, por indução, que (0) = (a), para todo 1 ≤ k ≤ p e para
∂xi1 . . . ∂xik ∂xi1 . . . ∂xik
quaisquer i1 , . . . , ik ∈ {1, . . . , n}.

Para j = 1, temos, pela Regra da Cadeia (ver observação 8.2), que dg(0)v = df(a)v para todo
∂g ∂f
v ∈ Rn , ou seja, (0) = (a) para todo i = 1, . . . , n.
∂xi ∂xi
Suponhamos que o resultado seja válido para funções (p − 1)−vezes diferenciáveis no ponto
∂f
a ∈ U, p−1 ≥ 1. Seja f uma função p−vezes diferenciável no ponto a. Então é (p−1)−vezes
∂xi
diferenciável no ponto a, para todo i = 1, . . . , n.
∂f
Pela hipótese de indução, a função h dada por h(v) = (a + v), v ∈ U0 , é (p − 1)−vezes
∂xi
diferenciável na origem e
 
∂f
∂k
∂k h ∂xi
(0) = (a) , (V)
∂xi1 . . . ∂xik ∂xi1 . . . ∂xik
para 1 ≤ k ≤ p − 1, quaisquer que sejam i1 , . . . , ik ∈ {1, . . . , n}.

Logo, como p ≥ 2, temos que f é diferenciável numa vizinhança do ponto a e, portanto,


∂g ∂f
(v) = (a + v) para todo i = 1, . . . , n, e todo v numa vizinhança da origem.
∂xi ∂xi
∂g
Assim, h(v) = (v) e, por (V),
∂xi  
k ∂g

∂xi ∂k+1 f
(0) = (a) ,
∂xi1 . . . ∂xik ∂xi1 . . . ∂xik ∂xi
ou seja,
∂k+1 g ∂k+1 f
(0) = (a) ,
∂xi1 . . . ∂xik ∂xi ∂xi1 . . . ∂xik ∂xi
para todo k + 1 = 2, . . . , p e quaisquer i1 , . . . , ik , i ∈ {1, . . . , n}.

• Sendo Hk : Rn −→ R, Hk (v) = dk f(a)vk , 1 ≤ k ≤ p, temos, pelo provado na observação 8.4,


que dj Hk (0) = 0 se j ∈ {1, . . . , p} e j 6= k, e dk Hk (0) = k! dk f(a).

Logo rp (0) = 0 e dj rp (0) = dj f(a) − dj f(a) = 0 para todo j = 1, . . . , p.

Lema 8.1. Seja r : U0 ⊂ Rn −→ R uma função p−vezes diferenciável no ponto 0 ∈ U0 . Então


r(v)
r(0) = dr(0) = . . . = dp r(0) = 0 se, e somente se, lim = 0.
v→0 kvkp

158 Instituto de Matemática UFF


Fórmula de Taylor; pontos crı́ticos.

Prova.
(=⇒) Para p = 0, estamos supondo r contı́nua no ponto 0.

Para p = 1, r é diferenciável na origem e r(0) = dr(0) = 0. Logo, como


r(v) = r(0) + dr(0)v + ρ(v)kvk ,
r(v) r(v)
com lim ρ(v) = 0, temos que ρ(v) = , e, portanto, lim = 0.
v→0 kvk v→0 kvk

Suponhamos que o resultado é válido para funções (p − 1)−vezes diferenciáveis na origem,


p − 1 ≥ 1.

Seja r : U0 −→ R uma função p−vezes diferenciável na origem com r(0) = dr(0) = . . . =


dp r(0) = 0.
∂r
Então, para todo 1 ≤ i ≤ n, ϕi = : U0 −→ R é (p − 1)−vezes diferenciável na origem e
∂xi
∂r
(v)
p−1 ∂x i
ϕi (0) = dϕi (0) = . . . = d ϕi (0). Logo, pela hipótese de indução, lim = 0.
v→0 kvkp−1

Como p ≥ 2, r é diferenciável numa vizinhança V0 ⊂ U0 da origem e, portanto, pelo teorema do


valor médio, para todo v ∈ U0 , existe θv ∈ (0, 1) tal que
X
n
∂r ∂r
  
(θv v) αi
r(v) ∂xi X
n (θ v)
 ∂xi v  αi
= i=1
= |θv |p−1  .

kvkp kvkp kθv vkp−1 kvk
 
i=1


n
αi
Considerando R com a norma do máximo, temos que
≤ 1, para todo i = 1, . . . , n.
kvk
∂r
(θv v)
r(v) ∂xi
Logo lim = 0, uma vez que lim = 0, para todo i = 1, . . . , n.
v→0 kvkp v→0 kθv vkp−1

(⇐=) Para p = 0, lim r(v) = 0, e, portanto, r(0) = 0, pois estamos supondo r contı́nua na origem.
v→0

r(v)
Para p = 1, lim r(v) = lim kvk = 0. Então r(0) = 0, pois r é contı́nua na origem, uma vez
v→0 v→0 kvk
que r é diferenciável neste ponto. Além disso, como f é diferenciável na origem,
r(v) = r(0) + dr(0)v + r(v) = dr(0)v + r(v) ,
r(v) r(tv) r(tv)
onde lim = 0. Logo, para todo v ∈ Rn − {0} e para todo t ∈ R − {0}, = dr(0)v + .
v→0 kvk t t
Como
r(tv) r(tv)
lim = lim = 0,
t→0 ktvk t→0 ktvk

temos que  
r(tv) r(tv) r(tv) r(tv)
dr(0)v = lim − lim = lim ±kvk − = 0,
t→0 t t→0 t t→0 ktvk ktvk

J. Delgado - K. Frensel 159


Análise

para todo v ∈ Rn − {0}. Logo dr(0) = 0.

Suponhamos que o resultado é válido para funções p−vezes diferenciáveis no ponto 0, p ≥ 1.


r(v)
Seja r : U0 −→ R uma função (p + 1)−vezes diferenciável na origem com lim = 0. Como
v→0 kvkp+1
r(v) r(p)
lim p
= lim kvk = 0, temos, pela hipótese de indução, que
v→0 kvk v→0 kvkp+1
r(0) = dr(0) = . . . = dp r(0) = 0.

Mostraremos, agora, que dp+1 r(0) = 0.

De fato, pelo provado na primeira parte do lema, temos que


1
r(v) − dp+1 r(0)vp+1
(p + 1)!
lim = 0,
v→0 kvkp+1

já que dj ϕ(0) = 0, j = 1, . . . , p, e dp+1 ϕ(0) = (p + 1)! dp+1 r(0), onde ϕ(v) = dp+1 r(0)vp+1 .
Então, para todo v ∈ Rn − {0},
 
1
r(tv) − dp+1 r(0)(tv)p+1
(p + 1)!
lim = 0,
t→0+ ktvkp+1
e, portanto,
1 dp+1 r(0)vp+1 r(tv)
= lim+ = 0.
(p + 1)! kvkp+1 t→0 ktvkp+1

Ou seja, dp+1 r(0)vp+1 = 0 para todo v ∈ Rn . Então dp+1 r(0) = 0. 

Observação 8.5. (Unicidade da Fórmula de Taylor)


Seja f : U −→ R uma função p−vezes diferenciável no ponto a ∈ U e, para cada i = 1, . . . , p,
seja ϕi : Rn × . . . × Rn −→ R uma função i−linear. Se
f(a + v) = f(a) + ϕ1 v + ϕ2 v2 + . . . + ϕp vp + rp (v) ,
rp (v) 1
com lim p
= 0, então ϕi vi = di f(a)vi , para todo i = 1, . . . , p e todo v ∈ Rn .
v→0 kvk i!
rp (v)
De fato, como rp é p−vezes diferenciável no ponto 0 e lim = 0, temos, pelo lema acima,
v→0 kvkp
que rp (0) = drp (0) = . . . = dp rp (0) = 0. Mas, pela observação 8.4, di rp (0) = di f(a) − ϕSi , para
todo i = 1, . . . , p, onde ϕSi é a simetrização de ϕi . Logo ϕSi = di f(a), ou seja,
1 S i 1
ϕi vi = ϕi v = di f(a) vi ,
i! i!
para todo i = 1, . . . , p.

Definição 8.3. Seja f : U ⊂ Rn −→ R uma função duas vezes diferenciável no ponto a ∈ U. A


forma Hessiana Hf(a), de f no ponto a é a forma quadrática da transformação bilinear simétrica
d2 f(a), ou seja,

160 Instituto de Matemática UFF


Fórmula de Taylor; pontos crı́ticos.

X
n
∂2 f
2 2 2
Hf(a) v = d f(a) v = (a) αi αj ,
∂xi ∂xj
i,j=1
n
onde v = (α1 , . . . , αn ) ∈ R .
 
∂2 f
• Pelo teorama de Schwarz, a matriz (a) , chamada matriz Hessiana de f no ponto a,
∂xi ∂xj
é simétrica.

Definição 8.4. Seja f : U −→ R uma função diferenciável. Um ponto a ∈ U é um ponto crı́tico


∂f ∂f
de f (ou um ponto singular) quando df(a) = 0, ou seja, (a) = . . . = (a) = 0.
∂x1 ∂xn

Definição 8.5. Dizemos que a função f tem um máximo (respectivamente, um mı́nimo) local
no ponto a ∈ U quando existe δ > 0 tal que
kvk < δ =⇒ f(a + v) ≤ f(a) (respectivamente, f(a) ≤ f(a + v)) .

Observação 8.6. Se f : U −→ R é diferenciável no ponto a ∈ U e a é um ponto de máximo


local (ou de mı́nimo local), então a é um ponto crı́tico de f

De fato, neste caso o ponto 0 é um ponto de máximo (ou de mı́nimo) local para as funções reais
∂f
de uma variável real dadas por: ϕi (t) = f(a + tei ), i = 1, . . . , n. Logo (a) = ϕi0 (0) = 0, para
∂xi
todo i = 1, . . . , n.

Então df(a) = 0, ou seja, a é um ponto crı́tico de f.

Definição 8.6. Dizemos que um ponto crı́tico a de f é n


ão-degenerado quando a matriz Hes-
∂2 f
siana de f no ponto a é invertı́vel, ou seja, det (a) 6= 0.
∂xi ∂xj

Teorema 8.3. Seja f : U ⊂ Rn −→ R uma função duas vezes diferenciável. Todo ponto crı́tico
não-degenerado a ∈ U é um ponto crı́tico isolado.

Este teorema é consequência do seguinte resultado.

Teorema 8.4. Seja F = (f1 , . . . , fn ) : U ⊂ Rn −→ Rn uma função onde cada funç


 ão coorde-

∂fi
nada fi : U −→ R, i = 1, . . . , n, é diferenciável no ponto a ∈ U. Se a matriz H = (a)
∂xj n×n
tem determinante diferente de zero, então existe δ > 0 tal que
0 < kx − ak < δ =⇒ F(x) 6= F(a) .

A matriz H, referida no teorema acima, é chamada a matriz Jacobiana de f no ponto a.

Lema 8.2. Seja H : Rn −→ Rn uma transformação linear invertı́vel. Então existe c > 0 tal que
kH(x)k ≥ ckxk para todo x ∈ Rn .

J. Delgado - K. Frensel 161


Análise

Prova.
1 
Seja = kH−1 k = sup kH−1 (x)k | kxk = 1 > 0. Então, para todo x ∈ Rn :
c
kH(x)k
kxk = kH−1 (H(x))k ≤ kH−1 k kH(x)k = ,
c
ou seja, kH(x)k ≥ ckxk. 

Prova.
(Demonstração do teorema 8.4)

Como a função fi : U −→ R é diferenciável no ponto a, para cada i = 1, . . . , n, temos:


X
n
fi (x) = fi (a) + hij (xj − aj ) + ρi (x)kx − ak ,
j=1

∂fi
onde lim ρi (x) = 0 e hij = (a) .
x→a ∂xj
Fazendo ρ(x) = (ρ1 (x), . . . , ρn (x)), temos que:
F(x) = F(a) + H(x − a) + ρ(x) kx − ak ,

onde lim ρ(x) = 0.


x→a
1
Pelo lema 8.2, existe c = > 0 tal que kH(x)k ≥ ckxk para todo x ∈ Rn .
kH−1 k
c
Como lim ρ(x) = 0, existe δ > 0 tal que 0 < kx − ak < δ =⇒ kρ(x)k < .
x→a 2
Logo, se 0 < kx − ak < δ, obtemos:
kF(x) − F(a)k = k H(x − a) + ρ(x)kx − ak k ≥ kH(x − a)k − kρ(x)k kx − ak
c c
≥ ckx − ak − kx − ak = kx − ak ,
2 2
c
ou seja, kF(x) − F(a)k ≥ kx − ak.
2
Então F(x) 6= F(a) para todo x ∈ U tal que 0 < kx − ak < δ. 

Prova.
(Demonstração do teorema 8.3)
 
n ∂f ∂f
Seja F : U −→ R dada por F(x) = (x), . . . , (x) . Então F tem funções coordenadas
∂x1  ∂xn  2 
∂f ∂fi ∂ f
fi = diferenciáveis no ponto a e a matriz (a) = (a) é a matriz Hessiana de
∂xi ∂xj ∂xj ∂xi
f no ponto a. Logo, pelo teorema 8.4, existe δ > 0 tal que 0 < kx − ak < δ =⇒ F(x) 6= F(a) = 0,
ou seja, grad f(x) 6= 0. Provamos, assim, que se 0 < kx − ak < δ, então x não é um ponto crı́tico
de f. 

Corolário 8.1. O conjunto dos pontos crı́ticos não-degenerados de uma função duas vezes
diferenciável é enumerável.

162 Instituto de Matemática UFF


Fórmula de Taylor; pontos crı́ticos.

Prova.
Basta lembrar que todo conjunto discreto é enumerável. 

Corolário 8.2. Se todos os pontos crı́ticos de uma função f : U −→ R, duas vezes dife-
renciável, são não-degenerados, então em cada compacto K ⊂ U há apenas um número finito
deles.

Prova.
Como f é de classe C1 , o conjunto C dos pontos crı́ticos é um  subconjunto fechado  de U,
∂f ∂f
pois C = F−1 (0), onde F é a função contı́nua dada por F(x) = (x), . . . , (x) . Logo o
∂x1 ∂xn
conjunto dos pontos crı́ticos de f contidos num compacto K ⊂ U é fechado em K e é, portanto,
compacto. Como C ∩ K é compacto e discreto, temos que C ∩ K é finito. 
X
n
Definição 8.7. Seja H : R −→ R a forma quadrática dada por H v =
n 2
hij αi αj , onde
i,j=1
hij = hji , i, j = 1, . . . , n, e v = (α1 , . . . , αn ) ∈ Rn .

Dizemos que H é positiva (respectivamente negativa) se H v2 > 0 (respectivamente H v2 < 0)


para todo v ∈ Rn − {0}.

Se uma forma quadrática é positiva ou negativa, dizemos que ela é definida. E dizemos que
uma forma quadrática H é indefinida quando existem v, w ∈ Rn tais que H v2 > 0 e H w2 < 0.

Exemplo 8.3. Se h , i é um produto interno de Rn , a forma quadrática H v2 = hv, vi é positiva,


e a forma quadrática H v2 = −hv, vi é negativa.

E, para todo i = 1, . . . , n − 1, a forma quadrática


H v2 = α21 + . . . + α2i − α2i+1 − . . . − α2n ,

é indefinida. 

Observação 8.7.
• H é positiva se, e somente se, todos os autovalores da matriz simétrica (hij ) são positivos.

• H é negativa se, e somente se, todos os autovalores da matriz simétrica (hij ) são negativos.

Em particular, se H é definida então det(hij ) 6= 0, ou seja, a matriz (hij ) é invertı́vel.

Podemos também provar isto, observando que se Hv2 6= 0 para todo v ∈ Rn − {0} então
6 0 para todo v ∈ Rn − {0}, onde H0 = (hij ). Logo H0 v 6= 0 para todo v ∈ Rn − {0}
Hv2 = hH0 v, vi =
e, portanto, H0 é invertı́vel.

• H é indefinida se, e somente se, H0 = (hij ) possui um autovalor positivo e outro negativo.

J. Delgado - K. Frensel 163


Análise

Observação 8.8. Se f é duas vezes diferenciável no ponto a, df(a) = 0 e Hf(a) é positiva ou


negativa, então a é um ponto crı́tico não-degenerado.

Teorema 8.5. Sejam f : U −→ R uma função duas vezes diferenciável no ponto crı́tico a ∈ U
e H a forma quadrática Hessiana de f no ponto a. Então:

(1) Se H é positiva, a é ponto de mı́nimo local não-degenerado;

(2) Se H é negativa, a é ponto de máximo local não-degenerado;

(3) Se H é indefinida, a não é ponto de mı́nimo local nem de máximo local de f.

Prova.
Seja δ0 > 0 tal que Bδ0 (a) ⊂ U. Então a + v ∈ U se 0 < kvk < δ0 .

Para todo v ∈ Rn , com 0 < kvk < δ0 , temos " #


 2
1 1 v r(v)
f(a + v) = f(a) + Hv2 + r(v) = f(a) + H + kvk2 . (?)
2 2 kvk kr(v)k2

Como a função ϕ0 : Rn −→ R, ϕ0 (v) = Hv2 é contı́nua e Sn−1 = {v ∈ Rn | kvk = 1} é compacto,


temos que se H é positiva, existe c > 0 tal que ϕ0 (u) ≥ c para todo u ∈ Sn−1 .
 2
v
Logo H ≥ c para todo v ∈ Rn − {0}.
kvk
r(v)
Além disso, temos que lim = 0, pois f é duas vezes diferenciável no ponto a. Logo existe
v→0 kvk2
r(v) c
0 < δ < δ0 , tal que 0 < kvk < δ =⇒ 2 < .
kvk 4
c c
 c
Assim, f(a+v)−f(a) ≥ − kvk2 = kvk2 > 0 para todo 0 < kvk < δ, ou seja, f(a+v) > f(a)
2 4 4
para todo 0 < kvk < δ. Então a é um ponto de mı́nimo local para f.

A afirmação (2) prova-se de modo análogo.

Se H é indefinida, existem v, w ∈ Rn − {0} tais que Hv2 > 0 e Hw2 < 0. Então, para todo t 6= 0,
temos que H (tv)2 = t2 Hv2 > 0 e H (tw)2 = t2 Hw2 < 0. Logo, por (?),
f(a + tv) − f(a) r(tv) f(a + tw) − f(a) r(tw)
2
= Hv2 + 2 e 2
= Hw2 + 2 .
t t t t
r(tv) r(tw)
Como lim 2 = lim 2 = 0, segue-se que
t→0 t t→0 t

f(a + tv) − f(a) f(a + tw) − f(a)


lim = Hv2 > 0 e lim = Hw2 < 0.
t→0 t2 t→0 t2
Logo existe δ > 0 tal que 0 < |t| < δ =⇒ f(a + tv) − f(a) > 0 e f(a + tw) − f(a) < 0.

Portanto, a não é ponto de máximo local nem de mı́nimo local para f. 

164 Instituto de Matemática UFF


O teorema da função implı́cita

Exemplo 8.4. Seja f : Rm+n = Rm × Rn −→ R a função definida por f(x, y) = hx, xi − hy, yi,
∂f ∂f
onde x ∈ Rm e y ∈ Rn . Então = 2xi e = −2yj . Logo grad f(x, y) = 2(x, −y) e, portanto,
∂xi ∂yj
a origem é o único ponto crı́tico de f.

A matriz Hessiana de f em qualquer ponto de Rm+n é a matriz diagonal cujas m primeiras


entradas na diagonal principal são iguais a 2 e as n últimas são iguais a −2.

Então a matriz Hessiana é positiva se n = 0, negativa se m = 0, e indefinida se mn 6= 0. Assim,


a origem é ponto de mı́nimo se n = 0 e de máximo se m = 0.

Para mn 6= 0, f não admite mı́nimo nem máximo na origem, que se chama um ponto de sela,
devido à forma do gráfico da função f(x, y) = x2 − y2 . 

Observação 8.9. Como vimos na demonstração do teorema 8.5, se grad f(a) = 0 e Hv2 > 0
para algum v ∈ Rn , então existe δ > 0 tal que 0 < |t| < δ =⇒ f(a + tv) > f(a). Então se a é um
ponto de máximo local de f, a forma Hessiana de f no ponto a é não-positiva, isto é, Hv2 ≤ 0
para todo v ∈ Rn . De modo análogo, se a é um ponto de mı́nimo local de f, então a forma
Hessiana de f no ponto a é não-negativa, ou seja, Hv2 ≥ 0 para todo v ∈ Rn .

Mas a recı́proca destas afirmações são falsas, ou seja, quando a forma hessiana de f num ponto
crı́tico é ≤ 0 (ou ≥ 0) não se pode afirmar que a função tem um máximo (ou um mı́nimo) neste
ponto.

Por exemplo, sejam as funções f : R2 −→ R e g : R2 −→ R dadas por


f(x, y) = x2 e g(x, y) = x2 + y3 .

Então grad f(x, y) = (2x, 0), grad g(x, y) = (2x, 3y2 ), e as hessianas de f e g no ponto crı́tico
(0, 0) coincidem e são não-negativas, pois Hf(0, 0)v2 = Hg(0, 0)v2 = 2α2 para todo v = (α, β) ∈
R2 . Mas a origem é um ponto de mı́nimo para f e não é um mı́nimo local para g.

9 O teorema da função implı́cita

Começamos observando o seguinte exemplo:

Seja f : R2 −→ R dada por f(x, y) = x2 + y2 . Então S1 = f−1 (1) = {(x, y) ∈ R2 | x2 + y2 = 1}.

A equação x2 + y2 = 1 não define y como função de x, nem x como função de y,


globalmente. Mas, se tomarmos U1 = {(x, y) ∈ R2 | y > 0}; U2 = {(x, y) ∈ R2 | y < 0};
U3 = {(x, y) ∈ R2 | x > 0} e U4 = {(x, y) ∈ R2 | x < 0}, temos que:

J. Delgado - K. Frensel 165


Análise

Fig. 8: O cı́rculo unitário S1 = {(x, y) ∈ R2 | x2 + y2 = 1}


p
• (x, y) ∈ S1 ∩ U1 ⇐⇒ y = 1 − x2 e x ∈ (−1, 1) ;
p
• (x, y) ∈ S1 ∩ U2 ⇐⇒ y = − 1 − x2 e x ∈ (−1, 1) ;
p
• (x, y) ∈ S1 ∩ U3 ⇐⇒ x = 1 − y2 e y ∈ (−1, 1) ;
p
• (x, y) ∈ S1 ∩ U4 ⇐⇒ x = − 1 − y2 e y ∈ (−1, 1) .

Como S1 = (U1 ∩ S1 ) ∪ (U2 ∩ S1 ) ∪ (U3 ∩ S1 ) ∪ (U4 ∩ S1 ), temos que


S1 = Graf ξ1 ∪ Graf ξ2 ∪ Graf ξ3 ∪ Graf ξ4 ,

onde ξi : (−1, 1) −→ R, i = 1, 2, 3, 4, são as funções de classe C∞ dadas por:


p p p p
ξ1 (x) = 1 − x2 , ξ2 (x) = − 1 − x2 , ξ3 (y) = 1 − y2 , e ξ4 (y) = − 1 − y2 ,

Logo todo ponto (x0 , y0 ) ∈ S1 pertence a um aberto V de R2 tal que V ∩ S1 é o gráfico de


uma função de classe C∞ definida num aberto de R.

Definição 9.1. Dizemos que um conjunto C ⊂ R2 é uma curva de classe Ck (0 ≤ k ≤ ∞)


quando C é localmente o gráfico de uma função de classe Ck . Ou seja, para todo ponto p ∈ C
existe um aberto V ⊂ R2 tal que p ∈ V e V ∩ C é o gráfico de uma função ξ de classe Ck definida
num aberto de R.

Fig. 9: Uma curva de classe Ck é, localmente, o gráfico de uma função de classe Ck

166 Instituto de Matemática UFF


O teorema da função implı́cita

Exemplo 9.1. O cı́rculo S1 é uma curva de classe C∞ .

Exemplo 9.2. O conjunto C = {(x, y) ∈ R2 | x2 − y2 = 0} não é uma curva nem de classe C0 ,


pois, para todo aberto V contendo a origem, C ∩ V não é o gráfico de uma função y = ξ(x) nem
x = ξ(y), uma vez que C ∩ V contém sempre dois segmentos de reta de inclinação ±1 que se
cortam na origem. 

Fig. 10: O conjunto C não é uma curva nem de classe C0 .

Exemplo 9.3. O conjunto C = {(x, y) ∈ R2 | x2 − y2 = 1} é uma curva desconexa de classe


C∞ , pois C = (V1 ∩ C) ∪ (V2 ∩ C), onde V1 = {(x, y) ∈ R2 | x > 0} e V2 = {(x, y) ∈ R2 | x < 0} são
abertos de R2 tais que:

Fig. 11: O conjunto C é uma curva desconexa de classe C∞ .

• V1 ∩ C é o gráfico da função C∞ ξ1 : R −→ R2 dada por ξ1 (y) =


p
1 + y2 ,

• V2 ∩ C é o gráfico da função C∞ ξ2 : R −→ R2 dada por ξ2 (y) = − 1 + y2 


p

Analisaremos, agora, um exemplo de um subconjunto de Rn+1 que é dado localmente


como o gráfico de uma função definida num aberto de Rn .

J. Delgado - K. Frensel 167


Análise

Exemplo 9.4. Seja f : Rn+1 −→ R dada por f(x) = hx, xi e seja


f−1 (1) = Sn = {x ∈ Rn+1 | hx, xi = 1}

a esfera unitária n−dimensional.

Indiquemos por U ⊂ Rn a bola aberta de raio 1 e centro na origem.

Para cada i = 1, . . . , n + 1, sejam Vi = {x ∈ Rn+1 | xi > 0} e Wi = {x ∈ Rn+1 | xi < 0}.

Escrevendo x? = (x1 , . . . , xi−1 , xi+1 , . . . , xn ), temos:


x ∈ Sn ∩ Vi ⇐⇒ kx? k < 1 e
p
1 − hx? , x? i
xi =
x ∈ Sn ∩ Wi ⇐⇒ kx? k < 1 e xi = − 1 − hx? , x? i .
p

Logo, se ξ : U −→ R é a função C∞ dada por ξ(u) = 1 − hu, ui , Sn ∩ Vi é o gráfico da função


p

xi = ξ(x? ) e Sn ∩ Wi é o gráfico da função xi = −ξ(x? ), para cada i = 1, . . . , n + 1.


n+1
! n+1
!
[ [
Como Sn = Vi ∩ Sn ∪ Wi ∩ Sn , todo ponto p ∈ Sn pertence a um aberto Z de Rn+1
i=1 i=1
tal que Z ∩ Sn é o gráfico de uma função de classe C∞ definida num aberto de Rn . 

Definição 9.2. Um conjunto M ⊂ Rn+1 chama-se uma hipersuperfı́cie (ou hiperfı́cie) de classe
Ck , 0 ≤ k ≤ ∞, de Rn+1 quando M é localmente o gráfico de uma função de classe Ck de n
variáveis. Ou seja, todo ponto p ∈ M pertence a um aberto V ⊂ Rn+1 tal que V ∩ M é o gráfico
de uma função de classe Ck definida num aberto de Rn (existem um aberto U ⊂ Rn , uma função
ξ : U −→ R de classe Ck e um inteiro i ∈ {1, . . . , n + 1} tais que xi = ξ(x1 , . . . , xi−1 , xi+1 , . . . , xn+1 )
e x? = (x1 , . . . , xi−1 , xi+1 , . . . , xn+1 ) ∈ U).

Quando n = 1, dizemos que M ⊂ R2 é uma curva, e quando n = 2, dizemos que M ⊂ R3 é uma


superfı́cie.

Observação 9.1. Podemos também considerar as hipersuperfı́cies diferenciáveis (caso in-


termediário entre C0 e C1 ) que são localmente gráficos de funções diferenciáveis.

Exemplo 9.5. Sn é uma hipersuperfı́cie de classe C∞ de Rn+1 . 

Seja M ⊂ Rn+1 e seja p ∈ M. Definimos Tp M como sendo o conjunto de todos os vetores


velocidade λ 0 (0), onde λ : (−ε, ε) −→ M ⊂ Rn+1 é um caminho diferenciável em t = 0 e λ(0) = p.

Quando M é uma hipersuperfı́cie diferenciável, o conjunto Tp M chama-se o espaço tan-


gente a M no ponto p.

Teorema 9.1. Se M ⊂ Rn+1 é uma hipersuperfı́cie diferenciável, então Tp M é um subespaço


vetorial de dimensão n do espaço euclidiano Rn+1 , para cada p ∈ M.

168 Instituto de Matemática UFF


O teorema da função implı́cita

Prova.
Dado p = (a1 , . . . , an+1 ) ∈ M, existem abertos V ⊂ Rn+1 , U ⊂ Rn , com p ∈ V, um inteiro
i ∈ {1, . . . , n + 1} e uma função ξ : U −→ R diferenciável tais que x ∈ V ∩ M ⇐⇒ xi = ξ(x? ),
onde x? = (x1 , . . . , xi−1 , xi+1 , . . . , xn+1 ) ∈ U.
 
X ∂ξ
Afirmação: Tp M = v = (α1 , . . . , αn+1 ) ∈ Rn+1 αi = (p? ) αj ,
∂xj
j6=i

onde p? = (a1 , . . . , ai−1 , ai+1 , . . . , an+1 ) .

De fato, seja v ∈ Tp M. Então existe um caminho diferenciável em t = 0, λ : (−ε, ε) −→ M, com


λ(0) = p e λ 0 (0) = v. Como V é aberto, p ∈ V e λ é contı́nuo em t = 0, existe 0 < ε0 ≤ ε tal que
λ(t) ∈ M ∩ V para todo t ∈ (−ε0 , ε0 ).

Logo λi (t) = ξ(λ1 (t), . . . , λi−1 (t), λi+1 (t), . . . , λn+1 (t)) para todo t ∈ (−ε0 , ε0 ).

Pela Regra da Cadeia,


X ∂ξ
λi0 (0) = (p? ) λj0 (0) ,
∂xj
j6=i
X ∂ξ
ou seja, αi = (p? )αj .
∂xj
j6=i
X ∂ξ
Sejam agora v = (α1 , . . . , αn+1 ) ∈ Rn+1 tal que αi = (p? )αj e ε > 0 tal que p? + tv? ∈ U
∂xj
j6=i
para todo t ∈ (−ε, ε), onde v? = (v1 , . . . , vi−1 , vi+1 , . . . , vn+1 ).

Podemos, assim, definir o caminho λ : (−ε, ε) −→ M ∩ V pondo λj (t) = aj + tαj , j 6= i, e


λi (t) = ξ(λ1 (t), . . . , λi−1 (t), λi+1 (t), . . . , λn+1 (t)) = ξ(p? + tv? ) .

Logo λ é diferenciável em t = 0, λ(0) = p e λ 0 (0) = v. Então v ∈ Tp M, provando, assim, a


afirmação.

Assim, Tp M é um subespaço vetorial de dimensão n de Rn+1 gerado pelos vetores linearmente


independentes
e1 + c1 ei , . . . , ei−1 + ci−1 ei , ei+1 + ci+1 ei , . . . , en+1 + cn+1 ei ,
 
∂ξ
onde cj = (p? ) .
∂xj
Outra maneira de interpretar a afirmação acima é dizer que ela caracteriza Tp M como o núcleo
do funcional linear não-nulo ϕ : Rn+1 −→ R, dado por
X
ϕ(v) = αi − cj αj ,
j6=i

∂ξ ?
onde v = (α1 , . . . , αn+1 ) e cj = (p ). Ou ainda, Tp M é o gráfico do funcional linear
∂xj

J. Delgado - K. Frensel 169


Análise

dξ(p? ) : Rn −→ R, dado por:


X ∂ξ
v? = (α1 , . . . , αi−1 , αi+1 , . . . , αn+1 ) 7−→ dξ(p? )v? = (p? )αj .
∂xj
j6=i

Exemplo 9.6. Seja Sn = {x ∈ Rn+1 | hx, xi = 1}. Já sabemos que Sn é uma hipersuperfı́cie de
classe C∞ .

Afirmação: Tp Sn = {v ∈ Rn+1 | hv, pi = 0} = [p]⊥ , para todo p ∈ Sn .

De fato, seja λ : (−ε, ε) −→ Sn uma curva diferenciável em t = 0 com λ(0) = p e λ 0 (0) = v.

Então, como hλ(t), λ(t)i = 1 para todo t ∈ (−ε, ε) , temos que 2hλ 0 (0), λ(0)i = 0 , ou seja,
hv, pi = 0 . Logo Tp Sn ⊂ [p]⊥ e, portanto, Tp Sn = [p]⊥ , pois dim Tp Sn = dim[p]⊥ = n. 

Para hipersuperfı́cies M ⊂ Rn+1 de classe C0 , Tp M pode não ser um espaço vetorial de


dimensão n.
p
Exemplo 9.7. Seja X = {(x, y, z) ∈ R3 | z = x2 + y2 } o cone de vértice na origem e eixo−z.
Então, para p = (0, 0, 0), Tp M = {(0, 0, 0)}.

Fig. 12: Cone X de vértice na origem.

De fato, seja λ : (−ε, ε) −→ X uma curva diferenciável em t = 0 com λ(0) = (0, 0, 0)


p
e λ 0 (0) = (v1 , v2 , v3 ) . Então, se λ(t) = (λ1 (t), λ2 (t), λ3 (t)), λ3 (t) = (λ1 (t))2 + (λ2 (t))2 ,
λ1 (t) λ (t)
v1 = λ10 (0) = lim e v2 = λ20 (0) = lim 2 .
t→0 t t→0 t
Logo, r
(λ1 (t))2 + (λ2 (t))2
q
1p
v3 = lim+ (λ1 (t))2 + (λ2 (t))2 = lim+ = v21 + v22 ,
t→0 t t→0 t2
e r
(λ1 (t))2 + (λ2 (t))2
q
1p
v3 = lim− (λ1 (t))2 + (λ2 (t))2 = lim− − =− v21 + v22 .
t→0 t t→0 t2

170 Instituto de Matemática UFF


O teorema da função implı́cita

q
Portanto, v21 + v22 = 0, ou seja, v1 = v2 = v3 = 0. 

Exemplo 9.8. Seja Y a superfı́cie de classe C0 dada por Y = {(x, y, z) ∈ R3 | z = |x|}. Então,
para p = (0, 0, 0), Tp Y = {(0, β, 0) | β ∈ R} é um espaço vetorial de dimensão 1 (6= 2) em R3 .

Fig. 13: Superfı́cie Y.

De fato, seja λ : (−ε, ε) −→ Y, λ(t) = (λ1 (t), λ2 (t), λ3 (t)), uma curva diferenciável em t = 0 com
λ(0) = (0, 0, 0) e λ 0 (0) = (v1 , v2 , v3 ) = v.
λ1 (t)
Então λ3 (t) = |λ1 (t)| e v1 = λ10 (0) = lim .
t→0 t
Suponhamos que v1 > 0. Então existe 0 < ε0 < ε tal que λ1 (t) > 0 para t ∈ (0, ε0 ) e λ1 (t) < 0
para t ∈ (−ε0 , 0). Assim,
λ3 (t) |λ (t)| λ (t)
v3 = λ30 (0) = lim± = lim± 1 = lim± ± 1 = ±v1 .
t→0 t t→0 t t→0 t
Logo v1 = 0, uma contradição. De modo análogo, podemos provar que v1 não pode ser negativo.

Então v1 = 0 e, portanto, v3 = 0, ou seja, v ∈ {(0, β, 0) ∈ R3 | β ∈ R}.

Reciprocamente, seja v = (0, β, 0) , β ∈ R. Então a curva λ : R −→ Y, dada por λ(t) = (0, βt 0),
é de classe C∞ , λ(0) = (0, 0, 0) e λ 0 (0) = (0, β, 0). Logo (0, β, 0) ∈ Tp Y para todo β ∈ R.

Assim, Tp Y = {(0, β, 0) ∈ R3 | β ∈ R} . 

Definição 9.3. Seja f : U ⊂ Rn −→ R uma função diferenciável no aberto U. Dizemos que


c ∈ R é um valor regular de f quando não existem pontos crı́ticos de f no nı́vel c, ou seja,
grad f(x) 6= 0 para todo x ∈ f−1 (c). Quando c é um valor regular de f, diz-se que o nı́vel c é
regular. Quando existem pontos crı́ticos x ∈ U tais que f(x) = c, dizemos que c é um nı́vel
crı́tico de f .

Observação 9.2. Se f−1 (c) = ∅, então c é um valor regular.

Exemplo 9.9. Seja f : R2 −→ R a função de classe C∞ dada por f(x, y) = x2 + y2 .

J. Delgado - K. Frensel 171


Análise

Como grad f(x, y) = (2x, 2y) para todo (x, y) ∈ R2 , temos que grad f(x, y) = (0, 0) se, e só se,
(x, y) = (0, 0). Logo f−1 (c) é um nı́vel regular para todo c ∈ R − {0}, pois f(0, 0) = 0. 

Teorema 9.2. (Teorema Global da Função Implı́cita)


Sejam f : U ⊂ Rn+1 −→ R uma função de classe Ck , k ≥ 1, definida no aberto U, e c ∈ f(U) um
valor regular de f. Então M = f−1 (c) é uma hipersuperfı́cie de classe Ck e
Tp M = ker df(p) = {v ∈ Rn+1 | df(p)(v) = 0} = {v ∈ Rn+1 | hv, grad f(p)i = 0},

para todo p ∈ M.

Exemplo 9.10. Seja f : Rn+1 −→ R a função de classe C∞ dada por f(x) = hx, xi. Como
∂f
grad f(x) = 2x, pois (x) = 2xi , para todo i = 1, . . . , n + 1, grad f(x) = 0 se, e somente se,
∂xi
x = 0, ou seja, se, e só se, f(x) = 0. Assim, f−1 (c) é um nı́vel regular para todo c ∈ R − {0},
sendo f−1 (c) = ∅, se c < 0, e f−1 (c) = Sn√c (0), se c > 0. Logo, pelo teorema acima, Sn√c é uma
hipersuperfı́cie de classe C∞ e
Tp Sn√c (0) = {v ∈ Rn+1 | hv, 2pi = 0} = [p]⊥ ,

para todo p ∈ Sn√c (0). 

Exemplo 9.11. Seja det : Rn2 = Rn × . . . × Rn −→ R a função de classe C∞ que associa a


cada matriz n × n, X = (xij ), o seu determinante.

Como a expansão de det X pelas entradas da i−ésima linha é


X
n
det X = (−1)i+j xij X[i,j] ,
j=1

onde X[i,j] é o determinante da matriz (n − 1) × (n − 1) que se obtém da matriz X omitindo a


i−ésima linha e a j−ésima coluna, temos que
∂ det
(X) = (−1)i+j X[i,j] ,
∂xij
2
para todo X ∈ Rn e todos i, j = 1, . . . , n.
∂ det
Em particular, no ponto X = I, temos (I) = δij , i, j = 1, . . . , n, ou seja, o gradiente da função
∂xij
determinante no ponto I é a matriz identidade.

Seja U = {X ∈ Rn | det X 6= 0} o conjunto aberto formado pelas matrizes n × n invertı́veis. Então


2

∂ det
a restrição det : U −→ R é uma função C∞ sem pontos crı́ticos. De fato, se (X) = 0 para
∂xij
todo i, j = 1, . . . , n, então
X
n
det X = (−1)i+j xij X[i,j] = 0 ,
j=1

e, portanto, X 6∈ U. Logo todo c ∈ R é um valor regular para a função det : U → R.

172 Instituto de Matemática UFF


O teorema da função implı́cita

Em particular,
M = det−1 (1) = (conjunto das matrizes n × n que têm determinante igual a 1)

é uma hipersuperfı́cie de classe C∞ em Rn . M é um grupo relativamente à multiplicação de


2

matrizes, conhecido como o grupo unimodular de Rn .


2
O espaço tangente TI (M) de M no ponto I é o subespaço de dimensão n2 − 1 de Rn formado
pelas matrizes n × n de traço nulo, pois grad(det(I)) = I e, portanto,
 
2
Xn X
n
TI M = X ∈ Rn hX, Ii = xij δij = xii = traço X = 0 . 

i,j=1 i=1

Observação 9.3. Toda hipersuperfı́cie M ⊂ Rn+1 , sendo localmente o gráfico de uma função
xi = ξ(x1 , . . . , xi−1 , xi+1 , . . . , xn+1 ) = ξ(x? ), de n variáveis, é também localmente a imagem
inversa f−1 (0) do valor regular 0 da função f(x) = xi − ξ(x? ), definida no aberto V ⊂ Rn+1 tal que
∂f
V ∩ M é o gráfico de ξ, pois (x) = 1 para todo x ∈ V e f−1 (0) = {x ∈ V | xi = ξ(x? )} = V ∩ M.
∂xi
Y
n+1 Y
Para isso, estamos supondo V = Ij , onde cada Ij é um intervalo aberto, e U = Ij é o
j=1 j6=i
domı́nio da função ξ.

Mas não é verdade que toda hipersuperfı́cie M ⊂ Rn+1 seja globalmente a imagem inversa de
um valor regular, pois se M = f−1 (c), a aplicação ϕ = grad f : M −→ Rn+1 fornece um campo
contı́nuo de vetores normais não-nulos ao longo de M, uma vez que ϕ(p) = grad f(p) ⊥ v para
todo v ∈ Tp M. As hipersuperfı́cies que admitem um campo contı́nuo de vetores normais não-
nulos ϕ : M −→ Rn+1 chamam-se hipersuperfı́cies orientáveis. Mas nem toda hipersuperfı́cie
em Rn+1 é orientável, como a faixa de Möbius em R3 (ver §14, Cap. V).

Portanto, existem hipersuperfı́cies em Rn+1 que não são globalmente a imagem inversa de um
valor regular.

Lema 9.1. Sejam X ⊂ Rm , K ⊂ Rk compacto, f : X × K −→ Rp contı́nua e c ∈ Rp . Se f−1 (c) é


o gráfico de uma aplicação ξ : X −→ K (isto é, para todo x ∈ X existe um único y = ξ(x) ∈ K tal
que f(x, ξ(x)) = c) então ξ é contı́nua.

Prova.
Dado x0 ∈ X, seja y0 = ξ(x0 ) ∈ K e seja {xn } uma sequência de pontos de X tal que xn −→ x0 .

Queremos provar que lim ξ(xn ) = y0 .


n→∞

Como a sequência {ξ(xn )} é limitada, pois ξ(xn ) ∈ K para todo n ∈ N, basta mostrar que toda
subsequência {ξ(xn )}n∈N 0 convergente em Rk tem limite y0 .

J. Delgado - K. Frensel 173


Análise

Seja N 0 ⊂ N tal que lim0 ξ(xn ) = y. Então y ∈ K, pois K é compacto. Além disso, como f é
n∈N
contı́nua e f(xn , ξ(xn )) = c para todo n ∈ N, temos c = lim0 f(xn , ξ(xn )) = f(x0 , y).
n∈N

Logo f(x0 , y) = f(x0 , y0 ) e, portanto, pela unicidade, y = y0 . 

Observação 9.4. Supondo K apenas limitado, o lema acima nem sempre é válido. Por exem-
plo, seja f : R × [0, 1) −→ R a função contı́nua definida por f(x, y) = (x2 + y2 )(ye|x| − 1). Então,
para cada x ∈ R, existe um único y ∈ [0, 1) tal que f(x, y) = 0, pois se x = 0, então y = 0, uma
vez que 1 6∈ [0, 1), e se x 6= 0, y = e−|x| ∈ [0, 1).

Logo f−1 (0) é o gráfico da função ξ : R −→ [0, 1) dada por ξ(0) = 0 e ξ(x) = e−|x| , se x ∈ R − {0},
que não é contı́nua em x = 0.

No teorema abaixo, representaremos os pontos de Rn+1 por pares (x, y), onde x ∈ Rn e
y ∈ R.

Teorema 9.3. (Teorema da Função Implı́cita)


Seja f : U −→ R uma função de classe Ck , k ≥ 1, definida num aberto U ⊂ Rn+1 . Seja
∂f
p = (x0 , y0 ) ∈ U tal que f(p) = c e (p) 6= 0.
∂y
Então existem uma bola aberta B = Bδ (x0 ) ⊂ Rn e um intervalo aberto J = (y0 − ε, y0 + ε) tais
que B × J ⊂ U e f−1 (c) ∩ (B × J) é o gráfico de uma função ξ : B −→ J de classe Ck (isto é, para
todo x ∈ B existe um único y = ξ(x) ∈ J tal que f(x, y) = c).

Para cada x ∈ B, tem-se:


∂f
− (x, ξ(x))
∂ξ ∂xi
(x) = , i = 1, . . . , n.
∂xi ∂f
(x, ξ(x))
∂y
A função y = ξ(x) diz-se definida implicitamente no aberto U × J pela equação f(x, y) = c.

Fig. 14: Função y = ξ(x) definida implicitamente no aberto U × J.

174 Instituto de Matemática UFF


O teorema da função implı́cita

Prova.
∂f ∂f
Suponhamos que (x0 , y0 ) > 0. Como : U −→ R é contı́nua, existem δ 0 > 0 e ε > 0, tais
∂y ∂y
∂f
que B 0 × J ⊂ U e (x, y) > 0 para todo (x, y) ∈ B 0 × J, onde B 0 = Bδ 0 (x0 ) e J = (y0 − ε, y0 + ε).
∂y
Então, para todo x ∈ B 0 , a função y 7−→ f(x, y) é estritamente crescente no intervalo
J = [y0 − ε, y0 + ε]. Como f(x0 , y0 ) = c, temos que f(x0 , y0 − ε) < c e f(x0 , y0 + ε) > c.

Pela continuidade de f, existe 0 < δ < δ 0 tal que f(x, y0 − ε) < c e f(x, y0 + ε) > c para todo
x ∈ B = Bδ (x0 ). Então, pelo Teorema do Valor Intermediário, existe, para cada x ∈ B, um único
y = ξ(x) ∈ J tal que f(x, y) = c. Logo y = ξ(x) ∈ J e f−1 (c) ∩ (B × J) = f−1 (c) ∩ (B × J) é o
gráfico de uma função ξ : B −→ J a qual, pelo lema anterior, é contı́nua.

Mostraremos agora que, em todo ponto x ∈ B, existem as derivadas parciais de ξ.

Seja x ∈ B e tome k = k(t) = ξ(x + tei ) − ξ(x). Então,


ξ(x + tei ) = ξ(x) + k e f(x + tei , ξ(x) + k) = f(x, ξ(x)) = c ,

para todo t ∈ (−δ0 , δ0 ), onde δ0 foi escolhido de modo que x + tei ∈ B para todo t ∈ (−δ0 , δ0 ).

Pelo Teorema do Valor Médio, para todo t ∈ (−δ0 , δ0 ), existe θ = θ(t) ∈ (0, 1) tal que:
∂f ∂f
0 = f(x + tei , ξ(x) + k) − f(x, ξ(x)) = (x + θtei , ξ(x) + θk)t + (x + θtei , ξ(x) + θk)k.
∂xi ∂y
Logo,
∂f
(x + θtei , ξ(x) + θk)
ξ(x + tei ) − ξ(x) k ∂xi
= =−
t t ∂f
(x + θtei , ξ(x) + θk) .
∂y
Pela continuidade de ξ, lim k(t) = 0. Então, pela continuidade das derivadas parciais de f, a
t→0
∂ξ
derivada parcial (x) existe e é igual a
∂xi
∂f
(x, ξ(x))
∂ξ ∂x
(x) = − i (I)
∂xi ∂f
(x, ξ(x))
∂y
para todo i = 1, . . . , n.
∂ξ
Como f é de classe C1 e ξ é contı́nua, temos, por (I), que é contı́nua para todo i = 1, . . . , n,
∂xi
ou seja, ξ é de classe C1 .

Suponhamos, por indução, que se f é de classe Ck−1 , então ξ é de classe Ck−1 , k − 1 ≥ 1.

Seja f ∈ Ck . Então ξ é de classe Ck−1 e as derivadas parciais de f são de classe Ck−1 .


∂ξ
Assim, por (I), é de classe Ck−1 para todo i = 1, . . . , n, ou seja, ξ é de classe Ck . 
∂xi

J. Delgado - K. Frensel 175


Análise

Observação 9.5. No teorema da função implı́cita, não há nada especial a respeito da última
variável. Ou seja, vale o seguinte resultado:

Seja f : U −→ R uma função de classe Ck definida no aberto U ⊂ Rn+1 . Se um ponto p =


∂f
(x01 , . . . , x0n+1 ) ∈ U é tal que f(p) = c e (p) 6= 0 para algum i = 1, . . . , n + 1, então existe ε > 0
∂xi
Y
n+1 Y
n+1
tal que V = (x0k − ε, x0k + ε) ⊂ U e uma função ξ : B = (x0k − ε, x0k + ε) −→ (x0i − ε, x0i + ε)
k=1 k=1
k 6= i
de classe Ck cujo gráfico é f−1 (c) ∩ V, ou seja, o conjunto f (c) ∩ V é dado por: −1


(x1 , . . . , xn+1 ) ∈ Rn+1 | (x1 , . . . , xi−1 , xi+1 , . . . , xn+1 ) ∈ B e ξ(x1 , . . . , xi−1 , xi+1 , . . . , xn+1 ) = xi .

Além disso,
∂f
(x1 , . . . , xi−1 , ξ(x? ), xi+1 , . . . , xn+1 )
∂ξ ? ∂xj
(x ) = − ,
∂xj ∂f
(x1 , . . . , xi−1 , ξ(x? ), xi+1 , . . . , xn+1 )
∂xi
para todo x ∈ B e todo j = 1, . . . , n + 1 , j 6= i, onde x? = (x1 , . . . , xi−1 , xi+1 , . . . , xn+1 ).

Corolário 9.1. Seja f : U −→ R uma função de classe Ck , k ≥ 1, no aberto U ⊂ Rn+1 . Se


∂f
ξ : W −→ R é contı́nua no aberto W ⊂ Rn com (x, ξ(x)) ∈ U, (x, ξ(x)) 6= 0 e f(x, ξ(x)) = c
∂y
para todo x ∈ W, então ξ é de classe Ck .

Observação 9.6. No corolário acima, não basta supor que c é um valor regular de f. Por
exemplo, seja a função f : R2 −→ R de classe C∞ , dada por f(x, y) = x − y3 . Então, como
grad f(x, y) = (1, −3y2 ), todo c ∈ R é valor regular de f, mas a função contı́nua ξ : R −→ R,

dada por ξ(x) = 3 x, satisfaz f(x, ξ(x)) = 0 para todo x ∈ R e não é diferenciável na origem.
∂f
Observe que (x, 0) = 0 para todo x ∈ R.
∂y

Prova.
(do Teorema Global da Função Implı́cita)
∂f
Seja p ∈ f−1 (c). Como grad f(p) 6= 0, existe i ∈ {1, . . . , n + 1} tal que (p) 6= 0. Logo, pelo
∂xi
teorema da função implı́cita, existe um aberto V ⊂ Rn+1 tal que p ∈ V e V ∩ f−1 (c) é o gráfico de
uma função de classe Ck definida num aberto de Rn . Então M = f−1 (c) é uma hipersuperfı́cie
de classe Ck .

Seja v ∈ Tp M. Então existe uma curva λ : (−ε, ε) −→ M diferenciável em t = 0 tal que


λ(0) = p e λ 0 (0) = v. Logo df(p)v = (f ◦ λ) 0 (0) = 0, pois f(λ(t)) = c para todo t ∈ (−ε, ε). Assim,
hgrad f(p), vi = 0 para todo v ∈ Tp M, ou seja, Tp M ⊂ [grad f(p)]⊥ e, portanto,
Tp M = [grad f(p)]⊥ , pois dim Tp M = dim[grad f(p)]⊥ = n . 

176 Instituto de Matemática UFF


Multiplicador de Lagrange

10 Multiplicador de Lagrange

Seja M ⊂ Rn+1 uma hipersuperfı́cie de classe Ck , k ≥ 1, contida num aberto U ⊂ Rn+1 , e


f : U −→ R uma função de classe Ck .

Os pontos crı́ticos de f : U −→ R são, como já definimos anteriormente, os pontos x ∈ U


∂f
tais que grad f(x) = 0, ou seja, (x) = 0 para todo v ∈ Rn+1 . Isto equivale a dizer que
∂v
(f ◦ λ) 0 (0) = 0 para todo caminho λ : (−ε, ε) −→ U diferenciável em t = 0 tal que λ(0) = x.

Por analogia, daremos a seguinte definição:

Definição 10.1. Dizemos que p ∈ M é um ponto crı́tico de f|M se (f ◦ λ) 0 (0) = 0 para todo
∂f
caminho λ : (−ε, ε) −→ M diferenciável em t = 0 com λ(0) = p. Isto significa que (p) = 0
∂v
para todo v ∈ Tp M, ou seja, p ∈ M é um ponto crı́tico de f|M se, e só se, hgrad f(p), vi = 0 para
todo v ∈ Tp M, ou ainda, se, e somente se, o vetor grad f(p) é normal à hipersuperfı́cie M no
ponto p.

Observação 10.1. Se p ∈ M é um ponto de máximo ou de mı́nimo local de f|M , então p


é um ponto crı́tico de f|M, pois para toda curva λ : (−ε, ε) −→ M diferenciável em t = 0 com
λ(0) = p, 0 é ponto de máximo ou de mı́nimo local da função real f ◦ λ : (−ε, ε) −→ R e, portanto,
df(p)v = (f ◦ λ) 0 (0) = 0.

Observação 10.2. Todo ponto crı́tico de f em U que pertence a M é um ponto crı́tico de f|M ,
pois, neste caso, grad f(p) = 0 e, portanto, hgrad f(p), vi = 0 para todo v ∈ Rn+1 .

Mas pode existir um ponto crı́tico de f|M que não é ponto crı́tico de f em U, isto é, no qual grad f
não se anula.

Exemplo 10.1. Sejam f : R2 −→ R a função de classe C∞ dada por f(x, y) = y, e M = S1 =


{(x, y) ∈ R2 | x2 + y2 = 1}. Então f não possui ponto crı́tico, pois grad f(x, y) = (0, 1) 6= (0, 0) para
todo (x, y) ∈ R2 . Mas (0, −1) e (0, 1) são pontos crı́ticos de f|M , pois (0, −1) é o ponto de mı́nimo
e (0, 1) é o ponto de máximo de f|M .

Em geral, se a hipersuperfı́cie M ⊂ Rn+1 é compacta, então f|M admite pelo menos dois pontos
crı́ticos: os pontos onde f|M assume seus valores máximo e mı́nimo. 

Teorema 10.1. (do Multiplicador de Lagrange)


Sejam ϕ : U ⊂ Rn+1 −→ R uma função de classe Ck , M = ϕ−1 (c), onde c ∈ ϕ(U) é um valor
regular de ϕ, e f : U −→ R uma função de classe Ck . Um ponto p ∈ M é ponto crı́tico de f|M
se, e só se, existe um número real λ ∈ R tal que grad f(p) = λ grad ϕ(p).

J. Delgado - K. Frensel 177


Análise

Prova.
Para todo ponto p ∈ M, temos Tp M = [grad ϕ(p)]⊥ , pois M é uma hipersuperfı́cie de nı́vel
de ϕ. Além disso, p é ponto crı́tico de f|M se, e só se, grad f(p) ⊥ Tp M.

Como Tp M ⊂ Rn+1 é um subespaço vetorial de dimensão n, temos que p ∈ M é ponto crı́tico


de f|M se, e só se, grad f(p) é um múltiplo de grad ϕ(p). 

A pesquisa dos pontos crı́ticos de f|M reduz-se, portanto, a resolver o sistema de n + 2


equações 
 ∂f (p) = λ ∂ϕ (p) , i = 1, . . . , n + 1 ,
∂xi ∂xi

ϕ(p) = c ,
nas n + 2 incógnitas λ, x1 , . . . , xn+1 , onde p = (x1 , . . . , xn+1 ). O número λ chama-se o multiplica-
dor de Lagrange.

Observação 10.3. A condição grad f(p) = λ grad ϕ(p) significa que a hipersuperfı́cie M é
tangente à hipersuperfı́cie de nı́vel de f que passa pelo ponto crı́tico p da função f|M . No caso
em que se podem esboçar as superfı́cies de nı́vel da função f, esta observação auxilia a localizar
os pontos crı́ticos (ver exemplo abaixo).

Observação 10.4. Quando a hipersuperfı́cie M não é dada como imagem inversa ϕ−1 (c)
de um valor regular, os pontos crı́ticos de f|M são simplesmente os pontos p ∈ M nos quais
grad f(p) é normal a M, ou seja, grad f(p) ⊥ v para todo v ∈ Tp M.

Exemplo 10.2. Seja f : R2 −→ R a função de classe C∞ dada por f(x, y) = ax + by, com
a2 + b2 6= 0, e seja S1 = ϕ−1 (1), onde ϕ : R2 −→ R é dada por ϕ(x, y) = x2 + y2 . Como 1 é valor
regular de ϕ, os pontos crı́ticos de f|S1 são os
pontos (x, y) ∈ S1 onde grad f(x, y) = (a, b)
e grad ϕ(x, y) = (2x, 2y) são múltiplos. Então
(a, b) = λ(x, y) e x2 + y2 = 1. Isto nos dá
a b
x= p e y= p ,
a2 + b2 a2 + b2
ou
a b
x = −p e y = −p .
a2 + b2 a2 + b2
Nestes pontos, f|S1 assume, respectivamente,
Fig. 15: Pontos crı́ticos de f|S1 .
p
seu valor máximo igual à a2 + b2 , e seu va-
p
lor mı́nimo igual a − a2 + b2 , pois
p
|f(x, y)| ≤ a2 + b2 para todo (x, y) ∈ S1 . 

178 Instituto de Matemática UFF


Multiplicador de Lagrange

Exemplo 10.3. Dados uma hipersuperfı́cie M ⊂ Rn+1 e um ponto b ∈ Rn+1 tal que b 6∈ M,
determinar o ponto p ∈ M mais próximo a b. No caso em que M é fechada, um tal ponto sempre
existe.

Consideremos a função f : Rn+1 − {b} −→ R de classe C∞ dada por f(x) = kx − bk. Os


pontos onde f|M assume seu valor mı́nimo, caso existam, estão entre os pontos crı́ticos de f|M ,
x−b
isto é, entre os pontos x ∈ M onde grad f(x) é normal a M. Como grad f(x) = , pois
kx − bk
∂f x − bi
(x) = i , para todo i = 1, . . . , n, os pontos crı́ticos de f|M , entre os quais se encontram
∂xi kx − bk
os pontos de M situados a uma distância mı́nima do ponto b, são os pontos x ∈ M tais que
x − b é normal a M. 

Fig. 16: x − b é normal a M.

Exemplo 10.4. Seja A : Rn −→ Rn uma transformação linear autoadjunta, isto é, hAx, yi =
hx, Ayi para quaisquer x, y ∈ Rn . Isto equivale a dizer que a matriz (aij ) de A com respeito à
base canônica é simétrica, pois aij = hAej , ei i = hAei , ej i = aji .

Um número real λ é um autovalor de A quando existe um vetor y ∈ Rn − {0} tal que Ay = λy. E
os autovetores associados ao autovalor λ são os vetores x ∈ Rn tais que Ax = λx.

Em geral, uma transformação linear A : Rn −→ Rn não precisa ter autovalores reais, como a
rotação de ângulo θ ∈ (0, π) no plano.

Afirmação: Se A : Rn −→ Rn é uma transformação linear autoadjunta, então existe uma base


ortonormal de Rn formada por autovetores de A.

De fato, seja f : Rn −→ R a forma quadrática dada por f(x) = hAx, xi ou, em termos de
Xn
coordenadas, f(x) = aij xi xj .
i,j=1

Para determinarmos uma base ortonormal de autovetores de A estudaremos os pontos crı́ticos

J. Delgado - K. Frensel 179


Análise

de f na esfera unitária Sn−1 ⊂ Rn . Como Sn−1 = ϕ−1 (1), onde 1 é valor regular da função
ϕ(x) = hx, xi, temos que x ∈ Sn−1 é um ponto crı́tico de f|Sn−1 se, e só se, os vetores grad f(x)
∂f Xn
e grad ϕ(x) = 2x são múltiplos. Sendo (x) = 2 aij xj , temos que grad f(x) = 2Ax. Logo
∂xi
j=1
n−1
os pontos crı́ticos de f|Sn−1 são os pontos u ∈ S tais que Au = λu e, num tal ponto, temos
f(u) = hλu, ui = λ, pois hu, ui = 1.

Provamos, assim, que dada a forma quadrática f : Rn −→ R, f(x) = hAx, xi, onde A : Rn −→ Rn
é autoadjunta, um ponto u ∈ Sn−1 é um ponto crı́tico de f|Sn−1 se, e só se, Au = λu, onde
λ = f(u). Ou seja, λ = f(u) é um autovalor de A e u é um autovetor de norma 1 associado ao
autovalor λ.

Em particular, se λ1 é o valor máximo de f no compacto Sn−1 atingido no ponto u1 ∈ Sn−1 , então


λ1 é o maior autovalor de A e Au1 = λ1 u1 .

Seja E = {x ∈ Rn | hx, u1 i = 0} o complemento ortogonal do vetor u1 . Se x ∈ E, então hAx, u1 i =


hx, Au1 i = λ1 hx, u1 i = 0. Logo A(E) ⊂ E e, portanto, por restrição, obtemos uma transformação
linear autoadjunta A : E −→ E.

Seja λ2 o valor máximo da forma quadrática f entre os vetores unitários pertencentes a E, e seja
u2 ∈ E tal que |u2 | = 1 e f(u2 ) = λ2 . Então λ2 é um autovalor de A e Au2 = λ2 u2 .

Prosseguindo desta maneira, obtemos uma base ortonormal de Rn , {u1 , u2 , . . . , un }, formada


por autovetores de A. 

Exemplo 10.5. A média geométrica de n números reais positivos x1 , . . . , xn é menor do que


ou igual à média aritmética destes números, isto é,
√ x1 + . . . + xn
n
x1 · . . . · xn ≤ ,
n
e a igualdade vale se, e só se, x1 = . . . = xn .

De fato, sejam x1 , . . . , xn n números reais positivos, f : Rn −→ R a função de classe C∞ dada


por f(y1 , . . . , yn ) = y1 · . . . · yn e c = x1 + . . . + xn .

Vamos determinar o valor máximo de f na hipersuperfı́cie


Mc = {(y1 , . . . , yn ) ∈ Rn | y1 + . . . + yn = c , y1 > 0, . . . , yn > 0} .

Consideremos o aberto U = {(y1 , . . . , yn ) ∈ Rn | y1 > 0, . . . , yn > 0} e a função ϕ : U −→ R de


classe C∞ dada por ϕ(y1 , . . . , yn ) = y1 + . . . + yn .

Então ϕ−1 (c) = Mc é uma hipersuperfı́cie de classe C∞ de Rn , pois grad ϕ(y) = (1, 1, . . . , 1) 6=
(0, 0, . . . , 0) para todo y ∈ U.

180 Instituto de Matemática UFF


Multiplicador de Lagrange

Como Mc é compacto, pois Mc ⊂ [0, c] × . . . × [0, c], existe z ∈ Mc tal que f(z) é o valor máximo
de f|Mc . Então z ∈ Mc , pois f(y) = 0 para todo y ∈ Mc − Mc e f(y) > 0 para todo y ∈ Mc .
∂f Y
n
Sendo (y) = yj , para todo i = 1, . . . , n, temos, pelo método do multiplicador de La-
∂yi
j=1
j 6= i
Y
grange, que grad f(z) = λ grad ϕ(z) = (λ, . . . , λ). Então z1 + . . . + zn = c, zi > 0 e zj = λ,
j6=i
para todo i = 1, . . . , n.
Y
n
Afirmação: Se z1 , . . . , zn ∈ R − {0} e zj = λ para todo i = 1, . . . , n, então z1 = . . . = zn .
j=1
j 6= i

Vamos provar esta afirmação por indução sobre n.

Se n = 2, é claro que z1 = z2 .

Suponhamos o resultado válido para n − 1, n − 1 ≥ 2. Sejam z1 , . . . , zn n números reais não-


Y
n
nulos tais que zj = λ para todo i = 1, . . . , n. Como, para todos i, i 0 ∈ {1, . . . , n − 1},
j=1
j 6= i
Y
n Y n Y
n−1 Y
n−1
0
i 6= i , zj = zj , e zn 6= 0, temos zj = zj . Logo, pela hipótese de indução,
j=1 j=1 j=1 j=1
j 6= i j 6= i 0 j 6= i j 6= i 0
z1 = . . . = zn−1 . Além disso, z1 = zn , pois z1 z2 . . . zn−1 = z2 z3 . . . zn−1 zn .

Então z1 = z2 = . . . = zn−1 = zn , provando a afirmação.

c
Como z1 + . . . + zn = c, temos z1 = . . . = zn = .
n
 c n
Logo f(x1 , . . . , xn ) ≤ f(z1 , . . . , zn ) = , pois (x1 , . . . , xn ) ∈ Mc . Assim,
n
 x + . . . + x n
n
x1 . . . x n ≤ 1 ,
n
ou seja,
√ x1 + . . . + xn
n
x1 . . . x n ≤ ,
n
para quaisquer números reais positivos x1 , . . . , xn , e a igualdade vale se, e só se, x1 = . . . = xn .


Exemplo 10.6. (Desigualdade de Hadamard)


Se X é uma matriz n × n cujas linhas são os vetores Xi = (xi1 , . . . , xin ), então
| det X| ≤ kX1 k . . . kXn k,

onde k k é a norma Euclidiana.

J. Delgado - K. Frensel 181


Análise

Se det X = 0, a desigualdade é evidente. Se det X 6= 0, então todos os vetores-linhas são não-


Xi
nulos. Neste caso, podemos considerar os vetores unitários Wi = , i = 1, . . . , n. Então,
kXi k
como Xi = kXi kWi , temos que det X = kX1 k . . . kXn k det W, onde W é a matriz cujas linhas são
os vetores unitários W1 , . . . , Wn . A desigualdade ficará provada se mostrarmos que | det W| ≤ 1.
Mais geralmente:
X
n
Afirmação: Se W = (wij ) é uma matriz n × n tal que w2ij = n então | det W| ≤ 1.
i,j=1

De fato, sejam f, ϕ : Rn −→ R as funções de classe C∞ dadas por f(X) = det X e


2

X
n
∂ϕ ∂f
ϕ(X) = (xij )2 . Então, para todos i, j = 1, . . . , n, (X) = 2xij e (X) = (−1)i+j X[i,j] ,
∂xij ∂xij
i,j=1
onde X[i,j] é o determinante da matriz (n − 1) × (n − 1), obtida de X pela omissão da i−ésima
linha e da j−ésima coluna.

Assim, para todo n ∈ N, ϕ−1 (n) = M é uma hipersuperfı́cie compacta de classe C∞ em Rn .


2

2 √
Mais precisamente, M é a esfera em Rn de centro na origem e raio n.

Então, pelo método do Multiplicador de Lagrange, uma matriz W = (wij ) é um ponto crı́tico de
X
n
f|M se, e só se, w2ij = n e grad f(W) = λ grad ϕ(W) para algum λ real, ou seja,
i,j=1
(−1)i+j W[i,j] = 2λwij , (?)

para quaisquer i, j = 1, . . . , n.

Multiplicando por wij , somando e levando em conta a expansão de um determinante em relação


às entradas de uma linha, temos:
X
n X
n
n det W = (−1)i+j wij W[i,j] = 2λ w2ij = 2λn .
i,j=1 i,j=1

Logo det W = 2λ.

Multiplicando agora (?) por wij , fixando i e somando em relação a j, obtemos:


Xn X
n X
n
i+j 2
det W = (−1) wij W[i,j] = 2λ wij = (det W) w2ij .
j=1 j=1 j=1

Se W é uma matriz onde f|M atinge seu valor máximo ou mı́nimo, então det W 6= 0 e, pela
X
n
2
igualdade acima, kXi k = w2ij = 1 para todo i = 1, . . . , n, ou seja, os vetores-linha têm norma
j=1
igual a 1.

Multiplicando (?) por wkj , k 6= i, e somando em relação a j, temos:


X n Xn
i+j
(−1) wkj W[i,j] = 2λ wkj wij = 2λhWk , Wi i .
j=1 j=1

182 Instituto de Matemática UFF


Multiplicador de Lagrange

X
n
Logo hWk , Wi i = 0 para k 6= i, pois (−1)i+j wkj W[i,j] = 0, por ser o desenvolvimento, em
j=1
relação à i−ésima linha, do determinante de uma matriz com duas linhas (a i−ésima e a
k−ésima) iguais a Wk .

Assim, todo ponto W ∈ M onde f|M atinge seu valor máximo ou mı́nimo é uma matriz cujas
linhas são vetores unitários dois a dois ortogonais, ou seja W é uma matriz ortogonal. Logo
det W = +1, se W é um ponto de máximo, e det W = −1, se W é um ponto de mı́nimo. Então
−1 ≤ det W ≤ 1 para todo W ∈ M, ou seja, −kX1 k . . . kXn k ≤ det X ≤ kX1 k . . . kXn k para toda
matriz X.

E a igualdade | det X| = kX1 k . . . kXn k ocorre se, e só se, X1 , . . . , Xn são vetores dois a dois
ortogonais, no caso em que det X 6= 0. 

Observação 10.5. O valor absoluto de det X é o volume do paralelepı́pedo n−dimensional


determinado pelos vetores-linha X1 , . . . , Xn da matriz X. Assim, a desigualdade de Hadamard
significa, geometricamente, que se mantivermos constantes (não-nulos) os comprimentos des-
ses vetores, | det X| torna-se máximo quando eles forem 2 a 2 ortogonais e, neste caso, o volume
do paralelepı́pedo é o produto kX1 k . . . kXn k dos comprimentos de suas arestas.

J. Delgado - K. Frensel 183


184 Instituto de Matemática UFF
Capı́tulo 4

Aplicações diferenciáveis

1 Diferenciabilidade de uma aplicação

Definição 1.1. Uma aplicação f : U −→ Rn , definida no aberto U ⊂ Rm , é diferenciável no


ponto a ∈ U quando existe uma transformação linear T : Rm −→ Rn tal que, para todo v ∈ Rm ,
com a + v ∈ U, tem-se

f(a + v) = f(a) + Tv + r(v) , (?)


r(v)
onde lim = 0.
v→0 kvk

r(v)
Seja a aplicação ρ : U0 −→ Rn , dada por ρ(v) = , se v 6= 0, e ρ(0) = 0, onde
kvk
U0 = {v ∈ Rm | a + v ∈ U} é um aberto que contém a origem. Então f é diferenciável no ponto a
se, e só se, lim ρ(v) = 0, ou seja, ρ é contı́nua na origem.
v→0

Observação 1.1. O fato de uma aplicação ser ou não diferenciável num determinado ponto
independe das normas tomadas em Rn e Rm .

Observação 1.2. Toda aplicação diferenciável no ponto a é contı́nua neste ponto, pois
r(v)
lim f(a + v) = f(a) + lim Tv + lim kvk = f(a) .
v→0 v→0 v→0 kvk

Definição 1.2. Seja f : U −→ Rn uma função definida num aberto U ⊂ Rm . A derivada


direcional de f num ponto a ∈ U, relativamente a um vetor v ∈ Rm , é o limite
∂f f(a + tv) − f(a)
(a) = lim ∈ Rn ,
∂v t→0 t
quando tal limite existe.

185
Análise

Seja δ > 0 tal que o segmento (a − δv, a + δv) está contido em U e considere o caminho
∂f
retilı́neo λ : (−δ, δ) −→ U, dado por λ(t) = a + tv. Então (a) é o vetor velocidade do caminho
∂v
f ◦ λ : (−δ, δ) −→ Rn no instante t = 0, pois
f ◦ λ(t) − f ◦ λ(0) f(a + tv) − f(a) ∂f
(f ◦ λ) 0 (0) = lim = lim = (a) .
t→0 t t→0 t ∂v

Fig. 1: Derivada direcional de f em a relativamente a v

Se f = (f1 , . . . , fn ) então
∂f
 ∂f ∂fn

1
(a) = (a), . . . , (a) .
∂v ∂v ∂v
∂f
Quando v = ej é o j−ésimo vetor da base canônica de Rm , escrevemos (a) em vez de
∂xj
∂f
(a). Assim,
∂ej  
∂f ∂f1 ∂f
(a) = (a), . . . , n (a) .
∂xj ∂xj ∂xj

Observação 1.3. Seja f diferenciável no ponto a. Então, para todo v ∈ Rm e para t ∈ R


suficientemente pequeno,
f(a + tv) − f(a) = T (tv) + ρ(tv)ktvk ,

com lim ρ(tv) = 0. Como T (tv) = t Tv e ktvk = |t| kvk, temos que
t→0
f(a + tv) − f(a)
lim = Tv ± lim ρ(tv)kvk = Tv ,
t→0 t t→0
∂f
Logo Tv = (a). Em particular, obtemos que a transformação linear que satisfaz (?) é única.
∂v
Esta transformação, designada por f 0 (a) ou Df(a), é chamada a derivada de f no ponto a.

Para n = 1, a derivada f 0 (a) é a diferencial df(a) estudada no capı́tulo anterior.

Definição 1.3. A matriz n × m da transformação linear f 0 (a) : Rm −→ Rn , em relação às


bases canônicas de Rm e Rn , é chamada a matriz Jacobiana de f no ponto a e é indicada pela
notação Jf(a).

As m colunas da matriz Jacobiana Jf(a) são os vetores


 
0 ∂f ∂f1 ∂fn
f (a)ej = (a) = (a), . . . , (a) ∈ Rn .
∂xj ∂xj ∂xj

186 Instituto de Matemática UFF


Diferenciabilidade de uma aplicação

 
∂fi
Assim, Jf(a) = (a) , onde f1 , . . . , fn : U ⊂ Rm −→ R são as funções-coordenada de f.
∂xj

Como, para todo v = (α1 , . . . , αm ) ∈ Rm ,


X X X
m m m
!
∂f ∂f1 ∂fn
f 0 (a)v = (a)αj = (a)αj , . . . , (a)αj
∂xj ∂xj ∂xj
j=1 j=1 j=1

e, como f(a + v) = f(a) + f 0 (a) v + r(v), obtemos que


X
m
∂fi
fi (a + v) = fi (a) + (a)αj + ri (v) ,
∂xj
j=1

ri (v)
para todo i = 1, . . . , n. Então lim = 0, para todo i = 1, . . . , n, uma vez que r(v) =
v→0 kvk
r(v)
(r1 (v), . . . , rn (v)) e lim = 0. Ou seja, se f é diferenciável no ponto a, então cada função-
v→0 kvk
coordenada de f é diferenciável no ponto a e f 0 (a)v = (df1 (a)v, . . . , dfn (a)v).

Reciprocamente, se cada função-coordenada de f é diferenciável no ponto a, temos que


X
n
∂fi
fi (a + v) = fi (a) + (a)αj + ri (v) ,
∂xj
j=1

ri (v)
com lim = 0, para todo i = 1, . . . , n.
v→0 kvk
Assim, se r(v) = (r1 (v), . . . , rn (v)),
X X
m m
!
∂f1 ∂fn
f(a + v) = f(a) + (a)αj , . . . , (a)αj + r(v) ,
∂xj ∂xj
j=1 j=1

r(v)
com lim = 0. Logo f é diferenciável no ponto a e
v→0 kvk
X X
m m
!
∂f1 ∂fn
f 0 (a)v = (a)αj , . . . , (a)αj = (df1 (a)v, . . . , dfn (a)v) .
∂xj ∂xj
j=1 j=1

Com isto, provamos o seguinte resultado:

Teorema 1.1. A aplicação f : U ⊂ Rm −→ Rn é diferenciável no ponto a ∈ U se, e só se, cada


uma de suas funções-coordenada fi : U −→ R, i = 1, . . . , n, é diferenciável no ponto a. Neste
caso,
f 0 (a)v = (df1 (a)v, . . . , dfn (a)v) ,

para todo v ∈ Rm .
 
∂fi ∂f
Observação 1.4. Para cada i = 1, . . . , n, a i−ésima linha (a), . . . , i (a) da ma-
∂x1 ∂xm
triz Jacobiana Jf(a) é a matriz 1 × m da diferencial, dfi (a) : Rm −→ R, da i−ésima função-
coordenada fi de f em relação à base canônica de Rm .

J. Delgado - K. Frensel 187


Análise

Corolário 1.1. A aplicação f = (g, h) : U ⊂ Rm −→ Rn × Rp , dada por f(x) = (g(x), h(x)), é


diferenciável no ponto a ∈ U se, e só se, as aplicações coordenadas g : U −→ Rn e h : U −→ Rp
são diferenciáveis no ponto a. Neste caso, f 0 (a) = (g 0 (a), h 0 (a)) : Rm −→ Rn × Rp .

Prova.
Basta observar que as funções-coordenada de f são as funções-coordenada de g seguidas
das funções-coordenada de h. 

Observação 1.5. Seja f : U ⊂ Rm −→ Rn uma aplicação diferenciável no ponto a ∈ U. Se


λ : (−ε, ε) −→ U é um caminho qualquer diferenciável em t = 0, com λ(0) = a e λ 0 (0) = v, então
∂f
f 0 (a)v = (a) = (f ◦ λ) 0 (0) .
∂v
∂fi
De fato, pela observação 3.9 do capı́tulo 3, temos que (fi ◦λ) 0 (0) = (a), para todo i = 1, . . . , n.
∂v
Logo, como
∂f
 ∂f ∂f

0
f (a)v = (a) = (a), . . . , n (a) ,
1
∂v ∂v ∂v
temos que
f 0 (a)v = ((f1 ◦ λ) 0 (0), . . . , (fn ◦ λ) 0 (0)) = (f ◦ λ) 0 (0).

Definição 1.4. Dizemos que uma aplicação f : U ⊂ Rm −→ Rn é diferenciável no aberto U


quando é diferenciável em todos os pontos de U. Neste caso, fica definida a aplicação derivada
f 0 : U −→ L(Rm , Rn ) ,

que associa a cada ponto x ∈ U, a transformação linear f 0 (x) : Rm −→ Rn , derivada de f no


∂f
ponto x. Fica também definida, para todo v ∈ Rm , a aplicação : U −→ Rn , cujo valor num
∂v
∂f
ponto x ∈ U é a derivada direcional (x) = f 0 (x)v.
∂v

Observação 1.6. O espaço vetorial L(Rm ; Rn ) das transformações lineares T : Rm −→ Rn


possui uma norma natural, dada por:
kT k = sup{ kT (x)k | kxk = 1}.

Se identificarmos L(Rm ; Rn ) com Rmn , fazendo corresponder a cada transformação linear


T : Rm −→ Rn sua matriz em relação às bases canônicas de Rm e Rn , as funções-coordenada
de uma aplicação ψ : X −→ L(Rm ; Rn ), definida num conjunto X ⊂ Rp , são as mn funções
ψij : X −→ R tais que, para cada x ∈ X, ψij (x) é a (i, j)−entrada da matriz da transformação
linear ψ(x).

Resulta, então, do teorema 6.11 do capı́tulo 1, que uma aplicação ψ : X −→ L(Rm ; Rn ) é


contı́nua se, e só se, cada uma das funções ψij : U −→ R é contı́nua.

188 Instituto de Matemática UFF


Diferenciabilidade de uma aplicação

Também, pelo teorema 1.1 acima, uma aplicação ϕ : U −→ L(Rm ; Rn ) é diferenciável no ponto
a ∈ U se, e só se, cada uma das funções ϕij : U −→ R é diferenciável no ponto a.

Teorema 1.2. Seja f : U −→ Rn uma aplicação definida no aberto U ⊂ Rm . As seguintes


afirmações são equivalentes:

(1) f é diferenciável e a aplicação derivada f 0 : U −→ L(Rm ; Rn ) é contı́nua;

(2) As funções-coordenada f1 , . . . , fn : U −→ R da aplicação f possuem derivadas parciais


∂fi
: U −→ R contı́nuas;
∂xj
 ∂f 
m
(3) Para cada v ∈ R , existe a derivada direcional (x) em todo ponto x ∈ U e a aplicação
∂v
∂f
: U −→ Rn é contı́nua.
∂v

Prova.
∂fi
(1)=⇒(2) Por serem as derivadas parciais as funções-coordenada da aplicação f 0 .
∂xj
(2)=⇒(1) Pelo teorema 3.2 do capı́tulo 3, (2) implica que cada função-coordenada fi é dife-
renciável e, portanto, f é diferenciável pelo teorema 1.1 acima. Além disso, f 0 é contı́nua, pois
∂fi
suas funções-coordenada, , são contı́nuas.
∂xj
(2)=⇒(3) Seja v = (α1 , . . . , αn ) ∈ Rm . Pelo provado acima, f é diferenciável. Então
∂f Xm
∂f
= αj .
∂v ∂xj
j=1

∂fi ∂f ∂f
Como cada função-coordenada, , de é contı́nua, temos que é contı́nua para todo
∂xj ∂xj ∂xj
∂f
j = 1, . . . , m. Logo, para todo v ∈ Rm , : U −→ Rn é contı́nua.
∂v
∂f
(3)=⇒(2) Tomando v = ej , temos, por hipótese, que a derivada parcial : U −→ Rn existe e é
∂xj
contı́nua, para todo j = 1, . . . , m.
∂fi
Logo, cada uma das funções-coordenada : U −→ R existe e é contı́nua . 
∂xj

Definição 1.5. Dizemos que uma aplicação f : U −→ Rn é de classe C1 no aberto U ⊂ Rm


quando f cumpre uma das (e portanto todas as) condições do teorema acima.

Em particular, f ∈ C1 se, e só se, cada uma das suas funções-coordenada é de classe C1 .

Definição 1.6. Dizemos que uma aplicação f : U −→ Rn , definida no aberto U ⊂ Rm , é


duas vezes diferenciável no ponto a ∈ U quando f é diferenciável em U e satisfaz as condições
abaixo:

J. Delgado - K. Frensel 189


Análise

(1) A aplicação derivada f 0 : U −→ L(Rm ; Rn ) é diferenciável no ponto a;


∂fi
(2) Cada derivada parcial : U −→ R é diferenciável no ponto a;
∂xj
∂f
(3) Para cada v ∈ Rm , a aplicação derivada direcional : U −→ Rn é diferenciável no ponto a.
∂v

Como no teorema 1.2, podemos mostrar que as três condições acima são equivalentes.
Então, f satisfaz a uma delas se, e só se, satisfaz a todas. Assim, f é duas vezes diferenciável
no ponto a se, e só se, cada função-coordenada fi é duas vezes diferenciável no ponto a.

Definição 1.7. Quando f : U −→ Rn é duas vezes diferenciável no ponto a ∈ U, sua derivada


segunda no ponto a é a aplicação bilinear
f 00 (a) : Rm × Rm −→ Rn ,

cujo valor no ponto (v, w) ∈ Rm × Rm é o vetor  


∂ ∂f
f 00 (a) · v · w = (a) ∈ Rn .
∂v ∂w
∂2 f ∂
 ∂f 
Escrevemos (a) em vez de (a).
∂v ∂w ∂v ∂w

Se v = (α1 , . . . , αm ) e w = (β1 , . . . , βm ), então


X X
m
! m
∂ ∂2 f
 ∂f  ∂ ∂f
00
f (a) · v · w = (a) = βk (a) = (a) βk αj ,
∂v ∂w ∂v ∂xk ∂xj ∂xk
k=1 j,k=1

é o vetor de Rn cujas coordenadas são:


X
m
∂ 2 fi
00
fi (a) · v · w = (a) βk αj , i = 1, . . . , n.
∂xj ∂xk
j,k=1

Pelo teorema de Schwarz para funções, segue que fi00 (a) · v · w = fi00 (a) · w · v para todo
i = 1, . . . , n. Logo,
f 00 (a) · v · w = f 00 (a) · w · v ,

ou seja,
∂2 f ∂2 f
(a) = (a)
∂w ∂v ∂v ∂w
quando f : U −→ Rn é duas vezes diferenciável no ponto a.

Isto prova o seguinte resultado:

Teorema 1.3. (Teorema de Schwarz para aplicações)


Se a aplicação f : U −→ Rn , definida no aberto U ⊂ Rm , é duas vezes diferenciável no ponto
a ∈ U, então a derivada segunda f 00 (a) : Rm × Rm −→ Rn é uma aplicação bilinear simétrica.

190 Instituto de Matemática UFF


Diferenciabilidade de uma aplicação

Observação 1.7. Na realidade, a derivada segunda de uma aplicação diferenciável


f : U ⊂ Rm −→ Rn no ponto a ∈ U é uma transformação linear f 00 (a) : Rm −→ L(Rm ; Rn ),
pois f 00 (a) = (f 0 ) 0 (a) e f 0 : U ⊂ Rm −→ L(Rm ; Rn ). Mas, como existe um isomorfismo natural
entre L(Rm ; L(Rm ; Rn )) e o espaço L2 (Rm ; Rn ) das transformações bilineares de Rm × Rm em
Rn , que associa a cada transformação linear T : Rm −→ L(Rm ; Rn ) a transformação bilinear
Te : Rm × Rm −→ Rn tal que Te(v, w) = (Tv)w, podemos considerar a derivada segunda como
sendo a transformação bilinear f 00 (a) : Rm × Rm −→ Rn dada por
  
Xm 2
∂ f1 (a) Xm 2
∂ f1 (a) 
 αj · · · αj  β 
 j=1 ∂xj ∂x1 ∂xj ∂xm  1

j=1 
  
 
 
f 00 (a)(v, w) = ((f 0 ) 0 (a) · v) · w = 
 .. .. ..  . 
  .. 
 . . .  
  
 
X ∂2 f (a) X
m m 
2
∂ fn (a) 
n  
 αj · · · αj  βm
∂xj ∂x1 ∂xj ∂xm
j=1 j=1

X
m X X
m X
m m
!
∂2 f1 (a) ∂2 fn (a)
= αj βk , · · · , αj βk
∂xj ∂xk ∂xj ∂xk
k=1 j=1 k=1 j=1

X
m
∂2 f(a)
= αj βk ,
∂xj ∂xk
j,k=1

como foi definida anteriormente, onde v = (α1 , . . . , αm ) e w = (β1 , . . . , βm ).

Definição 1.8. Dizemos que uma aplicação f : U −→ Rn é de classe C2 no aberto U ⊂ Rm


quando f é diferenciável e sua derivada f 0 : U −→ L(Rm ; Rn ) é de classe C1 .

Pelo teorema 1.2, isto equivale a dizer que para i = 1, . . . , n e j = 1, . . . , m arbitrários,


∂2 fi
existem e são contı́nuas as derivadas parciais de segunda ordem : U −→ R das funções-
∂xj ∂xk
∂fi
coordenada de f, ou seja, cada função-coordenada de f 0 é de classe C1 , ou ainda, cada
∂xk
função-coordenada fi de f é de classe C2 .
∂f
E também, f é de classe C2 se, e só se, a derivada direcional : U −→ Rn é de classe
∂v
C1 para todo v ∈ Rm , .

Por indução, dizemos que a aplicação f : U −→ Rn , definida no aberto U ⊂ Rm , é


k−vezes diferenciável no ponto a ∈ U quando f é diferenciável em U e a aplicação derivada
f 0 : U −→ L(Rm ; Rn ) é (k − 1)−vezes diferenciável no ponto a, ou seja, para todo v ∈ Rm , a
∂f
derivada direcional : U −→ Rn é uma aplicação (k − 1)−vezes diferenciável no ponto a, ou
∂v
∂f
ainda, as derivadas parciais i : U −→ R são funções (k − 1)−vezes diferenciáveis no ponto a.
∂xj

J. Delgado - K. Frensel 191


Análise

Para verificar as equivalências acima, basta provar, por indução, que uma aplicação
f : U ⊂ Rm −→ Rn é k−vezes diferenciável no ponto a ∈ U se, e só se, cada função-coordenada
fi de f é k−vezes diferenciável no ponto a.

Quando f : U −→ Rn é k−vezes diferenciável no ponto a, definimos a k−ésima derivada


(ou derivada de ordem k) de f no ponto a como sendo a aplicação k−linear
f(k) (a) : Rm × . . . × Rm −→ Rn ,

cujo valor no ponto (v1 , . . . , vk ) ∈ Rm × . . . × Rm é o vetor


∂k f
f(k) (a) · v1 · . . . · vk = (a) ∈ Rn .
∂v1 ∂v2 . . . ∂vk
Como consequência do Teorema de Schwarz (ver observação 7.2 do capı́tulo 3), a k−ésima
derivada f(k) (a) é uma aplicação k−linear simétrica.

Por exemplo, se k = 3, u = (α1 , . . . , αm ), v = (β1 , . . . , βm ) e w = (γ1 , . . . , γm ), temos:


Xm
∂3 f
f(3) (a) · u · v · w = (a) γk βj αi .
∂xi ∂xj ∂xk
i,j,k=1

Definição 1.9. Uma aplicação f : U −→ Rn , definida no aberto U ⊂ Rm , é de classe Ck


quando é diferenciável e sua derivada f 0 : U −→ L(Rm ; Rn ) é uma aplicação de classe Ck−1 .

Pode-se provar, por indução, que uma aplicação f : U −→ Rn é de classe Ck se, e só se, cada
função coordenada fi de f é de classe Ck .

Assim, f é de classe Ck se, e só se, existem e são contı́nuas em U todas as derivadas par-
ciais de ordem ≤ k das funções-coordenada de f, ou ainda, para todo v ∈ Rm , a aplicação
∂f
: U −→ Rn é de classe Ck−1 .
∂v
Para completar, dizemos que f é de classe C0 quando f é contı́nua, e é de classe C∞ quando
f ∈ Ck para todo k = 0, 1, . . ..

Observação 1.8. Se f ∈ Ck então f ∈ Ck−1 , para todo k ≥ 1.

Observação 1.9. Quando v1 = . . . = vk = v, o valor da aplicação k−linear f(k) (a) na k−lista


(v, . . . , v) será indicado f(k) (a) vk .

Observação 1.10. A aplicação f = (g, h) : U −→ Rn × Rp dada por f(x) = (g(x), h(x)),


é k−vezes diferenciável num ponto (ou de classe Ck em U) se, e só se, suas aplicações-
coordenadas g : U −→ Rn e h : U −→ Rp são k−vezes diferenciáveis neste ponto (ou de
classe Ck em U).

192 Instituto de Matemática UFF


Exemplos de aplicações diferenciáveis

2 Exemplos de aplicações diferenciáveis

Exemplo 2.1. Toda aplicação constante é de classe C∞ e sua derivada é nula. 

Exemplo 2.2. Toda aplicação linear T : Rm −→ Rn é diferenciável e T 0 (x) = T para todo


x ∈ Rm .
r(v)
De fato, como T (x + v) = Tx + Tv para todo v ∈ Rm , temos que r(v) = 0 e, portanto, lim = 0.
v→0 kvk
Logo T 0 (x) = T para todo x ∈ Rm ou seja, a derivada T 0 : Rm −→ L(Rm ; Rn ) é constante. Em
particular, T é de classe C∞ . 

Exemplo 2.3. Toda aplicação bilinear ϕ : Rm × Rn −→ Rp é diferenciável e, em cada ponto


(a, b) ∈ Rm × Rn , sua derivada é a transformação linear ϕ 0 (a, b) : Rm × Rn −→ Rp , definida por:
ϕ 0 (a, b)(v, w) = ϕ(v, b) + ϕ(a, w) .

De fato, como
ϕ(a + v, b + w) = ϕ(a, b) + ϕ(v, b) + ϕ(a, w) + ϕ(v, w),
ϕ(v, w)
basta mostrar que lim = 0.
(v,w)→(0,0) k(v, w)k
Pela observação 6.43 do capı́tulo 1, existe uma constante c > 0 tal que
kϕ(v, w)k ≤ ckvks kwks ,

para todo v ∈ Rm e todo w ∈ Rn . Logo, tomando a norma da soma em Rm , Rn e Rm × Rn , temos


k(v, w)ks = kvks + kwks ,

e, portanto,
kϕ(v, w)k ckvks kwks
≤ ≤ ckvks .
k(v, w)ks kvks + kwks
ϕ(v, w)
Então lim = 0.
(v,w)−→(0,0) k(v, w)ks
Além disso, a aplicação derivada
ϕ 0 : Rm × Rn −→ L(Rm × Rn ; Rp )
(a, b) 7−→ ϕ 0 (a, b) ,
é linear, pois
ϕ 0 (a + λa 0 , b + λb 0 )(v, w) = ϕ(a + λa 0 , w) + ϕ(v, b + λb 0 )
= ϕ(a, w) + λϕ(a 0 , w) + ϕ(v, b) + λϕ(v, b 0 )
= (ϕ 0 (a, b) + λϕ 0 (a 0 , b 0 ))(v, w) ,
para todo (v, w) ∈ Rm × Rn . Então, pelo exemplo anterior, ϕ 0 é de classe C∞ e, portanto, ϕ é
de classe C∞ .

J. Delgado - K. Frensel 193


Análise

Assim, a derivada segunda ϕ 00 (a, b) : (Rm × Rn ) × (Rm × Rn ) −→ Rp de ϕ é dada por:


ϕ 00 (a, b)((v1 , w1 ), (v2 , w2 )) = ((ϕ 0 ) 0 (a, b)(v1 , w1 ))(v2 , w2 )
= (ϕ 0 (v1 , w1 ))(v2 , w2 ) = ϕ(v2 , w1 ) + ϕ(v1 , w2 ) .
Casos particulares de aplicações bilineares são o produto interno
ϕ : Rm × Rm −→ R
(x, y) 7−→ ϕ(x, y) = hx, yi ,
e a multiplicação de matrizes
M : Rpn × Rnm −→ Rpm
(X, Y) 7−→ M(X, Y) = XY ,
cujas derivadas são dadas por
ϕ 0 (x, y)(v, w) = hv, yi + hx, wi e M 0 (X, Y)(V, W) = VY + XW ,

respectivamente.

Mais geralmente, se ϕ : Rm1 × . . . × Rmk −→ Rn é uma aplicação k−linear, então ϕ é de


classe C∞ , pois suas funções-coordenada são k−lineares e, portanto, polinômios de grau k de
m1 + . . . + mk variáveis.

Pode-se provar, de modo análogo ao caso bilinear (k = 2), que existe c > 0 tal que
kϕ(v1 , . . . , vk )k ≤ ckv1 ks · . . . · kvk ks .

Então, como
X
n
ϕ(a1 + v1 , . . . , ak + vk ) = ϕ(a1 , . . . , ak ) + ϕ(a1 , . . . , ai−1 , vi , ai+1 , . . . , ak )
i=1
X
+ ϕ(a1 , . . . , ai−1 , vi , ai+1 , . . . , aj−1 , vj , aj+1 , . . . , ak )
i<j

+ . . . + ϕ(v1 , . . . , vk ) ,

temos que ϕ é diferenciável em todo ponto (a1 , . . . , ak ) ∈ Rm1 × . . . × Rmk e


X
k
0
ϕ (a1 , . . . , ak )(v1 , . . . , vk ) = ϕ(a1 , . . . , ai−1 , vi , ai+1 , . . . , ak ) .
i=1

De fato, como
X


ϕ(a1 , . . . , ai−1 , vi , ai+1 , . . . , aj−1 , vj , aj+1 , . . . , ak ) + . . . + ϕ(v1 , . . . , vk )



i<j
X
≤ M(2) kvi ks kvj ks + . . . + M(k) kv1 ks . . . kvk ks ,
i<j

onde M(2) , . . . , M(k) são constantes positivas que dependem de ka1 ks , . . . , kak ks e c, podemos

194 Instituto de Matemática UFF


Exemplos de aplicações diferenciáveis

provar, de modo similar ao caso k = 2, que


X
ϕ(a1 , . . . , ai−1 , vi , ai+1 , . . . , aj−1 , vj , aj+1 , . . . , vk ) + . . . + ϕ(v1 , . . . , vk )
i<j
lim =0
(v1 ,...,vk )−→(0,...,0) k(v1 , . . . , vk )ks

Por exemplo, se k = 3,
ϕ 0 (a, b, c)(u, v, w) = ϕ(u, b, c) + ϕ(a, v, c) + ϕ(a, b, w) .

Um exemplo de aplicação n−linear é a função determinante


det : Rn × . . . × Rn −→ R
X 7−→ det X = det(X1 , . . . , Xn ) ,
onde X1 , . . . , Xn são os vetores-linha da matriz X. Sua derivada no ponto X é o funcional linear
det 0 (X) : Rn −→ R, cujo valor na matriz V = (V1 , . . . , Vn ) é
2

X
n
det 0 (X) · V = det(X1 , . . . , Xk−1 , Vk , Xk+1 , . . . , Xn ) .
k=1

Em particular, se V = Eij =matriz cuja (i, j)−ésima entrada é igual a 1 e as demais são iguais a
zero, então
∂ det
(X) = det 0 (X)Eij = det(X1 , . . . , Xi−1 , ej , Xi+1 , . . . , Xn ) = (−1)i+j X[i,j] ,
∂xij
onde X[i,j] é o determinante da matriz (n − 1) × (n − 1) obtida de X pela omissão da i−ésima
linha e da j−ésima coluna, re-obtendo, assim, um fato já conhecido. 

Exemplo 2.4. Seja U = GL(Rn ) ⊂ Rn2 o conjunto aberto formado pelas matrizes n × n que
são invertı́veis.

Mostraremos que a aplicação


2
f : U −→ Rn
X 7−→ f(X) = X−1 ,
2 2
é diferenciável e sua derivada no ponto A ∈ U é a transformação linear f 0 (A) : Rn −→ Rn ,
definida por
f 0 (A)V = −A−1 VA−1 .

De fato, se
r(V) = (A + V)−1 − A−1 + A−1 VA−1 ,

obtemos, multiplicando ambos os membros da igualdade, à esquerda, por A + V, que:


(A + V)r(V) = I − I − VA−1 + VA−1 + VA−1 VA−1 = VA−1 VA−1 = (VA−1 )2 ,

e, portanto,
r(V) = (A + V)−1 (VA−1 )2 .

J. Delgado - K. Frensel 195


Análise

Logo
kr(V)k ≤ k(A + V)−1 k kA−1 k2 kVk2 .
r(V)
Assim, pelo lema abaixo, lim = 0. 
v→0 kVk

Lema 2.1. Seja A ∈ Rn2 uma matriz invertı́vel. Então existe c > 0 tal que, para toda n × n
1
matriz V, com kVk ≤ c, A + V é invertı́vel e k(A + V)−1 k ≤ .
c

Prova.
1
Seja c = > 0. Então
2kA−1 k
kxk = kA−1 (Ax)k ≤ kA−1 k kA(x)k ,

ou seja, kA(x)k ≥ 2ckxk para todo x ∈ Rn .

Se kVk ≤ c, temos que


k(A + V)(x)k = kAx + Vxk ≥ kAxk − kVxk ≥ 2ckxk − ckxk = ckxk .

Logo, se kVk ≤ c, então A + V é invertı́vel e


kxk = k(A + V)(A + V)−1 (x)k ≥ ck(A + V)−1 (x)k ,
1
ou seja, k(A + V)−1 k ≤ . 
c
Em particular, a inversão de matrizes f : X 7−→ X−1 é uma aplicação contı́nua. Como
f(U) = U e f−1 = f, f é um homeomorfismo de U sobre si mesmo.

Mostraremos agora que f é de classe C∞ .


2 ∂f 2
Seja V ∈ Rn fixo. A derivada direcional : U −→ Rn é dada por
∂V
∂f
(X) = −X−1 V X−1 .
∂V
2 2 2
Seja a aplicação bilinear ϕV : Rn × Rn −→ Rn definida por
ϕV (X, Y) = X V Y .
∂f 2 2
Então = −ϕV ◦ (f, f), onde (f, f) : U −→ Rn × Rn é dada por (f, f)(X) = (X−1 , X−1 ) .
∂V
∂f 2 2
Logo : U −→ Rn é contı́nua para todo V ∈ Rn e, portanto, f é de classe C1 .
∂V
Como a aplicação bilinear ϕV é de classe C∞ e a composta de duas aplicações de classe
∂f 2
Ck é de classe Ck (ver seção 3), temos que = −ϕV ◦ (f, f) é de classe C1 para todo V ∈ Rn .
∂V
Logo f é de classe C2 .

Prosseguindo desta maneira, obtemos que f é de classe Ck para todo k ∈ N, ou seja, f é


de classe C∞ .

196 Instituto de Matemática UFF


Exemplos de aplicações diferenciáveis

Definição 2.1. Sejam U ⊂ Rm e V ⊂ Rn conjuntos abertos. Dizemos que uma bijeção f :


U −→ V é um difeomorfismo de U sobre V quando f e f−1 são diferenciáveis (provaremos
depois que n = m).

Dizemos que f : U −→ V é um difeomorfismo de classe Ck se f é um difeomorfismo e f ∈ Ck


(provaremos depois que f é um difeomorfismo Ck se, e só se, f−1 é um difeomorfismo Ck ).

A inversão de matrizes f : U −→ U é um exemplo de difeomorfismo de classe C∞ , pois


f−1 = f e f é de classe C∞ .

Observação 2.1. Existem critérios indiretos, como o Teorema da Função Implı́cita, que per-
mitem concluir que uma certa aplicação é diferenciável, sem que se conheça sua derivada.
Na ausência destes métodos indiretos, fica o problema de obter um candidato razoável para a
derivada, sem o qual não se pode provar a diferenciabilidade da aplicação.

Um processo, quando pode ser aplicado, é o de desenvolver f(a + v) (ou cada uma de suas
funções-coordenada) em série de potências nas coordenadas de v, e destacar a parte de pri-
meiro grau em relação a v, que é a candidata a ser f 0 (a)v.

No exemplo acima,
f(A + V) = (A + V)−1 = ((I + VA−1 )A)−1 = A−1 (I + VA−1 )−1 .

Seja X ∈ Rn tal que kXk < 1. Então I − X é invertı́vel, pois se existisse v ∈ Rn − {0} tal que
2

X(v) = v, terı́amos kXk ≥ 1.


X

Além disso, sabemos que se kXk < 1, a série Xj é absolutamente convergente, pois
j=0
j j
kX k ≤ kXk para todo j ∈ N. Logo, como
lim (I − Xn+1 ) = I, e (I − X)(I + X + . . . + Xn ) = I − Xn+1 ,
n→∞

para todo n ∈ N, temos que


X

(I − X)−1 = Xj (?)
j=0

1
Seja X = −VA−1 tal que kVk < .
kA−1 k
Como kXk < 1, temos, por (?), que
X

(I + VA−1 )−1 = (−1)j (VA−1 )j .
j=0

Logo,
(A + V)−1 = A−1 (I + VA−1 )−1 = A−1 − A−1 VA−1 + r(V) ,

J. Delgado - K. Frensel 197


Análise

onde
X X

r(V) = A−1 (−1)j (VA−1 )j = A−1 (VA−1 )2 (−1)j (VA−1 )j ,
j≥2 j=0

1
se kVk < .
kA−1 k
2 1
Para todo V ∈ Rn , com kVk < , temos que
2kA−1 k
kr(V)k ≤ 2kVk2 kA−1 k3 ,

pois
X∞ X


j −1 j 1
(−1) (VA ) ≤ = 2.

2j


j=0 j=0

r(V)
Então lim = 0 e, portanto, f é diferenciável em A e f 0 (A)V = −A−1 VA−1 .
v→0 kVk

Exemplo 2.5. Uma função de variável complexa f : U −→ C, definida no aberto U ⊂ C, pode


ser vista como uma aplicação f : U −→ R2 definida no aberto U ⊂ R2 . A derivada da função
complexa no ponto z = x + iy é o número complexo definido pelo limite
f(z + H) − f(z)
f 0 (z) = lim ,
H→0 H
quando tal limite existe. Isto equivale a dizer que

f(z + H) = f(z) + f 0 (z)H + r(H) ,


r(H)
onde lim = 0.
H→0 |H|
Assim, a função complexa f : U −→ C é derivável no ponto z = x + iy se, e só se, a aplicação
f : U ⊂ R2 −→ R2 é diferenciável no ponto (x, y) e sua derivada f 0 (x, y) : R2 −→ R2 é uma
0
transformação linear no plano que consiste em multiplicar por
!um número complexo a+ib = f (z)
a −b
fixo, ou seja, a matriz Jacobiana Jf(z) tem a forma , que, por sua vez, equivale a dizer
b a
que as partes real e imaginária da função complexa f = u + iv satisfazem as equações de
Cauchy-Riemann:
∂u ∂v ∂u ∂v
(z) = (z) (= a) e − (z) = (z) (= b) .
∂x ∂y ∂y ∂x
Então, se f 0 (z) = a + ib 6= 0, f 0 (z) : R2 −→ R2 é uma transformação linear que preserva

! positiva {e1 , e2 } na base positiva {f (z)e1 , f (z)e2 } = {(a, b), (−b, a)},
0 0
orientação, pois leva a base
a −b
uma vez que det = a2 + b2 > 0.
b a
Além disso, como hf 0 (z)e1 , f 0 (z)e1 i = hf 0 (z)e2 , f 0 (z)e2 i = a2 + b2 = λ2 e hf 0 (z)e1 , f 0 (z)e2 i = 0,

198 Instituto de Matemática UFF


A regra da cadeia

temos que
hf 0 (z)X, f 0 (z)Yi = hx1 f 0 (z)e1 + x2 f 0 (z)e2 , y1 f 0 (z)e1 + y2 f 0 (z)e2 i
= (x1 y1 + x2 y2 )λ2 = λ2 hX, Yi ,
para quaisquer X = (x1 , x2 ), Y = (y1 , y2 ) ∈ R2 .

Logo f 0 (z) : R2 −→ R2 é uma transformação linear que preserva ângulo, pois


hf 0 (z)X, f 0 (z)Yi λ2 hX, Yi hX, Yi
cos(∠(f 0 (z)X, f 0 (z)Y)) = = = = cos(∠(X, Y)) .
0 0
kf (z)Xk kf (z)Yk |λ| kXk |λ| kYk kXk kYk

Uma transformação linear T : R2 −→ R2 do tipo T (z) = Az, onde A é um número complexo


não-nulo, é chamada uma semelhança positiva: trata-se de uma rotação positiva (multiplicação
A
por = eiθ ) seguida de uma homotetia (multiplicação pelo número real |A| > 0). 
|A|

Exemplo 2.6. Seja f : I −→ Rn um caminho definido no intervalo aberto I ⊂ R. Pela definição


dada no capı́tulo 2, f é diferenciável no ponto a ∈ I quando existe o vetor velocidade
f(a + t) − f(a)
v = lim .
t→0 t
r(t)
Isto equivale a dizer que lim = 0 , onde r(t) = f(a + t) − f(a) − vt.
t→0 t

Como toda transformação linear T : R −→ Rn é da forma T (t) = t T (1), um caminho é dife-


renciável no sentido do capı́tulo 2 se, e só se, é diferenciável no sentido deste capı́tulo. 

3 A regra da cadeia

Teorema 3.1. (Regra da Cadeia)


Sejam U ⊂ Rm , V ⊂ Rn abertos, f : U −→ Rn diferenciável no ponto a, com f(U) ⊂ V, e
g : V −→ Rp diferenciável no ponto f(a). Então g ◦ f : U −→ Rp é diferenciável no ponto a e
(g ◦ f) 0 (a) = g 0 (f(a)) ◦ f 0 (a) : Rm −→ Rp .

Prova.
Sejam g1 , . . . , gp : V −→ R as funções-coordenada de g. Então, pelo teorema 1.1, g1 , . . . , gp
são diferenciáveis no ponto f(a) e, pela Regra da Cadeia para funções, as funções-coordenada
g1 ◦ f, . . . , gp ◦ f da aplicação g ◦ f são diferenciáveis no ponto a e
∂gi ◦ f Xn
∂gi ∂f
(a) = (f(a)) k (a) ,
∂xj ∂yk ∂xj
k=1

para todo i = 1, . . . , p e todo j = 1, . . . , m.

J. Delgado - K. Frensel 199


Análise

Logo, pelo teorema 1.1, g ◦ f é diferenciável no ponto a.

Como
(g ◦ f) 0 (a)ej = ((g1 ◦ f) 0 (a)ej , . . . , (gp ◦ f) 0 (a)ej ) ,

e
X
n
∂gi ∂fk
gi0 (f(a))(f 0 (a)ej ) = gi0 (f(a))(f10 (a)ej , . . . , fn0 (a)ej ) = (f(a)) (a) = (gi ◦ f) 0 (a)ej ,
∂yk ∂xj
k=1

para todo i = 1, . . . , p, temos que


(g ◦ f) 0 (a)ej = (g 0 (f(a)) ◦ f 0 (a))ej ,

para todo j = 1, . . . , m.

Logo (g ◦ f) 0 (a) = g 0 (f(a)) ◦ f 0 (a). 

Outra maneira de provar que (g ◦ f) 0 (a) = g 0 (f(a)) ◦ f 0 (a).

Sejam v ∈ Rm e λ : (−ε, ε) −→ U um caminho diferenciável em t = 0, com λ(0) = a e


λ 0 (0) = v. Então as funções fi ◦ λ : (−ε, ε) −→ R são diferenciáveis em t = 0, (fi ◦ λ)(0) = fi (a)
e (fi ◦ λ) 0 (0) = dfi (a) · v. Logo o caminho f ◦ λ é diferenciável em t = 0, f ◦ λ(0) = f(a) e
(f ◦ λ) 0 (0) = (df1 (a)v, . . . , dfn (a)v) = f 0 (a)v.

De modo análogo, temos que g ◦ (f ◦ λ) é um caminho em Rp diferenciável em t = 0, com


(g ◦ (f ◦ λ))(0) = g(f(a)) e (g ◦ (f ◦ λ)) 0 (0) = g 0 (f(a)) · (f 0 (a) v).

Por outro lado, (g◦f)◦λ é um caminho diferenciável em t = 0, como ((g◦f)◦λ)(0) = g(f(a))


e ((g ◦ f) ◦ λ) 0 (0) = (g ◦ f) 0 (a) v. Logo (g ◦ f) 0 (a) v = g 0 (f(a))(f 0 (a) v) para todo v ∈ Rn .

Ou seja, (g ◦ f) 0 (a) = g 0 (f(a)) ◦ f 0 (a).




Fig. 2: Representação esquemática da Regra da Cadeia

   
∂fk ∂gi
Corolário 3.1. Sejam Jf(a) = (a) , Jg(f(a)) = (f(a)) e J(g ◦ f)(a) =
∂xj n×m
∂yk p×n
 
∂(gi ◦ f)
(a) as matrizes Jacobianas de f, g e g ◦ f nos pontos indicados. Supondo f
∂xj p×m
diferenciável no ponto a e g diferenciável no ponto f(a), tem-se J(g ◦ f)(a) = Jg(f(a)) · Jf(a).

200 Instituto de Matemática UFF


A regra da cadeia

Prova.
Por (?), temos que:
∂(gi ◦ f)(a) X
n
∂gi ∂f
(J(g ◦ f)(a))ij = = (f(a)) k (a) = (Jg(f(a)) · Jf(a))ij ,
∂xj ∂yk ∂xj
k=1

para todo i = 1, . . . , p e todo j = 1, . . . , m. Logo J(g ◦ f)(a) = Jg(f(a)) · Jf(a). 

Corolário 3.2. A composta de duas aplicações de classe Ck é uma aplicação de classe Ck .

Prova.
Sejam f : U ⊂ Rm −→ Rn , g : V ⊂ Rn −→ Rp , f(U) ⊂ V, duas aplicações de classe Ck .

Pelo corolário 3.4 do capı́tulo 3, gi ◦ f é de classe Ck para todo i = 1, . . . , p, pois as funções-


coordenada de f e g são de classe Ck .

Outra demonstração: Pela Regra da Cadeia, (g ◦ f) 0 (x) = g 0 (f(x)) ◦ f 0 (x) para todo x ∈ U.
Considerando as aplicações derivadas
f 0 : U −→ L(Rm ; Rn ) , g 0 : V −→ L(Rn ; Rp ) e (g ◦ f) 0 : U −→ L(Rm ; Rp ) ,

a igualdade acima pode ser escrita da seguinte maneira:


(g ◦ f) 0 = (g 0 ◦ f) · f 0 : U −→ L(Rm ; Rp ) ,

onde ◦ indica a composição de aplicações e · significa o produto de transformações lineares.

Considerando a multiplicação de transformações lineares como uma aplicação bilinear


M : L(Rn ; Rp ) × L(Rm ; Rn ) −→ L(Rm ; Rp ) , M(T, S) = T · S ,

a Regra da Cadeia se exprime como:


(g ◦ f) 0 = M ◦ (g 0 ◦ f, f 0 ) ,

onde (g 0 ◦ f, f 0 ) : U −→ L(Rn ; Rp ) × L(Rm ; Rn ) é a aplicação que tem por coordenadas g 0 ◦ f e


f 0 . Sabemos que M ∈ C∞ , isto é, M ∈ Ck para todo k.

Provaremos, por indução, que se f, g ∈ Ck , então g ◦ f é de classe Ck .

Suponhamos que f, g ∈ C1 . Então f 0 , g 0 ∈ C0 .

Logo (g 0 ◦ f, f 0 ) ∈ C0 e, portanto, (g ◦ f) 0 = M ◦ (g 0 ◦ f, f 0 ) ∈ C0 , o que significa que g ◦ f ∈ C1 .

Suponhamos o resultado válido para funções de classe Ck−1 , k − 1 ≥ 1. Sejam f, g ∈ Ck . Então


f 0 , g 0 ∈ Ck−1 e, pela hipótese de indução, g 0 ◦ f ∈ Ck−1 .

Logo (g 0 ◦ f, f 0 ) ∈ Ck−1 e, portanto, M ◦ (g 0 ◦ f, f 0 ) ∈ Ck−1 , isto é, (g ◦ f) 0 ∈ Ck−1 .

Assim, g ◦ f ∈ Ck . 

J. Delgado - K. Frensel 201


Análise

Corolário 3.3. Se uma aplicação f : U −→ Rn , definida no aberto U ⊂ Rm e diferenciável no


ponto a, admite uma inversa g = f−1 : V −→ Rm definida no aberto V ⊂ Rn e diferenciável no
ponto b = f(a), então f 0 (a) : Rm −→ Rn é um isomorfismo, cujo inverso é g 0 (b) : Rn −→ Rm .
Em particular, m = n.

Prova.
Como g ◦ f = IdU e f ◦ g = IdV temos, pela Regra da Cadeia, que g 0 (b) · f 0 (a) = Id : Rm −→ Rm
e f 0 (a) · g 0 (b) = Id : Rn −→ Rn . Assim, g 0 (b) = (f 0 (a))−1 e m = n. 

Observação 3.1. Como consequência do corolário acima, se f : U −→ V é um difeomorfismo


entre os abertos U ⊂ Rm e V ⊂ Rn , então f 0 (x) : Rm −→ Rn é um isomorfismo para todo x ∈ U.
Em particular, m = n, ou seja, U, V ⊂ Rm são abertos do mesmo espaço Euclidiano.

Observação 3.2. O Teorema da invariância da dimensão, devido a L. E. J. Brouwer, diz que


se U ⊂ Rm e V ⊂ Rn são abertos homeomorfos, então m = n

Observação 3.3. Um difeomorfismo não é a mesma coisa que um homeomorfismo dife-


renciável. Por exemplo, a função f : R −→ R, f(x) = x3 , é um homeomorfismo de classe
C∞ cujo inverso não é diferenciável no ponto 0.

Corolário 3.4. Seja f : U −→ V uma bijeção de classe Ck , k ≥ 1, entre os subconjuntos


abertos U, V ⊂ Rm . Se sua inversa g = f−1 : V −→ U é diferenciável então f−1 ∈ Ck . Diz-se
então que f é um difeomorfismo de classe Ck .

Prova.
Sejam GL(Rm ) o conjunto das transformações lineares invertı́veis de Rm em si mesmo e
Inv : GL(Rm ) −→ GL(Rm ) a inversão de transformações lineares que, pelo exemplo 2.4, é
de classe C∞ .

Pelo corolário 3.3, g 0 (y) = [f 0 (g(y))]−1 . Logo a aplicação derivada g 0 : V −→ L(Rm , Rm ) pode
ser escrita como g 0 = Inv ◦ f 0 ◦ g.

Vamos provar, por indução, que se f é de classe Ck , então g = f−1 ’é de classe Ck .

Seja f ∈ C1 . Então f 0 ∈ C0 . Logo Inv ◦ f 0 ◦ g é de classe C0 , isto é, g 0 ∈ C0 . Assim, g ∈ C1 .

Suponhamos o resultado válido para funções de classe Ck−1 , k − 1 ≥ 1. Seja f ∈ Ck . Então


f 0 ∈ Ck−1 e, pela hipótese de indução, g ∈ Ck−1 , pois f ∈ Ck−1 . Logo, pelo corolário 3.2,
g 0 = Inv ◦ f 0 ◦ g ∈ Ck−1 . Assim, g ∈ Ck . 

202 Instituto de Matemática UFF


A regra da cadeia

Observação 3.4. Quando f : U −→ Rm é diferenciável no aberto U ⊂ Rm tem sentido, em


cada ponto x ∈ U, considerar o determinante det Jf(x) da matriz Jacobiana Jf(x), chamado o
determinante Jacobiano de f no ponto x. Assim, pelo corolário 3.3, se f é um difeomorfismo,
então det Jf(x) 6= 0 para todo x ∈ U.

O Teorema da Aplicação Inversa, que provaremos mais adiante, fornece uma recı́proca local
para este fato.

Corolário 3.5. Sejam f, g : U −→ Rn aplicações diferenciáveis no ponto a ∈ U ⊂ Rm e c um


número real. Então:

(1) f + g : U −→ Rn é diferenciável no ponto a e (f + g) 0 (a) = f 0 (a) + g 0 (a) .

(2) cf : U −→ Rn é diferenciável no ponto a e (cf) 0 (a) = cf 0 (a) .


f
(3) : U −→ Rn é diferenciável no ponto a, quando g(x) 6= 0 e g(x) ∈ R para todo x ∈ U, e
g
 0
f g(a) f 0 (a) − f(a) g 0 (a)
(a) = .
g (g(a))2
(4) Se ϕ : Rn × Rk −→ Rp é uma aplicação bilinear, f : U ⊂ Rm −→ Rn e g : U ⊂ Rm −→ Rk são
diferenciáveis no ponto a ∈ U, então ϕ(f, g) : U −→ Rp , definida por ϕ(f, g)(x) = ϕ(f(x), g(x)),
é diferenciável no ponto a e
(ϕ(f, g)) 0 (a) v = ϕ(f 0 (a) v, g(a)) + ϕ(f(a), g 0 (a) v) .
f
(5) Se f, g ∈ Ck , então f + g, cf, , ϕ(f, g) ∈ Ck .
g

Prova.
As três primeiras propriedades resultam do teorema 4.1 do capı́tulo 3 aplicado às funções-
coordenada de f e g.

(4) Pela Regra da Cadeia e pelo exemplo 2.3, temos, para todo v ∈ Rm ,
[ϕ(f, g)] 0 (a) v = (ϕ ◦ (f, g)) 0 (a) v
= ϕ 0 (f(a), g(a)) (f 0 (a) v, g 0 (a) v))
= ϕ(f 0 (a) v, g(a)) + ϕ(f(a), g 0 (a) v) .
(5) Considere as aplicações (f, g) : U −→ Rn × Rp , α : Rn × Rn −→ Rn , c? : Rn −→ Rn e
q : Rn × (R − {0}) −→ Rn , dadas por
y
(f, g)(x) = (f(x), g(x)), α(y, z) = y + z, c? (y) = c y e q(y, z) = .
z
Então,
f
f + g = α ◦ (f, g) , cf = c? ◦ f , = q ◦ (f, g) e ϕ(f, g) = ϕ ◦ (f, g) .
g

J. Delgado - K. Frensel 203


Análise

As aplicações α e c? são de classe C∞ , pois são lineares. A aplicação q é também de classe


C∞ , pois q = m ◦ (Id, Inv), onde Id : Rn −→ Rn é a identidade, Inv : R − {0} −→ R − {0} é
a inversão de números reais não-nulos (matrizes invertı́veis 1 × 1) e m : Rn × R −→ Rn é a
aplicação bilinear dada por m(x, y) = xy. Como m, Inv e Id são C∞ , temos que q também é de
classe C∞ .
f
Logo, se f, g ∈ Ck , temos, pelo corolário 3.2, que f + g, cf, e ϕ(f, g) são de classe Ck . 
g

Observação 3.5. Em particular, se ϕ : Rn × R −→ Rn é a multiplicação ϕ(x, y) = xy, temos


que ϕ(f, g) = f g e
(f g) 0 (a) v = g(a) f 0 (a) v + f(a) g 0 (a) v ,

para todo v ∈ Rm .

Exemplo 3.1. Sejam f, g : U −→ Rn aplicações diferenciáveis (respectivamente de classe Ck )


definidas no aberto U ⊂ Rm . Então ξ : U −→ R, ξ(x) = hf(x), g(x)i é diferenciável (respectiva-
mente de classe Ck ) e
ξ 0 (x) · v = hf 0 (x) v, g(x)i + hf(x), g 0 (x) vi ,

para todo x ∈ U e todo v ∈ Rm .

Em particular, tomando f = g, temos ξ(x) = kf(x)k2 e

ξ 0 (x) v = 2hf 0 (x) v, f(x)i .

Segue-se também pela Regra da Cadeia que, em cada ponto x ∈ U onde f(x) 6= 0, a função
p
ϕ : U −→ R, dada por ψ(x) = kf(x)k = hf(x), f(x)i , é diferenciável no ponto x e
hf 0 (x) v, f(x)i
ψ 0 (x) v = ,
kf(x)k
para todo v ∈ Rm . 

4 As fórmulas de Taylor

No caso de uma aplicação f : U −→ Rn , definida no aberto U ⊂ Rm , com a, a + v ∈ U, a


fórmula de Taylor se escreve:
1 00 1
f(a + v) = f(a) + f 0 (a) v + f (a) v2 + . . . + f(p) (a) vp + rp (v) , (?)
2 p!

onde  
∂2 f ∂ ∂p f ∂p−1 f
 ∂f  ∂
00 2 (p) p
f (a) · v = 2 (a) = (a), . . . , f (a) v = p (a) = (a) .
∂v ∂v ∂v ∂v ∂v ∂vp−1

204 Instituto de Matemática UFF


As fórmulas de Taylor

(1) Fórmula de Taylor infinitesimal: Se f é p−vezes diferenciável no ponto a, então


rp (v)
lim = 0.
v→0 kvkp

(2) Fórmula de Taylor com resto integral: Se f é de classe Cp+1 e [a, a + v] ⊂ U, então
Z1
1
rp (v) = (1 − t)p fp+1 (a + tv) vp+1 dt .
p! 0

Como, para cada j = 0, 1, . . . , p, f(j) (a) vj é o vetor de Rn cujas coordenadas são os


números d(j) fi (a) vj , onde fi são as funções-coordenada de f, temos que a fórmula de Tay-
lor (?) equivale a n igualdades numéricas que correspondem à fórmula de Taylor para funções
reais. Então, as fórmulas de Taylor (1) e (2) seguem das fórmulas análogas para funções reais,
provadas na seção 8 do capı́tulo 3.

(3) Fórmula de Taylor com resto de Lagrange: Sejam [a, a + v] ⊂ U, f uma aplicação de
classe Cp que é p + 1 vezes diferenciável em todo ponto do segmento aberto (a, a + v), com
kf(p+1) (x) wp+1 k ≤ M kwkp+1 para todo x ∈ (a, a + v) e todo w ∈ Rm . Então
M
krp (v)k ≤ kvkp+1 .
(p + 1)!
Prova.
Seja o caminho ϕ : [0, 1] −→ Rn dado por ϕ(t) = f(a + tv). Então ϕ é de classe Cp , (p + 1)−
vezes diferenciável no intervalo aberto (0, 1),
ϕ 0 (t) = f 0 (a + tv) v , ϕ 00 (t) = f 00 (a + tv) v2 , . . . , ϕ(p) (t) = f(p) (a + tv) vp ,

para todo t ∈ [0, 1], e


ϕ(p+1) (t) = f(p+1) (a + tv) vp+1 ,

com
kϕ(p+1) (t)k ≤ M kvkp+1 ,

para todo t ∈ (0, 1).

Então, pela Fórmula de Taylor com resto de Lagrange para caminhos, provada no capı́tulo 2,
temos
ϕ 00 (0) ϕ(p) (0)
ϕ(1) = ϕ(0) + ϕ 0 (0) + + ... + + rp ,
2! p!
com
M kvkp+1
krp k ≤ ,
(p + 1)!
ou seja,
f 00 (a) v2 f(p) (a) vp
f(a + v) = f(a) + f 0 (a) v + + ... + + rp (v) ,
2! p!
M kvkp+1
com krp (v)k ≤ .
(p + 1)! 

J. Delgado - K. Frensel 205


Análise

Observação 4.1. (Unicidade da fórmula de Taylor)


Se f : U −→ Rn é uma aplicação p−vezes diferenciável no ponto a ∈ U ⊂ Rm e, para cada
i = 1, 2, . . . , p, é dada uma aplicação i−linear ϕi : Rm × . . . × Rm −→ Rn de modo que
Xp
1
f(a + v) = f(a) + ϕi vi + rp (v) ,
i!
i=1

rp (v)
com lim = 0, então ϕi vi = f(i) (a) vi para todo i = 1, . . . , p e todo v ∈ Rm .
v→0 kvkp

De fato, como cada função-coordenada de ϕi é uma função i−linear, o resultado segue da


unicidade da fórmula de Taylor para funções reais provada no capı́tulo 3 (ver observação 8.5).

5 A desigualdade do valor médio

Assim como para os caminhos, não há para as aplicações f : U ⊂ Rm −→ Rn , n > 1, um


Teorema do Valor Médio sob a forma de igualdade. Vale porém a desigualdade abaixo.

Desigualdade do Valor Médio: Sejam U ⊂ Rm aberto e f : U −→ Rn uma aplicação contı́nua


no segmento fechado [a, a + v] ⊂ U e diferenciável em todos os pontos do segmento aberto
(a, a + v). Se kf 0 (x)k ≤ M para todo x ∈ (a, a + v) então kf(a + v) − f(a)k ≤ Mkvk.

Prova.
O caminho λ : [0, 1] −→ Rn , definido por λ(t) = f(a + tv), é contı́nuo em [0, 1], diferenciável no
intervalo aberto (0, 1), λ(0) = f(a), λ(1) = f(a + v) e, pela Regra da Cadeia, λ 0 (t) = f 0 (a + tv) v.
Logo kλ 0 (t)k ≤ kf 0 (a + tv)k kvk ≤ M kvk para todo t ∈ (0, 1).

Então, pelo Teorema do Valor Médio para caminhos, demonstrado no capı́tulo 2, temos que
kλ(1) − λ(0)k ≤ Mkvk, ou seja, kf(a + v) − f(a)k ≤ M kvk. 

Corolário 5.1. Seja U ⊂ Rn aberto e convexo. Se f : U −→ Rn é diferenciável e kf 0 (x)k ≤ M


para todo x ∈ U, então f é Lipschitziana, com kf(x) − f(y)k ≤ Mkx − yk para todos x, y ∈ U.

Prova.
Como U é convexo, dados x, y ∈ U, temos que [x, y] ⊂ U. Logo, como f é contı́nua em [x, y] e
diferenciável em todos os pontos do segmento aberto (x, y), temos, pela Desigualdade do Valor
Médio, que
kf(y) − f(x)k = kf(x + (y − x)) − f(x)k ≤ M ky − xk ,

pois kf 0 (z)k ≤ M para todo z ∈ (x, y). 

206 Instituto de Matemática UFF


A desigualdade do valor médio

Observação 5.1. A convexidade de U é essencial para a validade do corolário acima (ver


observação 4.2 do capı́tulo 3).

Corolário 5.2. Se f : U −→ Rn é diferenciável no aberto conexo U ⊂ Rm e f 0 (x) = 0 para todo


x ∈ U, então f é constante.

Prova.
Seja a ∈ U. Consideremos os conjuntos
A = {x ∈ U | f(x) = f(a)} e B = {x ∈ U | f(x) 6= f(a)} .

Como f é contı́nua, B é aberto.

Afirmação: A é aberto.

De fato, dado x ∈ A, existe δ > 0 tal que Bδ (x) ⊂ U. Então, se |v| < δ, temos que [x, x + v] ⊂ U
e, portanto, pela Desigualdade do Valor Médio, kf(x + v) − f(x)k ≤ ε kvk para todo ε > 0, pois
f 0 (y) ≡ 0 para todo y ∈ U. Logo f(x + v) = f(x) = f(a) para todo v com kvk < δ, ou seja
f(y) = f(a) para todo y ∈ Bδ (x).

Assim, U = A ∪ B é uma cisão. Como U é conexo e A 6= ∅, pois a ∈ A, obtemos que U = A, ou


seja, f(x) = f(a) para todo x ∈ U. 

O corolário abaixo fornece uma estimativa para o resto r(v) = f(a + v) − f(a) − T v, quando
T = f 0 (a), e representa uma forma mais refinada da Desigualdade do Valor Médio, à qual se
reduz quando T = 0.

Corolário 5.3. Sejam U ⊂ Rm aberto, [a, a + v] ⊂ U, f : U −→ Rn uma aplicação diferenciável


em todos os pontos do segmento aberto (a, a + v) e f|[a,a+v] contı́nua. Seja T : Rm −→ Rn uma
transformação linear tal que kf 0 (x) − T k ≤ M para todo x ∈ (a, a + v). Então
kf(a + v) − f(a) − T vk ≤ M kvk .

Prova.
Seja g : U −→ Rn a aplicação dada por g(x) = f(x) − Tx. Como g 0 (x) = f 0 (x) − T , temos
que
kg 0 (x)k = kf 0 (x) − T k ≤ M ,

para todo x ∈ (a, a + v). Logo, pela Desigualdade do Valor Médio aplicada a g, obtemos que
kg(a + v) − g(a)k ≤ M kvk ,

ou seja

kf(a + v) − f(a) − Tvk ≤ M kvk . 

J. Delgado - K. Frensel 207


Análise

Definição 5.1. Dizemos que uma aplicação diferenciável f : U −→ Rn é uniformemente dife-


renciável num subconjunto X ⊂ U quando, para todo ε > 0 dado, existe δ > 0 tal que
kvk < δ =⇒ kf(x + v) − f(x) − f 0 (x) vk < ε kvk ,

para todo x ∈ X, com x + v ∈ U.

Corolário 5.4. Uma aplicação f : U −→ Rn de classe C1 é uniformemente diferenciável em


todo compacto K ⊂ U.

Prova.
Pelo corolário 12.3 do capı́tulo 1, existe δ 0 > 0 tal que se x ∈ K e kvk < δ 0 , então [x, x + v] ⊂ U.
Como f 0 : U −→ L(Rm , Rn ) é contı́nua, pelo teorema 11.3 do capı́tulo 1, dado ε > 0 existe
0 < δ < δ 0 tal que
x ∈ K, kvk < δ =⇒ kf 0 (x + v) − f 0 (x)k < ε .

Então,
x ∈ K, kvk < δ, t ∈ [0, 1] =⇒ kf 0 (x + tv) − f 0 (x)k < ε ,

ou seja,
x ∈ K , kvk < δ , y ∈ [x, x + v] =⇒ kf 0 (y) − f 0 (x)k < ε .

Logo, pelo corolário 5.3, tomando T = f 0 (x), obtemos que


kf(x + v) − f(x) − f 0 (x) · vk ≤ ε kvk ,

para todo v com kvk < δ e para todo x ∈ K. 

Corolário 5.5. Sejam U ⊂ Rm aberto e c ∈ U. Se a aplicação contı́nua f : U −→ Rn é


diferenciável em U − {c} e existe lim f 0 (x) = T ∈ L(Rm , Rn ) então f é diferenciável no ponto c e
x→c
f 0 (c) = T .

Prova.
Seja δ 0 > 0 tal que se kvk < δ 0 então [c, c + v] ⊂ U. Pela definição de limite, dado ε > 0,
existe 0 < δ < δ 0 tal que
0 < kvk < δ =⇒ kf 0 (c + tv) − T k < ε ,

para todo t ∈ (0, 1).

Então, pelo corolário 5.3, kr(v)k ≤ εkvk para todo 0 < kvk < δ, onde r(v) = f(c + v) − f(c) − T v.

Logo, f é diferenciável no ponto c e f 0 (c) = T . 

208 Instituto de Matemática UFF


Sequências de aplicações diferenciáveis

6 Sequências de aplicações diferenciáveis

Definição 6.1. Dizemos que uma sequência de aplicações fk : X −→ Rn , definidas num


conjunto X, converge uniformemente para uma aplicação f : X −→ Rn quando, para todo ε > 0
dado, existe k0 ∈ N tal que
k ≥ k0 =⇒ kfk (x) − f(x)k < ε ,

para todo x ∈ X.

Observação 6.1. Como a afirmação ”lim fk = f uniformemente em X” não depende da norma


que se considera no espaço euclidiano, temos que fk −→ f uniformemente em X se, e só
se, para cada i = 1, . . . , n, fki −→ fi uniformemente em X, onde fk1 , . . . , fkn : X −→ R são
as funções-coordenada da aplicação fk : X −→ Rn e f1 , . . . , fn : X −→ R são as funções-
coordenada de f.

Observação 6.2. Se considerarmos o espaço L(Rm , Rn ) com a norma do sup, uma sequência
de aplicações gk : X −→ L(Rm , Rn ) converge para a aplicação g : X −→ L(Rm , Rn ) uniforme-
mente em X se, e só se, para todo ε > 0 dado, existe k0 ∈ N tal que
k ≥ k0 =⇒ kgk (x) v − g(x) vk ≤ ε kvk ,

para todo x ∈ X e todo v ∈ Rm .

De fato, pela definição da norma do sup, tem-se


kgk (x) − g(x)k ≤ ε ⇐⇒ kgk (x) v − g(x) vk ≤ ε kvk ,

para todo v ∈ Rn .

Definição 6.2. Seja X ⊂ Rm . Dizemos que uma sequência de aplicações fk : X −→ Rn


converge de modo localmente uniforme em X para uma aplicação f : X −→ Rn quando para
todo x ∈ X existe uma bola aberta B de centro x tal que fk −→ f uniformemente em X ∩ B.
Isto equivale a dizer que X está contido numa reunião de abertos U ⊂ Rm tais que fk −→ f
uniformemente em cada U ∩ X.

Observação 6.3. Evidentemente, convergência uniforme =⇒ convergência localmente uni-


forme =⇒ convergência simples (isto é, lim fk (x) = f(x) para todo x ∈ X). As implicações
k→∞
contrárias são falsas.
x
Exemplo 6.1. A sequência de funções fk : R −→ R, dadas por fk (x) = , converge de modo
k
localmente uniforme em R para a função identicamente nula, mas não converge uniformemente
em R. 

J. Delgado - K. Frensel 209


Análise

Critério de Cauchy: Uma sequência de aplicações fk : X −→ Rn converge uniformemente em X


se, e só se, para todo ε > 0 dado, existe k0 ∈ N tal que
j, k ≥ k0 =⇒ kfk (x) − fj (x)k < ε ,

para todo x ∈ X.

Prova.
Suponhamos que fk −→ f uniformemente em X. Então, dado ε > 0, existe k0 ∈ N tal que
ε
k ≥ k0 =⇒ kfk (x) − f(x)k < ,
2
para todo x ∈ X. Logo, se k, j ≥ k0 , temos que
ε ε
kfk (x) − fj (x)k ≤ kfk (x) − f(x)k + kf(x) − fj (x)k < + = ε,
2 2
para todo x ∈ X.

Reciprocamente, para cada x ∈ X, a sequência de vetores {fk (x)} é de Cauchy e, portanto,


converge para um vetor, que chamaremos de f(x). Isto define uma função f : X −→ R tal que
f(x) = lim fk (x) para todo x ∈ X.
k→∞

Dado ε > 0, existe k0 ∈ N tal que


ε
k, j ≥ k0 =⇒ kfk (x) − fj (x)k < ,
2
ε
para todo x ∈ X. Fixando k ≥ k0 e x ∈ X e fazendo j → ∞, obtemos que kfk (x) − f(x)k ≤ .
2
Logo kfk (x) − f(x)k < ε para todo k ≥ k0 e todo x ∈ X. Ou seja, fk −→ f uniformemente em X.

Como consequência do Critério de Cauchy, obtemos o
X
Teste de Weierstrass: Se, para cada k ∈ N e cada x ∈ X, tem-se kfk (x)k ≤ ck , onde ck
X
é uma série convergente de números reais positivos, então a série fk , cujos termos são as
X
aplicações fk : X −→ Rn , converge uniformemente em X. Além disso, a série fk converge
X
absoluta e uniformemente em X, isto é, a série kfk k converge uniformemente em X.

Teorema 6.1. (da continuidade do limite uniforme)


Seja fk : X −→ Rn uma sequência de aplicações contı́nuas no ponto a ∈ X ⊂ Rm . Se a
sequência fk converge uniformemente em X para a aplicação f : X −→ Rn , então f é contı́nua
no ponto a.

Prova.
Dado ε > 0, existe k0 ∈ N tal que
ε
k ≥ k0 =⇒ kfk (x) − f(x)k < ,
3

210 Instituto de Matemática UFF


Sequências de aplicações diferenciáveis

para todo x ∈ X.

Como fk0 é contı́nua no ponto a, existe δ > 0 tal que


ε
x ∈ X, kx − ak < δ =⇒ kfk0 (x) − fk0 (a)k < .
3
Logo, se x ∈ X e kx − ak < δ, então
ε ε ε
kf(x) − f(a)k ≤ kf(x) − fk0 (x)k + kfk0 (x) − fk0 (a)k + kfk0 (a) − f(a)k < + + = ε.
3 3 3
Portanto, f é contı́nua no ponto a. 

Lema 6.1. Seja U ⊂ Rm um aberto convexo e limitado. Se a sequência de aplicações dife-


renciáveis fk : U −→ Rn converge num ponto c ∈ U e a sequência das aplicações derivadas
fk0 : U −→ L(Rm , Rn ) converge uniformemente em U para uma aplicação g : U −→ L(Rm , Rn ),
então (fk ) converge uniformemente em U para uma aplicação diferenciável f : U −→ Rn , com
f 0 = g.

Prova.
Dado ε > 0, existe k0 ∈ N tal que
k, j ≥ k0 =⇒ kfj0 (x) − fk0 (x)k < ε 0 (1)

ε ε
para todo x ∈ U, onde ε 0 = min , e M = diam U.
3 2M
Como U é convexo, temos, pelo corolário 5.1, aplicado a fj − fk , que, para quaisquer x, y ∈ U,
j, k ≥ k0 =⇒ k(fj (y) − fk (y)) − (fj (x) − fk (x))k ≤ ε 0 ky − xk . (2)

Tomando x = c, temos que, para todo y ∈ U,


ε
k, j ≥ k0 =⇒ kfj (y) − fk (y)k ≤ kfj (c) − fk (c)k + ky − ck .
2M
Como a sequência (fk (c)) converge, existe k00 ≥ k0 tal que
ε
k, j ≥ k00 =⇒ kfj (c) − fk (c)k < .
2
Logo, para todo y ∈ U,
ε ε
k, j ≥ k00 =⇒ kfj (y) − fk (y)k < + = ε,
2 2
pois ky − xk ≤ M para todos x, y ∈ U. Assim, a sequência (fk ) converge uniformemente para
uma aplicação f : U −→ Rn .

Mostraremos agora que f é diferenciável em todo ponto x0 ∈ U e f 0 (x0 ) = g(x0 ).

De fato, fazendo j −→ ∞ em (2) e tomando y = x0 + v, temos que


k ≥ k0 =⇒ kf(x0 + v) − f(x0 ) − [fk (x0 + v) − fk (x0 )]k ≤ ε 0 kvk . (3)

Como cada fk é diferenciável no ponto x0 , para cada k ∈ N, existe δk (x0 ) > 0 tal que
kvk < δk (x0 ) =⇒ kfk (x0 + v) − fk (x0 ) − fk0 (x0 ) vk < ε 0 kvk . (4)

J. Delgado - K. Frensel 211


Análise

Fazendo j → ∞ em (1), obtemos:


k ≥ k0 =⇒ kfk0 (x) − g(x)k ≤ ε 0 , (5)

para todo x ∈ U.

Então, tomando k = k0 e δ = δk0 (x0 ), temos, por (3), (4) e (5), que:
kvk < δ =⇒ kf(x0 + v) − f(x0 ) − g(x0 ) vk
≤ kf(x0 + v) − f(x0 ) − [fk0 (x0 + v) − fk0 (x0 )]k
+kfk0 (x0 + v) − fk0 (x0 ) − fk0 0 (x0 )vk + kfk0 0 (x0 )v − g(x0 )vk
≤ 3ε 0 kvk ≤ εkvk .
Logo f é diferenciável em x0 e f 0 (x0 ) = g(x0 ). 

Teorema 6.2. (da derivação termo a termo)


Seja U ⊂ Rm um aberto conexo. Se a sequência de aplicações diferenciáveis fk : U −→ Rn
converge num ponto c ∈ U e a sequência das derivadas fk0 : U −→ L(Rm , Rn ) converge de modo
localmente uniforme para uma aplicação g : U −→ L(Rm , Rn ), então a sequência (fk ) converge
de modo localmente uniforme para uma aplicação f : U −→ Rn diferenciável, com f 0 = g.

Prova.
Como fk0 converge de modo localmente uniforme para g, para todo x ∈ U, existe uma bola
[
aberta Bx ⊂ U tal que fk0 −→ g uniformemente em Bx . Logo U = Bx e, pelo lema 6.1, se (fk )
x∈U
converge em algum ponto de Bx , então (fk ) converge uniformemente em Bx .

Seja A a reunião das bolas Bx nas quais (fk ) converge uniformemente, e B a reunião das bolas
Bx nas quais não há convergência em ponto algum. Como U = A ∪ B é uma cisão de U, U é
conexo e A 6= ∅, pois Bc ⊂ A, temos que U = A, ou seja, (fk ) converge de modo localmente
uniforme em U para uma aplicação f : U −→ Rn . Então, pelo lema 6.1, f é diferenciável e f 0 = g.


Observação 6.4. Mesmo supondo fk0 −→ g uniformemente no aberto conexo U e (fk (c))
convergente para algum c ∈ U, nem sempre é verdadeiro que (fk ) converge uniformemente em
x
U. Por exemplo, seja fk : R −→ R a sequência de funções dadas por fk (x) = .
k
1
Então fk0 ≡ −→ g ≡ 0 uniformemente em R, mas (fk ) não converge uniformemente em R.
k
Mas se existir um número real M > 0 tal que dois pontos quaisquer de U podem ser ligados
por uma poligonal de comprimento ≤ M contida em U, temos (por (2) do lema 6.1) que (fk )
converge uniformemente em U, se (fk0 ) convergir uniformemente em U e (fk (c)) convergir para
algum c ∈ U. Quando U é convexo e limitado isto ocorre.

212 Instituto de Matemática UFF


Aplicações fortemente diferenciáveis

Corolário 6.1. Derivação termo a termo para séries


X
Seja U ⊂ Rm aberto e conexo. Se a série fk , de aplicações diferenciáveis fk : U −→ Rn ,
X
converge num ponto c ∈ U e a série das derivadas fk0 converge de modo localmente uniforme
X X
em U para a soma g = fk0 , então fk converge de modo localmente uniforme em U para
uma aplicação f : U −→ Rn diferenciável, com f 0 = g.

7 Aplicações fortemente diferenciáveis

Existe uma noção de diferenciabilidade, correspondente ao que seria classe C1 , mas onde
se supõe que a aplicação é diferenciável num único ponto. Trata-se da noção de diferenciabili-
dade forte que veremos mais abaixo.

Teorema 7.1. Seja f : U −→ Rn uma aplicação, definida no aberto U ⊂ Rm , diferenciável no


ponto a ∈ U.

(a) Se a transformação linear f 0 (a) : Rm −→ Rn é injetora, então existem c > 0 e δ > 0 tais que
kx − ak < δ =⇒ kf(x) − f(a)k ≥ ckx − ak .

(b) Se f 0 (a) : Rm −→ Rn é sobrejetora, então em qualquer bola de centro a existem pontos x


tais que kf(a)k < kf(x)k e, se f(a) 6= 0, pontos y tais que kf(y)k < kf(a)k.

Prova.
(a) Como a aplicação f 0 (a) : Sm−1 −→ Rn é contı́nua, por ser a restrição de uma aplicação
linear, temos que a função kf 0 (a)k : Sm−1 −→ R é contı́nua. Sendo Sm−1 compacta, existe
v0 ∈ Sm−1 tal que kf 0 (a) vk ≥ kf 0 (a) v0 k para todo v ∈ Sm−1 . Logo 2c = kf 0 (a) v0 k > 0, pois f 0 (a)
é injetora. Além disso, como f é diferenciável no ponto a,
f(x) = f(a) + f 0 (a)(x − a) + R(x) ,
R(x)
com lim = 0. Então, existe δ > 0 tal que
x→a kx − ak
kx − ak < δ =⇒ kR(x)k ≤ ckx − ak .

Logo,
kx − ak < δ =⇒ kf(x) − f(a)k ≥ kf 0 (a)(x − a)k − kR(x)k ≥ 2ckx − ak − ckx − ak = ckx − ak .

(b) Seja Bδ (a) ⊂ U a bola de centro a e raio δ > 0. Suponhamos, por absurdo, que kf(x)k ≤
kf(a)k para todo x ∈ Bδ (a). Então a é um ponto de máximo da função ξ : Bδ (a) −→ R,
ξ(x) = kf(x)k. Além disso, f(a) 6= 0, pois, caso contrário, f(x) = 0 para todo x ∈ Bδ (a) e,

J. Delgado - K. Frensel 213


Análise

portanto, f 0 (a) = 0 não seria sobrejetora.


hf 0 (a) v, f(a)i
Como f(a) 6= 0 temos, pelo exemplo 3.1, que ξ é diferenciável em a e ξ 0 (a) v = .
kf(a)k
Logo hf 0 (a) v, f(a)i = 0 para todo v ∈ Rm , pois a é um ponto de máximo.

Em particular, f 0 (a) v 6= f(a) para todo v ∈ Rm , uma contradição, pois f 0 (a) é sobrejetora.

De modo análogo, se f(a) 6= 0 e não existirem pontos y ∈ Bδ (a), para algum δ > 0, com
kf(y)k < kf(a)k, então a seria um mı́nimo para a função ξ(x) = kf(x)k, x ∈ Bδ (a), o que leva a
uma contradição como acima. 

Corolário 7.1. Se f : U −→ Rn é diferenciável no ponto a ∈ U ⊂ Rm e f 0 (a) é injetora, então


existe uma bola de centro a tal que:
x ∈ B , x 6= a =⇒ f(x) 6= f(a) .

Observação 7.1. Cabem as perguntas: se f 0 (a) é injetora, existe uma bola B de centro a tal
que f|B é injetora? E se f 0 (a) é sobrejetora, f(a) ∈ int f(U)? A resposta a estas perguntas é
não, sem hipóteses adicionais.

Exemplo 7.1. No caso n = m = 1, f 0 (a) 6= 0 equivale a dizer que f 0 (a) é injetora ou sobreje-
tora.
1 x
Seja f : R −→ R a função dada por f(x) = x2 sen + , se x 6= 0, e f(0) = 0.
x 2
1
Então f é diferenciável em R e f 0 (0) = 6= 0.
2
Mas f não é injetora em intervalo algum da forma (−δ, δ).

De fato, suponhamos que f é injetora em (−δ, δ). Como


 f écontı́nua, temos que f é monótona.
1 2 1
Seja k0 ∈ N, tal que < δ. Sendo f(0) = 0 < f = , f é crescente. Logo, para
2π k0 2πk0 2πk0
todo k ≥ k0 par, temos:
 
2
 2  4 1 1
f <f ⇐⇒ + <
(2k + 1) π 2πk ((2k + 1)π)2 (2k + 1)π 2kπ
 
1 4 1
⇐⇒ +1 <
(2k + 1)π (2k + 1)π 2kπ

4 1
⇐⇒ +1<1+
(2k + 1)π 2k

1 1 1
⇐⇒ 8k < (2k + 1)π ⇐⇒ < + ,
π 4 8k
1 1
e, portanto, ≤ , uma contradição. 
π 4

214 Instituto de Matemática UFF


Aplicações fortemente diferenciáveis

Observação 7.2. Se a função f : I ⊂ R −→ R é contı́nua, derivável no ponto a ∈ I e f 0 (a) > 0,


então existe δ > 0 tal que (a − δ, a + δ) ⊂ I e a − δ < y < a < x < a + δ =⇒ f(y) < f(a) < f(x).

Em particular, f(a) ∈ int f(I). O mesmo terı́amos se f 0 (a) < 0.

O exemplo abaixo exibe uma aplicação f : R2 −→ R2 diferenciável na origem, cuja derivada


f 0 (0) : R2 −→ R2 é a aplicação identidade, mas f não é injetora em vizinhança alguma de 0, nem
f(0) ∈ int f(U), para todo aberto U contendo 0.

Exemplo 7.2. Sejaf : R2 −→ R2 a aplicação dada por


(x, x2 ) 
se (x, y) ∈ Γ = (x, y) ∈ R2 x > 0 e 0 < y < x2
f(x, y) =
(x, y) se (x, y) 6∈ Γ .

Fig. 3: A parte sombreada transforma-se por f na curva y = x2 , x > 0


Fig. 4: A parte sombreada é a imagem de f

Afirmação: f é descontı́nua nos pontos (x, 0), com x > 0.


1
 
De fato, seja x > 0 e consideremos a sequência pn = x, . Então existe n0 ∈ N tal que
n
1
< x2 . Logo pn −→ (x, 0), mas f(pn ) não converge para f(x, 0) = (x, 0), pois f(pn ) = (x, x2 )
n0
para todo n ≥ n0 .

É fácil verificar que f é contı́nua nos demais pontos de R2 .

Afirmação: f é diferenciável na origem e f 0 (0, 0) = Id é a transformação identidade.

De fato, para todo v = (x, y) ∈ R2 , f(v) = f(0) + v + r(v), onde r(v) = (0, x2 − y) se x > 0 e
0 < y < x2 , e r(v) = 0 nos demais pontos. Como a primeira coordenada é sempre zero e a
2
segunda está sempre compreendida
entre 0 e x , temos que
= p |r(v)| ≤ p x
r(v) 2

kvk ≤ |x| .
x 2 + y2 x2 + y2

J. Delgado - K. Frensel 215


Análise

r(v)
Logo lim = 0. Ou seja, f é diferenciável na origem e f 0 (0) v = v para todo v ∈ R2 .
v→0 kvk

Como em qualquer aberto contendo (0, 0) existe um segmento de reta vertical de extremos
(x, 0) e (x, x2 ), com x > 0, o qual é transformado por f num único ponto (x, x2 ), temos que f
não é injetora em vizinhança alguma de 0. Além disso, como nenhum ponto (x, y), com x > 0
e 0 < y < x2 , pertence à imagem de f, temos que f(0) = 0 não é um ponto interior a f(U) para
todo aberto U ⊂ R2 contendo (0, 0). 

Observação 7.3. Podemos modificar um pouco o exemplo acima de modo a obter uma
aplicação contı́nua f : R2 −→ R2 diferenciável na origem, com f 0 (0) = Id, tal que f não é
injetora em nenhuma bola de centro 0 (ver exemplo abaixo).

Mas, com o auxı́lio da Teoria do Grau, é possı́vel mostrar que se f : U −→ Rn é contı́nua no


aberto U ⊂ Rn e possui, no ponto a ∈ U, uma derivada f 0 (a) : Rn −→ Rn que é um isomorfismo,
então f(a) ∈ int f(U). Isto mostra que a descontinuidade da aplicação f do exemplo acima é
essencial para termos f(a) 6∈ int f(U).

Exemplo 7.3. Seja a aplicação f : R2 −→ R2 definida por 


 x2
 4y ,
 0≤y≤
(x, y) 
 4
se (x, y) ∈ R2 − Γ x2 x2
f(x, y) = onde g(x, y) = 4 (x2 − y) , ≤y≤
(x, g(x, y)) 
 3 4 2
se (x, y) ∈ Γ , 
 x2
 2 y + 1 x2 , ≤ y ≤ x2 .
3 3 2
Pode-se provar, com um pouco mais de trabalho que no exemplo anterior, que f é contı́nua
em todos os pontos do plano e que f é diferenciável na origem, com f 0 (0) = Id. Além disso,
f(R2 ) = R2 .

Seja Uum aberto qualquer contendo a origem. Então, para x > 0 suficientemente pequeno,

x2
x, e (x, x2 ) pertencem a U.
4
 
x2
Logo, como f x, = f(x, x2 ) = (x, x2 ) , temos que f|U não é injetora. Assim, f não é injetora
4
em vizinhança alguma da origem. 

Definição 7.1. Dizemos que uma aplicação f : U −→ Rn definida num aberto U ⊂ Rm , é


fortemente diferenciável no ponto a ∈ U quando existe uma transformação linear T : Rm −→ Rn
tal que, para todos x, y ∈ U, vale
f(x) = f(y) + T (x − y) + ρa (x, y) |x − y| ,

onde lim ρa (x, y) = 0.


x,y→a

216 Instituto de Matemática UFF


Aplicações fortemente diferenciáveis

Observação 7.4. Tomando y = a, obtemos que toda aplicação fortemente diferenciável no


ponto a é diferenciável neste ponto e T = f 0 (a).

Assim, f é fortemente diferenciável no ponto a ∈ U se, e só se, para todo ε > 0 dado, existe
δ > 0 tal que
x, y ∈ Bδ (a) =⇒ |ρa (x, y)| < ε ,

onde ρa (x, y) |x − y| = f(x) − f(y) − f 0 (a)(x − y) .

Observação 7.5. Quando m = n = 1, uma função f : I −→ R, definida no intervalo aberto


I ⊂ R, é fortemente diferenciável no ponto a ∈ I quando, para x 6= y em I, a reta secante ao
gráfico de f que passa pelos pontos (x, f(x)) e (y, f(y)) tende para a reta tangente no ponto
(a, f(a)) quando x → a e y → a.

Na definição usual de derivada, temos apenas que a secante ao gráfico que passa pelos pontos
(a, f(a)) e (x, f(x)) tende à tangente no ponto (a, f(a)) quando x → a.

Observação 7.6. Se f : U −→ Rn é fortemente diferenciável no ponto a, então, para todo


ε > 0 dado, existe δ > 0, tal que
x, y ∈ Bδ (a) =⇒ kf(x) − f(y)k ≤ (kf 0 (a)k + ε) kx − yk .

De fato, dado ε > 0, existe δ > 0 tal que


x, y ∈ Bδ (a) =⇒ kρa (x, y)k < ε
=⇒ kf(x) − f(y)k ≤ kf 0 (a)(x − y)k + kρa (x, y)k kx − yk
≤ (kf 0 (a)k + ε) kx − yk .
Em particular, f é contı́nua, ou melhor, f é Lipschitziana numa bola de centro a.

Teorema 7.2. Se f : U ⊂ Rm −→ Rn é fortemente diferenciável no ponto a e f 0 (a) : Rm −→ Rn


é injetora, então existem c > 0 e δ > 0 tais que
x, y ∈ Bδ (a) =⇒ kf(x) − f(y)k ≥ ckx − yk .

Logo f é um homeomorfismo da bola Bδ (a) sobre sua imagem e, em particular, f é injetora na


bola Bδ (a).

Prova.
Como f 0 (a) é injetora, já sabemos que existe c > 0 tal que kf 0 (a) vk ≥ 2ckvk para todo v ∈ Rm .

Então, para ε = c > 0, existe δ > 0 tal que


x, y ∈ Bδ (a) =⇒ kra (x, y)k < ckx − yk ,

onde ra (x, y) = f(x) − f(y) − f 0 (a) (x − y) .

J. Delgado - K. Frensel 217


Análise

Assim,
x, y ∈ Bδ (a) =⇒ kf(x) − f(y)k ≥ kf 0 (a)(x − y)k − kra (x, y)k
≥ 2ckx − yk − ckx − yk
= ckx − yk .
Logo f : Bδ −→ Y = f(Bδ (a)) é uma bijeção e a inversa f−1 : Y −→ Bδ (a) é contı́nua, pois
1
kf−1 (w) − f−1 (z)k ≤ kw − zk para quaisquer z, w ∈ Y. Portanto, f : Bδ (a) −→ Y é um homeo-
c
morfismo. 

Observação 7.7. Provaremos na seção 11 (Forma local das submersões) que se f : U ⊂


Rm −→ Rn é fortemente diferenciável no ponto a e f 0 (a) : Rm −→ Rn é sobrejetora, então
f(a) ∈ int f(U).

Teorema 7.3. A aplicação f : U ⊂ Rm −→ Rn é fortemente diferenciável no ponto a ∈ U se,


e só se, é diferenciável no ponto a e, para todo ε > 0, existe δ > 0 tal que o resto ra (x) =
f(x) − f(a) − f 0 (a)(x − a) satisfaz a condição de Lipschitz:
kra (x) − ra (y)k ≤ εkx − yk ,

para todos x, y ∈ Bδ (a).

Prova.
Basta observar que ra (x, y) = ra (x) − ra (y), pois ra (x, y) = f(x) − f(y) − f 0 (a)(x − y),
ra (x) = f(x) − f(a) − f 0 (a)(x − a) e ra (y) = f(y) − f(a) − f 0 (a)(y − a). 

O teorema abaixo mostra que a única diferença entre a diferenciabilidade forte e a con-
tinuidade da derivada é que a primeira faz sentido mesmo quando a aplicação é diferenciável
num único ponto

Teorema 7.4. Seja f : U ⊂ Rm −→ Rn uma aplicação diferenciável. Então f é fortemente


diferenciável no ponto a se, e só se, a aplicação derivada f 0 : U −→ L(Rm , Rn ) é contı́nua no
ponto a.

Prova.
Suponhamos que f 0 é contı́nua no ponto a. Seja ra (x) = f(x) − f(a) − f 0 (a)(x − a). Então
ra é diferenciável, com derivada ra0 (x) = f 0 (x) − f 0 (a) contı́nua no ponto a e ra0 (a) = 0.

Logo, para todo ε > 0 dado, existe δ > 0 tal que Bδ (a) ⊂ U e x ∈ Bδ (a) =⇒ kra0 (x)k < ε.

Como Bδ (a) é convexo, temos, pelo corolário 5.1, que se x, y ∈ Bδ (a), então kra (x) − ra (y)k ≤
εkx − yk. Assim, pelo teorema 7.3, f é fortemente diferenciável no ponto a.

218 Instituto de Matemática UFF


Aplicações fortemente diferenciáveis

Reciprocamente, suponhamos que f é fortemente diferenciável no ponto a.

Somando as igualdades
f(x) − f(y) = f 0 (a)(x − y) + ra (x, y) e f(y) − f(x) = f 0 (x)(y − x) + rx (y) ,

obtemos que
(f 0 (x) − f 0 (a))(y − x) = −(ra (x, y) + rx (y)) . (?)

Dado ε > 0, existe δ > 0 tal que


ε
x, y ∈ B2δ (a) =⇒ kra (x, y)k ≤ kx − yk , (??)
2
e, para todo x ∈ U, existe 0 < δx < δ, tal que
ε
ky − xk < δx =⇒ krx (y)k ≤ ky − xk . (? ? ?)
2
δx
Seja u ∈ Rm um vetor unitário e seja x ∈ U tal que kx − ak < δ. Tome y = x + u.
2
Então ky − ak < 2δ e ky − xk < δx . Logo, por (?), (??) e (? ? ?),
ε ε
k(f 0 (x) − f 0 (a)) (y − x)k ≤ kx − yk + kx − yk .
2 2
δx δx
Assim, k(f 0 (x) − f 0 (a)) uk ≤ ε , ou seja, k(f 0 (x) − f 0 (a)) uk ≤ ε para u ∈ Rm unitário.
2 2
Portanto, kf 0 (x) − f 0 (a)k ≤ ε. 

Exemplo 7.4. Daremos agora um exemplo de uma função f : R −→ R fortemente dife-


renciável num ponto a ∈ R que não é diferenciável em vizinhança alguma de a.

Para isso, consideramos a função g : R −→ R de classe C∞ dada por g(x) = x2 e a sequência


1
an = , para todo n ∈ N.
n
Seja f : R −→ R a função definida por:

• f(x) = g(x) para todo x ∈ (−∞, 0] ∪ [a1 , +∞);

• f(an ) = g(an );
a2n − a2n+1
• f|[an+1 ,an ] é linear para todo n ∈ N, ou seja, f(x) = (x − an+1 ) + a2n+1 para todo
an − an+1
x ∈ [an+1 , an ].

Então f não é diferenciável em an para todo n ∈ N, pois


a2n − a2n+1
(x − an+1 + an − an ) + a2n+1 − a2n
f(x) − f(an ) an − an+1 a2 − a2n+1
lim− = lim− = lim− n = an + an+1 ;
x→an x − an x→an x − an x→an an − an+1

a2n−1 − a2n
(x − an ) + a2n − a2n
f(x) − f(an ) an−1 − an
lim = lim+ = an−1 + an ,
x→a+n x − an x→an x − an
e, portanto, f 0 (a− 0 +
n ) = an + an+1 6= an−1 + an = f (an ).

J. Delgado - K. Frensel 219


Análise

Mas f é fortemente diferenciável na origem e f 0 (0) = 0.


 
1 ε 1 1
De fato: Dado ε > 0, existe n0 ∈ N tal que < . Sejam x, y ∈ − , , x < y e
n0 4 n0 n0
ra (x, y) = f(x) − f(y).

• Se x ≤ 0 e y ≤ 0, então
2
|ra (x, y)| = |f(x) − f(y)| = |x2 − y2 | = |x + y| |x − y| ≤ |x − y| < ε |x − y| .
n0
1
h 1 1
i 1 1 1
• Se x ≤ 0 e 0 < y < , existe n ∈ N tal que y ∈ , . Então < ≤ e
n0 n+1 n n+1 n n0
 1   1 
|ra (x, y)| = |f(x) − f(y)| ≤ f(x) − f + f − f(y)

n+1 n+1


2  1 2  1 1
 1

= x − + + y −

n+1 n n+1 n+1

1 1 1 1 1
 
= x + x − + + y −

n+1 n+1 n n+1 n+1

ε
 1  ε  1

< −x + y−
2 n+1 2 n+1
ε ε
= (y − x) = |y − x| < ε |y − x| .
2 2
 
1 1 1 1
h i
• Se x > 0 e y > 0, existem j, k ∈ N, j ≥ k, tais que x ∈ , ey∈ , .
j+1 j k+1 k
1 1 1 1 1 1
Como < ≤ e < ≤ , temos, no caso j < k, que:
j+1 j n0 k+1 k n0
     1   1 
1 1

|ra (x, y)| = |f(x) − f(y)| ≤ f(x) − f

+ f − f + f − f(y)

j j k+1 k+1

2
aj − a2j+1
2 2

a − a
(x − aj+1 ) + a2j+1 − a2j + |a2j − a2k+1 | + k
k+1

= (y − ak+1 )
aj − aj+1 ak − ak+1
|a2j − a2j+1 |
= |x − aj | + |aj + ak+1 | |aj − ak+1 | + |ak + ak+1 | |y − ak+1 |
|aj − aj+1 |

= |aj + aj+1 | |x − aj | + |aj + ak+1 | |aj − ak+1 | + |ak + ak+1 | |y − ak+1 |

ε
≤ | (aj − x) + (ak+1 − aj ) + (y − ak+1 )|
2
ε
= (y − x) < ε |y − x| .
2
1 1 1
E quando j = k, ou seja, ≤ x < y ≤ ≤ , temos que:
j+1 j n0
ε
|f(y) − f(x)| = (aj + aj+1 ) (y − x) ≤ (y − x) < ε |y − x| . 
2

220 Instituto de Matemática UFF


O teorema da aplicação inversa

8 O teorema da aplicação inversa

Se f : U ⊂ Rn −→ V ⊂ Rn é um difeomorfismo, então sua derivada f 0 (x) : Rn −→ Rn


é um isomorfismo
  em todo ponto x ∈ U, ou seja, det Jf(x) 6= 0 para todo x ∈ U, onde Jf(x) =
∂fi
(x) é a matriz Jacobiana de f no ponto x. É natural, então, indagar se a recı́proca é
∂xj ij
válida. Antes de responder a esta pergunta, vamos analisar alguns exemplos.

Exemplo 8.1. Uma função diferenciável f : I −→ J do intervalo aberto I sobre o intervalo


aberto J ⊂ R é um difeomorfismo se, e só se, f 0 (x) 6= 0 para todo x ∈ I.

De fato, se f 0 (x) 6= 0 para todo x ∈ I, então, pelo Teorema de Darboux, temos que ou f 0 (x) > 0
para todo x ∈ I ou f 0 (x) < 0 para todo x ∈ I. No primeiro caso, f é um homeomorfismo crescente,
e, no segundo caso, f é um homeomorfismo decrescente. E, em qualquer caso, pelo Teorema
da Função Inversa para funções reais de uma variável real (ver Curso de Análise, Vol. I de
E. Lima) f−1 : J −→ I é diferenciável. Portanto, para n = 1, a resposta a nossa pergunta é
afirmativa. 

Exemplo 8.2. Seja U ⊂ Rn a bola aberta de centro na origem e raio 1. A aplicação g : U −→


x
Rn definida por f(x) = p é um difeomorfismo de classe C∞ , cujo inverso é a aplicação
1 − hx, xi
n y
g : R −→ U dada por g(y) = p .
1 + hy, yi

Exemplo 8.3. Seja f : R2 −→ R2 a aplicação dada por f(x, y) = ex (cos y, sen y), ou, em
termos da variável complexa z = x + iy, f(z) = ez . Então f é de classe C∞ e f 0 (x, y) : R2 −→ R2
é dada por: ! !
ex cos y −ex sen y u
f 0 (x, y)(u, v) = ,
ex sen y ex cos y v
ou seja, f 0 (z) w = ez w é a multiplicação pelo número complexo z
! e , onde w = u + iv. Logo,
ex cos y −ex sen y
det Jf(x, y) = det x x
= e2x 6= 0
e sen y e cos y
para todo (x, y) ∈ R2 .

Mas f não é injetora, pois f(x1 , y1 ) = f(x2 , y2 ) se, e só se, x1 = x2 e y2 = y1 + 2π k , k ∈ Z.

Geometricamente, f transforma cada reta vertical x = a num cı́rculo de raio ea e centro na


origem, e cada reta horizontal y = b numa semi-reta aberta que parte da origem e passa pelo
ponto (cos b, sen b).

Temos, então, que f(R2 ) = R2 − {0}.

J. Delgado - K. Frensel 221


Análise

Obteremos, como consequência do Teorema da Aplicação Inversa, que f : R2 −→ R2 − {0} é um


difeomorfismo local. 

Definição 8.1. Dizemos que uma aplicação diferenciável f : U −→ Rn , definida no aberto


U ⊂ Rn , é um difeomorfismo local quando para todo x ∈ U existe um aberto Vx , com x ∈ Vx ⊂ U,
tal que a restrição de f a Vx é um difeomorfismo sobre um aberto Wx ⊂ Rn . Se f ∈ Ck , dizemos
que f é um difeomorfismo local de classe Ck . Neste caso, para todo x ∈ U, a aplicação inversa
(f|Vx )−1 : Wx −→ Vx é também de classe Ck pelo corolário 3.4.

Observação 8.1. Se f : U −→ Rn é um difeomorfismo local, então f 0 (x) : Rn −→ Rn é um


isomorfismo para todo x ∈ U. O Teorema da Aplicação Inversa nos dará a recı́proca deste fato,
no caso em que f ∈ Ck (k ≥ 1).

Observação 8.2. Todo difeomorfismo (global) é um difeomorfismo local.


Observação 8.3. f : I −→ R, definida no intervalo aberto I, é um difeomorfismo local se, e só
se, f é um difeomorfismo (global) de f sobre sua imagem J = f(I).

Observação 8.4. Todo difeomorfismo local f : U ⊂ Rn −→ Rn é uma aplicação aberta, isto


é, f(V) é aberto em Rn para todo V ⊂ U aberto em Rn .

De fato, seja V ⊂ U um aberto em Rn . Então, para cada x ∈ V, existe um aberto Vx ⊂ U, x ∈ Vx ,


e um aberto Wx ⊂ Rn tais que f : Vx −→ Wx é um difeomorfismo. Logo f(V ∩ Vx ) é aberto para
[
todo x ∈ V e, portanto, f(V) = f(V ∩ Vx ) é um conjunto aberto de Rn .
x∈V

Em particular, f(U) é um conjunto aberto de Rn .

Observação 8.5. Um difeomorfismo local f : U −→ Rn é um difeomorfismo (global) sobre


sua imagem f(U) = V se, e só se, f é uma aplicação injetora.

De fato, se f é um difeomorfismo local, temos, pela observação acima, que f(U) = V é aberto.
Se, além disso, f : U −→ V é uma bijeção, temos que f−1 : V −→ U é diferenciável, pois f−1
é diferenciável em todos os pontos f(x) ∈ V, uma vez que f−1 |Wx : Wx −→ Vx é diferenciável,
f(x) ∈ Wx e a diferenciabilidade é uma propriedade local.

Para demonstrar o Teorema da Aplicação Inversa utilizaremos o Método das Aproximações


Sucessivas.

Definição 8.2. Seja X ⊂ Rm . Dizemos que uma aplicação f : X −→ Rn é uma contração


quando existem λ ∈ R, 0 ≤ λ < 1, e normas em Rm e Rn ,tais que kf(x) − f(y)k ≤ λ kx − yk para
quaisquer x, y ∈ X.

222 Instituto de Matemática UFF


O teorema da aplicação inversa

Observação 8.6. Ao precisarmos especificar a constante λ diremos que f é uma λ−contração.

Observação 8.7. Toda contração é Lipschitziana, e, portanto, uniformemente contı́nua.

Observação 8.8. Seja U ⊂ Rm aberto e convexo. Se f : U −→ Rn é uma aplicação dife-


renciável e kf 0 (x)k ≤ λ < 1 para todo x ∈ U, temos, pelo corolário 5.1, que kf(x) − f(y)k ≤
λkx − yk para quaisquer x, y ∈ U, ou seja, f é uma λ−contração.

Definição 8.3. Um ponto fixo de uma aplicação f : X −→ Rm , X ⊂ Rm , é um ponto x ∈ X tal


que f(x) = x.

Observação 8.9. A busca de uma solução x para uma equação do tipo f(x) = b reduz-se à
procura de um ponto fixo para a aplicação ξ, dada por ξ(x) = f(x) − b + x, pois ξ(x) = x se, e
só se, f(x) = b.

Teorema 8.1. (do ponto fixo para contrações – método das aproximações sucessivas)
Sejam F ⊂ Rm um subconjunto fechado e f : F −→ F uma contração. Então, dado qualquer
x0 ∈ F, a sequência x1 = f(x0 ), x2 = f(x1 ), . . . , xk+1 = f(xk ), . . . converge para um ponto a ∈ F,
que é o único ponto fixo de f.

Prova.
Unicidade: Sejam a, b ∈ F tais que f(a) = a e f(b) = b, e seja 0 ≤ λ < 1 tal que kf(x) − f(y)k ≤
λkx − yk para quaisquer x, y ∈ F. Então
ka − bk = kf(a) − f(b)k ≤ λka − bk ,

ou seja, (1 − λ)ka − bk ≤ 0. Logo a = b, pois 1 − λ > 0 e ka − bk ≥ 0.

Existência: Seja x0 ∈ F e consideremos a sequência {xk } onde xk+1 = f(xk ) para todo k ≥ 0.
Então
kxk+1 − xk k = kf(xk ) − f(xk−1 )k ≤ λkxk − xk−1 k ,

para todo k ≥ 1. Logo, por indução, podemos provar que


kxk+1 − xk k ≤ λk kx1 − x0 k ,

para todo k ≥ 0.

Assim,
X
p−1
X
p−1
λk
kxk+p − xk k ≤ kxk+i+1 − xk+i k ≤ λk+i kx1 − x0 k ≤ kx1 − x0 k ,
1−λ
i=0 i=0

para todos k, p ∈ N.

J. Delgado - K. Frensel 223


Análise

Mas, como λk −→ 0, dado ε > 0, existe k0 ∈ N tal que


k ≥ k0 =⇒ kxk+p − xk k < ε ,

para todo p ∈ N. Ou seja, a sequência {xk } é de Cauchy e, portanto, converge para um ponto a,
onde a ∈ F, pois F é fechado.

Além disso, como f é contı́nua, temos que f(a) = lim f(xk ) = lim xk+1 = a, isto é, a é um ponto
k→∞ k→∞
fixo de f. 

Exemplo 8.4. O ponto fixo de uma aplicação f : F −→ F pode não existir quando tivermos
apenas kf(x) − f(y)k < kx − yk para quaisquer x, y ∈ F, x 6= y.
 
1 1 x
 p 
De fato, seja f : R −→ R a função f(x) = x + 1 + x2 . Como f 0 (x) = 1+ p ,
2 2 1 + x2

x < 1 para todo x ∈ R. Logo |f(x) − f(y)| < |x − y| para

temos que 0 < f 0 (x) < 1, pois p
1 + x2

quaisquer x, y ∈ F, x 6= y, mas f não possui um ponto fixo, pois f(x) > x para todo x ∈ R. 

Observação 8.10. Se K ⊂ Rm é compacto e a aplicação f : K −→ K satisfaz a condição


kf(x) − f(y)k < kx − yk para todo par de pontos x 6= y em K, então f possui um único ponto fixo
em K.

Com efeito, seja a ∈ K o ponto onde a função contı́nua ϕ : K −→ R, ϕ(x) = kf(x) − xk, atinge
seu mı́nimo c = kf(a) − ak. Se c 6= 0, ou seja, f(a) 6= a, terı́amos
kf(f(a)) − f(a)k < kf(a) − ak = c ,

uma contradição, pois ϕ(f(a)) seria menor do que o mı́nimo c. Logo f(a) = a, ou seja, a é um
ponto fixo de f.

Suponhamos agora que f(a) = a, f(b) = b e a 6= b. Então ka − bk = kf(a) − f(b)k < ka − bk,
um absurdo. Logo f possui um único ponto fixo.

Para garantir que uma contração f : X −→ Rm possui um ponto fixo, basta encontrar um
subconjunto F ⊂ X fechado em Rm tal que f(F) ⊂ F.

Lema 8.1. Seja f : X −→ Rm uma λ−contração. Se B[a; r] ⊂ X e kf(a) − ak ≤ (1 − λ) r, então


f admite um único ponto fixo em B[a; r].

Prova.
Pelo teorema anterior, basta provar que f(B[a; r]) ⊂ B[a; r], o que ocorre, pois x ∈ B[a; r] =⇒
kx − ak ≤ r =⇒

kf(x) − ak ≤ kf(x) − f(a)k + kf(a) − ak ≤ λkx − ak + (1 − λ)r ≤ λr + (1 − λ)r = r . 

224 Instituto de Matemática UFF


O teorema da aplicação inversa

Teorema 8.2. (da perturbação da identidade)


Seja ϕ : U −→ Rm uma λ−contração definida no aberto U ⊂ Rm . Então a aplicação f : U −→ Rm
dada por f(x) = x + ϕ(x), é um homeomorfismo de U sobre o conjunto aberto f(U) ⊂ Rm . Além
disso, se U = Rm então f(U) = Rm .

Prova.
Para quaisquer x, y ∈ U, temos
kf(x) − f(y)k = kx − y + ϕ(x) − ϕ(y)k ≥ kx − yk − kϕ(x) − ϕ(y)k
≥ kx − yk − λkx − yk = (1 − λ)kx − yk .
Então f é uma bijeção de U sobre f(U) e a aplicação inversa f−1 : f(U) −→ U satisfaz a condição
de Lipschitz
kf−1 (z) − f−1 (w)k ≤ c kz − wk ,
1
com c = , para todos z, w ∈ f(U). Em particular, f é um homeomorfismo de U sobre f(U).
1−λ
Seja b ∈ f(U). Então existe a ∈ U tal que b = f(a) = ϕ(a) + a.

Afirmação: Existe δ > 0 tal que B(b; δ) ⊂ f(U).

Sejam y ∈ Rm e r > 0 tal que B[a; r] ⊂ U, e consideremos a aplicação ξy : B[a; r] −→ Rm dada


por ξy (x) = y − ϕ(x). Então ξy é uma λ−contração e ξy (x) = x ⇐⇒ y = x + ϕ(x) = f(x).

Sendo ξy (a) − a = y − a − ϕ(a) = y − b, temos que


ky − bk ≤ (1 − λ)r =⇒ kξy (a) − ak ≤ (1 − λ)r ,

Então, pelo lema 8.1, ξy (B[a; r]) ⊂ B[a; r] e portanto, pelo Teorema do Ponto Fixo para Contrações,
existe x ∈ B[a; r] ⊂ U tal que ξy (x) = x, ou seja, existe x ∈ U tal que f(x) = y. Logo,
B[b; (1 − λ)r] ⊂ f(U) e, portanto, b ∈ int f(U). Como b ∈ f(U) é arbitrário, provamos que
f(U) é aberto em Rm .

Finalmente, se U = Rm então B[a; r] ⊂ Rm para todo r > 0. Logo, pelo provado acima,
B[f(a); (1 − λ)r] ⊂ f(U) para todo r > 0.
k
Se tomarmos rk = > 0, k ∈ N, teremos que B[f(a); k] ⊂ f(U) para todo k ∈ N. Assim,
[ 1−λ
Rm = B[f(a); k] ⊂ f(U), ou seja, f(U) = Rm . 
k∈N

Corolário 8.1. (Perturbação de um isomorfismo)


Sejam U ⊂ Rm um conjunto aberto e f : U −→ Rm uma aplicação da forma f(x) = Tx + ϕ(x),
onde T : Rm −→ Rm é uma transformação linear invertı́vel e a aplicação ϕ : U −→ Rm satisfaz
kϕ(x) − ϕ(y)k ≤ λkx − yk, com λkT −1 k < 1.

J. Delgado - K. Frensel 225


Análise

Então f é um homeomorfismo de U sobre o conjunto aberto f(U) ⊂ Rm . Além disso, se U = Rm ,


tem-se f(U) = Rm .

Prova.
Consideremos as aplicações g : U −→ Rm e ψ : U −→ Rm dadas por
g(x) = (T −1 ◦ f)(x) = x + (T −1 ◦ ϕ)(x) e ψ(x) = (T −1 ◦ ϕ)(x) .

Então ψ é uma µ−contração, com µ = λkT −1 k < 1, pois:


kψ(x) − ψ(y)k = kT −1 (ϕ(x)) − T −1 (ϕ(y))k ≤ kT −1 k kϕ(x) − ϕ(y)k ≤ kT −1 kλkx − yk .

Logo, pelo teorema acima, g = T −1 ◦ f é um homeomorfismo de U sobre o aberto T −1 (f(U))


e T −1 (f(U)) = Rm quando U = Rm . Então, como T : Rm −→ Rm é um homeomorfismo, pois
T é um isomorfismo, temos que f = T ◦ g é um homeomorfismo de U sobre o aberto f(U) e
f(U) = T (T −1 (f(U))) = T (Rm ) = Rm quando U = Rm . 

Lema 8.2. (da diferenciabilidade do homeomorfismo inverso)


Seja f : U −→ V um homeomorfismo entre os abertos U, V ⊂ Rm . Se f é diferenciável num ponto
a ∈ U e f 0 (a) : Rm −→ Rm é um isomorfismo, então o homeomorfismo inverso f−1 : V −→ U
é diferenciável no ponto b = f(a). Se f é fortemente diferenciável no ponto a, então f−1 é
fortemente diferenciável no ponto b = f(a).

Prova.
Fazendo g = f−1 e
s(w) = g(b + w) − g(b) − f 0 (a)−1 w , (1)
s(w)
precisamos mostrar que lim = 0.
w→0 kwk
Seja v = g(b + w) − g(b). Então
f(a + v) − f(a) = f(a + g(b + w) − g(b)) − f(a) = f(g(b + w)) − b = b + w − b = w .

Como f e g são contı́nuas, temos que v → 0 se, e só se, w → 0.

Além disso, como f é diferenciável no ponto a,


r(v)
f(a + v) − f(a) = f 0 (a)v + r(v), onde lim = 0. (2)
v→0 kvk

Como v = g(b + w) − g(b) e w = f(a + v) − f(a), temos, por (1) e (2), que
v = (f 0 (a))−1 (f(a + v) − f(a)) + s(w)
= (f 0 (a))−1 (f 0 (a)v + r(v)) + s(w)
= v + (f 0 (a))−1 r(v) + s(w) .
Logo,

226 Instituto de Matemática UFF


O teorema da aplicação inversa

s(w) = −(f 0 (a))−1 r(v) , (3)

e
s(w) r(v) kvk
= −(f 0 (a))−1 . (4)
kwk kvk kwk
Pelo Teorema 7.1, existem c > 0 e µ > 0 tais que
kf(a + v) − f(a)k ≥ ckvk ,

para todo v ∈ Rm com kvk < µ. Ou seja,


kvk kvk 1
= ≤ , (5)
kwk kf(a + v) − f(a)k c
quando kvk < µ .
r(v)
Além disso, como lim = 0, dado ε > 0, existe 0 < µ 0 < µ tal que
v→0 kvk
kr(v)k εc
kvk < µ 0 =⇒ ≤ 0
. (6)
kvk k(f (a))−1 k
Por outro lado, como g é contı́nua no ponto b = f(a) e v = g(b + w) − g(b), existe δ > 0 tal que
kwk < δ =⇒ kvk < µ 0 . Logo, por (4), (5), (6),
ks(w)k k(f 0 (a))−1 r(v)k kvk kr(v)k kvk
kwk < δ =⇒ = ≤ k(f 0 (a))−1 k
kwk kvk kwk kvk kwk
εc 1
≤ k(f 0 (a))−1 k = ε.
k(f 0 (a))−1 k c
Logo g = f−1 é diferenciável no ponto b = f(a) e g 0 (b) = (f 0 (a))−1 .

Suponhamos agora que f é fortemente diferenciável no ponto a. Fazendo v = g(b + w) − g(b)


e u = g(b + z) − g(b) temos, por (3), que
s(w) − s(z) = (f 0 (a))−1 [r(u) − r(v)] . (7)

Como f é fortemente diferenciável no ponto a e f 0 (a) : Rm −→ Rm é injetora temos, pelo teorema


7.2, que existem c > 0 e µ > 0 tais que
kuk < µ e kvk < µ =⇒ kf(a + u) − f(a + v)k ≥ cku − vk . (8)

Além disso, dado ε > 0, existe, pelo teorema 7.3, 0 < µ 0 < µ tal que

u, v ∈ B(0; µ 0 ) =⇒ kr(u) − r(v)k ≤ ku − vk . (9)
k(f 0 (a))−1 k
Como g é contı́nua em b e u = g(b + z) − g(b), v = g(b + w) − g(b), existe δ > 0 tal que
kzk < δ , kwk < δ =⇒ kuk < µ 0 , kvk < µ 0 .

Logo, por (7), (9), (8), kwk < δ e kzk < δ =⇒



ks(w) − s(z)k ≤ k(f 0 (a))−1 k kr(u) − r(v)k ≤ k(f 0 (a))−1 k ku − vk
k(f 0 (a))−1 k

≤ kf(a + u) − f(a + v)k = εkz − wk .
c
Finalmente, pelo teorema 7.3, g = f−1 é fortemente diferenciável no ponto b = f(a). 

J. Delgado - K. Frensel 227


Análise

Teorema 8.3. (da Aplicação Inversa)


Sejam U ⊂ Rm um conjunto aberto e f : U −→ Rm uma aplicação fortemente diferenciável no
ponto a ∈ U tal que f 0 (a) : Rm −→ Rm é um isomorfismo. Então f é um homeomorfismo de um
aberto V contendo a sobre um aberto W contendo f(a), o homeomorfismo inverso f−1 : W −→ V
é fortemente diferenciável no ponto b = f(a) e sua derivada neste ponto é (f 0 (a))−1 . Se f é de
classe Ck , k ≥ 1, então V pode ser tomado de modo que f seja um difeomorfismo de V sobre
W (e pelo corolário 3.4, tem-se que f−1 é, também, de classe Ck ).

Prova.
Seja r(x) = f(x) − f(a) − f 0 (a)(x − a). Como f é fortemente diferenciável no ponto a, temos, pelo
1
teorema 7.3, que dado 0 < λ < , existe δ > 0 tal que
k(f 0 (a))−1 k
x, y ∈ B(a; δ) =⇒ kr(x) − r(y)k ≤ λkx − yk .

Como

• f 0 (a) : Rm −→ Rm é um isomorfismo;

• f(x) = f 0 (a) x + r(x) + f(a) − f 0 (a) · a e kϕ(x) − ϕ(y)k ≤ λkx − yk , para quaisquer
x, y ∈ V = B(a; δ), onde ϕ(x) = r(x) + f(a) − f 0 (a) · a;

• 0 < λ k(f 0 (a))−1 k < 1,

temos, pelo corolário 8.1, que f é um homeomorfismo do aberto V sobre o aberto W = f(V).
Portanto, pelo lema 8.2, a inversa f−1 : W −→ V é fortemente diferenciável no ponto b = f(a).

Suponhamos agora que f é de classe Ck , k ≥ 1, e f 0 (a) : Rm −→ Rm é um isomorfismo. Então,


pelo teorema 7.4, f é fortemente diferenciável no ponto a, e, pelo provado acima, existe δ > 0
tal que f é um homeomorfismo de V = B(a; δ) sobre o aberto W = f(V).

Como a aplicação derivada f 0 : U −→ L(Rm ; Rm ) é contı́nua, o conjunto GL(Rm ) dos isomor-


fismos lineares de Rm é aberto em L(Rm ; Rm ) e f 0 (a) ∈ GL(Rm ), existe 0 < δ 0 < δ tal que
f 0 (x) ∈ GL(Rm ) para todo x ∈ B(a; δ 0 ) = V 0 ⊂ V.

Sendo W 0 = f(V 0 ) aberto em Rm e f : V 0 −→ W 0 um homeomorfismo diferenciável, temos, pelo


lema 8.2, que f−1 : W 0 −→ V 0 é diferenciável em todos os pontos de W 0 .

Logo f : V 0 −→ W 0 é um difeomorfismo. 

Corolário 8.2. Uma aplicação f : U ⊂ Rm −→ Rm de classe Ck (1 ≤ k ≤ ∞), definida no


aberto U ⊂ Rm , é um difeomorfismo local se, e só se, para todo x ∈ U, f 0 (x) : Rm −→ Rm é um
isomorfismo (ou seja, det Jf(x) 6= 0).

228 Instituto de Matemática UFF


Aplicação: o Lema de Morse

Corolário 8.3. (Perturbação diferenciável da identidade)


Seja U ⊂ Rm um aberto convexo. Se ϕ : U −→ Rm é de classe C1 , com kϕ 0 (x)k ≤ λ < 1 para
todo x ∈ U, então f : U −→ Rm , dada por f(x) = x + ϕ(x), é um difeomorfismo de U sobre sua
imagem f(U). Se, além disso, U = Rm , então f(U) = Rm .

Prova.
Como U ⊂ Rm é aberto e convexo e kϕ 0 (x)k ≤ λ para todo x ∈ U, temos, pelo corolário
5.1, que ϕ é uma λ−contração. Logo, pelo teorema da perturbação da identidade, f é um
homeomorfismo de U sobre o aberto f(U).

Além disso, como f 0 (x) = Id + ϕ 0 (x) e kϕ 0 (x)k ≤ λ < 1, para todo x ∈ U, temos que f 0 (x) é um
isomorfismo para todo x ∈ U, pois, caso
contrário, existiria v ∈ Rm − {0} tal que ϕ 0 (x) v = −v,
0 v = 1 ≤ kϕ 0 (x)k.
um absurdo, uma vez que ϕ (x) kvk
Portanto, pelo corolário 8.2, f é um difeomorfismo local. Como f : U −→ f(U) é injetora, f é um
difeomorfismo (global). 

Exemplo 8.5. Seja f : Rn2 −→ Rn2 a aplicação definida por f(X) = Xk , onde k ∈ N. Então f é
de classe C∞ e
X
k
0
f (X) V = Xi−1 V Xk−i .
i=1
2 2 2
De fato, como f(X) = L(X, . . . , X), onde L : Rn × . . . × Rn −→ Rn é a aplicação k−linear,
não-simétrica dada por L(X1 , . . . , Xk ) = X1 · . . . · Xk , temos, pela observação 8.4 do capı́tulo 3,
que f é de classe C∞ e
(k − 1)! X X
k k
1
0
f (X) V = LS (X, . . . , X, V) = | · .{z
X . . · X} ·V · X
| · .{z
. . · X} = Xi−1 · V · Xk−i .
(k − 1)! (k − 1)!
i=1 i−1 k−i i=1

. . × Rn} é a aplicação de classe C∞ dada


n 2 2 2
Ou ainda, como f = L ◦ h, onde h : Rn −→ R
| × .{z
k
por h(X) = (X, . . . , X), então f é de classe C∞ e, pela Regra da Cadeia e pelo exemplo 2.3,
f 0 (X) · V = L 0 (X, . . . , X) ◦ h 0 (X) · V = L 0 (X, . . . , X) · (V, . . . , V)
Xk X k
= L(X, . . . , X, |{z}
V , X . . . , X) = Xi−1 VXk−i
i=1 i i=1
n2 2
No ponto X = Id, temos f 0 (Id) · V = kV. Logo f 0 (Id) : R −→ Rn é um isomorfismo.
2
Pelo teorema da Aplicação Inversa, existem abertos V, W ⊂ Rn tais que Id ∈ V, f(Id) = Id ∈ W
e f : V −→ W é um difeomorfismo de classe C∞ . Isto é, para todo Y ∈ W, existe uma única
matriz X ∈ V tal que Xk = Y e X (raiz k−ésima de Y) é uma aplicação de classe C∞ de Y. 

J. Delgado - K. Frensel 229


Análise

9 Aplicação: o Lema de Morse

Como ilustração sobre o emprego do Teorema da Aplicação Inversa, provaremos o Lema


de Morse, segundo o qual, na vizinhança de um ponto crı́tico não-degenerado de uma função f,
é possı́vel tomar um sistema de coordenadas em relação ao qual f se exprime como uma forma
quadrática com coeficientes constantes:
X
f(y) = aij yi yj .

Definição 9.1. Um sistema de coordenadas de classe Ck num aberto U ⊂ Rm é um difeo-


morfismo ξ : V −→ U de classe Ck definido num aberto V ⊂ Rm . As coordenadas de um ponto
p ∈ U no sistema ξ são os números y1 , . . . , yn tais que y = (y1 , . . . , ym ) ∈ V e ξ(y) = p.

Exemplo 9.1. Seja P = {(x, 0) ∈ R2 | x ≥ 0}. Então, no aberto U = R2 − P, podemos introduzir


um sistema de coordenadas ξ : V −→ U de classe C∞ , definido no aberto V = (0, +∞) × (0, 2π)
por ξ(r, θ) = reiθ = (r cos θ, r sen θ).
!
cos θ −r sen θ
De fato, como ξ é injetora, ξ(V) = U e det Jξ(r, θ) = det = r 6= 0, temos,
sen θ r cos θ
pelo Teorema da Aplicação Inversa, que ξ é um difeomorfismo de classe C∞ .
p
Se P = (x, y) = ξ(r, θ) então r = x2 + y2 é a distância de P à origem e θ é o ângulo, em
radianos, que OP faz com o semi-eixo positivo das abscissas. Os números r e θ são chamados
as coordenadas polares do ponto P = (x, y).

Mais geralmente, se P ⊂ R2 é qualquer semi-reta fechada partindo da origem que faz um ângulo
θ0 com o semi-eixo positivo das abscissas, podemos definir um sistema de coordenadas polares
ξ : (0, ∞) × (θ0 , θ0 + 2π) −→ U = R2 − P pela mesma fórmula ξ(r, θ) = reiθ . 


Exemplo 9.2. Seja P = (x, 0, z) ∈ R3 | x ≥ 0 e seja V = (0, ∞) × (0, π) × (0, 2π). Então, a
aplicação ξ : V −→ R3 − P definida por
ξ(r, ϕ, θ) = (r sen ϕ cos θ, r sen ϕ sen θ, r cos ϕ) ,

é um sistema de coordenadas de classe C∞ no aberto R3 − P.

De fato, se P = (x, y, z) = ξ(r, ϕ, θ), então r é a distância de P à origem, ϕ é o ângulo que o raio
OP faz com o semi-eixo positivo dos z e θ é o ângulo que (x, y, 0) faz com o semi-eixo positivo
dos x.

Com isto, é fácil verificar que ξ é injetora e ξ(V) = R3 − P. Além disso, como

230 Instituto de Matemática UFF


Aplicação: o Lema de Morse

 
sen ϕ cos θ r cos ϕ cos θ −r sen ϕ sen θ
  2
det Jξ(r, ϕ, θ) = det sen ϕ sen θ r cos ϕ sen θ
 r sen ϕ cos θ = r sen ϕ > 0 ,
cos ϕ −r sen ϕ 0
temos que ξ é um difeomorfismo de classe C∞ .

Se P = (x, y, z) = ξ(r, ϕ, θ), os números r , ϕ , θ são chamados as coordenadas esféricas do


ponto P ∈ R3 − P 

Fig. 5: Coordenadas esféricas (r, ϕ, θ) do ponto P = (x, y, z)

Observação 9.1. A introdução de um novo sistema de coordenadas numa região do espaço


euclidiano tem por objetivo simplificar a descrição de certos conjuntos ou funções. Por exemplo,
p
em coordenadas esféricas, a função f(x, y, z) = x2 + y2 + z2 torna-se f ◦ ξ(r, ϕ, θ) = r e a
esfera x2 + y2 + z2 = c2 é descrita pela equação r = c.

O Lema de Morse diz que numa vizinhança de um ponto crı́tico não-degenerado é possı́vel
obter um sistema de coordenadas que simplifica bastante a forma da função.

Lema 9.1. (Lema de Morse)


Seja a um ponto crı́tico não-degenerado de uma função f : U −→ R de classe Ck , k ≥ 3, definida
num aberto U ⊂ Rn . Então existe um sistema de coordenadas ξ : V −→ W de classe Ck−2 , com
a ∈ W ⊂ U, 0 ∈ V e ξ(0) = a, tal que
X
n
f(ξ(y)) − f(a) = aij yi yj ,
i,j=1

1 ∂2 f
para todo y = (y1 , . . . , yn ) ∈ V, onde aij = (a) .
2 ∂xi ∂xj

Prova.
Seja δ > 0 tal que B(a; δ) ⊂ U. Como f é de classe C2 e [a, x] ⊂ U para todo x ∈ B(a; δ),
temos, pela Fórmula de Taylor com resto integral, que

J. Delgado - K. Frensel 231


Análise

Z1
x ∈ B(a; δ) =⇒ f(x) = f(a) + (1 − t)d2 f (a + t(x − a))(x − a)2 dt
0
X
n
= f(a) + aij (x)(xi − a)(xj − a) ,
i,j=1

onde, Z1
∂2 f
aij (x) = (1 − t) (a + t(x − a)) dt , i, j = 1, . . . , n.
0 ∂xi ∂xj
∂2 f
Como as funções são de classe Ck−2 , k − 2 ≥ 1, temos, pela Regra de Leibniz, que as
∂xi ∂xj
funções aij : B(a; δ) −→ R são de classe Ck−2 , para todos i, j = 1, . . . , n. E, pelo Teorema de
Schwarz, a matriz A(x) = (aij (x)) é simétrica para todo x ∈ B(a; δ).

Assim, podemos escrever


f(x) = f(a) + hA(x)(x − a), (x − a)i .
 
1 ∂2 f
Como A0 = A(a) = (a) e a é um ponto crı́tico não-degenerado, temos que A0 é
2 ∂xi ∂xj
uma matriz simétrica invertı́vel.
2
Seja C(x) = A0−1 A(x). Então C : B(a; δ) −→ Rn é de classe Ck−2 , A(x) = A0 C(x) para todo
x ∈ B(a; δ) e C(a) = Id.
2
Pelo exemplo 8.5, existem abertos V1 , V2 ⊂ Rn tais que Id ∈ V1 , Id ∈ V2 e ϕ : V1 −→ V2 ,
ϕ(X) = X2 , é um difeomorfismo de classe C∞ . Como C : B(a; δ) −→ Rn é contı́nua e C(a) = Id,
2

existe 0 < δ 0 < δ tal que C(B(a; δ 0 )) ⊂ V2 .

Logo B = ϕ−1 ◦ C é de classe Ck−2 , B(x)2 = C(x) para todo x ∈ B(a; δ 0 ) e B(a) = Id.

Então, como A(x) = A0 C(x) = A0 B(x)2 e A(x) é simétrica para todo x ∈ B(a; δ), temos, tomando
transpostas, que:
2 2 2
A(x) = A0 B(x)2 = B(x)T A0 =⇒ B(x)2 = A−1
0 B(x)T A0 = A−1 T
0 B(x) A0 .

Como A−1 T
0 B(a) A0 = Id, B(a) = Id e as aplicações
2 2
B : B(a; δ 0 ) −→ Rn e A−1 T 0
0 B(x) A0 : B(a, δ ) −→ R
n

são contı́nuas, existe 0 < δ 00 < δ 0 tal que


x ∈ B(a; δ 00 ) =⇒ A−1 T
0 B(x) A0 ∈ V1 e B(x) ∈ V1 .

Logo B(x) = A0−1 B(x)T A0 para todo x ∈ B(a; δ 00 ), pois ϕ : V1 −→ V2 é um difeomorfismo.

Assim, A0 B(x) = B(x)T A0 e A(x) = A0 B(x)2 = B(x)T A0 B(x) e, portanto,




f(x) − f(a) = hA(x)(x − a), (x − a)i = B(x)T A0 B(x)(x − a), (x − a)
= hA0 B(x)(x − a), B(x)(x − a)i .

232 Instituto de Matemática UFF


Aplicação: o Lema de Morse

Seja ψ : B(a; δ 00 ) −→ Rn a aplicação de classe Ck−2 dada por ψ(x) = B(x)(x − a).
Se φ : L(Rn ; Rn ) × Rn −→ Rn é a aplicação bilinear dada por φ(B, y) = B · y então, pela
Regra da Cadeia, para todo x ∈ B(a; δ 00 ) e v ∈ Rn , temos que
ψ 0 (x) v = φ 0 (B(x), (x − a)) (B 0 (x) v, v)
= φ(B 0 (x) v, (x − a)) + φ(B(x), v)
∂B
= (x)(x − a) + B(x)v .
∂v
Logo, para x = a, ψ 0 (a) · v = B(a) · v = v para todo v ∈ Rn , ou seja, ψ 0 (a) : Rn −→ Rn é a
aplicação identidade.

Então, pelo Teorema da Aplicação Inversa, existe 0 < δ 000 < δ 00 e um aberto V ⊂ Rn tais que
0 = ψ(a) ∈ V e ψ : W −→ V é um difeomorfismo de classe Ck−2 , onde W = B(a; δ 000 ).

Assim, se ξ = ψ−1 : V −→ W, temos que ξ é um sistema de coordenadas de classe Ck−2 no


aberto W tal que ξ(0) = a e
X
n
f(ξ(y)) − f(a) = hA0 y, yi = aij yi yj . 
i,j=1

Corolário 9.1. Seja a um ponto crı́tico não-degenerado de uma função f : U −→ R de classe


Ck , k ≥ 3, definida num aberto U ⊂ Rm . Então existe um sistema de coordenadas η : V0 −→ W
de classe Ck−2 , com a ∈ W, 0 ∈ V0 , η(0) = a e
f(η(z)) − f(a) = −z21 − . . . − z2i + z2i+1 + . . . + z2m .

Prova.
1 ∂2 f
Seja A0 = (aij ) a matriz simétrica de entradas aij = (a), dada pelo Lema de Morse.
2 ∂xi ∂xj
Então existe uma base ortonormal {u1 , . . . , um } de Rm tal que A0 uj = λj uj para todo j = 1, . . . , m.
Como A0 é invertı́vel, λj 6= 0 para todo j = 1, . . . , m. Sejam λ1 < 0, . . . , λi < 0 e λi+1 >
0, . . . , λm > 0, os autovalores negativos e positivos de A0 .
uj u
Para j ≤ i, seja vj = p e, para j > i, seja vj = p j .
−λj λj
Então {v1 , . . . , vm } é uma base ortogonal de R
m
tal que

 0 se j 6= k


hA0 vj , vk i = −1 se j = k e j ≤ i



1 se j = k e j > i .
Consideremos agora a transformação linear invertı́vel T : Rm −→ Rm tal que Tej = vj para todo
j = 1, . . . , m. Sendo V0 = T −1 (V), onde V é o aberto que contém a origem obtido no Lema de
Morse, temos que η = ξ ◦ T : V0 −→ W é um difeomorfismo de classe Ck−2 tal que

J. Delgado - K. Frensel 233


Análise

f ◦ η(z) − f(a) = (f ◦ ξ)(T (z)) − f(a) = hA0 T (z), T (z)i


X X
* m
! m +
= A0 z j vj , z k vk
j=1 k=1
X
m
= zj zk hA0 vj , vk i
j,k=1

= −z21 − . . . − z2i + z2i+1 + . . . + z2m ,

concluindo a prova do corolário. 

Observação 9.2. O número i que aparece no corolário acima chama-se o ı́ndice do ponto
crı́tico a. Quando i = m, a é um ponto de máximo local para f; se i = 0, a é um ponto de mı́nimo
local. Para 0 < i < m, a é um ponto de sela de ı́ndice i.

Observação 9.3. No caso m = 2, seja a ∈ U um ponto crı́tico não-degenerado da função


f : U −→ R de classe Ck , k ≥ 3, definida no aberto U ⊂ R2 . Pelo Lema de Morse, existe um
sistema de coordenadas η : Vo −→ W de classe Ck−2 , com 0 ∈ V0 , a ∈ W ⊂ U, η(0) = a, tal que
f ◦ η(z) − f(a) = ±(z21 + z22 ) ou f ◦ η(z) − f(a) = −z21 + z22 .

Quando a é um ponto de máximo ou de mı́nimo local de f, temos que f ◦ η(z) = f(a) − (z21 + z22 )
e f ◦ η(z) = f(a) + z21 + z22 , respectivamente. Logo as curvas de nı́vel de f próximas de a são
imagens pelo difeomorfismo η dos cı́rculos z21 + z22 = const., tendo, portanto, a forma dada pela
figura 6. E quando a é um ponto de sela, temos que f ◦ η(z) = f(a) − z21 + z22 . Logo, as curvas
de nı́vel de f próximas de a são imagens pelo difeomorfismo η das curvas −y21 + y22 = const.,
tendo a forma dada pela figura 7.

Fig. 6: Curvas de nı́vel de f próximas do ponto crı́tico a Fig. 7: Curvas de nı́vel de f próximas do ponto crı́tico a

Observação 9.4. Os três parágrafos seguintes têm objetivo semelhante ao deste: a partir de
hipóteses sobre a derivada, obter sistemas de coordenadas convenientes, em relação aos quais
a aplicação se exprime por meio de fórmulas simples.

234 Instituto de Matemática UFF


Forma Local das Imersões

10 Forma Local das Imersões

Definição 10.1. Uma imersão do aberto U ⊂ Rm no espaço euclidiano Rn é uma aplicação


diferenciável f : U −→ Rn tal que a derivada f 0 (x) : Rm −→ Rn é uma transformação linear
injetora para todo x ∈ U. Em particular m ≤ n.

Observação 10.1. A composta de duas imersões é uma imersão.

Observação 10.2. Já vimos que a derivada f 0 : U −→ L(Rm ; Rn ) é contı́nua no ponto a se,
e só se, f é fortemente diferenciável no ponto a. E, neste caso, se f 0 (a) : Rm −→ Rn é injetora
então, pelo teorema 7.2, existe δ > 0 tal que f : B(a; δ) −→ f(B(a; δ)) é um homeomorfismo. Em
particular, f|B(a;δ) é injetora.

Exemplo 10.1. Seja f : Rm −→ Rm × Rn a aplicação de inclusão dada por f(x) = (x, 0).
Como f é linear, f 0 (x) = f para todo x ∈ Rm . Logo f é uma imersão C∞ .

Mostraremos que toda imersão de classe Ck , k ≥ 1, coincide localmente, após uma mudança
do sistema de coordenadas, com a imersão f acima. 

Exemplo 10.2. Seja I ⊂ R um intervalo aberto. Um caminho diferenciável f : I −→ Rn é uma


imersão se, e só se, seu vetor velocidade f 0 (t) 6= 0 para todo t ∈ I.

Então, para todo t ∈ I, L = {f(t) + sf 0 (t) | s ∈ R} é uma reta tan-


gente à imagem f(I) no ponto f(t). Como uma imersão pode não
ser injetora, então, quando f(t1 ) = f(t2 ), as duas retas tangentes
L1 = {f(t1 ) + sf 0 (t1 ) | s ∈ R} e L2 = {f(t2 ) + sf 0 (t2 ) | s ∈ R} podem
(ou não) ser distintas.

Mas, pelo teorema 7.1, existe δ > 0 tal que f(t) 6= f(t1 ) para todo
t ∈ J = (t1 − δ, t1 + δ) ⊂ I, t 6= t1 . Assim, L1 é a única reta
Fig. 8: Retas L1 e L2 tangentes à curva f
tangente no ponto f(t1 ) para o caminho f|J .

Por exemplo, f : R −→ R2 , f(t) = (t3 − t, t2 ), é uma imersão de classe C∞ da reta no plano tal
que f(1) = f(−1) = (0, 1). Como f 0 (1) = (2, 2) e f 0 (−1) = (2, −2), temos que

L1 = {(0, 1) + s(1, 1) | s ∈ R} 6= L2 = {(0, 1) + s(1, −1) | s ∈ R} . 

Exemplo 10.3. Seja o caminho g : R −→ R2 de classe C∞ dado por g(t) = (t−sen t, 1−cos t).
Como g 0 (t) = (1 − cos t, sen t), temos que g não é imersão, pois g 0 (t) = 0 para t = 2πk, k ∈ Z.

J. Delgado - K. Frensel 235


Análise

Fig. 9: Ciclóide

A imagem deste caminho é a curva chamada ciclóide. Ela possui uma infinidade de pontos
angulares (cúspides), nos quais o vetor velocidade é igual a zero. 

Observação 10.3. Nem sempre podemos identificar os pontos onde a derivada de uma
aplicação não é injetora pela forma geométrica de sua imagem. Por exemplo, a imagem do
caminho f : R −→ R2 , f(t) = (t3 , t3 ), é uma reta. Para t = 0, o vetor velocidade f 0 (0) = (0, 0), o
que não se deve ao aspecto de f(R), mas à maneira como a reta está parametrizada por f.

Teorema 10.1. (Forma Local das Imersões)


Sejam U ⊂ Rm um aberto e f : U −→ Rm+n uma aplicação fortemente diferenciável no ponto
a ∈ U. Se a derivada f 0 (a) : Rm −→ Rm+n é injetora, existe um homeomorfismo h : Z −→ V ×W,
fortemente diferenciável no ponto f(a), de um aberto Z em Rm+n que contém f(a) sobre um
aberto V × W em Rm × Rn que contém (a, 0), tal que
h ◦ f(x) = (x, 0) ,

para todo x ∈ V e h.

Se f é de classe Ck , k ≥ 1, é possı́vel restringir V, W e Z, se necessário, de modo que h seja


um difeomorfismo de classe Ck .

Fig. 10: Representação esquemática do Teorema da Forma Local das Imersões

236 Instituto de Matemática UFF


Forma Local das Imersões

Prova.
Seja E = f 0 (a)(Rm ). Como f 0 (a) é injetora, dim E = m. Sejam {w1 , . . . , wm } uma base de E,
v1 , . . . , vn vetores linearmente independentes tais que {w1 , . . . , wm , v1 , . . . , vn } é uma base de
Rm+n e F o subespaço gerado pelos vetores v1 , . . . , vn . Então Rm+n = E ⊕ F.

Seja ϕ : U × Rn −→ Rm+n a aplicação definida por


X
n
ϕ(x, y) = f(x) + yi vi ,
i=1

onde y = (y1 , . . . , yn ). Então, se v ∈ R e w = (β1 , . . . , βn ) ∈ Rn ,


m

Xn
0 0
ϕ (a, 0)(v, w) = f (a) v + β i vi . (1)
i=1

Afirmação: ϕ é fortemente diferenciável no ponto (a, 0).

De fato,
X
n
ϕ(x, y) = f(x) + yi vi = ϕ(a, 0) + ϕ 0 (a, 0) · (x − a, y) + rϕ
(a,0) (x, y)
i=1
X
n
= f(a) + f 0 (a) (x − a) + yi vi + rϕ
(a,0) (x, y)
i=1
=⇒ rϕ
(a,0) (x, y) = f(x) − f(a) − f 0 (a) (x − a) = rfa (x) .
Como f é fortemente diferenciável no ponto a, dado ε > 0, existe δ > 0 tal que
x, x 0 ∈ B(a; δ) ⊂ Rm =⇒ krfa (x) − rfa (x 0 )k ≤ εkx − x 0 kS .

Então,
(x, y), (x 0 , y 0 ) ∈ B(a; δ) × Rn =⇒ krϕ ϕ 0 0 f 0 f 0
(a,0) (x, y) − r(a,0) (x , y )k = kra (x ) − ra (x)k ≤ εkx − x kS
≤ ε (kx 0 − xkS + ky 0 − ykS )
= ε k(x, y) − (x 0 , y 0 )kS .
Logo ϕ é fortemente diferenciável no ponto (a, 0), concluindo a prova da afirmação.

Além disso, como f 0 (a) : Rm −→ Rm+n é injetora e Rm+n = f 0 (a)(Rm ) ⊕ F, temos, por (1), que
ϕ 0 (a, 0) : Rm+n −→ Rm+n é um isomorfismo.

Pelo Teorema da Aplicação Inversa, existem um aberto contendo (a, 0), o qual podemos supor
da forma V × W, onde 0 ∈ W ⊂ Rn e a ∈ V ⊂ U, e um aberto Z ⊂ Rm+n , com f(a) ∈ Z, tais que
ϕ : V × W −→ Z é um homeomorfismo e h = ϕ−1 : Z −→ V × W é fortemente diferenciável no
ponto f(a). Como ϕ(x, 0) = f(x), temos que hf(x) = hϕ(x, 0) = (x, 0) para todo x ∈ V.

Quando f é de classe Ck , k ≥ 1, então ϕ também é de classe Ck . Pelo Teorema da Aplicação


Inversa, V, W e Z podem ser tomados de modo que ϕ : V × W −→ Z seja um difeomorfismo de
classe Ck , cujo inverso h é também de classe Ck . 

J. Delgado - K. Frensel 237


Análise

Exemplo 10.4. Seja f : U ⊂ R2 −→ R3 , f = (f1 , f2 , f3 ) uma aplicação de classe Ck , k ≥ 1, tal


que f 0 (a) : R2 −→ R3 é injetora no ponto a = (a1 , a2 ) ∈ U, ou seja, a matriz Jacobiana de f no
ponto a,
∂f1 ∂f1
 
(a) (a)
 ∂x ∂y 
 ∂f2 ∂f2 
 ∂x (a)
Jf(a) = 
∂y
(a),
 ∂f ∂f3 
3
(a) (a)
∂x ∂y
tem posto 2.

Então Jf(a) possui um menor de ordem 2 não-nulo.

Se, por exemplo,  


∂f1 ∂f1
 ∂x (a) ∂y
(a)
det  ∂f
2 ∂f2  6= 0 ,
(a) (a)
∂x ∂y
então {f 0 (a)e1 , f 0 (a)e2 , e3 }, onde e3 = (0, 0, 1), é uma base de R3 . Nesse caso, deinimos
ϕ : U × R −→ R3 por ϕ(x, y, z) = (f1 (x, y), f2 (x, y), f3 (x, y) + z) .

Observe que
∂f1 ∂f1
 
(a) (a) 0 
∂f1 ∂f1

 ∂x ∂y
 ∂x (a) (a)

 ∂f2 ∂f2  ∂y
 ∂x (a)
det Jϕ(a, 0) = det  (a) 0 = det  ∂f2 ∂f2  6= 0 .
 ∂f ∂y 
(a) (a)
3 ∂f3 
∂x ∂y
(a) (a) 1
∂x ∂y
Pela forma local das imersões, existem abertos V ⊂ R2 , I ⊂ R, Z ⊂ R3 tais que a ∈ V, 0 ∈ I,
f(a) ∈ Z, ϕ : V × I −→ Z é um difeomorfismo de classe Ck e h ◦ f(x, y) = (x, y, 0) para todo
x, y ∈ V, onde h = ϕ−1 : Z −→ V × I é também de classe Ck . 

Corolário 10.1. Seja f : U −→ Rm+n definida no aberto U ⊂ Rm , fortemente diferenciável no


ponto a ∈ U, com f 0 (a) : Rm −→ Rm+n injetora. Então, existe um aberto V, com a ∈ V ⊂ U,
tal que f : V −→ f(V) é um homeomorfismo e o homeomorfismo inverso f−1 : f(V) −→ V é a
restrição de uma aplicação contı́nua ξ : Z −→ V definida num aberto Z em Rm+n , f(V) ⊂ Z,
fortemente diferenciável no ponto f(a). Se f é de classe Ck , k ≥ 1, então ξ pode ser tomada de
classe Ck .

Prova.
Seja h : Z −→ V × W a aplicação obtida no teorema acima. Então f(V) ⊂ Z. Seja ξ : Z −→ V a
aplicação definida por ξ(z) = π ◦ h(z), onde π : V × W −→ V, π(x, y) = x, é a projeção sobre a
primeira coordenada.

238 Instituto de Matemática UFF


Forma Local das Imersões

Então ξ é contı́nua, pois h é contı́nua e π é de classe C∞ . Além disso, ξ é fortemente dife-


renciável no ponto f(a).

De fato,
ξ(f(a)) = π ◦ h(f(a)) = a, ξ 0 (f(a))(w) = π 0 (h(f(a))) ◦ h 0 (f(a))(w) = π(h 0 (f(a))(w)) ,

e, portanto,
ξ(z) = π(h(z)) = ξ(f(a)) + ξ 0 (f(a)) (z − f(a)) + rξf(a) (z)
= π(h(f(a))) + π(h 0 (f(a))(z − f(a))) + rξf(a) (z) .

Então rξf(a) (z) = π(rhf(a) (z)). Como h é fortemente diferenciável em f(a), dado ε > 0, existe δ > 0
tal que
z, w ∈ B(f(a); δ) =⇒ krhf(a) (z) − rhf(a) (w)kS ≤ εkz − wk .

Logo, como
kπk = sup {kπ(x, y)kS | k(x, y)kS = 1} = sup {kxkS | kxkS + kykS = 1} = 1 ,

temos que
z, w ∈ B(f(a); δ) =⇒ krξf(a) (z) − rξf(a) (w)kS = kπ(rhf(a) (z) − rhf(a) (w))kS
≤ krhf(a) (z) − rhf(a) (w)kS
≤ εkz − wk .
Portanto ξ é fortemente diferenciável no ponto f(a).

Se f é de classe Ck , temos, pelo teorema acima, que h é de classe Ck . Logo ξ = π ◦ h é de


classe Ck .

Como ξf(x) = πh(f(x)) = π(x, 0) = x para todo x ∈ V, temos que f : V −→ f(V) é uma bijeção
e ξ|f(V) = f−1 : f(V) −→ V.

Então f : V −→ f(V) é um homeomorfismo, pois, pela observação 7.6, podemos tomar V ⊂ Rm ,


a ∈ V, de modo que f : V −→ f(V) seja contı́nua, uma vez que f é fortemente diferenciável em
a. 

Observação 10.4. Como consequência deste corolário, temos que se f é de classe Ck ,


k ≥ 1, e f 0 (a) : Rm −→ Rm+n é injetora, então f 0 (x) : Rm −→ Rm+n é injetora para todo x
num aberto V de Rm que contém a.

De fato, como ξ ◦ f(x) = x para todo x ∈ V, temos que ξ 0 (f(x)) ◦ f 0 (x) = Id : Rm −→ Rm . Logo
f 0 (x) é injetora para todo x ∈ V.

Este resultado pode ser provado diretamente.

J. Delgado - K. Frensel 239


Análise

De fato, seja T : Rm −→ Rm+n uma transformação linear injetora.

Então a matriz A = (aij ) de T em relação às bases canônicas de Rm e Rm+n tem m colunas
linearmente independentes e, portanto, m linhas linearmente independentes, pois posto-linha
de uma matriz = posto-coluna da matriz.

Sejam Ai1 = (ai1 1 , . . . , ai1 m ), . . . , Aim = (aim 1 , . . . , aim m ) os m vetores-linha de A linearmente


independentes, i1 , . . . , im ∈ {1, . . . , m + n}.

Como Aik ∈ Rm para todo k = 1, . . . , m, {Ai1 , . . . , Aim } é uma base de Rm e, portanto, o deter-
minante da matriz m × m cujas linhas são Ai1 , . . . , Aim é diferente de zero.

Sendo a aplicação ϕ : L(Rm ; Rm+n ) −→ R, que associa a cada transformação linear S o deter-
minante da matriz m×m cujas linhas são as linhas i1 , . . . , im da matriz de S em relação às bases
canônicas de Rm e Rm+n , é contı́nua e ϕ(T ) 6= 0, existe ε > 0 tal que kS − T k < ε =⇒ ϕ(S) 6= 0.

Além disso, como f 0 : U −→ L(Rm ; Rm+n ) é contı́nua, tomando T = f 0 (a), existe δ > 0 tal que
kx − ak < δ =⇒ kf 0 (x) − f 0 (a)k < ε .

Logo ϕ(f 0 (x)) 6= 0 para todo x ∈ B(a; δ), ou seja, f 0 (x) tem posto m e, portanto, é injetora para
todo x ∈ B(a; δ).

11 Forma Local das Submersões

Definição 11.1. Uma aplicação diferenciável f : U −→ Rn definida num aberto U ⊂ Rm , é


uma submersão quando f 0 (x) : Rm −→ Rn é uma transformação linear sobrejetora para todo
x ∈ U. Em particular, m ≥ n.

Observação 11.1. Como um funcional linear é sobrejetivo ou nulo, temos que uma função
diferenciável f : U ⊂ Rm −→ R é uma submersão se, e só se, df(x) 6= 0 para todo x ∈ U, ou
seja, se, e só se, grad f(x) 6= 0 para todo x ∈ U.

Observação 11.2. A composta de duas submersões é uma submersão.

Definição 11.2. Uma decomposição em soma direta do tipo Rm+n = Rm n


I ⊕ RJ significa que
se fez uma partição {1, . . . , m + n} = I ∪ J, onde I = {i1 , . . . , im } e J = {j1 , . . . , jn } são disjuntos.

Dada a partição, consideramos Rm


I ⊂ R
m+n
como o subespaço gerado por {ei1 , . . . , eim } e
RnJ ⊂ Rm+n como o subespaço gerado por {ej1 , . . . , ejn }.

240 Instituto de Matemática UFF


Forma Local das Submersões

Então todo vetor z ∈ Rm+n se escreve, de modo único, como z = x + y, onde x ∈ Rm n


I e y ∈ RJ .
Assim, Rm+n = Rm n m n
I ⊕ RJ é a soma direta dos subespaços RI e RJ .

Uma vez dada a decomposição em soma direta Rm+n = Rm n


I ⊕ RJ , escrevemos os elementos de
Rm+n como pares z = (x, y), onde x ∈ Rm n
I e y ∈ RJ .

Por exemplo, seja R3 = R2I ⊕ RJ , onde I = {1, 3} e J = {2}, ou seja, R2I é gerado por {e1 , e3 } e RJ é
gerado por {e2 }. Então todo z = (z1 , z2 , z3 ) ∈ R3 se escreve como z = (x, y), onde x = (z1 , 0, z3 )
e y = (0, z2 , 0).

Observação 11.3. Dada uma transformação linear sobrejetora T : Rm+n −→ Rn , existe uma
I ⊕ RJ tal que a restrição T |RJ : RJ −→ R é
decomposição em soma direta do tipo Rm+n = Rm n n
n n

um isomorfismo.

De fato, como os vetores {Te1 , . . . , Tem+n } geram Rn , existe J = {j1 , . . . , jn } ⊂ {1, . . . , m + n} tal
que {Tej1 , . . . , Tejn } é uma base de Rn .

Se I = {i1 , . . . , im } é o conjunto dos ı́ndices restantes, a partição {1, . . . , m + n} = I ∪ J fornece a


decomposição em soma direta Rm+n = Rm n
I ⊕ RJ .

Então T |RnJ : RnJ −→ Rn é um isomorfismo, pois transforma a base {ej1 , . . . , ejn } de RnJ na base
{Tej1 , . . . , Tejn } de Rn .

Seja A = (aij ) a matriz n × (m + n) da transformação linear T em relação às bases canônicas


de Rm+n e Rn .

Então T |RnJ é um isomorfismo se, e só se, a submatriz n × n da matriz A cujas colunas são as n
colunas da matriz A cujos ı́ndices pertencem ao conjunto J tem determinante diferente de zero.

Exemplo 11.1. Dada uma decomposição em soma direta do tipo Rm+n = Rm n


I ⊕ RJ , seja
f : Rm+n −→ Rn a projeção sobre a segunda coordenada, ou seja, f(x, y) = y = (yj1 , . . . , yjn ).

Como f é linear, temos f 0 (x, y) = f para todo z = (x, y) ∈ Rm+n . Logo f é uma submersão e a
matriz Jacobiana de f tem como linhas os vetores ej1 , . . . , ejn da base canônica de Rm+n . 

Definição 11.3. Seja f : U −→ Rn definida no aberto U ⊂ Rm e seja E ⊂ Rm um subespaço


vetorial. Dizemos que f é diferenciável ao longo de E no ponto a quando existe uma transformação
linear ∂E f(a) : E −→ Rn , chamada a derivada de f ao longo de E no ponto a, tal que
v ∈ E , a + v ∈ U =⇒ f(a + v) = f(a) + ∂E f(a) · v + r(v) ,
r(v)
com lim = 0.
v→0 kvk
v∈E

J. Delgado - K. Frensel 241


Análise

Observação 11.4. Se f é diferenciável no ponto a, então f é diferenciável neste ponto ao


longo de qualquer subespaço E ⊂ Rm com ∂E f(a) = f 0 (a)|E .

Definição 11.4. Dadas uma decomposição em soma direta do tipo Rm+n = Rm n


I ⊕ RJ e uma
aplicação f : U −→ Rp definida no aberto U ⊂ Rm+n , a derivada de f no ponto a ao longo de
Rm n
I , caso exista, é indicada por ∂1 f(a) e a derivada de f no ponto a ao longo de RJ , caso exista,
é representada por ∂2 f(a). Estas são as derivadas parciais de f no ponto a relativamente à
decomposição Rm+n = Rm n
I ⊕ RJ .

Observação 11.5. Se f : U −→ Rp é diferenciável no ponto a, então ∂1 f(a) = f 0 (a)|RmI ,


∂2 f(a) = f 0 (a)|RnJ e, para qualquer u = (v, w) ∈ Rm n
I ⊕ RJ ,
f 0 (a)u = f 0 (a)(v + w) = f 0 (a) v + f 0 (a) w = ∂1 f(a)v + ∂2 f(a)w .

Observação 11.6. Mesmo no caso da decomposição usual R2 = R ⊕ R, uma função


f : U ⊂ R2 −→ R pode ser diferenciável ao longo de cada um dos subespaços R sem ser
diferenciável em R2 .

O teorema abaixo diz que, dada uma submersão f de classe C1 , é possı́vel obter novas
coordenadas em torno de cada ponto do seu domı́nio de modo que f seja a projeção sobre
as n últimas coordenadas, ou seja, o exemplo 11.1 é, localmente, o caso mais geral de uma
submersão.

Teorema 11.1. (Forma Local das Submersões)


Seja f : U −→ Rn uma aplicação definida no aberto U ⊂ Rm+n e fortemente diferenciável no
ponto a ∈ U. Se f 0 (a) : Rm+n −→ Rn é sobrejetora ou, mais precisamente, se é dada uma
decomposição em soma direta do tipo Rm+n = Rm n
I ⊕ RJ tal que a = a1 + a2 = (a1 , a2 ) e a
derivada parcial ∂2 f(a) = f 0 (a)|RnJ : RnJ −→ Rn é um isomorfismo, então existem abertos V, W e
Z, com a ∈ Z ⊂ U ⊂ Rm+n , a
f1 ∈ V ⊂ Rm , f(a) ∈ W ⊂ Rn e um homeomorfismo h : V × W −→ Z
fortemente diferenciável no ponto (f
a1 , f(a)) tal que
f ◦ h(e
x, w) = w ,

f1 = (ai1 , . . . , aim ). Se f é de classe Ck , k ≥ 1, podemos


x, w) ∈ V × W, onde a
para todo (e
restringir V, W e Z, se necessário, de modo que h seja um difeomorfismo de classe Ck .

Prova.
Seja c = f(a) e consideremos a função ϕ : U −→ Rm × Rn definida por
x, f(x, y)) = ((zi1 , . . . , zim ), f(x, y)) ,
ϕ(x, y) = (e

onde z = x + y. Então,

242 Instituto de Matemática UFF


Forma Local das Submersões

X
m
0 0
ϕ (a)(v, w) = (e v, ∂1 f(a)v + ∂2 f(a)w) , onde v =
v, f (a)(v, w)) = (e vek eik e e
v = (ve1 , . . . , vf
m ).
k=1

Fig. 11: Representação esquemática do teorema da forma local das submersões

Afirmação: ϕ é fortemente diferenciável no ponto a = (a1 , a2 ) = a1 + a2 .

De fato, como
ϕ(x, y) = (e a1 , f(a)) + ((e
x, f(x, y)) = (f f1 ), f 0 (a)(x + y − (a1 + a2 ))) + rϕ
x−a a (x, y) ,

temos que
rϕ f
a (x, y) = (0, ra (x + y)) .

Como f é fortemente diferenciável no ponto a = a1 + a2 , dado ε > 0, existe δ > 0 tal que

z = x + y , z 0 = x 0 + y 0 ∈ B(a; δ) =⇒ krfa (x + y) − rfa (x 0 + y 0 )kS ≤ εkx + y − (x 0 + y 0 )k


= εkz − z 0 k

0 0 0 0
=⇒ krϕ ϕ f f
a (x, y) − ra (x , y )kS = k(0, ra (x + y) − ra (x + y ))kS

= krfa (z) − rfa (z 0 )kS ≤ εkz − z 0 k .


Logo ϕ é fortemente diferenciável no ponto a = (a1 , a2 ).

Além disso, ϕ 0 (a) : Rm+n −→ Rm × Rn é um isomorfismo, pois dado (e


v, z) ∈ Rm × Rn e,
considerando os vetores
Xm
v= vek eik ∈ Rm
I e w = (∂2 f(a))−1 (z − ∂1 f(a)v) ∈ RnJ ,
k=1

J. Delgado - K. Frensel 243


Análise

temos, para u = (v, w) = v + w, que:


ϕ 0 (a)u = (e
v, ∂1 f(a)v + ∂2 f(a)w) = (e
v, ∂1 f(a)v + z − ∂1 f(a)v) = (e
v, z) .

Logo ϕ 0 (a) : Rm+n −→ Rm × Rn é sobrejetora e, portanto, um isomorfismo.

Pelo Teorema da Aplicação Inversa, ϕ é um homeomorfismo, com inverso h fortemente


diferenciável no ponto ϕ(a) = (f a1 , c), de um aberto Z ⊂ Rm+n contendo a sobre um
a1 , f(a)) = (f
a1 , c), o qual pode ser tomado da forma V × W, com V aberto em Rm , a
aberto contendo (f f1 ∈ V,
e W aberto em Rn , c ∈ W.

Então
h(e
x, w) = h1 (e
x, w) + h2 (e
x, w) = (h1 (e x, w)) ,
x, w), h2 (e

onde h1 : V × W −→ Rm n
I e h2 : V × W −→ RJ .

X
m
Como (e
x, w) = ϕh(e
x, w) = ϕ(h1 (e x, w)) , temos que h1 (e
x, w) + h2 (e x, w) = x k ei k e
k=1
f(h(e x, w) ∈ V × W, onde e
x, w)) = w para todo (e x = (x1 , . . . , xm ).

Se f é de classe Ck , então ϕ é de classe Ck . Pelo Teorema da Aplicação Inversa, V, W e


Z podem ser tomados de modo que ϕ seja um difeomorfismo de classe Ck de Z sobre V × W
e, portanto, seu inverso h também é de classe Ck .

Corolário 11.1. Seja f : U −→ Rn uma aplicação definida no aberto U ⊂ Rm+n , fortemente


diferenciável no ponto a ∈ U. Se f 0 (a) : Rm+n −→ Rn é sobrejetora, então existe um aberto Z
contendo a em Rm+n tal que f|Z é uma aplicação aberta, ou seja, para todo A ⊂ Z aberto, f(A)
é aberto em Rn . Em particular, f(a) ∈ int f(U).

Prova.
Seja h : V × W −→ Z o homeomorfismo dado pelo teorema acima, e seja A ⊂ Z um con-
junto aberto. Então
f(A) = f ◦ h ◦ h−1 (A) = π ◦ h−1 (A) .

Como h é contı́nua, h−1 (A) é um conjunto aberto e, portanto, π(h−1 (A)) é aberto, pois a projeção
π : V × W −→ W é uma aplicação aberta.

Logo f(A) é aberto para todo aberto A ⊂ Z. 

Corolário 11.2. Toda submersão de classe Ck , k ≥ 1, é uma aplicação aberta.


Observação 11.7. Na decomposição Rm+n = Rm n n
I ⊕ RJ , RJ é o subespaço de R
m+n
gerado
pelos vetores ej , j ∈ J = {j1 , . . . , jn } da base canônica de Rm+n . Então a derivada parcial
∂2 f(a) : RnJ −→ Rn é um isomorfismo se, e só se, a matriz

244 Instituto de Matemática UFF


Forma Local das Submersões

 
∂fi
(a) , i ∈ {1, . . . , n}, j ∈ {j1 , . . . , jn } ,
∂xj n×n

obtida da matriz Jacobiana de f no ponto a escolhendo as n colunas cujos ı́ndices pertencem a


J, tem determinante diferente de zero.

Observação 11.8. Se f : U ⊂ Rm+n −→ Rn é de classe Ck e f 0 (a) : Rm+n −→ Rn é sobre-


jetora para algum a ∈ U, então f 0 (z) : Rm+n −→ Rn é sobrejetora para todo z num aberto Z
contendo a.

De fato, seja h : V × W −→ Z o difeomorfismo de classe Ck dado pela forma local das sub-
mersões. Como f ◦ h = π, temos, pela Regra da Cadeia, que para todo (x, w) ∈ V × W,
f 0 (h(x, w)) h 0 (x, w) = π 0 (x, w) = π .

Logo f 0 (z) é sobrejetora para todo z ∈ Z, pois Z = h(V × W) e π é uma transformação linear
sobrejetora.

Este resultado também pode ser provado diretamente como no caso das imersões, pois
f 0 (a) : Rm+n −→ Rn é sobrejetora se, e só se, a matriz Jacobiana Jf(a) tem um menor de
ordem n com determinante 6= 0 (ver observação 10.4).

Teorema 11.2. (Teorema da Aplicação Implı́cita)


Seja f : U −→ Rn uma aplicação definida no aberto U ⊂ Rm+n , fortemente diferenciável no
ponto a ∈ U, com f(a) = c. Se f 0 (a) : Rm+n −→ Rn é sobrejetora ou, mais precisamente,
se Rm+n = Rm n
I ⊕ RJ é uma decomposição em soma direta tal que a = (a1 , a2 ) e a derivada
∂2 f(a) : RnJ −→ Rn é um isomorfismo, então existem abertos V ⊂ Rm contendo a
f1 e Z ⊂ U ⊂
Rm+n contendo a, com a seguinte propriedade: para cada e x) ∈ RnJ tal que
x ∈ V há um único ξ(e
X
m
x)) ∈ Z e f(x, ξ(e
(x, ξ(e x)) = c, onde e
x = (x1 , . . . , xm ) e x = xk eik .
i=1

A aplicação ξ : V −→ RnJ assim definida é fortemente diferenciável no ponto a


f1 e sua derivada
neste ponto é
ξ 0 (f v = −(∂2 f(a))−1 ◦ (∂1 f(a)) · v ,
a1 ) · e
X
m
m
v = (v1 , v2 , . . . , vm ) ∈ R , onde v =
para todo e vk e i k .
k=1

Se f é de classe Ck , k ≥ 1, então ξ é de classe Ck e sua derivada num ponto qualquer e


x ∈ V é
ξ 0 (e
x) = −[∂2 f(x, ξ(x))]−1 ◦ [∂1 f(x, ξ(x))] .

Em resumo: f−1 (c) ∩ Z é o gráfico da aplicação ξ : V −→ RnJ fortemente diferenciável no ponto


f1 . Se f é de classe Ck , então ξ é de classe Ck .
a

J. Delgado - K. Frensel 245


Análise

A aplicação ξ diz-se definida implicitamente pela equação f(x, y) = c.

X
n
Observação 11.9. Se ξ(ex) = x)ej` , então
ξ` (e
 `=1 
X X
m m


Graf(ξ) = xk eik + ξ` (e x = (x1 , . . . , xm ) ∈ V .
x)ej` e


k=1 `=1

Prova.
Seja h : V × W −→ Z o homeomorfismo fortemente diferenciável no ponto (f
a1 , f(a)) = (f
a1 , c),
dado pela forma local das submersões, onde h(f a1 , f(a)) = a e
X m
h(ex, w) = (x, h2 (e
x, w)) = xk eik + h2 (e
x, w) .
k=1

Defina a aplicação ξ : V −→ RnJ por ξ(e x, c). Então,


x) = h2 (e
X
m
(x, ξ(e
x)) = x) ∈ Z e
xk eik + ξ(e f(x, ξ(e
x)) = f(h(e
x, c)) = c ,
k=1

x = (x1 , . . . , xk ) ∈ V.
para todo e
X
m X
n
Reciprocamente, se (x, y) = x k ei k + y` ej` ∈ Z, e
x = (x1 , . . . , xk ) ∈ V e f(x, y) = c, então
k=1 `=1
(x, y) = h ◦ ϕ(x, y) = h(e
x, c) = (x, h2 (e
x, c)) = (x, ξ(e
x)) .

Logo y = ξ(e
x).

Então, para cada e x) ∈ RnJ tal que (x, ξ(e


x ∈ V existe um único ξ(e x)) ∈ Z e f(x, ξ(e
x)) = c.

Como ξ(e x ∈ V e h2 : V × W −→ RnJ é fortemente diferenciável no ponto


x, c) para todo e
x) = h2 (e
a1 , c), temos que ξ é fortemente diferenciável no ponto a
(f f1 .

Além disso, se f é de classe Ck , então ξ é de classe Ck , pois h2 é de classe Ck .

x)) = c, quando f é de classe Ck , obtemos, pela Regra


Finalmente, derivando a igualdade f(x, ξ(e
da Cadeia, que:
0 = f 0 (x, ξ(e
x))(v, ξ 0 (e
x)e
v) = ∂1 f(x, ξ(e x)) · ξ 0 (e
x))v + ∂2 f(x, ξ(e x) v ,
X
m
v ∈ Rm , onde v =
para todo e vk eik e e
v = (v1 , . . . , vm ), ou seja,
k=1
ξ 0 (e
x) e x))]−1 [∂1 f(x, ξ(e
v = −[∂2 f(x, ξ(e x))] · v .

Se f é apenas fortemente diferenciável no ponto a = (a1 , a2 ), temos que ξ é fortemente dife-


renciável no ponto a
f1 e (a1 , ξ(f
a1 )) = h(f
a1 , c) = a.

v ∈ Rm :
Logo, pela regra da cadeia, para todo e

ξ 0 (f v = −[∂2 f(a)]−1 [∂1 f(a)] v . 


a1 ) e

246 Instituto de Matemática UFF


O Teorema do Posto

Exemplo 11.2. Seja f : U ⊂ R3 −→ R2 , f = (f1 , f2 ), uma aplicação de classe Ck , k ≥ 1, tal


que, no ponto a = (a1 , a2 , a3 ) ∈ U, f 0 (a) : R3 −→ R2 é sobrejetora.

Suponhamos que R3 = RI ⊕ R2J é uma decomposição de R3 , onde I = {2}, J = {1, 3}, ou seja, RI
é gerado por {e2 } e R2J é gerado por {e1 , e3 } e, além disso, f 0 |R2J (a) é um isomorfismo.

Definimos ϕ : U −→ R × R2 por
ϕ(x, y, z) = (y, f1 (x, y, z), f2 (x, y, z)) .

Então ϕ(a) = (a2 , f(a)) 


e 
 0 1 0   
∂f1 ∂f1
 (a) (a)
 
 ∂f ∂f1 ∂f1 ∂x ∂z

1
Jϕ(a) = det  = − det  6 0,
=
 ∂x (a) ∂y (a) ∂z (a)
 
 ∂f ∂f2
2

 ∂f
 (a) (a)
2 ∂f2 ∂f2  ∂x ∂z
(a) (a) (a)
∂x ∂y ∂z
pois estamos supondo que {f 0 (a)e1 , f 0 (a)e3 } é uma base de R2 .

Logo, pela forma local das submersões, existem abertos Z ⊂ R3 , I ⊂ R, W ⊂ R2 , tais que a ∈ Z,
a2 ∈ I, f(a) ∈ W, ϕ : Z −→ I × W é um difeomorfismo de classe Ck , h = ϕ−1 : I × W −→ Z,
(1) (2)
h(x, y, z) = (h2 (x, y, z), x, h2 (x, y, z))

é também de classe Ck , f ◦ h(x, y, z) = (y, z), ou seja,


(1) (2)
f(h2 (x, y, z), x, h2 (x, y, z)) = (y, z)

para todo (x, y, z) ∈ I × W.

Então, se f(a) = c = (c1 , c2 ), temos que


(1) (2)
f(h2 (x, c1 , c2 ), x, h2 (x, c1 , c2 )) = (c1 , c2 ) = c ,

para todo x ∈ I. Logo f−1 (c) ∩ Z é o gráfico da aplicação de classe Ck ξ : I −→ R2J , dada por
(1) (2)
ξ(x) = h2 (x, c1 , c2 )e1 + h2 (x, c1 , c2 )e3 ,

ou seja,

 
(1) (2)
f−1 (c) ∩ Z = h2 (x, c1 , e2 ), x, h2 (x, c1 , c2 ) x ∈ I . 

12 O Teorema do Posto

Definição 12.1. O posto de uma transformação linear T : Rm −→ Rn é a dimensão da ima-


gem T (Rm ), ou seja, o número máximo de vetores LI entre os vetores T (e1 ), . . . , T (em ), ou,
equivalentemente, o número máximo de colunas LI da matriz de T . Portanto, o posto de T é

J. Delgado - K. Frensel 247


Análise

também o número máximo de linhas linearmente independentes da matriz de T .

Observação 12.1. O posto de T é igual a r se, e só se, a matriz de T possui um determinante
menor r × r não-nulo, mas qualquer determinante menor de ordem r + 1 é igual a zero.

Definição 12.2. O posto de uma aplicação diferenciável f : U −→ Rn num ponto x ∈ U ⊂ Rm


é o posto da sua derivada f 0 (x) : Rm −→ Rn .

Observação 12.2. O posto de f no ponto x é ≤ m e ≤ n.


• Uma imersão f : U −→ Rn , definida no aberto U ⊂ Rm , tem posto m em todos os pontos x ∈ U
e m ≤ n.

• Uma submersão g : U ⊂ Rm −→ Rn tem posto n em todos os pontos x ∈ U e m ≥ n.

Portanto, imersões e submersões são aplicações de posto máximo.

Observação 12.3. O posto de uma aplicação diferenciável f : U ⊂ Rm −→ Rn , em geral,


varia de ponto para ponto.

Quando n = 1, o posto de f é 1 nos pontos regulares e zero nos pontos crı́ticos de f.

Se f : U ⊂ R2 −→ R2 é holomorfa e f = u + iv, então seu posto em um ponto (x, y) ∈ U só pode


ser 2 ou 0.

De fato, pelas equações de Cauchy-Riemann


 
∂u ∂u
(x, y) (x, y)
Jf(x, y) =  ∂x ∂y
.

∂u ∂u
− (x, y) (x, y)
∂y ∂x
Logo
 ∂u 2  2
∂u
det Jf(x, y) = (x, y) + (x, y) =0
∂x ∂y
∂u ∂u
se, e só se, (x, y) = (x, y) = 0, ou seja, se, e só se, Jf(x, y) é a matriz nula.
∂x ∂y
2 2 3 2
! ão f : R −→ R , dada por f(x, y) = (x , y ), tem matriz Jacobiana
Finalmente, a aplicaç
3x2 0
Jf(x, y) = .
0 2y
Logo:

• f tem posto 2 nos pontos (x, y), com x 6= 0 e y 6= 0;

• f tem posto 1 nos pontos (x, 0), com x 6= 0 e nos pontos (0, y), com y 6= 0;

• f tem posto 0 na origem.

248 Instituto de Matemática UFF


O Teorema do Posto

Observação 12.4. Se f : U ⊂ Rm −→ Rn é uma aplicação de classe C1 , o posto de f é uma


função semi-contı́nua inferiormente com valores inteiros. Isto é, se posto f(a) = r, então existe
δ > 0 tal que B(a; δ) ⊂ U e o posto de f em x é ≥ r para todo x ∈ B(a; δ).

De fato, como o posto de f em a é igual a r, existe um determinante menor r × r da matriz Jf(a)


que é diferente de zero.

Logo, como f 0 : U −→ L(Rn ; Rm ) é contı́nua, existe δ > 0 tal que este menor é não-nulo em
todos os pontos da bola de centro a e raio δ.

Então, pela observação 12.1, o posto de f em x é ≥ r para todo x ∈ B(a; δ).

Definição 12.3. Dada uma decomposição Rm+n = Rm n


I ⊕ RJ , dizemos que um conjunto
X ⊂ Rm+n é verticalmente convexo quando
(x, y 0 ) , (x, y 00 ) ∈ X =⇒ [(x, y 0 ), (x, y 00 )] ⊂ X ,

ou seja, x + (1 − t)y 0 + ty 00 ∈ X para todo t ∈ [0, 1].

Exemplo 12.1. Se X = V ⊕ W = {x + y | x ∈ V , y ∈ W}, onde V ⊂ Rm n


I e W ⊂ RJ é convexo,
então X é verticalmente convexo. 

Lema 12.1. Seja U ⊂ Rm+n = Rm n


I ⊕ RJ um aberto verticalmente convexo. Se f : U −→ R
p

possui segunda derivada parcial ∂2 f, a qual é identicamente nula em U, então f independe da


segunda variável, isto é, f(x, y1 ) = f(x, y2 ) para quaisquer (x, y1 ), (x, y2 ) ∈ U.

Prova.
Sejam (x, y1 ), (x, y2 ) ∈ U, e seja λ : [0, 1] −→ Rp o caminho λ(t) = f(x + (1 − t)y1 + ty2 ).
Então, como y2 − y1 ∈ RnJ ,

f(x + y1 + (t + s)(y2 − y1 )) − f(x + y1 + t(y2 − y1 ))


λ 0 (t) = lim
s→0 s

= ∂2 f(x + y1 + t(y2 − y1 )) (y2 − y1 ) = 0 ,

para todo t ∈ [0, 1]. Logo λ é constante em [0, 1]. Em particular, λ(0) = λ(1), ou seja,
f(x, y1 ) = f(x, y2 ). 

Lema 12.2. Seja E ⊂ Rm+p um subespaço vetorial de dimensão m. Então existe uma decom-
p
posição em soma direta Rm+p = Rm
I ⊕ RJ tal que a projeção sobre a primeira coordenada
π : Rm+p −→ Rm m
I , π(x, y) = x, aplica E isomorficamente sobre RI .

J. Delgado - K. Frensel 249


Análise

Fig. 12: A projeção π é um isomorfismo de E sobre Rm


I

Prova.
Seja {u1 , . . . , um } uma base de E. Se E = Rm+p , não há nada a demonstrar. Se E 6= Rm+p ,
existe j1 ∈ {1, . . . , m + p} tal que ej1 6∈ E. Então {u1 , . . . , um , ej1 } são LI e geram um subespaço
E1 de Rm+p de dimensão m + 1. Se E1 6= Rm+p , existe j2 ∈ {1, . . . , m + p} tal que ej2 6∈ E1 .
Então {u1 , . . . , um , ej1 , ej2 } são LI e geram um subespaço de Rm+p de dimensão m + 2. Pros-
seguindo desta maneira, obtemos p vetores ej1 , . . . , ejp , da base canônica de Rm+p tais que
{u1 , . . . , um , ej1 , . . . , ejp } é uma base de Rm+p .

I o subespaço gerado por {ei1 , . . . , eim }, onde


Sejam RpJ o subespaço gerado por {ej1 , . . . , ejp } e Rm
{i1 , . . . , im } = {1, . . . , m + p} − {j1 , . . . , jp }.
p
Assim, Rm+p = Rm
I ⊕ RJ e R
m+p
= E ⊕ RpJ .
p
Seja π : Rm m m
I ⊕ RJ −→ RI a projeção sobre a primeira coordenada, ou seja, se z = x + y, x ∈ RI
e y ∈ RpJ , então π(z) = x.
p
Seja x ∈ Rm
I . Então existem x1 ∈ E e y1 ∈ RJ tais que x = x1 + y1 .

Logo x = π(x) = π(x1 + y1 ) = π(x1 ) e, portanto, π|E : E −→ Rm


I é sobrejetora.

Como dim E = m = dim Rm m


I , temos que π|E : E −→ RI é um isomorfismo. 

Teorema 12.1. (Teorema do Posto)


Seja f : U −→ Rm+p uma aplicação de classe Ck , k ≥ 1, e posto constante m em cada ponto
do aberto U ⊂ Rm+n . Então, para cada ponto a ∈ U, existem um difeomorfismo α de um aberto
V × W em Rm × Rn sobre um aberto Z ⊂ U contendo o ponto a e um difeomorfismo β de um
aberto Z 0 ⊂ Rm+p , tal que f(Z) ⊂ Z 0 , sobre um aberto V × W 0 em Rm × Rp , ambos de classe
Ck , tais que, para todo (x, y) ∈ V × W:
β ◦ f ◦ α(x, y) = (x, 0) .

Descrição do Teorema do Posto: Cada uma das fibras da vizinhança Z de a é transformada por
f num único ponto, do mesmo modo que cada segmento vertical x×W em V ×W é transformado
por β ◦ f ◦ α no ponto (x, 0).

250 Instituto de Matemática UFF


O Teorema do Posto

Fig. 13: Representação esquematica do Teorema do Posto

Prova.
Seja E = f 0 (a)(Rm+n ) ⊂ Rm+p .
p
Como dim E = m, pelo lema 12.2, existe uma decomposição em soma direta Rm+p = Rm
I ⊕ RJ
tal que a projeção sobre a primeira coordenada π : Rm+p −→ Rm
I , π(x, w) = x, é um isomorfismo
quando restrita a E, ou seja, π : E −→ Rm
I é um isomorfismo.

Seja T : Rm+p −→ Rm+p a transformação linear tal que T (ek ) = eik , k = 1, . . . , m e T (ek ) = ejk−m ,
k = m + 1, . . . , m + p, e seja π = L ◦ T −1 ◦ π, onde L : Rm × {0} −→ Rm é dada por L(x, 0) = x.

Logo (π ◦ f) 0 (a) = π ◦ f 0 (a) : Rm+n −→ Rm é sobrejetora. Então, pela Forma Local das Sub-
mersões, existe um difeomorfismo α de classe Ck de um aberto V0 × W ⊂ Rm × Rn sobre um
aberto Z0 contendo a em Rm+n tal que π ◦ f ◦ α(x, w) = x.
X
m
Assim, f ◦ α(x, y) = xk eik + λ(x, y), onde a aplicação λ : V0 × W −→ RpJ , dada por
k=1
X
p
λ(x, y) = λ` (x, y)ej` , é de classe Ck .
`=1

Observe que T −1 ◦ f ◦ α(x, y) = (x1 , x2 , . . . , xm , λ1 (x, y), . . . , λp (x, y)).

Afirmação: ∂2 λ = 0.
!
Im×m Om×n
De fato, a matriz Jacobiana de T −1 ◦ f ◦ α tem a forma , onde Im×m
Ap×m
Bp×n
 (m+p)×(m+n)

∂λi
é a matriz identidade m × m, Om×n é a matriz nula m × n e B = .
∂yk p×n

J. Delgado - K. Frensel 251


Análise

Como posto(T −1 ◦ f ◦ α) = posto(f ◦ α) = posto(f) = m, temos que B = 0, ou seja, ∂2 λ = 0,


provando a afirmação.

Além disso, como W pode ser tomado convexo, temos que V0 × W é verticalmente convexo e,
portanto, pelo lema 12.1, λ(x, y) não depende da variável y.

Seja α(a1 , a2 ) = a e consideremos a injeção i : V0 −→ V0 × W dada por i(x) = (x, a2 ). Então a


X
m
m+p
aplicação f ◦ α ◦ i : V0 −→ R , f ◦ α ◦ i(x) = xk eik + λ(x, a2 ), é de classe Ck e sua derivada
k=1
no ponto a1 , (f ◦ α ◦ i) 0 (a1 ) : Rm −→ Rm+p , é injetora, pois
X
m
0 0 0
(f ◦ α) (i(a1 ))(i (a1 )) v = (f ◦ α) (a1 , a2 ) (v, 0) = vk eik + λ 0 (a1 , a2 ) (v, 0).
k=1

Além disso, como λ independe de y, para todo (x, y) ∈ V0 × W:


f ◦ α ◦ i(x) = f ◦ α(x, a2 ) = f ◦ α(x, y) .

Pela Forma Local das Imersões, existe um difeomorfismo β : Z 0 −→ V × W 0 de classe Ck tal


que Z 0 é um aberto contendo f(a) em Rm+p , V ⊂ V0 aberto de Rm com a1 ∈ V, W 0 aberto de
Rp com 0 ∈ W 0 e β ◦ f ◦ α ◦ i(x) = (x, 0) para todo x ∈ V. Logo, β ◦ f ◦ α(x, y) = (x, 0) para todo
(x, y) ∈ V × W . 

Corolário 12.1. Seja f : U −→ Rn de classe C1 , com posto constante no aberto U ⊂ Rm .


Então:

(a) f é localmente injetora se, e só se, f é uma imersão.

(b) f é aberta se, e só se, f é uma submersão.

Prova.
(a) (⇐) Se f é uma imersão de classe C1 , então f é fortemente diferenciável no ponto a e
f 0 (a) : Rm −→ Rn é injetora para todo a ∈ U. Logo, pelo teorema 7.2, f é localmente injetora.

Ou ainda, pela Forma Local das Imersões, para cada a ∈ U, existe um aberto V ⊂ Rm , com
V ⊂ U e a ∈ V, e um difeomorfismo β : Z −→ V × W tal que β ◦ f(x) = (x, 0) para todo x ∈ V.
Logo f|V é injetora.

(⇒) Suponhamos que posto(f) = p < m. Então, pelo Teorema do Posto, a aplicação β ◦ f ◦ α :
(x, y) 7−→ (x, 0), definida no produto V × W dos abertos V ⊂ Rp e W ⊂ Rm−p não é injetora.

Como β e α são difeomorfismos, temos que f não é injetora em aberto algum contendo a, um
absurdo.

Logo posto(f) = m, ou seja, f é uma imersão.

252 Instituto de Matemática UFF


O Teorema do Posto

(b) (⇐) Segue do corolário 11.2.

(⇒) Suponhamos que posto(f) = p < n. Sejam os difeomorfismos β e α dados pelo Teorema
do Posto. Então β ◦ f ◦ α(x, y) = (x, 0) para todo x ∈ V, y ∈ W, onde V é um aberto de Rp , W é
um aberto de Rm−p , (x, 0) ∈ Rp × Rn−p .

Logo β ◦ f ◦ α(V × W) = β ◦ f(Z) = V × {0}, onde Z é um aberto de Rm que contém a, mas


f(Z) = β−1 (V × {0}) não é um aberto de Rn , uma contradição.

Assim, posto(f) = n, ou seja, f é uma submersão. 

Teorema 12.2. Seja f : U −→ Rn uma aplicação de classe C1 no aberto U ⊂ Rm e, para cada


r = 0, 1, . . . , p = min{m, n}, seja Ar o interior do conjunto dos pontos de U nos quais f tem posto
r. Então o conjunto aberto A = A0 ∪ A1 ∪ . . . ∪ Ap é denso em U.

Prova.
Seja V ⊂ U um aberto não-vazio.

Afirmação: V ∩ A 6= ∅.

De fato, como o posto de f só assume um número finito de valores, existe a ∈ V tal que
r = posto(f(a)) = max{posto(f(x)) | x ∈ V}.

Então, pela observação 12.4, existe δ > 0 tal que B(a; δ) ⊂ V e posto(f(x)) ≥ r para todo
x ∈ B(a; δ). Logo posto(f(x)) = r para todo x ∈ B(a; δ) e, portanto, B(a; δ) ⊂ Ar .

Assim, ∅ 6= B(a; r) ⊂ Ar ∩ V ⊂ A ∩ V. 

Observação 12.5. Em geral, Ar = ∅ para alguns r = 0, 1, . . . , p.

Observação 12.6. O conjunto Ap (que é igual a Am se m ≤ n e igual a An se n ≤ m) é o


conjunto dos pontos x ∈ U nos quais o posto de f 0 (x) é igual a p, pois tal conjunto é sempre
aberto, pela observação 12.4. Portanto, no caso r = p, não precisamos tomar o interior.

Corolário 12.2. Seja f : U −→ Rn uma aplicação de classe C1 no aberto U ⊂ Rm . Então


existe um subconjunto aberto e denso A ⊂ U tal que f tem posto constante em cada componente
conexa de A.

Prova.
Seja o conjunto aberto e denso A = A0 ∪ . . . ∪ Ap dado pelo teorema anterior. Como os abertos
A0 , A1 , . . . , Ap são dois a dois disjuntos, temos que se C é uma componente conexa de A e
C ∩ Aj 6= ∅ para algum j = 0, 1, . . . , r, então C ⊂ Aj , pois, caso contrário,

J. Delgado - K. Frensel 253


Análise

  
p
 [
C = (Aj ∩ C) ∪  Ak  ∩ C 
 
k=1
k 6= j

seria uma cisão não-trivial de C. Logo f tem posto constante j em C. 

Corolário 12.3. Se a aplicação f : U −→ Rn de classe C1 no aberto U ⊂ Rm é localmente


injetora, então m ≤ n e o cojunto dos pontos x ∈ U nos quais f 0 (x) : Rm −→ Rn é injetora é
aberto e denso em U.

Prova.
Seja a decomposição A = A0 ∪ . . . ∪ Ap dada pelo teorema 12.2. Em cada aberto Ai 6= ∅,
i = 0, . . . , p, f é localmente injetora e tem posto constante. Logo, pelo corolário 12.1, f|Ai é uma
imersão. Então m ≤ n e Ai = ∅ para todo i = 0, . . . , m − 1, ou seja, p = m e A = Am . Além
disso, pela observação 12.6, Am = {x ∈ U | f 0 (x) é injetora}.

Portanto, o conjunto dos pontos x ∈ U nos quais f 0 (x) : Rm −→ Rn é injetora é um conjunto


aberto e denso em U. 

Corolário 12.4. Se a aplicação f : U −→ Rn de classe C1 no aberto U ⊂ Rm é aberta, então


n ≤ m e o conjunto dos pontos x ∈ U nos quais a derivada f 0 (x) : Rm −→ Rn é sobrejetora é
aberto e denso em U.

Prova.
Seja a decomposição A = A0 ∪ . . . ∪ Ap dada pelo teorema 12.2. Como em cada aberto
Ai 6= ∅, f|Ai é uma aplicação aberta de posto constante temos, pelo corolário 12.1, que f|Ai é
uma submersão. Logo n ≤ m e Ai = ∅ para todo i = 0, . . . , n − 1. Ou seja, p = n e A = An .
Então, pela observação 12.6, An = {x ∈ U | f 0 (x) é sobrejetora}.

Assim, o conjunto {x ∈ U | f 0 (x) é sobrejetora} é aberto e denso em U. 

Observação 12.7. Quando m = 1, o corolário 12.3 pode ser demonstrado sem a ajuda do
Teorema do Posto.

De fato, se f : I −→ Rn é um caminho diferenciável, dizer que f 0 (x) é injetora equivale a dizer


que o vetor velocidade é 6= 0 no ponto x ∈ I.

Como f é de classe C1 , o conjunto A = {x ∈ I | f 0 (x) 6= 0} é aberto.

Além disso, como f é localmente injetora, não pode existir um intervalo aberto J ⊂ I tal que
A ∩ J = ∅, ou seja, não pode existir J ⊂ I tal que f 0 (x) = 0 para todo x ∈ J, pois, neste caso, f
seria constante em J, e assim, f não seria localmente injetora.

254 Instituto de Matemática UFF


O Teorema do Posto

No caso n = 1, o corolário 12.4 também pode ser provado diretamente.

De fato, se f : U ⊂ Rm −→ R é uma função diferenciável, então f 0 (x) é sobrejetora se, e só


se, df(x) 6= 0. Logo, como f é de classe C1 , temos que A = {x ∈ U | df(x) 6= 0} é um conjunto
aberto.

Além disso, se A não fosse denso em U, seu complementar conteria uma bola aberta B. Como
df(x) = 0 para x ∈ B e B é conexo, f seria constante em B e, portanto, f(B) seria um conjunto
formado por apenas um ponto, logo não poderia ser aberto. Assim, A é denso em U.

Apêndice I

Já vimos que o Teorema da Aplicação Implı́cita pode ser obtido a partir do Teorema da
Aplicação Inversa. Vamos provar que a recı́proca também é verdadeira.

Prova.
De fato, seja f : U ⊂ Rm −→ Rm uma aplicação fortemente diferenciável no ponto a ∈ U
(ou de classe Ck ) tal que f 0 (a) : Rm −→ Rm é um isomorfismo.

Como f é fortemente diferenciável no ponto a e f 0 (a) é injetora, existe, pelo teorema 7.2, um
aberto U0 ⊂ U, com a ∈ U0 , tal que f : U0 −→ f(U0 ) é um homeomorfismo.

Consideremos a aplicação F : Rm × U0 −→ Rm dada por F(x, y) = x − f(y).

Se f é de classe Ck então F é de classe Ck , e se f é fortemente diferenciável no ponto a então


F é fortemente diferenciável no ponto (f(a), a).

De fato, como
F(x, y) = x − f(y) = F(f(a), a) + (x − f(a)) − f 0 (a)(y − a) + rF(f(a),a) (x, y) ,

temos que
rF(f(a),a) (x, y) = −f(y) + f(a) + f 0 (a)(y − a) = −rfa (y) .

Logo, dado ε > 0, existe δ > 0 tal que


x, x 0 ∈ B(a; δ) =⇒ krfa (y 0 ) − rfa (y)k ≤ ε ky 0 − ykS

=⇒ krF(f(a),a) (x 0 , y 0 ) − rF(f(a),a) (x, y)k = krfa (y 0 ) − rfa (y)k ≤ ε ky 0 − ykS

≤ ε (ky 0 − ykS + kx 0 − xkS )

= εk(y 0 , x 0 ) − (y, x)kS ,


para todos y, y 0 ∈ Rm .

J. Delgado - K. Frensel 255


Análise

Além disso, como g 0 (f(a), a)(v, w) = v − f 0 (a) w , temos que F 0 (f(a), a)(0, w) = −f 0 (a)w e,
portanto, ∂2 F(f(a), a) : Rm −→ Rm é um isomorfismo, uma vez que f 0 (a) : Rm −→ Rm é um
isomorfismo.

Pelo Teorema da Aplicação Implı́cita, existem um aberto V ⊂ Rm e um aberto


Z ⊂ Rm × U0 , f(a) ∈ V e (f(a), a) ∈ Z, com a seguinte propriedade: para cada x ∈ V existe um
único y = ϕ(x) ∈ Rm tal que (x, ϕ(x)) ∈ Z e F(x, ϕ(x)) = x − f(ϕ(x)) = F(f(a), a) = 0, ou seja,
para cada x ∈ V existe um único y = ϕ(x) ∈ U0 tal que (x, ϕ(x)) ∈ Z e f(ϕ(x)) = x.

Então V ⊂ f(U0 ) e, como f : U0 −→ f(U0 ) é um homeomorfismo, U1 = f|−1


U0 (V) é um aberto que
contém o ponto a. Assim, f : U1 −→ V é um homeomorfismo do aberto U1 sobre o aberto V,
cuja inversa ϕ = f−1 é, pelo Teorema da Aplicação Implı́cita, fortemente diferenciável no ponto
f(a). E se f é de classe Ck , ϕ = f−1 é de classe Ck e, portanto, f : U1 −→ V é um difeomorfismo
de classe Ck . 

Apêndice II

Lembremos os enunciados dos Teoremas da Aplicação Implı́cita (simplificado) e da Aplicação


Inversa.

Teorema. (da Aplicação Implı́cita)


Seja g : U ⊂ Rm × Rn → Rn uma aplicação de classe Ck , (k ≥ 1). Suponha que g(xo , yo ) = c e
∂2 g(xo , yo ) : Rn → Rn seja um isomorfismo para um certo (xo , yo ) ∈ U. Então existem abertos
Z ⊂ U, com (xo , yo ) ∈ Z, e V ⊂ Rm , com xo ∈ V, tais que g−1 (c) ∩ Z é o gráfico de uma
aplicação ϕ : V → Rn de classe Ck , ou seja, para todo x ∈ V existe um único y = ϕ(x) ∈ Rn tal
que (x, ϕ(x)) ∈ Z e g(x, ϕ(x)) = c.

Teorema. (da Aplicação Inversa)


Seja f : U ⊂ Rn → Rn uma aplicação de classe Ck , k ≥ 1. Suponha que f 0 (a) : Rn → Rn seja
um isomorfismo para um certo a ∈ U. Então existem abertos V e W em Rn , com a ∈ V ⊂ U,
tais que f : V → W é um difeomorfismo de classe Ck .

Provaremos o Teorema da Aplicação Inversa usando duas vezes o Teorema da Aplicação Implı́cita.

Seja F : Rn × U → Rn a aplicação dada por F(x, y) = x − f(y).

Então F é uma aplicação de classe Ck e ∂2 F(b, a) = −f 0 (a) : Rn → Rn é um isomorfismo,


onde b = f(a) e F(b, a) = f(a) − f(a) = 0.

256 Instituto de Matemática UFF


O Teorema do Posto

Pelo Teorema da Aplicação Implı́cita, existem abertos V1 ⊂ Rn e Z1 ⊂ Rn × U, com


b ∈ V1 e (b, a) ∈ Z1 , tais que F−1 (0) ∩ Z1 é o gráfico de uma aplicação ϕ : V1 → Rn de
classe Ck , isto é, para cada x ∈ V1 existe um único y = ϕ(x) ∈ U tal que (x, ϕ(x)) ∈ Z1 e
F(x, ϕ(x)) = x − f(ϕ(x)) = 0. Observe que ϕ(b) = a.

Como f(ϕ(x)) = x para todo x ∈ V1 , temos que ϕ é injetora e f 0 (ϕ(x) · ϕ 0 (x) · v = v para
todos x ∈ V1 e v ∈ Rn . Logo ϕ 0 (b) : Rn → Rn é um isomorfismo.

Considere agora a aplicação G : U × V1 → Rn dada por G(z, w) = z − ϕ(w). Então G é


uma aplicação de classe Ck e ∂2 G(ϕ(b), b) = −ϕ 0 (b) : Rn → Rn é um isomorfismo.

Pelo Teorema da Aplicação Implı́cita, existem abertos V ⊂ Rn e Z ⊂ U × V1 , com ϕ(b) =


a ∈ V e (ϕ(b), b) = (a, f(a)) ∈ Z, tais que G−1 (0) ∩ Z é o gráfico de uma aplicação ξ : V → Rn
de classe Ck , isto é, para cada z ∈ V existe um único w = ξ(z) ∈ Rn tal que (z, ξ(z)) ∈ Z e
G(z, ξ(z)) = z − ϕ(ξ(z)) = 0.

Assim, ξ(a) = f(a), ξ(z) ∈ V1 e ϕ(ξ(z)) = z, para todo z ∈ V. Logo f(ϕ(ξ(z))) = f(z), para
todo z ∈ V.

Como f ◦ ϕ(x) = x, para todo x ∈ V1 , temos que ξ(z) = f(z) e portanto, ϕ(f(z)) = z, para
todo z ∈ V.

Afirmação: f : V → f(V) é um difeomorfismo de classe Ck sobre o aberto f(V).

De fato, sendo ϕ(f(z)) = z, para todo z ∈ V, temos que f é injetora em V.

Como ϕ(f(V) = V, f(V) ⊂ V1 e ϕ : V1 → Rn é uma aplicação contı́nua e injetora, temos


que ϕ−1 (V) = f(V) é um aberto de V1 e, portanto, de Rn .

Além disso, como ϕ : f(V) → V é a inversa de f : V → f(V) e ϕ : f(V) → V é uma


aplicação de classe Ck , temos que f : V → f(V) é um difeomorfismo de classe Ck do aberto V,
que contém a, sobre o aberto W = f(V). 

A versão “fortemente diferenciável” do Teorema da Aplicação Inversa se prova de modo


análogo, usando a versão “fortemente diferenciável” do Teorema da Aplicação Implı́cita. Ne-
cessitamos apenas provar que a aplicaçaõ F, definida na demonstração acima, é fortemente
diferenciável em (f(a), a) (ver Apêndice I).

Assim, a aplicação ϕ : V1 → U, neste caso, é fortemente diferenciável em b e, portanto, V1


pode ser tomado de modo que ϕ seja contı́nua em V1 .

FIM

J. Delgado - K. Frensel 257

You might also like