Professional Documents
Culture Documents
1 O espaço vetorial Rn
que tem uma coordenada igual a 1 e as outras nulas. Para todo x = (x1 , . . . , xn ) temos:
x = x 1 e1 + x 2 e2 + . . . + x n en .
-1
Análise
De fato, dada T ∈ L(Rm , Rn ), seja AT = (aij ) a matriz cuja j−ésima coluna é o vetor coluna
(Tej )t , onde {e1 , . . . , em } é a base canônica de Rm , ou seja, a matriz AT = (aij ) é definida pelas
igualdades
X
n
Tej = aij ei , j = 1, . . . , m ,
i=1
Escrevendo as colunas de uma matriz A ∈ M(n × m) uma após a outra numa linha,
podemos identificar A com um ponto do espaço euclidiano Rnm .
Além disso, como Φ é uma bijeção, podemos induzir em L(Rm , Rn ) uma estrutura de
espaço vetorial, para a qual T `k , 1 ≤ k ≤ n e 1 ≤ ` ≤ m, onde T `k (e` ) = ek e T `k (ej ) = 0 se
j 6= `, é uma base natural.
Podemos, assim, sempre que for conveniente, substituir L(Rm , Rn ) ora por M(n × m), ora
por Rn m .
ou seja,
X
n
πi (x1 , . . . , xi , . . . , xm ) = xj πi (ej ) = xi ,
j=1
m
é a projeção de R sobre seu i−ésimo fator.
de modo que ϕ fica inteiramente determinada pelos mn valores ϕ(ei , ej ) que assume nos pares
ordenados de vetores básicos (ei , ej ), 1 ≤ i ≤ m e 1 ≤ j ≤ n.
Definição 2.1. Seja E um espaço vetorial real. Um produto interno em E é uma aplicação
h , i : E × E −→ R que satisfaz as seguintes propriedades:
(2) hx + x 0 , yi = hx, yi + hx 0 , yi ;
J. Delgado - K. Frensel 1
Análise
para quaisquer x, x 0 , y ∈ E e λ ∈ R.
Ou seja, um produto interno sobre E é uma função real bilinear, simétrica e positiva defi-
nida.
é a delta de Kronecker.
Definição 2.2. Dizemos que dois vetores x, y são ortogonais em relação ao produto interno
h , i se hx, yi = 0.
Observação 2.3.
• O vetor nulo 0 é ortogonal a todos os vetores do espaço.
Prova.
Suponhamos que y 6= 0 e seja λ ∈ R. Como
hx + λy, x + λyi = kxk2 + 2λhx, yi + λ2 kyk2 ≥ 0 , ∀λ ∈ R,
Além disso, | hx, yi| = kxk kyk se, e só se, ∆ = 0, ou seja, se, e só se, existe λ0 ∈ R tal que
x + λ0 y = 0.
Logo | hx, yi| = kxk kyk se, e só se, x e y são LD.
Definição 2.3. Uma norma num espaço vetorial real E é uma função real k k : E −→ R que
satisfaz as seguintes condições:
para quaisquer x, y ∈ E e λ ∈ R.
De fato, como
kxk = k(x − y) + yk ≤ kx − yk + kyk ,
e
kyk = k(x − y) − xk ≤ kx − yk + kxk ,
J. Delgado - K. Frensel 3
Análise
temos que
−kx − yk ≤ kxk − kyk ≤ kx − yk ,
Prova.
Sejam x, y ∈ E e λ ∈ R. Então:
(2) kx + yk2 = hx + y, x + yi = kxk2 + 2hx, yi + kyk2 ≤ kxk2 + 2kxk kyk + kyk2 , pela desi-
gualdade de Cauchy-Schwarz.
Observação 2.9. Há uma infinidade de normas que podem ser definidas no espaço euclidi-
ano Rn . Dentre elas, temos:
De fato, como kxk = x21 + . . . + x2n ≥ |xi | para todo i = 1, . . . , n, temos que kxk ≥ kxkM .
p
Finalmente,
X
n
kxk2S = ( |x1 | + . . . + |xn | ) = |x1 | + . . . + |xn | + 2
2 2 2
|xi | |xj | ≥ |x1 |2 + . . . + |xn |2 = kxk2 ,
i, j = 1
i<j
Estas desigualdades servirão para mostrar que as três normas acima são equivalentes.
Definição 2.4. Uma métrica num conjunto M é uma função real d : M × M −→ R que satisfaz
as seguintes condições:
é uma métrica em E.
De fato, se x, y, z ∈ E, então:
Exemplo 2.3. Em Rn ,
p
• d(x, y) = (x1 − y1 )2 + . . . + (xn − yn )2 é a métrica que provém da norma euclidiana.
Observação 2.11. Uma norma num espaço vetorial E pode não provir de um produto interno,
J. Delgado - K. Frensel 5
Análise
que diz que a soma dos quadrados das diagonais de um paralelogramo é igual à soma dos
quadrados de seus quatro lados.
De fato,
kx + yk2 = hx + y, x + yi = kxk2 + kyk2 + 2hx, yi
kx − yk2 = hx − y, x − yi = kxk2 + kyk2 − 2hx, yi
=⇒ kx + yk2 + kx − yk2 = 2 kxk2 + kyk2 .
Com isso, podemos provar que as normas k kM e k kS em Rn , n ≥ 2, não provêm de um
produto interno, pois:
• ke1 + e2 k2M + ke1 − e2 k2M = 1 + 1 = 2 6= 4 = 2 ke1 k2M + ke2 k2M ,
e
• ke1 + e2 k2S + ke1 − e2 k2S = 4 + 4 = 8 6= 4 = 2 ke1 k2S + ke2 k2S .
Observação 3.1. A forma geométrica das bolas e esferas dependem, em geral, da norma
que se usa.
• B((a, b), r) = {(x, y) ∈ R2 | (x − a)2 + (y − b)2 < r} (disco aberto de centro (a, b) e raio r > 0).
• B[(a, b), r] = {(x, y) ∈ R2 | (x − a)2 +(y − b)2 ≤ r} (disco fechado de centro (a, b) e raio r > 0).
• S[(a, b), r] = {(x, y) ∈ R2 | (x − a)2 + (y − b)2 = r} (cı́rculo de centro (a, b) e raio r > 0).
Fig. 1: Bola aberta, bola fechada e esfera no plano em relação à métrica euclidiana
Fig. 2: Bola aberta, bola fechada e esfera no plano em relação à métrica do máximo
é a região interior ao quadrado de vértices nos pontos (a, b + r), (a, b − r), (a − r, b), (a + r, b).
é a união da região limitada pelo quadrado de vértices nos pontos (a, b + r), (a, b − r), (a − r, b),
(a + r, b) com o próprio quadrado.
J. Delgado - K. Frensel 7
Análise
é o quadrado de vértices nos pontos (a, b + r), (a, b − r), (a − r, b), (a + r, b).
Fig. 3: Bola aberta, bola fechada e esfera no plano em relação à métrica da soma
Fig. 4: Relação entre as bolas abertas de mesmo centro e raio em relação às métricas euclidiana, da soma e do máximo
Observação 3.2. De um modo geral, a bola aberta BM (a, r) ⊂ Rn , definida pela norma
kxkM = max{ |x1 |, . . . , |xn |}, é o produto cartesiano (a1 − r, a1 + r) × . . . × (an − r, an + r), onde
a = (a1 , . . . , an ).
De fato,
x = (x1 , . . . , xn ) ∈ BM (a, r) ⇐⇒ |x1 − a1 | < r , . . . , |xn − a| < r
⇐⇒ x1 ∈ (a1 − r, a1 + r) , . . . , xn ∈ (an − r, an + r)
⇐⇒ (x1 , . . . , xn ) ∈ (a1 − r, a1 + r) × . . . × (an − r, an + r) .
O fato das bolas de Rn serem produto cartesiano de intervalos da reta, torna esta métrica, em
muitas ocasiões, mais conveniente do que a métrica euclidiana.
• Mostraremos, agora, que as bolas relativas a diferentes normas em Rn têm em comum o fato
de serem convexas.
Teorema 3.1. Toda bola aberta ou fechada de Rn , com respeito a qualquer norma, é um
conjunto convexo.
Prova.
Sejam x, y ∈ B(a, r). Então kx − ak < r e ky − ak < r. Logo,
k(1 − t)x + ty − ak = k(1 − t)x + ty − (1 − t)a − tak ≤ k(1 − t)(x − a)k + kt(y − a)k < (1 − t)r + tr = r ,
Observação 3.3. Um subconjunto X ⊂ Rn é limitado se, e só se, existe a ∈ Rn e r > 0 tal
que X ⊂ B[a, r].
temos que um subconjunto X ⊂ Rn é limitado em relação a uma dessas normas se, e só se, é
limitado em relação a qualquer das outras duas.
J. Delgado - K. Frensel 9
Análise
Teorema 3.2. Um subconjunto X ⊂ Rn é limitado em relação à norma euclidiana se, e só se,
suas projeções π1 (X), . . . , πn (X) são conjuntos limitados em R.
Prova.
X é limitado com respeito à norma euclidiana k k ⇐⇒ X ⊂ Rn é limitado com respeito à norma
do máximo k kM ⇐⇒ ∃ r > 0 tal que X ⊂ BM [0, r] = [−r, r] × . . . × [−r, r] ⇐⇒ ∃ r > 0 tal que
π1 (X) ⊂ [−r, r], . . . , πn (X) ⊂ [−r, r] ⇐⇒ π1 (X), . . . , πn (X) são limitados em R.
para todo x ∈ Rn . Assim, se X ⊂ Rn é limitado com respeito a uma norma em Rn , será também
limitado em relação a qualquer outra norma em Rn .
Usaremos a notação (xk ), (xk )k∈N ou (x1 , x2 , . . . , xn , . . .) para indicar a sequência cujo k−ésimo
termo é xk .
A subsequência é indicada pelas notações (xk )k∈N 0 , (xki )i∈N ou (xk1 , xk2 , . . . , xki , . . .).
Definição 4.3. Dizemos que uma sequência (xk )k∈N é limitada quando o conjunto formado
pelos seus termos é limitado, ou seja, quando existe c > 0 tal que kxk k ≤ c para todo k ∈ N.
Pelo teorema 3.2, temos, então, que uma sequência (xk ) é limitada se, e só se, cada uma
de suas sequências de coordenadas (xki )k∈N , i = 1, . . . , n, é limitada em R.
Definição 4.4. Dizemos que o ponto a ∈ Rn é o limite da sequência (xk ) quando, para todo
ε > 0 dado, existe k0 ∈ N tal que k > k0 =⇒ kxk − ak < ε
Notação:
• Quando existe o limite a = lim xk , dizemos que a sequência (xk ) é convergente. Caso contrário,
dizemos que a sequência (xk ) é divergente.
uma contradição.
• Com isto, podemos definir o limite e convergência de uma sequência num espaço métrico
(M, d) qualquer.
Dado ε = 1 > 0, existe k0 ∈ N tal que kxk − ak < 1 para todo k > k0 .
Se r = max{ 1, kx1 − ak, . . . , kxk0 − ak } > 0, então, kxk − ak ≤ r para todo k ∈ N, ou seja,
{xk | k ∈ N} ⊂ B[a, r].
J. Delgado - K. Frensel 11
Análise
Observação 4.7. Como as três normas usuais de Rn estão relacionadas pelas desigualda-
des
kxkM ≤ kxk ≤ kxkS ≤ nkxkM ,
temos que:
lim kxk − akM = 0 ⇐⇒ lim kxk − ak = 0 ⇐⇒ lim kxk − akS = 0 .
k→∞ k→∞ k→∞
ou seja, a afirmação lim xk = a independe de qual das três normas usuais estamos conside-
k→∞
rando.
Como provaremos depois que duas normas quaisquer de Rn são equivalentes, a noção de
limite de uma sequência em Rn permanece a mesma seja qual for a norma que considerarmos.
Teorema 4.1. Uma sequência (xk ) em Rn converge para o ponto a = (a1 , . . . , an ) se, e só se,
lim xk i = ai para todo i = 1, . . . , n.
k→∞
Prova.
Como |xk i − ai | ≤ kxk − akM , temos que se lim xk = a, ou seja, se lim kxk − akM = 0,
k→∞ k→∞
então lim |xk i − ai | = 0, para todo i = 1, . . . , n, e, portanto, lim xk i = ai , i = 1, . . . , n.
k→∞ k→∞
Dado ε > 0, existe, para cada i = 1, . . . , n, um número natural ki tal que |xk i − ai | < ε para todo
k > ki .
Logo lim xk = a.
k→∞
Corolário 4.1. Se (xk ), (yk ) são sequência convergentes em Rn e (λk ) é uma sequência
convergente em R, com a = lim xk , b = lim yk e λ = lim λk , então:
(b) lim λk xk = λa ,
k→∞
Prova.
Pelo teorema 4.1, temos que lim xki = ai e lim yki = bi , i = 1, . . . , n.
k→∞ k→∞
Utilizando novamente o teorema 4.1 e os fatos conhecidos sobre limites de somas e de produtos
de sequências de números reais, temos que:
Também podemos provar (d) observando que | kxk k − kak | ≤ kxk − ak, que tem a vantagem de
valer para qualquer norma.
Prova.
Caso n = 1: Seja (xk ) uma sequência limitada de números reais, e sejam a < b tais que
xk ∈ [a, b] para todo k ∈ N.
Consideremos o conjunto:
A = { t ∈ R | xk ≥ t para uma infinidade de ı́ndices k } .
Então, dado ε > 0 existe tε ∈ A tal que c − ε < tε . Assim, existe uma infinidade de ı́ndices k tais
que xk > c − ε.
Assim, c − ε < xk < c + ε para uma infinidade de ı́ndices k, e, portanto, c é o limite de uma
subsequência de (xk ).
Pelo teorema 3.2, as sequências (xki )k∈N , i = 1, . . . , n, de coordenadas de (xk ) são sequências
limitadas de números reais.
Como (xk1 )k∈N é limitada, existe N1 ⊂ N infinito e a1 ∈ R tal que lim xk1 = a1 . Por sua vez,
k∈N1
como a sequência (xk2 )k∈N1 de números reais é limitada, existe N2 ⊂ N1 infinito e a2 ∈ R tais
J. Delgado - K. Frensel 13
Análise
Definição 4.5. Dizemos que um ponto a ∈ Rn é valor de aderência de uma sequência (xk )
de pontos de Rn quando a é limite de alguma subsequência de (xk ).
Observação 4.8. Uma sequência (xk ) não possui valor de aderência ⇐⇒ (xk ) não possui
subsequência limitada ⇐⇒ para todo número real A > 0 dado, existe k0 ∈ N tal que k > k0 =⇒
kxk k > A.
Observação 4.10. Uma sequência convergente possui um único valor de aderência, mas a
recı́proca não vale, pois, por exemplo, a sequência (1, 2, 1, 3, 1, 4, . . .) possui o 1 como único
valor de aderência, mas não converge, já que é ilimitada.
Teorema 4.3. Uma sequência limitada em Rn é convergente se, e somente se, possui um
único valor de aderência.
Prova.
(=⇒) É imediato.
(⇐=) Seja (xk ) uma sequência limitada e seja a ∈ Rn o seu único valor de aderência.
Suponhamos, por absurdo, que a sequência (xk ) não converge para a. Então, existe ε0 > 0 tal
que para todo k ∈ N, existe k 0 > k tal que kxk 0 − ak ≥ ε0 , ou seja, o conjunto N 0 = { k ∈ N | xk ∈
/
B(a, ε0 ) } é ilimitado e, portanto, infinito.
Como a sequência (xk )k∈N 0 é limitada, existe, pelo teorema 4.2, N 00 ⊂ N 0 infinito e b ∈ Rn tais
que lim00 xk = b.
k∈N
Sendo kxk − ak ≥ ε0 > 0 para todo k ∈ N 00 , temos que kb − ak ≥ ε0 > 0. Logo b 6= a e b é valor
de aderência de (xk ), uma contradição, já que (xk ) possui um único valor de aderência.
Definição 4.6. Dizemos que uma sequência (xk ) é de Cauchy quando para todo ε > 0 existe
k0 ∈ N tal que k, ` > k0 =⇒ kxk − x` k < ε.
Observação 4.11. (xk )k∈N é de Cauchy ⇐⇒ para cada i = 1, . . . , n, a sequência (xki )k∈N das
suas i−ésimas coordenadas é uma sequência de Cauchy de números reais.
Teorema 4.4. Uma sequência (xk )k∈N em Rn é de Cauchy se, e só se, é convergente.
Prova.
(⇐=) É imediato.
Então, para cada i = 1, . . . , n, a sequência (xki )k∈N de suas i−ésimas coordenadas é de Cau-
chy e, portanto, convergente. Sendo ai = lim xki , i = 1, . . . , n, temos, pelo teorema 4.2, que
k∈N
a = (a1 , . . . , an ) = lim xk , ou seja, (xk ) é convergente e tem limite a.
k∈N
para todo x ∈ Rn .
Observação 4.12. Se, para todo x0 ∈ Rn e todo r > 0, B1 (x0 , r) e B2 (x0 , r) indicarem, res-
pectivamente, a bola aberta de centro x0 e raio r segundo as normas k k1 e k k2 , as desigual-
dades acima significam que:
B2 (x0 , r) ⊂ B1 (x0 , ar) e B1 (x0 , r) ⊂ B2 (x0 , br) .
Observação 4.14. A equivalência entre normas é uma relação reflexiva, simétrica e transi-
tiva.
J. Delgado - K. Frensel 15
Análise
Prova.
Por transitividade, basta mostrar que uma norma qualquer k k em Rn é equivalente à norma
X n
da soma kxkS = |xi |.
i=1
Seja F = { kxk | kxkS = 1 } ⊂ R. Então, F 6= ∅ e limitado, pois 0 < kxk ≤ a para todo x ∈ Rn tal
que kxkS = 1.
Suponhamos que b = 0.
1
Dado k ∈ N, existe xk ∈ Rn tal que 0 < kxk k < e kxk kS = 1.
k
Como a sequência (xk )k ∈ N é limitada na norma da soma, temos, pelo teorema 4.2, que existe
N 0 ⊂ N infinito e c ∈ Rn tais que lim0 kxk − ckS = 0.
k∈N
Assim, pelo item (d) do corolário 4.1, temos que lim0 kxk kS = kckS . Logo kckS = 1, e, portanto,
k∈N
c 6= 0.
Como kxk − ck ≤ akxk − ckS para todo k ∈ N 0 e lim0 kxk − ckS = 0, temos que lim0 kxk − ck = 0
k∈N k∈N
e, portanto, lim0 kxk k = kck.
k∈N
1
Por outro lado, como kxk k < para todo k ∈ N, temos que lim kxk k = 0, o que é uma
k k∈N
contradição, já que kck =
6 0.
Logo inf F = b > 0. Assim, kxk ≥ b para todo x ∈ Rn tal que kxkS = 1.
x
kxkS
≥ b , para todo x ∈ R − {0}, ou seja, kxk ≥ bkxkS para todo x ∈ R .
n n
Então,
Aplicação: Uma sequência de polinômios pk (t) = ak0 +ak1 t+. . .+akn tn de grau ≤ n converge
para o polinômio p(t) = a0 + a1 t + . . . + an tn uniformemente no intervalo não-degenerado [α, β]
se, e só se, para cada i = 0, 1, . . . , n, a sequência (aki )k∈N dos coeficientes de ti nos polinômios
pk converge para o coeficiente ai de ti no polinômio p.
De fato, existe um isomorfismo linear Φ entre o espaço vetorial Rn+1 e o espaço vetorial Pn
dos polinômios reais de grau ≤ n dado por Φ((b0 , b1 , . . . , bn )) = pb (t) = b0 + b1 t + . . . + bn tn .
Seja kxk = sup{ |px (t)| | t ∈ [α, β] }. É fácil verificar que k k define uma norma em Rn+1 ,
pois:
(a) kλxk = sup{ |pλx (t)| | t ∈ [α, β] } = sup{ |λ| |px (t)| | t ∈ [α, β] } = |λ| kxk .
=⇒ ∃ t0 ∈ [α, β] tal que |px (t0 )| > 0 =⇒ kxk = sup |px (t)| ≥ |px (t0 )| > 0 .
t∈[α,β]
Logo,
|px+y (s)| ≤ kxk + kyk , para todo t ∈ [α, β]
Como duas normas quaisquer são equivalentes em Rn+1 , temos que xki −→ ai para todo
i = 0, 1, . . . , n ⇐⇒ kxk − akM −→ 0 ⇐⇒ kxk − ak −→ 0 ⇐⇒ pxk −→ pa uniformemente em [α, β].
5 Pontos de acumulação
J. Delgado - K. Frensel 17
Análise
ε 1
Tome 0 < t0 = < . Então:
2r 4
ε
• kb − ((1 − t0 )b + t0 a)k = kt0 (b − a)k = |t0 | r = < ε,
2
e
Então b ∈ B(a, r) 0 .
• Seja b ∈ B(a, r), b 6= a. Dado ε > 0, podemos supor, sem perda de generalidade, que
0 < ε < kb − ak.
ε 1
Tome 0 < t0 = < . Então:
2kb − ak 2
ε
• k(1 − t0 )b + t0 a − bk = |t0 | kb − ak = < ε,
2
e
Então b ∈ B(a, r) 0 .
ε e1
• Para b = a e 0 < ε < r, tome c = a + .
2 ke1 k
ε ke1 k ε
Assim, kb − ck = ka − ck = = < ε < r. Logo c ∈ B(a, ε) ∩ (B(a, r) − {a}).
2 ke1 k 2
Ou seja, a ∈ B(a, r) 0 .
Então, B(b, ε0 ) ∩ B(a, r) = ∅, pois, caso contrário, existiria x ∈ Rn tal que kx − bk < ε0 e
kx − ak < r =⇒ ka − bk ≤ kx − bk + ka − xk < ε0 + r = kb − ak, uma contradição.
Logo b 6∈ B(a, r) 0 .
E neste exemplo, todo ponto de X é ponto de acumulação de X, mas isso nem sempre acontece.
Ou seja, a ∈ X é um ponto isolado de X se, e só se, existe ε0 > 0 tal que B(a, ε0 ) ∩ X = {a}.
Quando todos os pontos de X são pontos isolados, dizemos que X é um conjunto discreto.
(2) Existe uma sequência (xk ) de pontos de X com lim xk = a e xk 6= a para todo k ∈ N;
Prova. 1 1
(1)=⇒(2): Como a ∈ X 0 , dado k ∈ N, existe xk ∈ B a, ∩ (X − {a}), ou seja, 0 < kxk − ak < .
k k
Logo xk 6= a para todo k ∈ N e lim xk = a .
k→∞
O conjunto {xk | k ≥ k0 } é infinito, porque, caso contrário, (xk ) teria uma subsequência constante,
que convergiria para um limite diferente de a, já que xk 6= a para todo k ∈ N. Logo X ∩ B(a, ε) é
um conjunto infinito.
(3)=⇒(1): É evidente.
Observação 5.2. A recı́proca do corolário acima é falsa. Por exemplo, N é infinito, mas
N 0 = ∅.
Prova.
Sendo infinito, X contém um subconjunto infinito enumerável {x1 , . . . , xk , . . .}. Assim, (xk ) é uma
sequência limitada de pontos de X tal que xk 6= x` para k 6= `.
J. Delgado - K. Frensel 19
Análise
Pelo teorema 4.4, existe N 0 ⊂ N infinito e a ∈ Rn tais que lim0 xk = a. Como os termos xk são
k∈N
dois a dois distintos, no máximo um deles é igual a a. Eliminando-o, se necessário, obtemos
uma sequência de pontos de X, todos diferentes de a, com limite a.
6 Aplicações contı́nuas
Ou seja, para toda bola aberta B(f(a), ε) de centro f(a) em Rn , existe uma bola aberta B(a, δ)
de centro a ∈ Rm tal que f(X ∩ B(a, δ)) ⊂ B(f(a), ε).
De fato, seja δ0 > 0 tal que B(a, δ0 ) ∩ X = {a}. Então, dado ε > 0, existe δ = δ0 > 0 tal que
f(B(a, δ) ∩ X) = {f(a)} ⊂ B(f(a), ε) .
para quaisquer x, y ∈ X.
= K kxkS kykS .
Como X é limitado em Rm × Rn , existe r > 0 tal que k(x, y)kS = kxkS + kykS ≤ r para todo
(x, y) ∈ X.
J. Delgado - K. Frensel 21
Análise
Portanto, ϕ cumpre uma condição de Lipschitz, com constante Kr, em cada bola BS [0, r] do
espaço Rm × Rn = Rm+n .
De fato, seja (x0 , y0 ) ∈ Rm × Rn tal que ϕ(x0 , y0 ) 6= 0. Suponhamos, por absurdo, que existe
K > 0 tal que kϕ(x, y)k ≤ K k(x, y)k para todo (x, y) ∈ Rm × Rn .
Observação 6.10. A noção de imersão isométrica depende das normas consideradas nos
espaços Rm e Rn .
Uma transformação ortogonal T : Rn −→ Rn também se caracteriza pelo fato de ser {Te1 , . . . , Ten }
uma base ortonormal. Isto equivale a dizer que as colunas da matriz da transformação T em
relação à base canônica são duas a duas ortogonais e unitárias. Isto é, At A = A At = I.
J. Delgado - K. Frensel 23
Análise
sendo uma aplicação lipschitziana (e, portanto, contı́nua), mas ela pode deixar de ser uma
contração fraca.
De fato,
|πi (x) − πi (y)| = |xi − yi | ≤ kx − yk ,
Prova.
Sendo g contı́nua em b = f(a), dado ε > 0, existe η > 0 tal que
y ∈ Y , ky − f(a)k < η =⇒ kg(y) − g(f(a))k < ε .
Então,
x ∈ X , kx − ak < δ =⇒ kg(f(x)) − g(f(a))k < ε .
Teorema 6.2. Uma aplicação f : X ⊂ Rm −→ Rn é contı́nua no ponto a ∈ X se, e só se, cada
uma das suas funções coordenadas fi = πi ◦ f : X −→ R é contı́nua no ponto a.
Prova.
(=⇒) Sendo f contı́nua no ponto a e πi : Rm −→ R contı́nua em Rn , i = 1, . . . , n, temos,
pelo teorema anterior, que fi = πi ◦ f é contı́nua no ponto a, i = 1, . . . , n.
Prova.
Se f = (f1 , . . . , fm ) e g = (g1 , . . . , gn ), então, as funções coordenadas de (f, g) são
f1 , . . . , fm , g1 , . . . , gn .
O teorema 6.1 e o corolário 6.1 são de grande utilidade para mostrar a continuidade de
certas aplicações. Vejamos alguns exemplos.
J. Delgado - K. Frensel 25
Análise
Exemplo 6.6. A função f : R2 −→ R dada por f(x, y) = (sen x) ex2 +y3 é contı́nua, pois
f = ϕ ◦ (sen ◦π1 , exp ◦s ◦ (ξ ◦ π1 , η ◦ π2 )) ,
onde ϕ : R × R −→ R , π1 : R × R −→ R, π2 : R × R −→ R, s : R × R −→ R, ξ : R −→ R,
η : R −→ R e exp : R −→ R são as funções contı́nuas dadas por: ϕ(x, y) = x y , π1 (x, y) = x ,
π2 (x, y) = y , s(x, y) = x + y , ξ(x) = x2 , η(x) = x3 e exp(x) = ex .
Teorema 6.3. Uma aplicação f : X ⊂ Rm −→ Rn é contı́nua no ponto a ∈ X se, e só se, para
toda sequência (xk ) de pontos de X com lim xk = a tem-se lim f(xk ) = f(a) .
k→∞ k→∞
Prova.
(=⇒) Seja f contı́nua no ponto a e (xk ) uma sequência de pontos de X com lim xk = a.
Dado ε > 0, existe δ > 0 tal que x ∈ X e kx − ak < δ =⇒ kf(x) − f(a)k < ε .
Como lim xk = a, existe k0 ∈ N tal que kxk − ak < δ para todo k > k0 . Logo kf(xk ) − f(a)k < ε
para todo k > k0 . Então f(xk ) −→ f(a).
(⇐=) Suponhamos que f não é contı́nua no ponto a. Então existe ε0 > 0 tal que para todo k ∈ N
1
podemos obter xk ∈ X com kxk − ak < e kf(xk ) − f(a)k ≥ ε0 .
k
Assim, xk −→ a, mas (f(xk )) não converge para f(a).
Em particular,
√
Observação 6.19. A função f : [0, +∞) −→ R, dada por f(x) = x , é um exemplo de uma
função uniformemente contı́nua que não é lipschitziana (veja Curso de Análise, Vol. I de E. Lima,
pag. 244).
J. Delgado - K. Frensel 27
Análise
Teorema 6.4. Uma aplicação f : X ⊂ Rm −→ Rn é uniformemente contı́nua se, e só se, para
quaisquer duas sequências (xk ) e (yk ) em X com lim (xk − yk ) = 0, tem-se
k→∞
lim ( f(xk ) − f(yk ) ) = 0.
k→∞
Prova.
(=⇒) Dado ε > 0, existe δ > 0 tal que x, y ∈ X e kx − yk < δ =⇒ kf(x) − f(y)k < ε.
Se (xk ) e (yk ) são sequências em X com lim (xk − yk ) = 0, existe k0 ∈ N tal que kxk − yk k < δ
k→∞
para todo k > k0 .
Logo kf(xk ) − f(yk )k < ε para todo k > k0 , ou seja, lim ( f(xk ) − f(yk ) ) = 0 .
k→∞
(⇐=) Suponhamos que f não é uniformemente contı́nua. Então existe ε0 > 0 tal que, para todo
1
k ∈ N, podemos obter um par de pontos xk , yk ∈ X com kxk − yk k < e kf(xk ) − f(yk )k ≥ ε0 .
k
Logo (xk − yk ) −→ 0, mas ( f(xk ) − f(yk ) ) 9 0.
7 Homeomorfismos
Observação 7.2. Já sabemos (veja Curso de Análise, Vol. I de E. Lima, pag. 237) que se
f : I −→ R é uma função contı́nua injetora definida num intervalo I, então f(I) = J é um intervalo
e f−1 : J −→ R é contı́nua, ou seja, f : I −→ J é um homeomorfismo.
Mas, em geral, uma bijeção f : X ⊂ Rm −→ Y ⊂ Rn pode ser contı́nua sem que sua inversa o
seja.
Exemplo 7.2. Seja f : [0, 2π) −→ S1 ⊂ R2 a aplicação definida por f(t) = (cos t, sen t). Pelo
teorema 6.2, f é contı́nua. Além disso, f é uma bijeção. Mas sua inversa f−1 : S1 −→ [0, 2π) é
descontı́nua no ponto p = (1, 0).
1
De fato, para cada k ∈ N, sejam tk = 2π − e zk = f(tk ). Então lim f(tk ) = lim zk = p, mas
k k→∞ k→∞
lim f−1 (zk ) = lim tk = 2π 6= 0 = f−1 (p).
k→∞ k→∞
De fato, seja (zk ) uma sequência de pontos de S1 − {p} tal que lim zk = q ∈ S1 − {p}.
k→∞
Como f é uma bijeção, para cada k ∈ N, existe um único tk ∈ (0, 2π) tal que f(tk ) = zk .
Afirmação: A sequência (tk ) é convergente e seu limite b pertence ao intervalo (0, 2π).
Com efeito, sendo (tk ) uma sequência limitada, ela possui pelo menos um valor de aderência,
e todos os seus valores de aderência pertencem ao intervalo [0, 2π].
Então f(b) = lim0 f(tk ) = lim0 zk = q ∈ S1 − {p}. Logo b ∈ (0, 2π) e, pela injetividade, b = f−1 (q).
k∈N k∈N
Pelo teorema 4.3, (tk ) é convergente e lim tk = f−1 (q), ou seja, lim f−1 (zk ) = f−1 (q).
k∈N k∈N
• De modo análogo, podemos provar que a aplicação f : (a, a + 2π) −→ S1 − {q} , onde
q = (cos a, sen a), é um homeomorfismo.
J. Delgado - K. Frensel 29
Análise
Exemplo 7.5. Duas bolas abertas ou duas bolas fechadas ou duas esferas quaisquer no
espaço Rn são homeomorfas.
De fato, dados a, b ∈ Rn e r > 0, s > 0 números reais, temos que a aplicação ϕ = Tb ◦ Hs/r ◦ T−a :
Rn −→ Rn é um homeomorfismo tal que:
ϕ(B(a, r)) = B(b, s) , ϕ(B[a, r]) = B[b, s] e ϕ(S[a, r)] = S[b, s] ,
s s
pois, como ϕ(x) = (x − a) + b, então kϕ(x) − bk = kx − ak e, portanto:
r r
kϕ(x) − bk < s ⇐⇒ kx − ak < r ;
kϕ(x) − bk ≤ s ⇐⇒ kx − ak ≤ r ;
kϕ(x) − bk = s ⇐⇒ kx − ak = r .
Como f e a aplicação identidade Id : Rn −→ Rn são contı́nuas, temos, pelo corolário 6.1, que
f é uma bijeção contı́nua. Sua inversa g : G −→ X, dada por g((x, f(x))) = x, é contı́nua, pois
g = π1 |G , onde π1 : Rm × Rn −→ Rm é a projeção π1 (x, y) = x.
1
pois H é o gráfico da função contı́nua f : R − {0} −→ R dada por f(x) = .
x
• Também, usando o resultado acima, podemos provar que o hemisfério norte
Sm
+ = x ∈ Rm+1 | kxk = 1 e xm+1 > 0
Como −p→x = { (1 − t)p + tx | t > 0 } = { p + t(x − p) | t > 0 }, temos que um ponto y = (1 − t)p + tx ∈
−→
p x pertence ao hiperplano Rm × {0} ⊂ Rm+1 se, e só se,
J. Delgado - K. Frensel 31
Análise
p→
1
Logo y = (1 − t)p + tx ∈ −x ∩ (Rm × {0}) se, e somente se, t = e, portanto,
1 − xm+1
x0
ϕ(x) = ϕ(x1 , . . . , xm , xm+1 ) = , sendo x 0 = (x1 , . . . , xm ) .
1 − xm+1
Assim, ϕ : Sm − {p} −→ Rm é uma aplicação contı́nua.
Seja agora a aplicação ξ : Rm −→ Sm − {p} definida pelo processo inverso, ou seja, ξ(x) é a
−−→
intersecção de Sm − {p} com a semi-reta p x? , onde x? = (x, 0).
8 Limites
se, para todo ε > 0 dado, podemos obter δ > 0 tal que
x ∈ X , 0 < kx − ak < δ =⇒ kf(x) − bk < ε .
Logo,
kb − ck ≤ kf(xδ ) − ck + kb − f(xδ )k < ε ,
Teorema 8.1. Existe lim f(x) ⇐⇒ para toda sequência (xk ) de pontos de X − {a} com
x→a
lim xk = a , existe lim f(xk ) .
k→∞ k→∞
Prova.
Pela observação anterior, basta mostrar que se (xk ) e (yk ) são duas sequências em X − {a}
com lim xk = lim yk = a, então lim f(xk ) = lim f(yk ).
Como lim z2k = lim z2k−1 = a, temos que lim zk = a. Logo, pela hipótese, a sequência (f(zk )) é
convergente. Assim, b = c, pois lim f(z2k−1 ) = b e lim f(z2k ) = c.
J. Delgado - K. Frensel 33
Análise
para todo x ∈ X, onde M é uma constante positiva que depende apenas da aplicação bilinear ϕ
e das normas consideradas em Rn , Rp e Rq .
• Como caso particular, temos que lim hf(x), g(x)i = 0 e lim α(x) f(x) = 0 se um dos fatores é
x→a x→a
limitado e o outro tende para zero.
x2 y
Exemplo 8.1. Se f : R2 − {0} −→ R é a função f(x, y) = , então lim f(x, y) = 0.
x2 + y2 (x,y)−→(0,0)
xy
De fato, a função f(x, y) é o produto de x por , sendo lim x = 0 e a aplicação
x2 + y2 (x,y)−→(0,0)
xy
(x, y) 7−→ limitada, pois, para (x, y) 6= (0, 0),
x2 + y2
|xy| 2 |x| |y| x 2 + y2
≤ ≤ = 1.
x 2 + y2 x2 + y2 x2 + y2
• Como consequência de (2), temos que se lim f(x) = b então lim kf(x)k = kbk, pois a função
x→a x→a
norma k k : Rn −→ R é contı́nua.
• E como consequência de (1), temos que se lim f(x) = b, então lim f(a+tu) = b, para qualquer
x→a t→0
vetor u 6= 0.
xy
Segue daı́ que não existe lim , pois, para u = (α, β) , o valor do limite
(x,y)→(0,0) x2 + y2
αβ
lim f(tα, tβ) = , que varia com α e β .
t→0 α2 + β2
Como b − ε = c + ε, temos que g(x) < f(x) para todo x ∈ {x ∈ X | 0 < kx − ak < δ} 6= ∅, pois
a ∈ X 0 , uma contradição.
De fato, dado ε > 0, existe δ > 0 tal que x, y ∈ X e kx − yk < δ =⇒ kf(x) − f(y)k < ε.
J. Delgado - K. Frensel 35
Análise
Prova.
Seja (xk ) uma sequência de pontos de X − {a}, com lim xk = a. Como (xk ) é uma sequência de
Cauchy e f é uniformemente contı́nua, então (f(xk )) é uma sequência de Cauchy e é, portanto,
convergente. Então, pelo teorema 8.1, existe lim f(x).
x→a
xy
Observação 8.12. A função contı́nua f : R2 − {(0, 0)} −→ R definida por f(x, y) = não
x2 + y2
é uniformemente contı́nua em qualquer conjunto X ⊂ R2 − {(0, 0)} do qual (0, 0) seja um ponto
de acumulação, pois não existe lim f(x, y).
(x,y)→(0,0)
Isto é, toda aplicação uniformemente contı́nua definida em X se estende de modo único a
uma aplicação uniformemente contı́nua em X = X ∪ X 0 .
Prova.
Para cada x ∈ X 0 − X, faça f(x) = lim f(x), o qual existe pelo teorema anterior. E se x ∈ X,
x→x
faça f(x) = f(x).
Observe que se x ∈ X 0 ∩ X, então f(x) = f(x) = lim f(x). Ou seja, f(x) = lim f(x), para todo
x→x x→x
x ∈ X 0.
Logo,
kx − yk ≤ kx − xk + kx − yk + ky − yk < δ0 + δ0 + |kx − yk < δ − kx − yk + kx − yk = δ ,
e, portanto,
ε ε ε
kf(x) − f(y)k ≤ kf(x) − f(x)k + kf(x) − f(y)k + kf(y) − f(y)k < + + = ε.
3 3 3
Assim, se x, y ∈ X , kx − yk < δ =⇒ kf(x) − f(y)k < ε.
9 Conjuntos abertos
Definição 9.1. Seja X ⊂ Rn . Um ponto a ∈ X é um ponto interior a X se existe δ > 0 tal que
B(a, δ) ⊂ X.
Definição 9.3. Dizemos que um conjunto V é uma vizinhança do ponto a quando a ∈ int V.
Definição 9.4. Um conjunto X ⊂ Rn é aberto quando todos os seus pontos são pontos interi-
ores a X, ou seja, quando para todo a ∈ X existe δ > 0 tal que B(a, δ) ⊂ X.
Então B(b, δ) ⊂ Rn −B[a, r], pois se kx−bk < δ =⇒ kb−ak ≤ kb−xk+kx−ak < δ+kx−ak =⇒
kx − ak > kb − ak − δ = r.
J. Delgado - K. Frensel 37
Análise
Logo, se x ∈ B(a, r) então x ∈ int X, ou seja, B(a, r) ⊂ int X, o que prova que int X é aberto.
Logo, pelo provado acima, int(B(x0 , r)) ⊂ int X, e, portanto, B(x0 , r) ⊂ int X, pois B(x0 , r) é um
conjunto aberto.
Portanto, int B[a, r] = B(a, r), uma vez que B(a, r) = int B(a, r) ⊂ int B[a, r].
Definição 9.5. Sejam X ⊂ Rn e a ∈ Rn . Dizemos que a é ponto fronteira de X se, para todo
r > 0, B(a, r) ∩ X 6= ∅ e B(a, r) ∩ (Rn − X) 6= ∅.
Ou seja,
Rn = int X ∪ int(Rn − X) ∪ ∂X ,
Exemplo 9.1. Como Rn − B[a, r] é aberto e int B[a, r] = B(a, r), temos que ∂B[a, r] = S[a, r].
Exemplo 9.2. Como Rn − B[a, r] é aberto e Rn − B[a, r] ⊂ Rn − B(a, r), temos que
Rn − B[a, r] ⊂ int(Rn − B(a, r)). Logo,
∂B(a, r) = Rn − (int B(a, r) ∪ int(Rn − B(a, r))) = Rn − (B(a, r) ∪ int(Rn − B(a, r))) ⊂ S[a, r] .
E se x ∈ S[a, r], ou seja, x = a + ru, kuk = 1, então, para todo 0 < ε < r,
x ∈ B(x, ε) ∩ (Rn − B(a, r)) e y = a + (r − ε/2)u ∈ B(x, ε) ∩ B(a, r),
ε ε
pois ky − xk = < ε e ky − ak = r − < r. Logo, S[a, r] ⊂ ∂B(a, r). Assim, ∂B(a, r) = S[a, r].
2 2
Observação 9.10. Um conjunto A ⊂ Rn é aberto se, e só se, nenhum de seus pontos é
ponto fronteira de A, ou seja, se, e só se, A ∩ ∂A = ∅.
Prova.
(1) Rn é obviamente aberto, e ∅ é aberto, pois um conjunto só pode deixar de ser aberto se
contiver algum ponto que não seja interior.
J. Delgado - K. Frensel 39
Análise
Exemplo 9.3. A = (0, 1] é aberto em X = [0, 1], pois A = (0, 2) ∩ [0, 1], onde (0, 2) é aberto em
R.
Teorema 9.2. Uma aplicação f : X ⊂ Rm −→ Rn é contı́nua se, e só se, a imagem inversa
f−1 (A), de todo aberto A ⊂ Rn , é um aberto em X.
Prova.
(=⇒) Seja x0 ∈ f−1 (A). Então f(x0 ) ∈ A. Como A é aberto em Rn , existe ε > 0 tal que
B(f(x0 ), ε) ⊂ A, ou seja, ky − f(x0 )k < ε =⇒ y ∈ A.
Sendo f contı́nua no ponto x0 ∈ X, existe δ > 0 tal que x ∈ X, kx − x0 k < δ =⇒ kf(x) − f(x0 )k < ε.
Logo f(X ∩ B(x0 , δ)) ⊂ B(f(x0 ), ε) ⊂ A, e, portanto, X ∩ B(x0 , δ) ⊂ f−1 (A). Provamos, assim, que
f−1 (A) é aberto em X.
(⇐=) Seja x0 ∈ X e seja ε > 0. Então, como por hipótese, f−1 (B(f(x0 ), ε)) é aberto em X,
existe δ > 0 tal que B(x0 , δ) ∩ X ⊂ f−1 (B(f(x0 ), ε). Logo, se x ∈ X e kx − x0 k < δ =⇒
f(x) ∈ B(f(x0 ), ε) =⇒ kf(x) − f(x0 )k < ε, ou seja, f é contı́nua no ponto x0 ∈ X. Como x0 ∈ X é
arbitrário, f é contı́nua.
Observação 9.14. Uma aplicação f : X ⊂ Rm −→ Y ⊂ Rn é contı́nua se, e só se, para todo
conjunto A ⊂ Y aberto em Y, f−1 (A) é aberto em X.
De fato, se A ⊂ Y é aberto em Y, existe B aberto em Rn tal que A = B∩Y. Como f−1 (A) = f−1 (B)
e f é contı́nua, temos, pelo teorema anterior que f−1 (B) = f−1 (A) é aberto em X. Reciproca-
mente, se A é aberto em Rn , então A ∩ Y é aberto em Y. Logo, por hipótese, f−1 (A ∩ Y) = f−1 (A)
é aberto em X. Assim, pelo teorema anterior, f é contı́nua.
Com isso, podemos provar novamente que a bola aberta B(a, r) é um conjunto aberto de Rn ,
pois
B(a, r) = {x ∈ Rn | kx − ak < r} = { x ∈ Rn | f(x) < r } ,
é um conjunto aberto.
J. Delgado - K. Frensel 41
Análise
10 Conjuntos fechados
Observação 10.1. Todo ponto a ∈ X é aderente a X, pois a = lim xk , com xk = a para todo
k ∈ N. Mas um ponto a pode ser aderente a X sem pertencer a X. Neste caso, a ∈ X 0 .
Então, dado ε > 0, existe k0 ∈ N tal que kxk − ak < ε para todo k > k0 , ou seja xk ∈ B(a, ε) ∩ X
para todo k > k0 . Logo B(a, ε) ∩ X 6= ∅.
1
Reciprocamente, para todo k ∈ N, temos, por hipótese, que existe xk ∈ B a, ∩ X, ou seja,
k
1
existe xk ∈ X com kxk − ak < .
k
Logo (xk ) é uma sequência de pontos de X que converge para a. Portanto, a é aderente a X.
• Em particular
B(a, r) = int B(a, r) ∪ ∂B(a, r) = B(a, r) ∪ S[a, r] = B[a, r]
e B[a, r] = int B[a, r] ∪ ∂B[a, r] = B(a, r) ∪ S[a, r] = B[a, r].
Exemplo 10.1. Se X = Qn , então X = Rn , pois todo número real é o limite de uma sequência
de números racionais, e, portanto, todo ponto (a1 , . . . , an ) ∈ Rn é o limite de uma sequência de
pontos de Qn .
Observação 10.5. O conceito de ponto aderente a X pode ser reformulado com abertos, em
vez de bolas:
Para provar a primeira afirmação, basta observar que toda bola aberta é um conjunto aberto, e
que todo conjunto aberto A contendo a, contém também uma bola aberta de centro a.
Definição 10.3. Dizemos que um conjunto X ⊂ Rn é fechado quando contém todos os seus
pontos aderentes, ou seja, quando X = X.
Exemplo 10.2. Toda bola fechada B[a, r] é um conjunto fechado, pois, pela observação 10.4,
B[a, r] = B[a, r].
Ou, mais diretamente, se (xk ) é uma sequência de pontos de B[a, r] , e lim xk = b , então
kb − ak ≤ r , pois kxk − ak ≤ r para todo k ∈ N e kb − ak = lim kxk − ak.
k→∞
Observação 10.7. X ⊂ Y ⊂ Rn =⇒ X ⊂ Y .
De fato, se a ∈ X, existe uma sequência (xk ) de pontos de X tal que lim xk = a. Como X ⊂ Y,
(xk ) é uma sequência de pontos de Y com lim xk = a. Logo a ∈ Y.
Prova.
Seja b ∈ Rn − X, ou seja, b 6∈ X. Então existe δ > 0 tal que B(b, δ) ∩ X = ∅. Seja y ∈ B(b, δ).
Como B(b, δ) é um aberto que contém y tal que B(b, δ) ∩ X = ∅, temos, pela observação 10.5,
que y 6∈ X, ou seja, y ∈ Rn − X. Logo B(b, δ) ⊂ Rn − X, provando, assim, que Rn − X é aberto.
Prova.
(=⇒) Se X é fechado, então X = X. Logo Rn − X = Rn − X é aberto.
J. Delgado - K. Frensel 43
Análise
Prova.
(1) ∅ e Rn são conjuntos fechados, pois Rn = Rn − ∅ e ∅ = Rn − Rn são conjuntos aber-
tos.
é um conjunto aberto.
(3) Se (Fλ )λ∈L é uma famı́lia de conjuntos fechados, então (Rn −Fλ )λ∈L é uma famı́lia de conjuntos
[ \
abertos. Logo (Rn − Fλ ) é um conjunto aberto. Assim, F = Fλ é fechado, pois
λ∈L \ [ λ∈L
n n n
R −F=R − Fλ = (R − Fλ )
λ∈L λ∈L
é um conjunto aberto.
Observação 10.11. Uma reunião infinita de conjuntos fechados pode ser um conjunto fe-
[
chado ou não, pois todo conjunto X ⊂ Rn é reunião de seus pontos: X = {x}. Como há
x∈X
conjuntos em Rn que não são fechados, há reuniões infinitas de conjuntos fechados que não
são fechados
Exemplo 10.3. O intervalo J = (0, 2] é fechado no intervalo I = (0, 3], pois J = [0, 2] ∩ (0, 3] e
[0, 2] ⊂ R é fechado. Mas J não é fechado em R.
onde G1 ∪ . . . ∪ Gk é fechado em Rn .
J. Delgado - K. Frensel 45
Análise
\
(3) A intersecção F = Fλ de uma famı́lia arbitrária de conjuntos Fλ fechados em X é um
λ∈L
n
conjunto fechado em X, pois, para cada λ ∈ L, Fλ = Gλ ∩ X, com
! Gλ fechado em R . Logo,
\ \ \
F= Fλ = (Gλ ∩ X) = Gλ ∩ X ,
λ∈L λ∈L λ∈L
Gλ é fechado em Rn .
T
onde λ∈L
Teorema 10.3. Uma aplicação f : X ⊂ Rm −→ Rn é contı́nua se, e só se, a imagem inversa
f−1 (F) de todo conjunto fechado F ⊂ Rn é um conjunto fechado em X.
Prova.
(=⇒) Seja f : X −→ Rn contı́nua e seja F ⊂ Rn fechado em Rn . Então A = Rn − F é aberto
em Rn e, portanto, pelo teorema 9.2, f−1 (A) é aberto em X. Mas, como f−1 (A) = f−1 (Rn − F) =
X − f−1 (F), temos, pela observação anterior, que f−1 (F) é fechado em X.
Observação 10.17. Uma aplicação f : X ⊂ Rm −→ Y ⊂ Rn é contı́nua se, e só se, para todo
F ⊂ Y fechado em Y, o conjunto f−1 (F) é fechado em X.
F = {x ∈ Rn | f1 (x) ≤ a1 , . . . , fk (x) ≤ ak }
é fechado em Rn , pois
1 ({a1 }) ∩ . . . ∩ fk ({ak })
F = f−1 {a1 }, . . . , {ak }
−1
e
são fechados em R.
Em particular, se f : Rn −→ R é a função contı́nua dada por f(x) = kx−ak, então S[a, r] = f−1 ({r})
é fechado em Rn .
J. Delgado - K. Frensel 47
Análise
Observação 10.22. Y ⊂ X é fechado em X se, e só se, YX = Y, ou seja, se, e só se, Y = Y∩X.
De fato, se Y = Y ∩ X, temos que Y é fechado em X, pois Y é fechado em Rn .
Prova.
Seja x ∈ X. Então existe uma sequência (yk ) de pontos de Y tal que lim yk = x.
Prova.
A coleção B das bolas abertas B(q, r) com centro num ponto q ∈ Qn e raio r > 0 racional,
com B(q, r) ∩ X 6= ∅, é enumerável. Seja B = {B1 , . . . , Bk , . . .} uma enumeração de B.
Para mostrar que E é denso em X, basta verificar que B(x0 , ε) ∩ E 6= ∅ para todo x0 ∈ X e para
todo ε > 0.
ε
Seja r > 0, r ∈ Q, tal que r < , e seja q ∈ Qn tal que kq − x0 k < r. Então x0 ∈ B(q, r) ∩ X e,
2
portanto, B(q, r) ∩ X 6= ∅, ou seja, B(q, r) = Bi , para algum i ∈ N. Existe, então, xi ∈ Bi ∩ E.
11 Conjuntos Compactos
De fato, se K é compacto e (xk ) é uma sequência de pontos de K, então (xk ) é uma sequência
limitada, pois K é limitado.
Pelo teorema de Bolzano-Weierstrass, existe N 0 ⊂ N infinito tal que (xk )k∈N 0 converge. Mais
ainda, lim0 xk ∈ K, pois K é fechado.
k∈N
Reciprocamente, suponhamos que K não é limitado Então, para todo k ∈ N, existe xk ∈ K tal
que kxk k ≥ k. Logo (xk ) é uma sequência de pontos de K que não possui uma subsequência
convergente, pois toda subsequência de (xk ) é ilimitada, o que contradiz a hipótese.
Assim, K é limitado.
J. Delgado - K. Frensel 49
Análise
Então existe x ∈ K−K. Como x ∈ K, existe uma sequência (xk ) de pontos de K tal que lim xk = x.
Logo, (xk ) é uma sequência de pontos de K tal que toda subsequência converge para x 6∈ K, o
que contradiz a hipótese. Assim, K é fechado.
Sendo cada Ki limitado, existe ri > 0 tal que kxkS ≤ ri para todo x ∈ Ki , i = 1, . . . , p.
Prova.
\ \
Pela observação 11.3, temos que Kk é compacto. Basta, então, mostrar que Kk 6= ∅.
k∈N k∈N
Para isso, tome xk ∈ Kk para cada k ∈ N.
Como xk ∈ K1 para todo k ∈ N, a sequência (xk )k∈N possui uma subsequência (xki )i∈N que
converge para um ponto x ∈ K1 .
Além disso, dado k ∈ N, temos que xki ∈ Kk para todo ki > k. Logo x = lim xki ∈ Kk para todo
\ i∈N
k ∈ N, ou seja, x ∈ Kk .
k∈N
Prova.
Seja (yk ) uma sequência de pontos de f(K). Então, para todo k ∈ N, existe xk ∈ K tal que
yk = f(xk ).
Como (xk ) é uma sequência de pontos de K e K é compacto, (xk )k∈N possui uma subsequência
(xki )i∈N que converge para um ponto x ∈ K.
Assim, sendo f é contı́nua, temos que lim f(xki ) = f(x), ou seja, (f(xki ))i∈N é uma subsequência
i→∞
de (yk ) que converge para um ponto f(x) ∈ f(K).
Observação 11.5.
• Uma aplicação contı́nua pode transformar um conjunto limitado num conjunto ilimitado.
1
Por exemplo, a função f(x) = leva o intervalo limitado (0, 1) no intervalo ilimitado (1, +∞).
x
• E, também, uma aplicação contı́nua pode transformar um conjunto fechado num conjunto que
não é fechado.
1
Por exemplo, a função f(x) = transforma R, fechado, no intervalo (0, 1) que não é fechado.
1 + x2
Prova.
Como f é contı́nua e K é compacto, f(K) é compacto em R.
J. Delgado - K. Frensel 51
Análise
Se K não é compacto, pode não existir c > 0 tal que f(x) ≥ c para todo x ∈ K.
1
Por exemplo, a função f : (0, +∞) −→ R, dada por f(x) = , é contı́nua e positiva, mas
x
f((0, +∞)) = (0, +∞).
Prova.
Seja F ⊂ K fechado em K. Como K é fechado em Rn , temos que F é fechado em Rn . Além
disso, como K é limitado e F ⊂ K, temos que F é limitado. Portanto, F é compacto. Logo f(F) é
compacto, uma vez que f é contı́nua. Assim, f(F) é fechado em Rn .
Prova.
Seja f : K −→ L uma bijeção contı́nua. Como K é compacto, f(K) = L é compacto.
Seja g = f−1 : L −→ K e seja F ⊂ K fechado em K. Então g−1 (F) = f(F) é fechado em Rn pelo
corolário 11.2 e, portanto, g−1 (F) é fechado em L. Logo, pela observação 10.17, g : L −→ K é
contı́nua e, portanto, f : K −→ L é um homeomorfismo.
Prova.
Como f é sobrejetora e F ⊂ L, temos que f(f−1 (F)) = F. Portanto, pelo corolário 11.2, F é
fechado.
Prova.
(=⇒) É evidente.
Aplicação: Seja g : [0, 2π] −→ Rn uma aplicação contı́nua com g(0) = g(2π). E seja a
aplicação f : S1 −→ Rn definida por f(eit ) = f(cos t, sen t) = g(t), que está bem definida, pois
g(0) = g(2π).
Como a aplicação ϕ : [0, 2π] −→ S1 , dada por ϕ(t) = (cos t, sen t), é contı́nua do compacto
[0, 2π] sobre o compacto S1 e f◦ϕ = g é contı́nua, temos, pelo corolário anterior, que a aplicação
f : S1 −→ Rn é contı́nua.
Prova.
Suponhamos, por absurdo, que existe ε0 > 0 tal que para todo δ > 0 podemos obter xδ ∈ X
e yδ ∈ K tais que kxδ − yδ k < δ e kf(xδ ) − f(yδ )k > ε0 .
1
Então, para todo k ∈ N, existem xk ∈ X e yk ∈ K tais que kxk − yk k < e kf(xk ) − f(yk )k ≥ ε0 .
k
Como (yk ) é uma sequência de pontos do compacto K, existe N 0 ⊂ N infinito tal que a sub-
sequência (yk )k∈N 0 converge para um ponto x ∈ K. Logo (xk )k∈N 0 converge, também, para
x e, portanto, pela continuidade de f, lim0 kf(xk ) − f(yk )k = kf(x) − f(x)k = 0, o que é uma
k∈N
contradição, pois kf(xk ) − f(yk )k ≥ ε0 , para todo k ∈ N.
Prova.
Suponhamos, por absurdo, que existe ε0 > 0 tal que, para todo δ > 0, podemos obter xδ ∈ X e
yδ ∈ K tais que kxδ − x0 k < δ e kf(xδ , yδ ) − f(x0 , yδ )k ≥ ε0 .
J. Delgado - K. Frensel 53
Análise
Então ϕ é contı́nua em todo ponto x0 ∈ X. De fato, pelo teorema anterior, dado ε > 0, existe
ε
δ > 0, tal que x ∈ X e kx − x0 k < δ =⇒ kf(x, t) − f(x0 , t)k < para todo t ∈ [a, b]. Logo,
2(b − a)
Zb
ε ε
|ϕ(x) − ϕ(x0 )| ≤ |f(x, t) − f(x0 , t)| dt ≤ × (b − a) = < ε .
a 2(b − a) 2
Definição 11.2. Uma cobertura de um conjunto X ⊂ Rn é uma famı́lia (Cλ )λ∈L de subconjun-
[
tos Cλ ⊂ Rn tal que X ⊂ Cλ .
λ∈L
Uma subcobertura de uma cobertura (Cλ )λ∈L é uma subfamı́lia (Cλ )λ∈L 0 , L 0 ⊂ L, para a qual
[
ainda se tem X ⊂ Cλ .
λ∈L 0
[
Dizemos que a cobertura X ⊂ Cλ é
λ∈L
Prova.
Se E = {x1 , . . . , xk , . . .} ⊂ X é um subconjunto enumerável denso em X e B é a coleção de
todas as bolas abertas B(x, r), com x ∈ E e r ∈ Q+ , tais que cada uma delas está contida em
algum Aλ , então B é um conjunto enumerável de bolas abertas.
[
Afirmação: X ⊂ B.
B∈B
Dado x ∈ X, existe λ ∈ L tal que x ∈ Aλ . Como Aλ é aberto, existe r > 0 racional tal que
B(x, 2r) ⊂ Aλ , e sendo E denso em X, existe xi ∈ E tal que kx − xi k < r, ou seja, x ∈ B(xi , r).
Prova.
Pelo teorema de Lindelöf, podemos obter uma subcobertura enumerável K ⊂ Aλ1 ∪. . .∪Aλk ∪. . ..
Assim, pela propriedade de Cantor, existe j0 ∈ N tal que Kj0 = ∅, ou seja, K ⊂ Aλ1 ∪ . . . ∪ Aλj0 .
Teorema 11.7. Se toda cobertura aberta do conjunto K ⊂ Rn possui uma subcobertura finita,
então K é compacto, ou seja, K é limitado e fechado.
Prova.
As bolas abertas de raio 1 centradas em pontos de K constituem uma cobertura aberta
[
K⊂ B(x, 1), que, por hipótese, possui uma subcobertura finita K ⊂ B(x1 , 1) ∪ . . . ∪ B(xk , 1).
x∈K
Assim, K é limitado por estar contido numa reunião finita de conjuntos limitados.
[ rx
Seja x0 ∈ Rn − K. Então, para todo x ∈ K, temos que rx = kx − x0 k > 0 e K ⊂ B x, .
2
x∈K
r r
Por hipótese, existem x1 , . . . , xk ∈ K tais que K ⊂ B x1 , x1 ∪ . . . ∪ B xk , xk .
2 2
r r
Seja r = min x1 , . . . , xk > 0.
2 2
rxj
Então B(x0 , r) ⊂ R − K, pois se y ∈ B(x0 , r) ∩ K, existiria j ∈ {1, . . . , k} tal que y ∈ B xj ,
n
e,
2
portanto,
rxj
rxj = kxj − x0 k ≤ kx0 − yk + ky − xj k < r + ≤ rxj ,
2
ou seja, rxj < rxj , uma contradição.
J. Delgado - K. Frensel 55
Análise
Observação 11.9. Os teoremas 11.6 e 11.7 mostram que poderı́amos ter definido um con-
[
junto compacto K pela condição de que toda cobertura aberta K ⊂ Aλ possui uma subcober-
tura finita K ⊂ Aλ1 ∪ . . . ∪ Aλk .
\
Corolário 11.6. Se o aberto U contém a intersecção K = Ki de uma sequência decres-
i∈N
cente K1 ⊃ K2 ⊃ . . . ⊃ Ki ⊃ . . . de conjuntos compactos, então existe i0 ∈ N tal que Ki0 ⊂ U.
Prova.
\ \ [
Como Ki ⊂ U, temos que Rn − U ⊂ Rn − Ki = (Rn − Ki ). Logo os abertos Ui = Rn − Ki ,
i∈N i∈N i∈N
juntamente com U, constituem uma cobertura aberta de K1 , da qual podemos extrair uma sub-
cobertura finita K1 ⊂ U ∪ Ui1 ∪ . . . ∪ Uip .
• O nosso objetivo, agora, é demonstrar o teorema de Baire. Mas antes precisamos dar algumas
definições e provar alguns resultados preliminares.
Isto ocorre apenas porque Q não é completo (fechado) em R, conforme resulta do teorema de
Baire a seguir.
Observação 11.15. O conjunto unitário {x} ⊂ Y tem interior vazio em Y se, e só se, x não é
isolado em Y.
De fato,
{x} tem interior vazio em Y ⇐⇒ x 6∈ intY {x} ⇐⇒ ∀ δ > 0 , B(x, δ) ∩ Y 6⊂ {x}
⇐⇒ ∀δ > 0 , B(x, δ) ∩ Y 6= {x} ⇐⇒ x não é isolado em Y .
Prova.
Sejam A1 , . . . , Ai , . . . subconjuntos abertos e densos em Y.
\
Para provar que A = Ai é denso em Y, basta mostrar que B(x, δ) ∩ A 6= ∅ para todo x ∈ Y e
i∈N
todo δ > 0.
J. Delgado - K. Frensel 57
Análise
1 \
Como o raio ri da bola Bi é menor do que , i ≥ 2, temos que se a, b ∈ (Bi ∩ Y), então
i
i∈N
2 \
ka − bk ≤ para todo i ≥ 2, e, portanto, (Bi ∩ Y) = {a} é um conjunto unitário.
i
i∈N
Além disso, como Bi+1 ∩ Y ⊂ Ai ∩ Bi para todo i ∈ N, temos que a ∈ Ai para todo i ∈ N, e
a ∈ B1 .
\
Logo a ∈ A = Ai e a ∈ B1 , ou seja, A ∩ B1 6= ∅, como querı́amos provar.
i∈N
[
Corolário 11.7. Seja F ⊂ Rn fechado. Se F = Fi , onde cada Fi é fechado em F (e, portanto
i∈N
em Rn ), então existe i0 ∈ N tal que intF Fi0 6= ∅.
Prova.
Se intF Fi = ∅ para todo i ∈ N, temos, pelo teorema de Baire, que intF F = ∅, o que é uma
contradição, pois intF F = F.
Prova.
[
Como F = {xi }, F = {x1 , . . . , xi , . . .}, temos que F é uma reunião enumerável de conjuntos
i∈N
fechados. Então, pelo corolário 11.7, existe i0 ∈ N tal que intF {xi0 } 6= ∅.
R−Q dos números irracionais seria uma reunião enumerável de conjuntos fechados com interior
vazio em R, ou seja, R − Q seria magro em R.
Exemplo 11.6. O conjunto de Cantor K é fechado, sem pontos isolados e com interior vazio
(ver Curso de Análise, Vol. I de E. Lima). Logo K é magro e perfeito e, portanto, infinito não-
enumerável.
Observação 12.1.
• d(S, T ) = d(T, S) ;
• S ∩ T 6= ∅ =⇒ d(S, T ) = 0 ;
• S1 ⊂ S2 e T1 ⊂ T2 =⇒ d(S2 , T2 ) ≤ d(S1 , T1 ) .
Um caso particular de distância entre dois conjuntos ocorre quando um deles consiste de
um único ponto.
J. Delgado - K. Frensel 59
Análise
Observação 12.3.
• x ∈ T =⇒ d(x, T ) = 0 ;
• T1 ⊂ T2 =⇒ d(x, T2 ) ≤ d(x, T1 ) ;
Observação 12.4.
• d(x, T ) = 0 ⇐⇒ ∀ ε > 0 , ∃ y ∈ T tal que kx − yk < ε ⇐⇒ ∀ ε > 0 , ∃y ∈ T tal que
y ∈ B(x, ε) ⇐⇒ x ∈ T .
Prova.
Como S ⊂ S e T ⊂ T , temos que d(S, T ) ≤ d(S, T ).
Como kxk − yk k −→ kx − yk e d(S, T ) ≤ kxk − yk k para todo k ∈ N, temos que d(S, T ) ≤ kx − yk.
Logo d(S, T ) é uma cota inferior do conjunto { kx−yk | x ∈ S e y ∈ T } e, portanto d(S, T ) ≤ d(S, T ).
Prova.
Como d(K, F) = inf{ kx − yk | x ∈ K e y ∈ F } existem sequências (xk ) de pontos de K e (yk )
de pontos de F tais que d(K, F) = lim kxk − yk k.
k→∞
Como as sequências (xk ) e (kxk − yk k) são limitadas (pois os seus termos xk pertencerem ao
compacto K e (kxk − yk k) é uma sequência convergente) resulta da desigualdade
kyk k ≤ kyk − xk k + kxk k ,
que a sequência (yk ) também é limitada. Então existe N 0 ⊂ N infinito tal que lim0 xk = x0 e
k∈N
lim0 yk = y0 .
k∈N
Prova.
Seja F = Rn − U. Como F é fechado e F ∩ K = ∅, temos, pelo Teorema 12.2, que d(F, K) = δ > 0.
Em particular, se x ∈ K e y ∈ Rn são tais que kx − yk < δ, então, para todo t ∈ [0, 1], temos:
k(1 − t)x + ty − xk = kt(x − y)k ≤ kx − yk < δ ,
Prova.
Como S é compacto, T é fechado e d(S, T ) = d(S, T ), temos, pelo teorema 12.2, que existem
x0 ∈ S e y0 ∈ T tais que d(S, T ) = d(S, T ) = kx0 − y0 k.
Observação 12.6.
• Em geral, dados um conjunto fechado F ⊂ Rn e um ponto x ∈ Rn , podem existir muitos
pontos de F que estão a uma distância mı́nima do ponto x. Por exemplo, se F = S[a, r], então
d(a, F) = ka − xk para todo x ∈ F.
J. Delgado - K. Frensel 61
Análise
x0 + y0
De fato, sejam x0 , y0 ∈ F tais que d(x, F) = kx − x0 k = kx − y0 k. Então, tomando z0 = ,
2
temos que z0 ∈ F, pois F é convexo,
e, portanto,
x x x y
kx − x0 k kx − y0 k
d(x, F) ≤ kx − z0 k =
+ − 0 − 0
≤ + = d(x, F) ,
2 2 2 2 2 2
ou seja,
kx − x0 k kx − y0 k
d(x, F) = kx − z0 k = + .
2 2
Como a norma considerada em Rn provém de um produto interno, temos que x − x0 e x − y0
são LD e existe λ ≥ 0 tal que x − x0 = λ(x − y0 ) . Mas, como kx − x0 k = kx − y0 k , temos que
λ = 1 e, portanto, x0 = y0
Prova.
Pelo corolário 12.2, existem x0 , y0 ∈ T tais que
d(x, T ) = d(x, T ) = kx − x0 k e d(y, T ) = d(y, T ) = ky − y0 k.
Então,
• d(x, T ) = kx − x0 k ≤ kx − y0 k ≤ kx − yk + ky − y0 k = kx − yk + d(y, T ),
• d(y, T ) = ky − y0 k ≤ ky − x0 k ≤ ky − xk + kx − x0 k = ky − xk + d(x, T ),
Corolário 12.5. A função f : Rn −→ R definida por f(x) = d(x, T ) é uma contração fraca. Em
particular, f é uniformemente contı́nua.
Observe que f está bem definida, pois F ∩ G = ∅ =⇒ d(x, F) + d(x, G) > 0 para todo x ∈ Rn ,
uma vez que d(x, F) + d(x, G) = 0 ⇐⇒ d(x, G) = d(x, F) = 0 ⇐⇒ x ∈ F ∩ G.
Logo, A = f−1 ((−∞, 1/2)) e B = f−1 ((1/2, +∞)) são dois abertos disjuntos tais que F ⊂ A e
G ⊂ B.
Provamos, assim, que dados dois fechados disjuntos F, G ⊂ Rn , existem sempre dois abertos
disjuntos A, B ⊂ Rn tais que F ⊂ A e G ⊂ B.
Sendo T limitado, existe N 0 ⊂ N infinito tal que as subsequências (xk )k∈N 0 e (yk )k∈N 0 convergem.
Então lim0 xk = x0 ∈ T , lim0 yk = y0 ∈ T e diam(T ) = lim0 kxk − yk k = kx0 − y0 k.
k∈N k∈N k∈N
J. Delgado - K. Frensel 63
Análise
Prova.
Como T ⊂ T , temos que diam(T ) ≤ diam(T ).
Então existem sequências (xk ) e (yk ) de pontos de T tais que lim xk = x0 e lim yk = y0 .
Prova.
Como f(K) é um conjunto compacto contido no aberto U, existe, pelo corolário 12.3, ε > 0
tal que B(f(x), ε) ⊂ U para todo x ∈ K.
E, pela continuidade uniforme de f, existe δ > 0 tal que x, y ∈ K, kx−yk < δ =⇒ kf(x)−f(y)k < ε.
Logo f(T ) ⊂ B ⊂ U.
Definição 12.3. Dizemos que um número δ > 0 é número de Lebesgue de uma cobertura
[
X⊂ Cλ quando todo subconjunto de X com diâmetro < δ está contido em algum Cλ .
λ∈L
Observação 12.14. Uma cobertura, mesmo aberta e finita, pode não ter número de Lebes-
gue algum.
Por exemplo, R − {0} = (−∞, 0) ∪ (0, +∞) é uma cobertura aberta e finita de R − {0}. Dado δ > 0,
o conjunto {−δ/4, δ/4} tem diâmetro < δ, mas não está contido em (0, +∞) nem em (−∞, 0).
Logo não existe número de Lebesgue para tal cobertura.
[
Teorema 12.6. Se K ⊂ Rn é compacto, então toda cobertura aberta K ⊂ Aλ possui um
λ∈L
número de Lebesgue.
Prova.
1
Suponhamos, por absurdo, que para todo k ∈ N, exista um subconjunto Sk ⊂ K com diam Sk <
k
que não está contido em algum Aλ .
Para cada k ∈ N, tome xk ∈ Sk . Como xk ∈ K para todo k ∈ N, existe N 0 ⊂ N infinito tal que a
subsequência (xk )k∈N 0 converge para um ponto a ∈ K.
Logo existe λ0 ∈ L tal que a ∈ Aλ0 . Seja δ > 0 tal que B(a, δ) ⊂ Aλ0 e seja k0 ∈ N 0 tal que
1 δ δ
< e kxk0 − ak < .
k0 2 2
1 δ
Então y ∈ Sk0 =⇒ ky − ak ≤ ky − xk0 k + kxk0 − ak < + < δ =⇒ y ∈ B(a, δ) =⇒ y ∈ Aλ0 .
k0 2
Assim, Sk0 ⊂ Aλ0 , o que é uma contradição.
13 Conexidade
Exemplo 13.1. R − {0} = (−∞, 0) ∪ (0, +∞) é uma cisão não-trivial de R − {0}.
Definição 13.2. Dizemos que um conjunto X ⊂ Rn é conexo quando só admite a cisão trivial.
Ou seja, se X é conexo, X = A ∪ B, com A e B abertos disjuntos em X, então A = ∅ ou B = ∅.
Exemplo 13.3. Todo intervalo aberto da reta é conexo (ver Teorema 13.2). Em particular, R
é conexo.
Definição 13.3. Dizemos que X é desconexo, quando existir uma cisão não-trivial X = A ∪ B.
J. Delgado - K. Frensel 65
Análise
De fato, se x ∈ X, então {x} é aberto em X, pois existe δ > 0 tal que B(x, δ) ∩ X = {x}. Assim, todo
subconjunto de X é aberto em X, pois é reunião de seus pontos. Então, se A ⊂ X e ∅ 6= A 6= X,
X = A ∪ (X − B) é uma cisão não-trivial de X.
Observação 13.3. O conjunto Q dos números racionais não é discreto, mas X ⊂ Q é conexo
se, e só se, X possui um único elemento.
De fato, seja X ⊂ Q tal que a, b ∈ X, a < b, e seja ξ um número irracional entre a e b. Então,
X = ( (−∞, ξ) ∩ X ) ∪ ( (ξ, +∞) ∩ X )
Prova.
Se A ⊂ f(X) é aberto e fechado em f(X), então f−1 (A) é aberto e fechado em X. Pela co-
nexidade de X temos que f−1 (A) = ∅ ou f−1 (A) = X, e, portanto, A = ∅ ou A = f(X).
Prova.
(=⇒) Seja X ⊂ R conexo e sejam a, b ∈ X, a < b.
(⇐=) Seja I ⊂ R um intervalo.Suponhamos, por absurdo, que existe uma cisão não-trivial
I = A ∪ B de I.
Sejam a ∈ A, b ∈ B, a < b. Então [a, b] ⊂ I e [a, b] = (A ∩ [a, b]) ∪ (B ∩ [a, b]) é uma cisão
não-trivial de [a, b].
Como K = A ∩ [a, b] e L = B ∩ [a, b] são fechados no compacto [a, b], temos que K e L são
fechados em R e, portanto, compactos, pois K, L ⊂ [a, b].
Mas, como |x0 − c| < |x0 − y0 | e |y0 − c| < |x0 − y0 |, temos que c 6∈ K e c 6∈ L, e, portanto, c 6∈ [a, b],
uma contradição.
Como g(z) = −g(−z), temos, pelo Teorema do Valor Intermediário, que existe u ∈ S1 tal que
g(u) = 0, ou seja, f(u) = f(−u).
J. Delgado - K. Frensel 67
Análise
Prova.
Suponhamos, por absurdo, que C ∩ ∂X = ∅. Então X ∩ C é aberto em C, pois X ∩ C = (int X) ∩ C,
e (Rn − X) ∩ C é aberto em C, pois (Rn − X) ∩ C = int(Rn − X) ∩ C .
Prova.
Seja a ∈ Rn tal que a ∈ Cλ para todo λ ∈ L e seja C = A ∪ B uma cisão de C. Sem perda
de generalidade podemos supor a ∈ A.
Corolário 13.3. Um conjunto X ⊂ Rn é conexo se, e só se, para quaisquer a, b ∈ X, existe
um conjunto conexo Ca b ⊂ X tal que a, b ∈ Ca b .
Prova.
(=⇒) É evidente.
(⇐=) Seja a ∈ X fixo. Então, para todo x ∈ X existe um conjunto conexo Ca x ⊂ X tal que
[
a, x ∈ Ca x . Logo X = Ca x .
x∈X
Como os conjuntos Ca x são conexos e têm em comum o ponto a, temos, pelo Teorema 13.5,
que C é conexo.
Prova.
(=⇒) Se X × Y é conexo, temos que X e Y são conexos, pois as projeções π1 : X × Y −→ X e
π2 : X × Y −→ Y são contı́nuas, π1 (X × Y) = X e π2 (X × Y) = Y.
Em particular, toda bola aberta e toda bola fechada em Rn são conjuntos conexos.
Observação 13.8. A interseção de conjuntos conexos pode não ser um conjunto conexo.
Por exemplo, sejam G1 = {(x, x2 ) | x ∈ R} e G2 = {(x, x) | x ∈ R}. Como G1 é o gráfico da função
contı́nua f1 : R −→ R, f1 (x) = x2 , G2 é o gráfico da função contı́nua f2 : R −→ R, f2 (x) = x, e R
é conexo, temos que G1 e G2 são conexos, pois G1 e G2 são homeomorfos a R.
Prova.
Seja K = A ∪ B uma cisão. Como A e B são fechados em K e K é fechado em Rn , temos que A
e B são fechados em Rn , e, portanto, compactos disjuntos, pois A ⊂ K, B ⊂ K e A ∩ B = ∅.
J. Delgado - K. Frensel 69
Análise
Portanto, Ki0 = (Ki0 ∩ U) ∪ (Ki0 ∩ V) é uma cisão de Ki0 . Como Ki0 é conexo, temos que
Ki0 ∩ U = ∅ ou Ki0 ∩ V = ∅. Logo A = ∅ ou B = ∅, pois A ⊂ Ki0 ∩ U e B ⊂ Ki0 ∩ V. Ou seja, K
só possui a cisão trivial e, portanto, K é conexo.
Por exemplo, os conjuntos Fi = R × {0} ∪ R × {1} ∪ [i, +∞) × [0, 1], i = 1, 2, . . ., formam uma
sequência decrescente de conjuntos fechados conexos, pois R × {0}, R × {1} e [i, +∞) × [0, 1]
são produtos cartesianos de dois conjuntos conexos da reta, R × {0} e [i, +∞) × [0, 1] possuem
um ponto em comum e R × {0} ∪ [i, +∞) × [0, 1] e R × {1} possuem um ponto em comum.
Fig. 6: Conjuntos Fi
\
Mas, F = Fi = R × {0} ∪ R × {1} não é conexo, pois F = R × {0} ∪ R × {1} é uma cisão não trivial
de F, uma vez que R × {0} e R × {1} são fechados disjuntos em R2 e, portanto, em F.
Prova.
Seja A ⊂ Y aberto não-vazio em Y e seja a ∈ A.
Então existe δ > 0 tal que B(a, δ) ∩ Y ⊂ A. Como Y ⊂ X, temos que a ∈ X e, portanto,
B(a, δ) ∩ X 6= ∅. Logo A ∩ X 6= ∅.
Seja Y = A∪B uma cisão. Como A e B são abertos em Y e X ⊂ Y, temos que X = (X∩A)∪(X∩B)
é uma cisão de X. Logo X ∩ A = ∅ ou X ∩ B = ∅. Assim, pelo provado acima, A = ∅ ou B = ∅,
ou seja, Y só possui a cisão trivial e, portanto, é conexo.
Além disso, como Sn −{pN } (onde pN = (0, 0, . . . , 0, 1) é o pólo norte) é homeomorfo a Rn , através
da projeção estereográfica, temos que Sn − {pN } é um conjunto conexo. Sendo Sn − {pN } = Sn ,
pois Sn − {pN } ⊂ Sn − {pN } ⊂ Sn e pN é ponto de acumulação de Sn , temos, pelo corolário 13.5,
que a esfera Sn é conexa.
Observe que a esfera Snk k = {x ∈ Rn+1 | kxk = 1}, com respeito a qualquer norma k k de Rn+1 , é
x
também conexa, pois f : Sn −→ Snk k , dada por f(x) = é um homeomorfismo, uma vez que
kxk
y
f−1 : Snk k −→ Sn , dada por f−1 (y) = , é contı́nua, onde k k0 é a norma euclidiana.
kyk0
1
Exemplo 13.7. Seja a função contı́nua f : (0, 1] −→ R dada por f(x) = sen . Como o gráfico
1
x
de f, G(f) = x, sen x ∈ (0, 1] , é homeomorfo ao intervalo (0, 1], G(f) é conexo.
x
⊂ G(f)
De fato, G(f) ∪ I, pois se (x0 , y0 ) ∈ G(f), existe uma
1
sequência xk , sen de pontos de G(f) que converge a (x0 , y0 ).
xk
Logo x0 ∈ [0, 1] e y0 ∈ [−1, 1]. Se x0 ∈ (0, 1],temos que
1 1 1
sen −→ sen , ou seja (x0 , y0 ) = x0 , sen ∈ G(f) e,
xk x0 x0
se x0 = 0, (x0 , y0 ) ∈ I.
Seja, agora, y0 ∈ [−1, 1]. Então existe ξ0 ∈ [0, 2π) tal que
sen ξ0 = y0 .
1
Logo xk = é uma sequência em (0, 1] tal que
ξ0 + 2πk
1
xk , sen −→ (0, y0 ).
xk Fig. 7: G(f) se acumulando num segmento
Como G(f) é conexo, temos que G(f) é conexo e, também, para todo T ⊂ I, G(f) ∪ T é conexo.
Em particular, G(f) ∪ {(0, 0)} é conexo.
J. Delgado - K. Frensel 71
Análise
Este exemplo destoa da intuição, que nos sugere um conjunto conexo como aquele for-
mado por ”um só pedaço”. Daremos, por isso, uma noção mais ampla de conexidade.
Exemplo 13.8. Dados x, y ∈ Rn , o caminho f : [0, 1] −→ Rn , dado por f(t) = (1 − t)x + ty, é
chamado o caminho retilı́neo que liga x a y. Às vezes, vamos nos referir a ele como o caminho
[x, y].
Definição 13.5. Dizemos que a, b ∈ X podem ser ligados por um caminho em X quando
existe um caminho f : I −→ X tal que a, b ∈ f(I).
Exemplo 13.9. Se X ⊂ Rn é convexo, dois pontos quaisquer a, b ∈ X podem ser ligados pelo
caminho retilı́neo [a, b].
então h é contı́nua.
Definição 13.7. Dizemos que um conjunto X ⊂ Rn é conexo por caminhos quando dois pon-
tos quaisquer a, b ∈ X podem ser ligados por um caminho em X.
Seja t0 ∈ A, ou seja, t0 ∈ [0, 1] e α(t0 ) = 0. Como λ é contı́nua em t0 , existe δ > 0 tal que
t ∈ [0, 1] e |t − t0 | < δ =⇒ |λ(t)| = |λ(t) − λ(t0 )| < 1.
Logo α(J) é um intervalo que contém 0 = α(t0 ). Se α(J) não é degenerado, existe n ∈ N tal que
1
ξn = ∈ α(J) e, portanto, existe tn ∈ J tal que α(tn ) = ξn .
(2n + 1) π2
J. Delgado - K. Frensel 73
Análise
Assim, |λ(tn )| > 1, uma contradição. Portanto, α(J) = {0}, ou seja, α(t) = 0 para todo t ∈ J.
Como A é não-vazio, aberto e fechado em [0, 1] e [0, 1] é conexo, temos que A = [0, 1], ou seja,
α(t) = 0 para todo t ∈ [0, 1], e, portanto, λ(t) = (0, 0) para todo t ∈ [0, 1].
Então não existe um caminho em G(f) ∪ {(0, 0} que liga (0, 0) a um ponto do gráfico de f.
Teorema 13.8. Se A ⊂ Rn é aberto e conexo, então dois pontos quaisquer de A podem ser
ligados por um caminho poligonal contido em A.
Prova.
Seja a ∈ A fixo, e seja U o conjunto formado pelos pontos de A que podem ser ligados ao
ponto a por um caminho poligonal contido em A.
Então U é não-vazio, pois a ∈ U, já que f : [0, 1] −→ A, f(t) = a para todo t ∈ [0, 1], é um
caminho em A que liga o ponto a ao ponto a.
Afirmação: U é aberto.
Seja b ∈ U. Então existe um caminho poligonal que liga o ponto a ao ponto b. Como b ∈ U ⊂ A
e A é aberto, existe δ > 0 tal que B(b, δ) ⊂ A. Dado y ∈ B(b, δ), o caminho retilı́neo que liga b
a y está contido em B(b, δ), pois B(b, δ) é convexo. Logo todo ponto y ∈ B(b, δ) pode ser ligado
ao ponto a por meio de um caminho poligonal em A, ou seja, B(b, δ) ⊂ U.
Afirmação: A − U é aberto.
Seja c ∈ A − U e seja δ > 0 tal que B(c, δ) ⊂ A. Então todo ponto y ∈ B(c, δ) não pode ser
ligado ao ponto a por meio de um caminho poligonal, pois, caso contrário, c poderia ser ligado
ao ponto a, uma vez que o caminho retilı́neo que liga y a c está contido em B(c, δ) e, portanto,
em A. Logo B(c, δ) ⊂ A − U.
Observação 13.15. No enunciado acima, podemos trocar caminhos poligonais por cami-
nhos poligonais formados por segmentos paralelos aos eixos coordenados. Para tanto, basta
verificar que isso é possı́vel para quaisquer dois pontos x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ) per-
tencentes à bola aberta B(a, δ) = (a1 −δ, a1 +δ)×. . .×(an −δ, an +δ) de centro a = (a1 , . . . , an )
De fato, como [xi , yi ] ⊂ (ai − δ, ai + δ) para todo i = 1, . . . n, temos que o caminho formado pela
justaposição dos caminhos retilı́neos
[(x1 , x2 , . . . xn ), (y1 , x2 , . . . , xn )] , [(y1 , x2 , . . . , xn ), (y1 , y2 , x3 , . . . , xn )] ,
. . . , [(y1 , y2 , . . . , yn−1 , xn ), (y1 , y2 , . . . , yn−1 , yn )] ,
é um caminho poligonal em B(a, δ), formado por segmentos paralelos aos eixos coordenados,
que liga o ponto x = (x1 , . . . , xn ) ao ponto y = (y1 , . . . , yn ) .
Corolário 13.6. Um aberto A ⊂ Rn é conexo se, e só se, é conexo por caminhos.
Para afirmar que X e Y são homeomorfos é necessário definir um homeomorfismo entre eles.
Para garantir que X e Y não são homeomorfos, deve-se lançar mão de invariantes topológicos
como a compacidade e a conexidade.
2 y2
2 x
Exemplo 13.10. Sejam C = {(x, y) ∈ R | x +y = 1} um cı́rculo, E = (x, y) ∈ R 2 + 2 = 1
2 2 2
a b
x2 y 2
uma elipse, H = (x, y) ∈ R2 2 − 2 = 1 uma hipérbole e P = {(x, y) ∈ R2 | y = px2 } uma
c d
parábola.
Exemplo 13.11. O intervalo fechado X = [a, b], a < b e a bola fechada Y = B[c, r] ⊂ R2 não
são homeomorfos, apesar de ambos serem compactos e conexos.
De fato, se x ∈ (a, b), então X − {x} = (X ∩ (−∞, x)) ∪ (X ∩ (x, +∞)) é desconexo, mas se
y ∈ B(c, r), B[c, r] − {y} continua sendo conexo, pois se:
s s
onde zs = 1 − c+ z0 ∈ S[c, s], é uma reunião de conexos, S[c, s] ∪ [zs , z0 ], s ∈ (0, r], que
r r
possuem em comum o ponto z0
J. Delgado - K. Frensel 75
Análise
Fig. 9: B[c, r] − {c} como reunião de conjuntos conexos com um ponto em comum
r
• y 6= c e y0 = (1 − t0 )c + t0 y, t0 = − , temos que
ky − ck
[
B[c, r] − {y} = ( S[c, s] ∪ [c, y0 ] ) ∪ ( (S[c, s0 ] − {y}) ∪ [c, y0 ] ) ,
s ∈ [0, r]
s 6= s0
onde s0 = ky − ck, é uma reunião de conjuntos conexos que possuem o ponto c em comum.
Fig. 10: B[c, r] − {y} como reunião de conjuntos conexos com um ponto em comum
Logo, se existisse um homeomorfismo f : [a, b] −→ B[c, r], terı́amos que [a, b] − {d}, a < d <
b, e B[c, r] − {f(d)} seriam homeomorfos, uma contradição, já que [a, b] − {d} é desconexo e
B[c, r] − {f(d)} é conexo.
É verdade que uma bola em Rm só é homeomorfa a uma bola em Rn quando m = n. Mas
a demonstração desse fato requer o uso de invariantes topológicos mais elaborados, que são
estudados na Topologia Algébrica ou na Topologia Diferencial.
(0, 0) faz com que o conjunto X − {(0, 0)} tenha quatro ”pedaços” conexos.
Fig. 11: X − {(0, 0)} tem 4 pedaços, enquanto Y − {a} tem apenas 2 pedaços
De fato, dado um subconjunto conexo C de X que contém o ponto x, temos que C ⊂ Cx , pois Cx
é a reunião de todos os subconjuntos conexos de X que contém x.
Por outro lado, pelo teorema 13.5, Cx é conexo, pois é uma reunião de conjuntos conexos que
possuem um ponto em comum.
Mais ainda, se C ⊂ X é conexo e tem algum ponto em comum com Cx então C ⊂ Cx , pois C ∪ Cx
é um conjunto conexo que contém x e, portanto, C ∪ Cx ⊂ Cx , ou seja, C ⊂ Cx .
J. Delgado - K. Frensel 77
Análise
Então existe δ > 0 tal que B(y0 , δ) ⊂ U. Como B(y0 , δ) ∪ Cx0 é conexo e contém o ponto x0 ,
temos que B(y0 , δ) ∪ Cx0 ⊂ Cx0 , ou seja, B(y0 , δ) ⊂ Cx0 . Logo Cx0 é aberto em Rn .
De fato, seja Dy a componente conexa de y em Y. Como, pelo Teorema 13.1, h(Cx ) é conexo
e contém y, temos que h(Cx ) ⊂ Dy . Por outro lado, como h−1 (Dy ) é um conjunto conexo que
contém x, então h−1 (Dy ) ⊂ Cx , ou seja, Dy ⊂ h(Cx ). Logo Dy = h(Cx ).
De fato: se A, B ∈ L(Rm , Rn ) e λ ∈ R,
(1) kλ Ak = sup { k(λA)(x)k2 | x ∈ Rm ; kxk1 = 1 } = sup { |λ| kA(x)k2 | x ∈ Rm ; kxk1 = 1 }
= |λ| sup { kA(x)k2 | x ∈ Rm ; kxk1 = 1 } = |λ| kAk .
(II) kABk ≤ kAk kBk, se A ∈ L(Rm , Rn ) e B ∈ L(Rk , Rm ), onde a norma em Rm deve ser
tomada a mesma.
Observação 14.1. Como duas normas no espaço vetorial L(Rm , Rn ) = Rmn são equivalen-
tes, temos que se Ak ∈ L(Rm , Rn ), k ∈ N, e A ∈ L(Rm , Rn ), então kAk −Ak −→ 0 ⇐⇒ akij −→ aij
para i = 1, . . . , n, j = 1, . . . , m, onde Ak = (akij ) e A = (aij ).
J. Delgado - K. Frensel 79
Análise
X X
! !
m m
kA(x)kM = max aij xj ≤ max |aij xj |
1≤i≤n 1≤i≤n
j=1 j=1
X m
!
≤ max |aij | ,
1≤i≤n
j=1
X X
m m
!
Seja i0 = 1, . . . , n tal que |ai0 j | = max |aij | , e seja x0 = (x01 , . . . , x0m ) ∈ Rm tal que
1≤i≤n
j=1 j=1
x0j = 1 se ai0 j > 0, e x0j = −1 se ai0 j ≤ 0.
Então kxkM = 1 e
X X X
!
m m m
kA(x0 )kM = max 0
aij xj ≥ 0
ai0 j xj = |ai0 j | ≥ kAk .
1≤i≤n
j=1 j=1 j=1
Logo,
X
m
0
kA(x )kM ≤ kAk ≤ |ai0 j | ≤ kA(x0 )kM ,
j=1
ou seja,
X X
m m
!
kAk = |ai0 j | = max |aij | .
1≤i≤n
j=1 j=1
m n
• Para outras escolhas de normas em R e R , veja a tabela da página 66 do livro Curso de
Análise, Vol II de E. Lima.
1 Caminhos diferenciáveis
Nota: Neste capı́tulo, os
Definição 1.1. Um caminho em Rn é uma aplicação f : I −→ Rn defi- caminhos não serão por
definição, contı́nuos. Mas,
nida num intervalo I ⊂ R. Se f(t) = (f1 (t), . . . , fn (t)), t ∈ I, as n funções
a partir do próximo capı́tulo,
fi : I −→ R são chamadas as funções coordenadas de f. os caminhos voltarão a ser
contı́nuos.
Observação 1.1. f = (f1 , . . . , fn ) : I −→ R é contı́nua no ponto a ∈ I ⇐⇒ fi : I −→ R é
n
Assim, podemos provar que se a ∈ X±0 , então lim± f(x) = b = (b1 , . . . , bn ) se, e só se,
x→a
lim± fi (x) = bi , para todo i = 1, . . . , n.
x→a
83
Análise
f(a + t) − f(a)
f 0 (a) = lim .
t→0 t
quando tal limite existe. A norma kf 0 (a)k chama-se velocidade escalar de f no ponto a.
• Quando f possui vetor velocidade no ponto a ∈ I, dizemos que f é diferenciável nesse ponto.
E se existe f 0 (a) para todo a ∈ I, dizemos que f é um caminho diferenciável.
• Quando f 0 (a) 6= 0, o vetor velocidade f 0 (a) determina a reta L = { f(a) + t f 0 (a) | t ∈ R }, cha-
mada reta tangente à curva f no ponto a.
f(a + t) − f(a)
Observação 1.4. A diferenciabilidade de f no ponto a ∈ I e o limite lim inde-
t→0 t
pendem da norma considerada em Rn .
Observação 1.6.
• Um caminho f : I −→ Rn é diferenciável no ponto a ∈ I se, e só se, existe um vetor v ∈ Rn tal
que, para a + t ∈ I, temos
f(a + t) = f(a) + t v + r(t) ,
r(t)
onde lim = 0. Neste caso, v = f 0 (a).
t→0 t
r(t)
Basta por ρ(t) = , se t 6= 0, e ρ(0) = 0.
t
Observação 1.7. Se I = [a, b), só podemos definir a derivada lateral de f à direita no ponto
a:
f(a + t) − f(a)
f 0 (a+ ) = lim+ .
t→0 t
E se I = (a, b], só podemos definir a derivada lateral de f à esquerda no ponto b:
f(b + t) − f(b)
f 0 (b− ) = lim− .
t→0 t
Exemplo 1.2. Seja g : R −→ R2 o caminho dado por g(t) = (t, |t|). Então g 0 (t) = (1, 1), para
todo t > 0 e g 0 (t) = (1, −1), para todo t < 0.
h 0 (t) = (3t2 , 3t2 ), t > 0, h 0 (t) = (3t2 , −3t2 ), t < 0 e h 0 (0) = (0, 0), pois h 0 (0+ ) = h 0 (0− ) = (0, 0).
Ou seja, para descrever a rota h(R), o ponto, cuja posição no tempo t é h(t), precisou dar uma
parada instantânea ao atingir o ponto anguloso (0, 0) de sua trajetória (ver exercı́cio 1.15).
J. Delgado - K. Frensel 85
Análise
As propriedades acima seguem das propriedades usuais da derivada de uma função real
de uma variável real aplicadas às funções coordenadas de um caminho diferenciável.
Observação 1.9. Se uma norma k k não provém de um produto interno, podemos ter um
caminho diferenciável f : I −→ Rn , com f(t) 6= 0 para todo t ∈ I, para o qual a função
ϕ(t) = kf(t)k não é diferenciável.
Por exemplo, seja f : R −→ R2 o caminho diferenciável dado por f(t) = (1, t). Considerando a
norma do máximo em R2 , temos que kf(t)kM = 1, se |t| ≤ 1 e kf(t)kM = |t|, se |t| ≥ 1. Logo a
função t 7−→ kf(t)kM não possui derivada nos pontos t = −1 e t = 1.
Observação 1.10. Sempre que tomarmos a derivada de kf(t)k estaremos considerando que
k k provém de um produto interno h , i.
De fato, kf(t)k = a para todo t ∈ I ⇐⇒ hf(t), f(t)i = a2 para todo t ∈ I ⇐⇒ 2hf(t), f 0 (t)i = 0
para todo t ∈ I ⇐⇒ f(t) ⊥ f 0 (t) para todo t ∈ I.
Exemplo 1.3. Seja o caminho diferenciável f : R −→ R2 dado por f(t) = (cos t, sen t). Então
kf(t)k = 1 para todo t ∈ R e f 0 (t) = (− sen t, cos t) é perpendicular a f(t) para todo t ∈ R.
Se existe f 00 (t) para todo t ∈ I, dizemos que f é duas vezes diferenciável. E se f 00 é contı́nua,
dizemos que f é de classe C2 .
Por extensão, dizemos que um caminho contı́nuo é de classe C0 e que f = f(0) é sua própria
derivada de ordem zero.
Observação 1.12. Seja 0 ≤ p ≤ ∞. Então f = (f1 , . . . , fn ) ∈ Cp (é de classe Cp ) se, e só se,
fi ∈ Cp para todo i = 1, . . . , n.
Definição 1.5. Seja p > 0. Dizemos que o caminho f : I −→ Rn é de classe Cp por partes
quando f é contı́nua e existem t1 < . . . < tk pertencentes ao interior do intervalo I tais que
f|I∩(−∞,t1 ] , f|[t1 ,t2 ] , . . . , f|[tk−1 ,tk ] , f|I∩[tk ,+∞)
são de classe Cp .
Exemplo 1.4. Para todo p > 0, considere o caminho f : R −→ Rn dado por f(t) = (tp+1 , tp |t|).
Como tp |t| = tp+1 para t ≥ 0 e tp |t| = −tp+1 para t ≤ 0, podemos provar, por indução, que f é
de classe Cp , onde f(p) (t) = ((p + 1)! t, −(p + 1)! t), para t ≤ 0, f(p) (t) = ((p + 1)! t, (p + 1)! t)
para t ≥ 0, e f(p) (0) = (0, 0).
Entretanto f não é p + 1 vezes diferenciável no ponto t = 0, pois f(p+1) (0+ ) = ((p + 1)!, (p + 1)!)
e f(p+1) (0− ) = ((p + 1)!, −(p + 1)!) .
J. Delgado - K. Frensel 87
Análise
2 Integral de um caminho
Uma partição pontilhada é um par P ? = (P, ξ), onde P é uma partição e ξ = (ξ1 , . . . , ξk ) é tal
que ti−1 ≤ ξi ≤ ti para todo i = 1, . . . , k.
Observação 2.1. O caminho limitado f = (f1 , . . . , fn ) é integrável se, e só se, fi : [a, b] −→ R
é integrável para todo i = 1, . . . , n. Neste
Z caso,
Zb b Zb
f(t) dt = f1 (t) dt, . . . , fn (t) dt .
a a a
Observação 2.2. Se f : [a, b] −→ Rn é integrável e c ∈ [a, b], então f|[a,c] e f|[c,b] são in-
tegráveis e
Zb Zc Zb
f(t) dt = f(t) dt + f(t) dt .
a a c
Como fi é integrável se, e só se, Di tem medida nula, temos que f é integrável se, e só se, D
tem medida nula.
Zb
Observação 2.4. A integrabilidade de f e o valor f(t) dt não dependem da norma consi-
a
derada em Rn .
Além disso,
Zb
Zb
f(t) dt
≤ kfk(t) dt .
a a
X
De fato, dada qualquer partição pontilhada (f; P ? ), temos que:
X
X
X X
n n
?
(f; P )
=
(ti − ti−1 ) f(ξi )
≤ (ti − ti−1 ) kf(ξi )k = (kfk, P ? ) .
i=1 i=1
Logo,
Zb Zb
X
X X
?
?
?
f(t) dt
=
lim (f; P )
= lim
(f; P )
≤ lim (kfk; P ) = kf(t)k dt .
|P|→0 |P|→0 |P|→0
a a
J. Delgado - K. Frensel 89
Análise
Regra da cadeia
• Basta aplicar a regra da cadeia em cada uma das funções coordenadas fi ◦ ϕ do caminho
f ◦ ϕ.
Observação 3.1. A função composta t 7−→ f(ϕ(t)) pode ser interpretada como uma mudança
de variável no caminho f, que equivale a descrever o mesmo percurso de outra maneira, sendo
o vetor velocidade (f◦ϕ) 0 (a) = ϕ 0 (a)f 0 (ϕ(a)) no ponto a um múltiplo escalar do vetor velocidade
de f no ponto ϕ(a).
Seja M > 0 tal que kf(t)k ≤ M para todo t ∈ [a, b]. Então, pela observação 2.6,
Zx Zy
Z x
kF(x) − F(y)k =
f(t) dt − f(t) dt
=
f(t) dt
≤ M kx − yk ,
a a y
Seja f : [a, a + h] −→ Rn um caminho p vezes diferenciável no intervalo [a, a + h], com f(p)
integrável. Então,
hp−1
f(a + h) = f(a) + f 0 (a) h + . . . + f(p−1) (a) + rp ,
(p − 1)!
onde Z1 Z a+h
hp p−1 (p) 1
rp = (1 − t) f (a + th) dt = (a + h − x)p−1 f(p) (x) dx .
(p − 1)! 0 (p − 1)! a
J. Delgado - K. Frensel 91
Análise
Realmente:
• Um caminho f é uniformemente diferenciável na norma do máximo se, e só se, cada uma de
suas funções coordenadas fi é uniformemente diferenciável;
• Uma função fi : [a, b] −→ R é uniformemente diferenciável se, e só se, fi é de classe C1 (ver
Curso de Análise, Vol. I de E. Lima, pag. 277).
Observação 3.2. O Teorema do Valor Médio não vale para caminhos diferenciáveis em Rn ,
n > 1.
Por exemplo, seja f : [0, 2π] −→ R2 o caminho diferenciável dado por f(t) = (cos t, sen t).
Como f(2π) − f(0) = (0, 0) e |f 0 (t)| = 1 para todo t ∈ [0, 2π], não existe c ∈ (0, 2π) tal que
f(2π) − f(0) = 2π f 0 (c).
1a Demonstração: Suponhamos que, além das hipóteses acima, f 0 é integrável em cada su-
bintervalo compacto [c, d] ⊂ (a, b).
Como f é contı́nua em [a, b], e existem sequências (ck ) e (dk ) tais que a < ck < dk < b, com
lim ck = a e lim dk = b, temos que
kf(b) − f(a)k = lim kf(ck ) − f(dk )k ≤ M lim |ck − dk | = M |b − a| ,
k→∞ k→∞
Seja ϕ : [a, b] −→ R a função real dada por ϕ(t) = hf(t), f(b) − f(a)i. Então ϕ é contı́nua em
[a, b], diferenciável em (a, b) e ϕ 0 (t) = hf 0 (t), f(b) − f(a)i para todo t ∈ (a, b).
Logo, pelo Teorema do Valor Médio para funções reais, existe c ∈ (a, b) tal que
ϕ(b) − ϕ(a) = (b − a) hf 0 (c), f(b) − f(a)i.
ou seja,
kf(b) − f(a)k ≤ M (b − a) .
Prova.
Sejam N 0 = {k ∈ N | ak = c}, N 00 = {k ∈ N | bk = c} e N 000 = {k ∈ N | k ∈ N | ak < c < bk }.
Então N = N 0 ∪ N 00 ∪ N 000 e N 0 , N 00 , N 000 são dois a dois disjuntos.
J. Delgado - K. Frensel 93
Análise
f(ak ) − f(c) f(bk ) − f(c)
Assim, como e convergem para f 0 (c) e (tk ), (1 − tk )
ak − c k∈N 000
b k − c
k∈N 000
f(bk ) − f(ak )
são sequências limitadas, temos que converge para f 0 (c).
bk − ak k∈N 000
Prova.
Suponhamos que f e g são diferenciáveis no intervalo fechado [a, b] e admitamos que
kf(b) − f(a)k > ϕ(b) − ϕ(a).
Dividindo o intervalo [a, b] ao meio, em pelo menos em uma das metades, digamos, [a1 , b1 ],
temos que
Analogamente, em pelo menos uma das metades [a2 , b2 ] de [a1 , b1 ] temos que
kf(b2 ) − f(a2 )k > A(ϕ(b2 ) − ϕ(a2 )).
tais que
b−a
bk − ak = e kf(bk ) − f(ak )k > A (ϕ(bk ) − ϕ(ak )) , para todo k ∈ N.
2k
Além disso, as sequências (ak ) e (bk ) convergem para um mesmo ponto c ∈ [a, b], pois (ak ) é
não-decrescente limitada, (bk ) é não-crescente limitada e (bk − ak ) −→ 0.
Como ϕ e f são contı́nuas em [a, b] e existem sequências (ck ) e (dk ) de pontos de (a, b) tais
que ck < dk , lim ck = a e lim dk = b, temos que
kf(b) − f(a)k = lim kf(dk ) − f(ck )k ≤ lim (ϕ(dk ) − ϕ(ck )) = ϕ(b) − ϕ(a)
k→∞ k→∞
Prova.
1
Sejam x ∈ (a, b] e n ∈ N. Como kf 0 (t)k ≤ para todo t ∈ (a, b), temos, pelo Teorema do
n
1
Valor Médio, que kf(x) − f(a)k ≤ kx − ak. Então,
n
1
kf(x) − f(a)k ≤ kx − ak lim = 0,
n→∞ n
Observação 3.3. O corolário acima também pode ser demonstrado aplicando-se a cada
função coordenada fi de f o resultado análogo para funções reais.
J. Delgado - K. Frensel 95
Análise
4 Caminhos retificáveis
Definição 4.1. Sejam P e Q partições do intervalo [a, b]. Dizemos que Q é mais fina que P
quando P ⊂ Q.
Prova.
Suponhamos, primeiro, que Q = P ∪ {r}, onde ti−1 < r < ti . Então,
Como kf(ti ) − f(ti−1 )k ≤ kf(ti ) − f(r)k + kf(r) − f(ti−1 )k, temos que `(f; Q) ≥ `(f; P).
(2) Dado ε > 0, existe uma partição P de [a, b] tal que `(f; P) > `(f) − ε.
Logo,
kf(t)k ≤ kf(t) − f(a)k + kf(a)k ≤ `(f) + kf(a)k
Prova.
Como sup `(f; P) ≥ `(f; P) para toda partição P de [a, b], temos que
P
sup `(f; Q) ≤ sup `(f; P) .
Q⊃P0 P
Por outro lado, dada uma partição P, temos que Q 0 = P ∪ P0 é uma partição mais fina do que
P e P0 . Logo, pelo teorema 4.1,
ou seja, sup `(f; Q) é uma cota superior do conjunto { `(f; P) | P é partição de [a, b]}.
Q⊃P0
Assim, sup `(f; P) ≤ sup `(f; Q} e. portanto, sup `(f; P) = sup `(f; Q) .
P Q⊃P0 P Q⊃P0
Teorema 4.2. Seja c ∈ [a, b]. Então o caminho f : [a, b] −→ Rn é retificável se, e só se, suas
restrições f1 = f|[a,c] e f2 = f|[c,b] são retificáveis. Neste caso, `(f) = `(f1 ) + `(f2 ).
Prova.
Suponhamos que f é retificável.
Seja P2 uma partição de [c, b] fixa e seja P1 uma partição de [a, c]. Então P = P1 ∪ P2 é uma
partição de [a, b] e `(f; P) = `(f1 ; P1 ) + `(f2 ; P2 ) .
J. Delgado - K. Frensel 97
Análise
Logo,
`(f1 ; P1 ) = `(f; P) − `(f2 ; P2 ) ≤ `(f) − `(f2 ; P2 ) ,
e, portanto, f1 é retificável e
`(f1 ) ≤ `(f) − `(f2 ; P2 ) .
Além disso, como `(f2 ; P2 ) ≤ `(f) − `(f1 ) para toda partição P2 de [c, b], temos que f2 é retificável
e `(f2 ) ≤ `(f) − `(f1 ), ou seja, `(f1 ) + `(f2 ) ≤ `(f).
Suponhamos agora que f1 e f2 são retificáveis. Dada uma partição P de [a, b] que contém c,
temos que P = P1 ∪ P2 , onde P1 é uma partição de [a, c] e P2 é uma partição de [c, b].
Como `(f; P) = `(f1 ; P1 ) + `(f2 ; P2 ) ≤ `(f1 ) + `(f2 ) e, pelo lema anterior, sup `(f; Q) = sup `(f; Q),
Q c∈Q
temos que f é retificável e `(f) ≤ `(f1 ) + `(f2 ).
Provamos, assim, que f é retificável se, e só se, f1 e f2 são retificáveis, e, neste caso,
`(f) = `(f1 ) + `(f2 ).
Observação 4.3.
• Seja f : [0, 1] −→ Rn o caminho retilı́neo f(t) = (1 − t) A + t B, com A, B ∈ Rn , e seja
P = {t0 = 0 < t1 < . . . < tk = 1} uma partição de [0, 1]. Como
kf(ti ) − f(ti−1 )k = k [ (1 − ti )A + ti B ] − [ (1 − ti−1 )A + ti−1 B ] k
= k (ti − ti−1 ) (B − A) k = (ti − ti−1 ) kB − Ak ,
para todo i = 0, . . . , k, temos que
X
k X
k
`(f; P) = kf(ti ) − f(ti−1 )k = kB − Ak (ti − ti−1 ) = kB − Ak .
i=1 i=1
• Se `(f) = kB − Ak e a norma de Rn provém de um produto interno, então f([a, b]) ⊂ [A, B].
De fato, suponhamos que existe C ∈ f([a, b]) tal que C 6∈ [A, B] e seja c ∈ [a, b] tal que f(c) = C.
Como C 6∈ [A, B], temos que B − C não é múltiplo positivo de C − A, pois, caso contrário, existiria
λ > 0 tal que
λ 1
B − C = λ(C − A) =⇒ λC + C = B + λA =⇒ (1 + λ)C = λA + B =⇒ C = A+ B,
1+λ 1+λ
1
uma contradição, uma vez que C = (1 − t)A + tB, onde t = ∈ (0, 1).
1+λ
Logo, como a norma k k provém de um produto interno, kB − Ck + kC − Ak > kB − Ak.
De fato, consideremos a aplicação g : [0, 1] −→ [A, B] dada por g(t) = (1−t) A+t B . A aplicação
g é contı́nua, sobrejetora e injetora, e sua inversa g−1 : [A, B] −→ [0, 1], dada por
kx − Ak
g−1 (x) = ,
kB − Ak
também é contı́nua.
Logo a função g−1 ◦ f : [a, b] −→ [0, 1] é contı́nua e, portanto, g−1 (f[a, b]) é um intervalo contido
no intervalo [0, 1] que contém os extremos 0 e 1, uma vez que f(a) = A e f(b) = B.
Assim, g−1 (f([a, b])) = [0, 1], ou seja, f([a, b]) = g([0, 1]) = [A, B].
Portanto, `(f) = 2 = k(0, 1) − (−1, 0)kS = kf(2) − f(0)kS , apesar de f([a, b]) não estar contido
num segmento de reta.
Observação 4.5. Ser ou não ser retificável é uma propriedade do caminho f que não de-
pende da norma tomada em Rn , uma vez que duas normas quaisquer em Rn são equivalentes,
mas o comprimento `(f) depende da norma. Por exemplo, o segmento de reta que liga os pontos
J. Delgado - K. Frensel 99
Análise
Observação 4.6. Se f : [a, b] −→ Rn é um caminho poligonal, temos, pelo teorema 4.2, que
`(f) é a soma dos comprimentos dos segmentos de reta que o compõem. Em particular, para
X
k
toda partição P = {t0 = a < t1 < . . . < tk = b} de [a, b], `(f; P) = kf(ti ) − f(ti−1 )k é,
i=1
realmente, o comprimento da poligonal inscrita em f, com vértices nos pontos f(ti ), i = 0, . . . , k.
(t, 0) se t 6= 1
Exemplo 4.1. O caminho f : [0, 2] −→ R2 dado por f(t) = é descontı́nuo,
(1, 1) se t = 1
mas é retificável e `(f) = 4, considerando R2 com a norma euclidiana.
Assim, `(f) = 4 .
Teorema 4.3. O caminho f : [a, b] −→ Rn é retificável se, e só se, cada uma de suas funções
coordenadas fi : [a, b] −→ R, i = 1, . . . , n é retificável, ou seja, tem variação limitada.
Prova.
Como ser ou não ser retificável independe da norma, podemos tomar em Rn a norma da soma.
Logo,
X
n
`(f; P) = `(fi ; P) .
i=1
para toda partição P de [a, b] e todo i = 1, . . . , n. Então fi tem variação limitada para todo
i = 1, . . . , n.
De fato, suponhamos que f é não-decrescente. Dada P = {t0 = a < t1 < . . . < tk = b} uma
partição de [a, b], temos que
Xk X
k
`(f, P) = |f(ti ) − f(ti−1 )| = ( f(ti ) − f(ti−1 ) ) = f(b) − f(a) .
i=1 i=1
“ ” “ ”
Fig. 7: Caminho h(t) = t, t sen 1t Fig. 8: Caminho ξ(t) = t cos 1t , t sen 1
t
Neste exemplo, quando t −→ 0, o ponto ξ(t) tende para a origem (0, 0) dando infinitas voltas
em torno dela.
Observação 4.8. No exemplo 4.1, vimos que um caminho descontı́nuo pode ser retificável,
mas, como veremos abaixo, a descontinuidade de um caminho retificável f : [a, b] −→ Rn num
ponto c ∈ [a, b] não pode ser arbitrária.
Teorema 4.4. Seja f : [a, b] −→ Rn um caminho tal que, para cada c ∈ [a, b), a restrição f|[a,c]
é retificável. Se existe K > 0 tal que `(f|[a,c] ) ≤ K para todo c ∈ [a, b), então existe lim− f(t).
t→b
n
Analogamente, dado f : (a, b] −→ R tal que f|[c,b] é retificável para todo c ∈ (a, b], com
`(f|[c,b] ) ≤ K seja qual for c ∈ (a, b], então existe lim+ f(t).
t→a
Prova.
Vamos provar apenas o primeiro resultado, pois o outro demonstra-se de modo análogo.
Seja t1 < t2 < . . . < tk < . . . uma sequência crescente em [a, b) tal que lim tk = b.
k→∞
X
k
Então, para todo k ∈ N, kf(ti ) − f(ti−1 )k ≤ K, pois P = {a, t1 , . . . , tk } é uma partição de [a, c],
i=2
com c = tk .
X
Logo a série de números reais kf(ti ) − f(ti−1 )k é convergente, pois a sequência de suas
i≥2
reduzidas é não-decrescente e limitada superiormente por K. Assim, a sequência das reduzidas
X
da série de vetores ( f(ti ) − f(ti−1 ) ) é de Cauchy e, portanto, convergente.
i≥2
Como a reduzida de ordem k − 1 desta série é f(tk ) − f(t1 ), temos que existe lim f(tk ). Sendo a
k→∞
sequência crescente tk −→ b arbitrária, segue, pela Observação 8.4 do Capı́tulo 1, que o limite
lim f(t) existe.
t→b−
Corolário 4.2. Seja f : [a, b] −→ Rn um caminho retificável. Então existem os limites laterais
lim f(t) (se c 6= a) e lim+ f(t) (se c 6= b).
t→c− t→c
Definição 4.3. Dizemos que um caminho f : [a, b] −→ Rn é regulado se, para todo c ∈ [a, b],
existem os limites laterais f(c− ) = lim− f(t) (se c 6= a) e f(c+ ) = lim+ f(t) (se c 6= b), ou seja, se
t→c t→c
f só possui descontinuidade de 1a espécie.
Definição 4.4. Dizemos que um caminho f : [a, b] −→ Rn é bem regulado quando ele é
regulado e, para todo c ∈ (a, b),
kf(c+ ) − f(c− )k = kf(c+ ) − f(c)k + kf(c) − f(c− )k .
se, e só se, f(c) pertence ao segmento de reta cujos extremos são f(c− ) e f(c+ ).
Mas, para uma norma arbitrária, podemos apenas afirmar que se f(c) ∈ [f(c− ), f(c+ )] para todo
c ∈ (a, b), então f é bem regulado.
Observação 4.12. Um caminho f : [a, b] −→ Rn regulado é bem regulado se, e só se, para
todo c ∈ (a, b), tem-se
lim ( kf(t) − f(c)k + kf(c) − f(s)k − kf(t) − f(s)k ) = 0 .
t → c+
s → c−
Neste exemplo, não existe lim `(f; P), pois, se a partição P não contém o ponto 1, temos que
|P|→0
`(f; P) = 2, enquanto que, para partições Q que contém 1, temos lim `(f; Q) = 4 .
|Q|→0
Prova.
(1)=⇒(2) Dado ε > 0 existe uma partição P0 = {t0 = a, t1 , . . . , tk = b} de [a, b] tal que
ε
L− < `(f; P0 ) ≤ L.
2
Seja 0 < δ < min { (ti − ti−1 ) } tal que
1≤i≤k
ε
ti − δ < s < ti < t < ti + δ =⇒ kf(t) − f(ti )k + kf(ti ) − f(s)k − kf(t) − f(s)k < ,
2k
para todo i = 1, . . . , k − 1 .
Observe que se |P| < δ, então existe no máximo um ti no interior de seus subintervalos, pois
0 < δ < min {ti − ti−1 }.
1≤i≤k
Logo se |P| < δ, então ti − δ < s < ti < t < ti + δ, para todo intervalo [s, t] de P que contém
ε(k − 1) ε
algum ti em seu interior, e, portanto, 0 ≤ `(f; P ∪ P0 ) − `(f; P) < < .
2k 2
Assim,
ε
L ≥ `(f; P) ≥ `(f; P ∪ P0 ) − > L − ε.
2
(2)=⇒(1) Dado ε > 0, existe δ > 0 tal que
|P| < δ =⇒ L − ε < `(f; P) < L + ε .
Logo, como sup {`(f; P)} = sup{`(f; P)}, temos que f é retificável e L − ε < `(f) ≤ L + ε para todo
P⊃P0 P
ε > 0.
Dado c ∈ (a, b), seja Qk uma sequência de partições com lim |Qk | = 0 e c 6∈ Qk .
k→∞
Corolário 4.3. Seja f : [a, b] −→ Rn um caminho contı́nuo. Então f é retificável com compri-
mento L se, e só se, lim `(f; P) = L.
|P|→0
para s, t ∈ [a, b] quaisquer. Dada uma partição P = {t0 , t1 , . . . , tk } de [a, b], temos
X
k X
`(f; P) = kf(ti ) − f(ti−1 )k ≤ K (ti − ti−1 ) = K(b − a) .
i=1
◦ f 0 ([a, b]) é limitado, ou seja, |f 0 (t)| ≤ M para todo t ∈ [a, b], uma vez que f 0 é contı́nuo e
[a, b] é um intervalo compacto;
Prova.
Basta mostrar que Zb
lim `(f; P) = kf 0 (t)k dt .
|P|→0 a
X X X
k k k
`(f; P) − kf 0 (ti−1 )k (ti − ti−1 ) = kf(ti ) − f(ti−1 )k − kf 0 (ti−1 )k |ti − ti−1 |
i=1 i=1 i=1
X
k
kf(ti ) − f(ti−1 )k − kf 0 (ti−1 )k |ti − ti−1 |
≤
i=1
Xk
≤ kf(ti ) − f(ti−1 ) − f 0 (ti−1 )(ti − ti−1 )k
i=1
Xk
ε X
k
= kρi (ti − ti−1 )k < ti − ti−1
2(b − a)
i=1 i=1
ε(b − a) ε
= = .
2(b − a) 2
Então se δ = min{ δ1 , δ2 } > 0 e |P| < δ , obtemos que:
Zb X X Zb
ε ε
`(f; P) − kf 0 (t)k dt ≤ `(f; P) − 0 0 0
? ?
(kf k; P ) + (kf k; P ) − kf (t)k dt < + = ε.
2 2
a a
Exemplo 4.4. Seja f : [0, 2π] −→ R2 , f(t) = (cos t, sen t). Então o comprimento de f é
Z 2π Z 2π
0
`(f) = kf (t)k dt = 1 dt = 2π .
0 0
√ √
E se g : [− π, π] −→ R2 , g(t) = (cos t2 , sen t2 ) , temos
Z √π Z √π Z √π √π
`(g) = √ kg (t)k dt = √ |2 t| dt = 2
0 2
2 t dt = 2t = 2π .
− π − π 0 0
Quando
Essa observação segue-se do corolário 11.5 do Capı́tulo 1, pois ϕ : [a, b] −→ [c, d] é uma
função contı́nua do compacto [a, b] sobre o compacto [c, d].
Prova.
(⇐=) Suponhamos que g é retificável. Seja P = {s0 , s1 , . . . , sk } uma partição de [a, b]. Se
ϕ(si−1 ) = ϕ(si ), temos que kg(ϕ(si )) − g(ϕ(si−1 ))k = 0.
(=⇒) Suponhamos que g ◦ ϕ é retificável e seja Q = {t0 , t1 , . . . , tk } uma partição de [c, d].
= `(g ◦ ϕ; P) .
Prova. Zt
Se f é parametrizado pelo comprimento de arco, então kf 0 (s)k ds = t − a para todo t ∈ [a, b].
Zτ a
d
Logo |f (t)| =
0
kf 0 (s)k ds = 1.
dτ a
Reciprocamente, se kf 0 (t)k = 1 para todo t ∈ [a, b], então
Zt Zt
0
`(f|[a,t] ) = kf (s)k ds = 1 ds = t − a .
a a
Exemplo 5.1. O caminho f : [0, 2π] −→ R2 , f(t) = (cos t, sen t), é parametrizado pelo compri-
mento de arco, pois f ∈ C∞ e kf 0 (t)k = 1 para todo t ∈ [0, 2π].
Prova.
Vamos mostrar que σ é contı́nua no ponto a. Como σ é monótona não-decrescente, existe
A = lim+ σ(t) = inf{ σ(t) | t ∈ (a, b] }
t→a
4A
Suponhamos, por absurdo, que A > 0 = σ(0). Então existe c1 ∈ (a, b] tal que A ≤ σ(c1 ) < .
3
4A A
Logo A ≤ σ(t) ≤ σ(c1 ) < para todo t ∈ (a, c1 ], e, portanto, `(f|[t,c1 ] ) = σ(c1 ) − σ(t) < .
3 3
A
Por outro lado, sendo f contı́nua em a, existe c2 ∈ (a, b) tal que t ∈ [a, c2 ] =⇒ kf(t) − f(a)k < .
3
Seja c = min{ c1 , c2 }. Então, para toda partição P de [a, c], temos
X
k
A A A 2A
`(f|[a,c] ; P) = kf(t1 ) − f(a)k + kf(ti ) − f(ti−1 )k < + `(f|[t1 ,c] ) < + = .
3 3 3 3
i=2
2A
Logo σ(c) = `(f|[a,c] ) ≤ < A , uma contradição.
3
De modo análogo, podemos provar que
sup { σ(t) | t ∈ [a, b) } = L = σ(b) ,
e, portanto,
lim σ(t) = sup{ σ(t) | t ∈ [a, b) } = L = σ(b) ,
t→b−
No caso geral, tome t0 ∈ (a, b). Como f|[a,t0 ] : [a, t0 ] −→ Rn é um caminho contı́nuo e retificável,
temos, pelo observado acima, que lim− σ(t) = σ(t0 ).
t→t0
E, por outro lado, como f|[t0 ,b] : [t0 , b] −→ Rn é um caminho contı́nuo retificável e
ψ(t) = `(f|[t0 ,t] ) = σ(t) − `(f|[a,t0 ] ) ,
Prova.
Consideremos o diagrama abaixo:
f
[a, b] - Rn
σ
g
?
[0, L]
Definimos g : [0, L] −→ Rn da seguinte maneira: dado u ∈ [0, L], existe t ∈ [a, b] tal que
σ(t) = u. Pomos, então, g(u) = f(t). O caminho g está bem definido, pois se σ(t) = σ(s) = u,
então f(s) = f(t).
Para provar que g é parametrizado pelo comprimento de arco, tome s ∈ [0, L] arbitrário. Então
existe t ∈ [a, b] tal que σ(t) = s e, portanto, pelo teorema 5.1,
Prova.
(⇐=) Como todo caminho lipschitziano é retificável, temos, pelo teorema 5.1, que toda repa-
rametrização de um caminho lipschitziano é retificável.
Logo f(t) = g(ψ(t)) = g(L − σ(t)) e, portanto, dado s = σ(t) ∈ [0, L], temos que
g(L − s) = f(t) = g̃(σ(t)) = g̃(s),
Assim, g(s) = g̃(L − s) para todo s ∈ [0, L], ou seja, g é o caminho g̃ percorrido em sentido
contrário.
Observação 5.3. Um caminho pode ser retificável sem ser lipschitziano. Por exemplo, o
√
caminho f : [0, 1] −→ R2 , dado por f(t) = (t, t) é retificável, pois suas funções coordenadas
√
são monótonas, mas não é lipschitziano, uma vez que a função t 7−→ t, t ∈ [0, 1], não é
lipschitziana.
Observação 5.4. Seja f : I −→ J uma função regular, ou seja, diferenciável com f 0 (t) 6= 0,
para todo t ∈ I, onde f(I) = J, I, J intervalos da reta.
Então, pelo Teorema do Valor Intermediário para a derivada (teorema de Darboux), temos que
ou f 0 (t) > 0 para todo t ∈ I e f é, então, monótona crescente, ou f 0 (t) < 0 para todo t ∈ I, sendo
f, portanto, monótona decrescente.
Por exemplo, o caminho f : [a, b] −→ R2 dado por f(t) = (cos t, sen t), é regular, mas não é
injetivo se b − a > 2π.
Se f : I → J é regular e f(I) = J, temos, pelo Teorema da Função Inversa (ver Curso de Análise,
Vol I de E. Lima, pag. 274, corolário 6), que f−1 : J −→ I é diferenciável e
1
(f−1 ) 0 (y) = ,
f 0 (f−1 (y))
para todo y ∈ J.
Prova.
• Se σ é monótona não-decrescente, temos, pelaZobservação 5.2, que
t
σ(t) = `(f|[a,t] ) = kf 0 (s)k ds .
a
Logo σ (t) = kf (t)k > 0 para todo t ∈ [a, b]. Como k k é a norma euclidiana, temos que σ 0 é
0 0
diferenciável e
hf 00 (t), f 0 (t)i
σ 00 (t) = ,
kf 0 (t)k
caso f ∈ Ck , k ≥ 2.
Seja f ∈ Ck+1 . Então f 0 , f 00 e σ 0 são de classe Ck−1 e, portanto, σ 00 é de classe Ck−1 . Assim, σ 0 é
de classe Ck .
6 A função-ângulo
Seja z : [a, b] −→ R2 um caminho tal que kz(t)k = 1 para todo t ∈ [a, b], onde k k é a
norma euclidiana. Podemos, portanto, escrever z : [a, b] −→ S1 .
Uma função-ângulo para o caminho z : [a, b] −→ S1 é uma função θ : [a, b] −→ R tal que
z(t) = (cos θ(t), sen θ(t)) para todo t ∈ [a, b].
Prova.
Unicidade (válida também para funções-ângulo contı́nuas).
Logo, se ϕ(a) = θ(a) = θ0 , temos k = 0 e, portanto, ϕ(t) = θ(t) para todo t ∈ [a, b].
Existência
Então, se z(t) = (x(t), y(t)), as funções coordenadas x, y : [a, b] −→ R são de classe Cr , com
x(a) = cos θ0 e y(a) = sen θ0 .
Portanto, z 0 (t) é um múltiplo do vetor w(t) = (−y(t), x(t)) para todo t ∈ [a, b].
Assim, para todo t ∈ [a, b], existe λ(t) ∈ R tal que z 0 (t) = λ(t) w(t), ou seja, x 0 (t) = −λ(t) y(t)
e y 0 (t) = λ(t) x(t).
Além disso, como λ(t) = hw(t), z 0 (t)i, para todo t ∈ [a, b], temos que λ é de classe Cr−1 .
Então θ(a) = θ0 e θ 0 (t) = λ(t) para todo t ∈ [a, b]. Logo θ é de classe Cr .
Agora vamos provar que x(t) = cos θ(t) e y(t) = sen θ(t) para todo t ∈ [a, b].
• ( x(t) cos θ(t) + y(t) sen θ(t) ) 0 = x 0 (t) cos θ(t) − x(t) θ 0 (t) sen θ(t)
+y 0 (t) sen θ(t) + y(t) θ 0 (t) cos θ(t)
= −λ(t) y(t) cos θ(t) − x(t) λ(t) sen θ(t)
+λ(t) x(t) sen θ(t) + y(t) λ(t) cos θ(t) = 0
• ( y(t) cos θ(t) − x(t) sen θ(t) ) 0 = y 0 (t) cos θ(t) − y(t) θ 0 (t) sen θ(t)
−x 0 (t) sen θ(t) − x(t) θ 0 (t) cos θ(t)
= λ(t) x(t) cos θ(t) − y(t) λ(t) sen θ(t)
+λ(t) y(t) sen θ(t) − x(t) λ(t) cos θ(t) = 0 ,
para todo t ∈ [a, b]. Então,
• x(t) cos θ(t) + y(t) sen θ(t) = x(a) cos θ(a) + y(a) sen θ(a)
= cos2 θ0 + sen2 θ0 = 1 (I)
e
• y(t) cos θ(t) − x(t) sen θ(t) = y(a) cos θ(a) − x(a) sen θ(a)
= sen θ(a) cos θ(a) − cos θ(a) sen θ(a) = 0 , (II)
para todo t ∈ [a, b].
Prova.
f(t)
Basta tomar a função-ângulo θ do caminho z(t) = com θ(a) = θ0 , uma vez que, pela
kf(t)k
observação 1.8, z é de classe Cr .
Corolário 6.2. Seja f : [a, b] −→ R2 −{0} um caminho de classe Cr por partes. Dado θ0 ∈ R tal
que f(a) = kf(a)k (cos θ0 , sen θ0 ), existe uma única função de classe Cr por partes θ : [a, b] −→
R tal que θ(a) = θ0 e f(t) = kf(t)k(cos θ(t), sen θ(t)), para todo t ∈ [a, b].
Prova.
Seja P = {t0 = a < t1 < . . . < tk = b} uam partição do intervalo [a, b] tal que f|[ti−1 ,ti ] é de
classe Cr , para todo i = 1, . . . , k.
Então, pelo teorema anterior, f|[a,t1 ] possui uma função-ângulo θ1 : [a, t1 ] −→ R de classe Cr tal
que θ1 (a) = θ0 . Como f|[t1 ,t2 ] é de classe Cr , existe uma função-ângulo θ2 : [t1 , t2 ] −→ R, com
θ2 (t1 ) = θ1 (t1 ), para o caminho f|[t1 ,t2 ] .
Então, a função θ : [a, b] −→ R, definida por θ(t) = θi (t), se t ∈ [ti−1 , ti ], é contı́nua e θ|[ti−1 ,ti ] é
de classe Cr para todo i = 1, . . . , k. Logo θ é de classe Cr por partes e é a única função-ângulo
de classe Cr por partes do caminho f tal que θ(a) = θ0 .
1 Derivadas parciais
Definição 1.1. Seja f : U −→ R uma função real definida num subconjunto aberto U ⊂ Rn .
Dado a ∈ U, a i−ésima derivada parcial de f no ponto a, 1 ≤ i ≤ n, é o limite
∂f f(a + tei ) − f(a)
(a) = lim ,
∂xi t→0 t
quando tal limite existe. Usa-se também a notação ∂i f(a).
Observação 1.2. Quando n = 2, o gráfico de f, G = {(x, y, f(x, y)), | (x, y) ∈ Dom(f)} é uma
”superfı́cie” em R3 , e a restrição de f ao segmento de reta que passa por c = (a, b) e é paralelo
ao eixo das abscissas tem como gráfico uma curva plana x 7−→ (x, b, f(x, b)) obtida na superfı́cie
∂f
fazendo y constante igual a b. Portanto, (a, b) é a inclinação da reta tangente a esta curva,
∂x
no ponto (a, b, f(a, b)), em relação ao plano horizontal, uma vez que:
117
Análise
∂f
Fig. 1: ∂x
(a, b) é a inclinação da reta r
∂f
∂f
r= 1, 0, (a, b) t + (a, b, f(a, b)) | t ∈ R = x, b, (a, b)(x − a) + f(a, b) |x ∈ R .
∂x ∂x
∂f
Observação 1.3. A i-ésima derivada parcial dá informações sobre o comportamento de
∂xi
f ao longo de um segmento de reta contido em U e paralelo ao i−ésimo eixo.
Definição 1.2. Dizemos que uma função f : U ⊂ Rn −→ R não depende da i−ésima variável
quando a, b ∈ U, b = a + tei =⇒ f(a) = f(b).
∂
Neste caso, existe f(a) em todos os pontos a ∈ U e é igual a zero. Mas a recı́proca
∂xi
nem sempre é verdadeira, como veremos abaixo.
∂f
• Assim, se U ⊂ Rn é um aberto i−convexo e f : U −→ R é uma função tal que (a) = 0
∂xi
para todo a ∈ U, então f independe da i−ésima variável.
Exemplo 1.1. Seja Γ = {(x, 0) ∈ R2 | x ≥ 0} o semi-eixo positivo fechado das abscissas. Então
U = R2 − Γ é aberto, horizontalmente convexo, mas não é verticalmente convexo.
Fig. 2: U = R2 − Γ
0 = {(0, t) | t < 0} ;
• f|r−0 ≡ 0 , onde r−
Mas f não é independente da segunda variável, pois se x > 0 e y > 0, então f(x, y) = x2 > 0 e
f(x, −y) = 0.
Observação 1.5. A existência apenas das derivadas parciais não permite conclusões sobre
o comportamento n−dimensional da função. Por exemplo, a existência de todas as derivadas
parciais num ponto não implica a continuidade da função nesse ponto.
xy
Exemplo 1.2. Seja f : R2 −→ R, definida por f(x, y) = , se (x, y) 6= (0, 0), e f(0, 0) = 0.
x2 + y2
Se z = (x, y) 6= (0, 0), temos que:
∂f y(x2 + y2 ) − xy(2x) y3 − x 2 y ∂f x(x2 + y2 ) − xy(2y) x3 − xy2
(z) = = e (z) = = .
∂x (x2 + y2 )2 (x2 + y2 )2 ∂y (x2 + y2 )2 (x2 + y2 )2
E, na origem:
∂f f(t, 0) − f(0, 0) ∂f f(0, t) − f(0, 0)
(0, 0) = lim =0 e (0, 0) = lim = 0.
∂x t→0 t ∂y t→0 t
Assim, f possui derivadas parciais em todos os pontos de R2 . Mas f não é contı́nua na origem.
ab
Mais ainda, não existe lim f(x, y), pois f(at, bt) = , para todo t ∈ R e todo (a, b) 6=
(x,y)−→(0,0) a2 + b2
1 2
(0, 0), e, portanto, lim f(t, t) = 6= = lim f(t, 2t), por exemplo.
t→0 2 5 t→0
2 Derivadas direcionais
∂f
Observação 2.1. Se v = 0, então (a) = 0 para todo a ∈ U.
∂v
Observação 2.2. As derivadas parciais são casos particulares das derivadas direcionais,
∂f ∂f
pois: (a) = (a) é a derivada direcional de f no ponto a segundo o vetor ei .
∂xi ∂ei
Observação 2.3. Dados a ∈ U e v ∈ Rn , existe ε > 0 tal que a + tv ∈ U para todo t ∈ (−ε, ε).
Assim, se λ : (−ε, ε) −→ U é o caminho retilı́neo, com λ(0) = a e λ 0 (t) = v para todo t ∈ (−ε, ε),
∂f
temos que: (a) = (f ◦ λ) 0 (0).
∂v
xy
Exemplo 2.1. Seja f : R2 −→ R a função dada por f(x, y) = , (x, y) 6= (0, 0), e f(0, 0) =
x2 + y2
∂f
0. Então f possui as derivadas direcionais (0, 0) para todo v = (α, 0) ou v = (0, β), as quais
∂v
são nulas, mas f não possui derivada direcional na origem segundo um vetor v = (α, β), com
α 6= 0 e β 6= 0, pois:
∂f f(tα, 0) − f(0, 0)
• (0, 0) = lim = 0, v = (α, 0)
∂v t→0 t
∂f f(0, tβ) − f(0, 0)
• (0, 0) = lim = 0, v = (0, β) ,
∂v t→0 t
e o limite
f(αt, βt) − f(0, 0) αβ 1
lim = lim 2
t→0 t t→0 α + β2 t
não existe.
∂f
Observação 2.4. Se α ∈ R − {0}, então existe (a) num ponto a se, e somente se, existe
∂v
∂f
(a) e, no caso afirmativo, temos:
∂(αv)
∂f f(a + tαv) − f(a) f(a + tαv) − f(a) ∂f
(a) = lim = α lim = α (a) .
∂(αv) t→0 t t→0 αt ∂v
∂f
Mas, pode ocorrer que a derivada direcional exista em todos os pontos do domı́nio de f,
∂v
segundo todos os vetores v ∈ Rn , sem que se tenha necessariamente:
∂f ∂f ∂f
(a) = (a) + (a) .
∂(v + w) ∂v ∂w
∂f
Observação 2.5. Na seção 3, mostraremos que depende linearmente de v se f é dife-
∂v
renciável, uma hipótese mais forte do que possuir derivadas direcionais.
A função g do exemplo anterior é contı́nua (ver exercı́cio 8:27, capı́tulo 1), mas não é
verdade, em geral, que a existência de todas as derivadas direcionais implique em continuidade.
x3 y
Exemplo 2.3. Seja h : R2 −→ R a função definida por h(x, y) = , se (x, y) 6= (0, 0), e
x6 + y2
h(0, 0) = 0.
Para (a, b) 6= (0, 0) e v = (α, β) ∈ R2 , temos que, se λ(t) = (a, b) + t(α, β) = (a + tα, b + tβ),
então:
(a + tα)3 (b + tβ)
(h ◦ λ)(t) =
(a + tα)6 + (b + tβ)2
e, portanto, a derivada (h ◦ λ) 0 (t) é dada por:
3(a + tα)2 α(b + tβ) + β(a + tα)3 (a + tα)6 + (b + tβ)2 − (a + tα)3 (b + tβ) 6α(a + tα)5 + 2β(b + tβ)
2
( (a + tα)6 + (b + tβ)2 ) .
Logo,
∂h (3a2 bα + βa3 )(a6 + b2 ) − a3 b(6αa5 + 2βb)
(a, b) = (h ◦ λ) 0 (0) =
∂v (a6 + b2 )2
−3a8 b + 3a2 b3 a9 − a3 b2
= α+ β,
(a6 + b2 )2 (a6 + b2 )2
E para (a, b) = (0, 0) e v = (α, β) ∈ R2 ,
∂h h(tα, 0)
e (0, 0) = lim = lim 0 = 0 , se β = 0 .
∂v t→0 t t→0
∂h
Assim, existem as derivadas direcionais (a), para todo a ∈ R2 e todo v ∈ R2 , e dependem
∂v
linearmente de v.
1
Em R2 − {(0, 0)}, a função h é contı́nua, mas h não é contı́nua na origem, pois h(x, x3 ) = para
2
todo x 6= 0.
• Outra propriedade desejável para um conceito adequado de derivada de uma função é que a
composta de duas funções deriváveis seja também derivável.
x3 y
Exemplo 2.4. Seja ϕ : R2 −→ R dada por ϕ(0, 0) = 0 e ϕ(x, y) = , se (x, y) 6= (0, 0) .
x4 + y2
Em R2 − {(0, 0)}, ϕ é contı́nua, e em (0,0), ϕ também é contı́nua,
pois, para (x, y) 6= (0, 0),
x 2 y
| ϕ(x, y) | = x p ≤ |x| ,
p
4
x +y 2 4
x +y 2
para v = (α, 0) ∈ R2 .
sen t1n 1 1 2
e • lim = lim = , quando tn = .
n→∞ 1 + sen 1
tn
n→∞ 2 2 (4n + 1)π
Prova.
Seja λ : [0, 1] −→ U o caminho C∞ dado por λ(t) = a + tv, t ∈ [0, 1]. Então a função
f ◦ λ : [0, 1] −→ R é contı́nua em [0, 1] e derivável em (0, 1), pois, para θ ∈ (0, 1),
(f ◦ λ)(θ + t) − f ◦ λ(θ) f(a + (θ + t)v) − f(a + θv)
(f ◦ λ) 0 (θ) = lim = lim
t→0 t t→0 t
f((a + θv) + tv) − f(a + θv) ∂f
= lim = (a + θv)
t→0 t ∂v
Assim, pelo Teorema do Valor Médio, para funções reais de uma variável real, existe θ0 ∈ (0, 1)
tal que (f ◦ λ)(1) − (f ◦ λ)(0) = (f ◦ λ) 0 (θ0 ), ou seja, existe θ0 ∈ (0, 1) tal que
∂f
f(a + v) − f(a) = (a + θ0 v) .
∂v
∂f
Observação 2.6. A existência de em todo ponto de (a, a + v) garante a continuidade de
∂v
f|(a,a+v) .
De fato, como foi provado acima, f◦λ é derivável em (0, 1) e, portanto, se xk = a+tk v, tk ∈ (0, 1),
é uma sequência de pontos de (a, a + v) que converge para o ponto a + t0 v ∈ (a, a + v), então
f(xk ) = f(a + tk v) = f ◦ λ(tk ) −→ f ◦ λ(t0 ) = f(a + t0 v) ,
kxk − ak ka + t0 v − ak
uma vez que tk = −→ = t0 .
kvk kvk
Prova.
Seja a ∈ U fixo.
está contido em U.
∂f
Além disso, como existe (x) para todo x ∈ U, temos, pela observação anterior, que a
∂(b − a)
restrição f|(a−ε(b−a),a+(1+ε)(b−a)) é contı́nua.
• Resulta, então, do Teorema do Valor Médio, que se [a, b] ⊂ U, existe θ0 ∈ (0, 1) tal que
∂f
f(b) − f(a) = f(a + (b − a)) − f(a) = (a + θ0 (b − a)) = 0 ,
∂(b − a)
ou seja, f(b) = f(a).
Por outro lado, se x ∈ U existe, pelo teorema 13.8 do Capı́tulo 1, uma poligonal contida em U
com vértices a0 = a, a1 , . . . , ak = x.
3 Funções diferenciáveis
A definição de função diferenciável que daremos abaixo é devida a Maurice Fréchet (França,
1878-1973) e Otto Stolz (Áustria, 1842-1905). Ela é uma extensão adequada do conceito de
função derivável de uma só variável para funções de n variáveis.
r(v)
Observação 3.3. A condição lim = 0 significa que r(v) tende a zero mais rapidamente
v→0 kvk
do que v. Isto se exprime dizendo-se que r(v) é um infinitésimo de ordem superior a v. Assim, f
é diferenciável no ponto a ∈ U quando f(a + v) − f(a) é igual a um funcional linear
Xn
∂f
(a) αi + (um resto infinitamente pequeno em relação a v).
∂xi
i=1
r(v)
Observação 3.4. Fazendo ρ(v) = se v 6= 0, a + v ∈ U, e ρ(0) = 0, temos que:
kvk
∂f
f : U −→ R é diferenciável no ponto a ∈ U se, e só se, todas as derivadas parciais (a),
∂xi
i = 1, . . . , n, existem no ponto a e, para todo v = (α1 , . . . , αn ) ∈ Rn tal que a + v ∈ U vale:
X
n
∂f
f(a + v) = f(a) + (a)αi + ρ(v) kvk , onde lim ρ(v) = 0.
∂xi v→0
i=1
De fato, seja v ∈ Rn . Então existe ε > 0 tal que a + tv ∈ U para todo t ∈ (−ε, ε), e
Xn
∂f
f(a + tv) = f(a) + (a)tαi + ρ(tv) |t| kvk .
∂xi
i=1
∂f ∂f ∂f
• (a) = (a) + (a) , para todos v, w ∈ Rn .
∂(v + w) ∂v ∂w
Prova.
Seja o aberto U0 = {v ∈ Rm | a + v ∈ U} que contém o ponto v = 0.
|αi |
Considerando Rm com a norma da soma, por exemplo, temos que ≤ 1 para todo
kvkS
v ∈ Rm − {0}.
|βk (v)| kω(v)kS
Logo, cada , k = 1, . . . , n, e, portanto, , é limitada em U1 − {0}, onde U1 é um
kvkS kvkS
aberto contido em U0 tal que 0 ∈ U1 e ρk |U1 limitada para todo k = 1, . . . , n.
ou seja,
X
m
(g ◦ f)(a + v) = (g ◦ f)(a) + Ai αi + R(v) ,
i=1
X
n
∂g ∂fk X
n
∂g
onde Ai = (b) (a) e R(v) = (b) ρk (v) kvk + σ ◦ ω(v) kω(v)k.
∂yk ∂xi ∂yk
k=1 k=1
Como,
R(v) X
n
∂g kω(v)k
= (b) ρk (v) + σ ◦ ω(v) ,
kvk ∂yk kvk
k=1
R(v) kω(v)k
temos que lim = 0, pois lim ρk (v) = 0, k = 1, . . . , n, lim σ ◦ ω(v) = 0 e é limitado em
v→0 kvk v→0 v→0 kvk
U2 − {0}.
para todo i = 1, . . . , m.
dx dxn
1
Observação 3.8. Se escrevemos λ(t) = (x1 (t), . . . , xn (t)), então λ 0 (t) = ,..., .
dt dt
df
Indicando com a derivada da função composta t 7−→ f ◦ λ(t) = f(x1 (t), . . . , xn (t)), a regra da
dt
cadeia nos dá que:
df X
n
∂f dxi
= (notação clássica do Cálculo Diferencial.)
dt ∂xi dt
i=1
Mas, o mesmo não é verdade se f possui derivadas direcionais em todos os pontos do domı́nio
segundo qualquer vetor, mas não é diferenciável.
x3 y
Por exemplo, considere a função h : R2 −→ R dada por h(x, y) = , (x, y) 6= (0, 0), e
x6 + y2
h(0, 0) = 0, e seja λ : R −→ R2 o caminho diferenciável, λ(t) = (t, t2 ), com λ(0) = (0, 0) e
λ 0 (0) = (1, 0). Então,
h(λ(t)) − h(0) t5 1 ∂h
(h ◦ λ) 0 (0) = lim = lim 7 = lim 2 = 1 6= (0, 0) = 0 .
t→0 t t→0 t + t5 t→0 t + 1 ∂x
(ver exemplo 2.3).
Observação 3.10. Nenhuma das funções definidas nos exemplos 2.1, 2.2, 2.3 e 2.4:
xy
• f : R2 −→ R , f(x, y) = , f(0, 0) = 0 ;
x2
+ y2
x2 y
• g : R2 −→ R , g(x, y) = 2 , g(0, 0) = 0 ;
x + y2
x3 y
• h : R2 −→ R , h(x, y) = 6 , h(0, 0) = 0 ;
x + y2
x3 y
• ϕ : R2 −→ R , ϕ(x, y) = 4 , ϕ(0, 0) = 0 ,
x + y2
são diferenciáveis na origem de R2 .
De fato:
• f porque não é contı́nua na origem nem possui derivada direcional segundo qualquer vetor na
origem.
∂g
• g porque, embora seja contı́nua na origem e existe (0, 0), para todo v ∈ R2 , as derivadas
∂v
direcionais na origem não dependem linearmente de v.
∂h
• h porque não é contı́nua na origem, embora possua derivadas direcionais (p), para todo
∂v
v ∈ R2 e todo p ∈ R2 , que dependem linearmente de v.
∂ϕ
• ϕ é contı́nua em R2 , possui derivadas direcionais segundo qualquer vetor v ∈ R2 , em todos
∂v
os pontos do plano, que dependem linearmente de v, mas contraria a Regra da Cadeia, pois
ϕ ◦ λ : R −→ R não é derivável na origem, onde λ : R −→ R2 é o caminho diferenciável dado por
1
λ(t) = t , t2 sen , t 6= 0, e λ(0) = 0.
t
• Diretamente, podemos verificar que, embora cada uma das funções acima possua derivadas
parciais na origem, elas não cumprem a condição:
r(v) 1 ∂F ∂F
lim = lim p F(α, β) − (0, 0)α − (0, 0)β = 0 ,
v→(0,0) kvk α→0 α2 + β2 ∂x ∂y
β→0
1 1
não existe, já que para as sequências αn = e βn = , que convergem para zero, a
n n
1 αn βn n
sequência q
2 2
= √ não converge.
αn + βn 2 2
α2n + β2n
Sejam u, v : U −→ R a parte real e a parte imaginária da função f, ou seja, f(z) = u(z) + iv(z).
r (h, k)
• v(x + h, y + k) = v(x, y) + bh + ak + r2 (h, k) , onde lim √2 2 = 0.
h,k→0 h + k2
Prova.
Para simplificar a notação, vamos considerar apenas o caso n = 2.
Observação 3.12. Na realidade, para que f seja diferenciável no ponto (a, b) é suficiente
∂f ∂f
que exista numa vizinhança deste ponto, que nele seja contı́nua e que (a, b) exista.
∂x ∂y
De fato, escrevendo
∂f ∂f
r(v) = f(a + h, b + k) − f(a, b + k) − (a, b)h + f(a, b + k) − f(a, b) − (a, b)k ,
∂x ∂y
existe, pelo Teorema do Valor Médio para funções reais de uma variável real, θ ∈ (0, 1) tal que
r(v)
∂f ∂f
h f(a, b + k) − f(a, b) ∂f k
= (a + θh, b + k) − (a, b) + − (a, b) .
kvk ∂x ∂x kvk k ∂y kvk
r(v) h k ∂f
Logo lim = 0, pois e são limitadas, é contı́nua no ponto (a, b) e
v→0 kvk kvk kvk ∂x
f(a, b + k) − f(a) ∂f
lim = (a, b) .
k→0 k ∂y
• Para funções de n variáveis, a diferenciabilidade de f num ponto é assegurada quando n − 1
das suas derivadas parciais existem numa vizinhança do ponto, são contı́nuas neste ponto e a
derivada parcial restante apenas exista neste ponto.
1
Exemplo 3.1. Seja f : R −→ R a função dada por f(x) = x2 sen , x 6= 0 e f(0) = 0. Então
x
1 1 x2 sen x1
f 0 (x) = 2x sen − cos , para x 6= 0 , e f 0 (0) = lim = 0.
x x x→0 x
Logo f é diferenciável em R, mas f não é de classe C1 , pois f 0 não é contı́nua em x = 0.
é de classe C∞ .
Este resultado segue do fato análogo já provado para funções reais de uma variável real, ou
pode ser provado por indução, primeiro para a soma e depois para o produto.
Prova.
Para k = 0, o resultado é verdadeiro. Suponhamos, por indução, que o corolário vale para
funções de classe Ck−1 , k ≥ 1, e que g, fi , i = 1, . . . , n são funções de classe Ck .
Então, pelo corolário 3.3, g, fi , i = 1, . . . , n são funções diferenciáveis e, pela Regra da Cadeia:
∂(g ◦ f) X
n
∂g ∂f
(x) = (f(x)) j (x) ,
∂xi ∂yj ∂xi
j=1
∂g ∂g
Como e f são de classe Ck−1 temos, pela hipótese de indução, que ◦ f é de classe Ck−1
∂yj ∂y
j
∂fj ∂g ∂f
para todo j = 1, . . . , n. Além disso, como k−1
∈ C , o produto ◦ f · j é de classe Ck−1 ,
∂xi ∂yj ∂xi
X
m
∂g
∂f
para todo j = 1, . . . , n, e portanto, a soma ◦ f · j é de classe Ck−1 .
∂yj ∂xi
j=1
∂(g ◦ f)
Logo ∈ Ck−1 para todo i = 1, . . . , m, ou seja, g ◦ f ∈ Ck .
∂xi
Observação 3.14. Seja g : U ⊂ Rn −→ R uma função de classe Ck , com g(x) 6= 0 para todo
x ∈ U.
1 1 1
Então a função é de classe Ck , pois = ρ ◦ g, onde ρ : R − {0} −→ R, dada por ρ(x) = , é de
g g x
classe C∞ .
X
n
Exemplo 3.3. O produto interno f : R × R −→ R, f(x, y) =
n n
xi yi , é uma função de classe
i=1
C∞ , pois f é um polinômio de 2n variáveis (de grau 2).
X
∞
n
Também, a função g : R −→ R, g(x) = kxk = 2
x2i , por ser um polinômio de n variáveis, é de
i=1
classe C∞ .
v
uX 2
u n
Então a norma h : Rn − {0} −→ R, h(x) = kxk = t xi é de classe C∞ , pois h = ρ ◦ g, onde
i=1
∞
√
ρ : (0, ∞) −→ R é a função C dada por ρ(x) = x.
• Pode ocorrer que normas k k que não provém de um produto interno não sejam diferenciáveis
em pontos x 6= 0.
∂ϕ
Por exemplo, se ϕ : R2 −→ R é a norma da soma ϕ(x, y) = |x| + |y|, então não existe nos
∂x
∂ϕ
pontos (0, y) e não existe nos pontos (x, 0).
∂y
ϕ(t, y) − ϕ(0, y) |t| ϕ(x, t) − ϕ(x, 0) |t|
De fato, lim± = lim± = ±1 , e lim± = lim± = ±1 .
t→0 t t→0 t t→0 t t→0 t
onde v = (α1 , . . . , αn ) ∈ Rn .
∂f ∂f
Então (a) · · · (a) é a matriz 1 × n do funcional linear df(a) em relação à base
∂x1 ∂xn
canônica {e1 , . . . , en } de Rn .
Notação.
Seja πi : Rn −→ R, πi (x) = xi , a projeção sobre a i−ésima coordenada, i = 1, . . . , n. Então
{π1 , . . . , πn } é a base de (Rn )? dual da base canônica.
Com a identificação feita acima, temos que {dx1 , . . . , dxn } é a base de (Rn )? dual da base
canônica.
Assim, a expressão formal da regra da cadeia (no caso R −→ Rn −→ R) diz que se cada
coordenada xi é função de um parâmetro real t, então podemos ”dividir” ambos os membros da
igualdade acima por ”dt” e obter:
df X
n
∂f dxi
= .
dt ∂xi dt
i=1
Prova.
Como as funções s, m : R2 −→ R, q : R × (R − {0}) −→ R dadas por s(x, y) = x + y ,
x
m(x, y) = xy e q(x, y) = são diferenciáveis, por serem de classe C∞ , e a função F : U −→ R2 ,
y
F(x) = (f(x), g(x)), tem coordenadas diferenciáveis no ponto a, temos, pela Regra da Cadeia,
f
que as funções s ◦ F = f + g, m ◦ F = f · g e q ◦ F = são diferenciáveis no ponto a e, além disso:
g
∂(f + g) ∂f ∂g
(a) = (a) + (a)
∂xi ∂xi ∂xi
∂(f · g) ∂f ∂g
(a) = g(a) (a) + f(a) (a)
∂xi ∂xi ∂xi
∂f ∂g
g(a) (a) − f(a) (a)
∂(f/g) ∂xi ∂xi
(a) = .
∂xi g(a)2
Assim,
X
n
∂(f + g) X
n
∂f X
n
∂g
• d(f + g)(a) = (a) dxi = (a) dxi + (a) dxi = df(a) + dg(a) ;
∂xi ∂xi ∂xi
i=1 i=1 i=1
X
n
∂(f · g) X
n
∂f X
n
∂g
• d(f·g)(a) = (a) dxi = g(a) (a) dxi +f(a) (a) dxi = g(a) df(a)+f(a) dg(a) ;
∂xi ∂xi ∂xi
i=1 i=1 i=1
X
n
∂f X
n
∂g
g(a) (a) dxi − f(a) (a) dxi
X
n
∂(f/g) ∂xi ∂xi g(a) df(a) − f(a) dg(a)
i=1 i=1
• d(f/g)(a) = (a) dxi = = .
∂xi g(a)2 g(a)2
i=1
onde v = (α1 , . . . , αn ).
para quaisquer x, y ∈ U.
Prova.
Neste corolário, estamos assumindo que
∂f
kdf(x)k = sup { |df(x)v| | v ∈ R , kvk = 1 } = sup (x) v ∈ R , kvk = 1 .
n n
∂v
Logo, se x, y ∈ U, o segmento fechado [x, x + (y − x)] ⊂ U, uma vez que U é convexo.
e, portanto,
v
uX ∂f X
u n 2 n 2
∂f
Logo kdf(x)k ≤ t (x) . Por outro lado, se (x) 6= 0, podemos tomar o vetor
∂xi ∂xi
i=1 i=1
∂f ∂f
(x), . . . , (x)
∂x1 ∂xn
v= v .
uX ∂f
u n 2
t (x)
∂xi
i=1
Observação 4.2. Se V não é convexo, uma função g : V −→ R pode ser diferenciável, com
diferencial dg limitada em V, sem ser Lipschitziana.
Seja g = f|V , onde f : U −→ R é a função definida por f(x, y) = x2 se x > 0 e y > 0 e f(x, y) = 0
se x ≤ 0 ou y ≤ 0.
∂f ∂f ∂f
Então (x, y) = 0 para todo (x, y) ∈ U; (x, y) = 2x se x > 0, y > 0; (x, y) = 0 se
∂y ∂x ∂x
∂f
(x, y) ∈ U − {(x, y) ∈ R2 | x ≥ 0 , y > 0}, pois f ≡ 0 neste aberto e, também, (0, y) = 0 para
∂x
y > 0, uma vez que
f(t, y) − f(0, y) t2 f(t, y) − f(0, y) 0
• lim+ = lim+ = 0 , e • lim− = lim− = 0 .
t→0 t t→0 t t→0 t t→0 t
∂f ∂f
Logo f é diferenciável, pois e são contı́nuas em U, ou seja, f é de classe C1 em U. Além
∂x ∂y
disso, como |x| < 2 para todo (x, y) ∈ s
V,
∂f 2 ∂f 2
kdf(x, y)k = (x, y) + (x, y) ≤ 4 ,
∂x ∂y
para todo (x, y) ∈ V.
1
Mas, f não é uniformemente contı́nua em V, pois, para as sequências zn = 1, e
n
1
wn = 1, − de pontos de V, temos que:
n 2
zn − wn = 0, −→ (0, 0) e f(zn ) − f(wn ) = 1 −→ 1 .
n
Em particular, f não é Lipschitziana em V.
O produto interno canônico induz um isomorfismo entre Rn e seu dual (Rn )? dado por:
Rn −→ (Rn )?
v 7−→ v? : Rn −→ R
x 7−→ hv, xi ,
pois dado ϕ ∈ (Rn )? , ϕ = v? , onde v = (ϕ(e1 ), . . . , ϕ(en )), uma vez que
ϕ(x1 , . . . , xn ) = ϕ(e1 )x1 + . . . + ϕ(en )xn .
Além disso, como v (ei ) = αi , i = 1, . . . , n, α1 . . . αn é a matriz 1 × n do funcional v?
?
Observação 5.1. As coordenadas de grad f(a) em relação à base canônica são iguais às
X
n
∂f
coordenadas de df(a) = (a) dxi em relação à base {dx1 , . . . , dxn } de (Rn )? , dual da base
∂xi
i=1
canônica.
• Veremos agora as três propriedades mais importantes do gradiente de uma função dife-
renciável f : U −→ R. Para isso, seja a ∈ U tal que grad f(a) 6= 0.
Primeira propriedade. O gradiente aponta para uma direção segundo a qual a função f é
crescente.
∂f
df(a) w = (a) = hgrad f(a), wi = k grad f(a)k2 > 0 .
∂w
Assim, se λ : (−ε, ε) −→ U é um caminho diferenciável tal que λ(0) = a e λ 0 (0) = grad f(a),
então
(f ◦ λ) 0 (0) = df(λ(0)) λ 0 (0) > 0 .
Então, se f e λ são de classe C1 , existe ε > 0 tal que (f ◦ λ) 0 (t) > 0 para todo t ∈ (−ε, ε),
e, portanto, f ◦ λ é crescente. Isto é, f cresce na direção do gradiente.
Segunda propriedade. Dentre todas as direções ao longo das quais a função f cresce, a
direção do gradiente é a de crescimento mais rápido.
De fato, não se tem df(a)v = hgrad f(a), vi > 0 apenas quando v = grad f(a), pois
hgrad f(a), vi > 0 para todo v que faz um ângulo agudo com grad f(a). Então f cresce ao
longo destas direções, mas grad f(a) é a direção segundo a qual o crescimento de f é o mais
rápido.
O Teorema da Função Implı́cita, que provaremos depois, garante que f−1 (c) é uma su-
perfı́cie (se n ≥ 3), ou uma curva (se n = 2), quando grad f(x) 6= 0 para todo x ∈ f−1 (c).
Dizer que w = grad f(a) é perpendicular ao conjunto de nı́vel f−1 (c), onde f(a) = c, sig-
nifica que w é perpendicular ao vetor velocidade λ 0 (0) de qualquer caminho diferenciável em
t = 0, com λ(0) = a e λ(t) ∈ f−1 (c) para todo t ∈ (−ε, ε). De fato, como f(λ(t)) = c para todo
t ∈ (−ε, ε),
0 = (f ◦ λ) 0 (0) = df(λ(0)) λ 0 (0) = hgrad f(a), λ 0 (0)i .
• As curvas de nı́vel de f são as retas ax+by = c para qualquer c ∈ R e grad f(x, y) = (a, b) para
todo (x, y) ∈ R2 . Assim, (a, b) é o vetor normal às retas ax + by = c, e {(x, y) ∈ R2 | ax + by > c}
é o semi-plano para o qual o vetor (a, b) aponta.
Fig. 5: Gradiente de f
Fig. 6: Gradiente de g
que é uma hipérbole cuja reta focal é o eixo x, se c > 0, e uma hipérbole cuja reta focal é o eixo
y, se c < 0.
Fig. 7: Gradiente de h
O gradiente de h, grad h(x, y) = (2x, −2y), é perpendicular às curvas de nı́vel e indica a direção
de crescimento de h.
• Nos pontos onde o gradiente se anula ocorre uma quebra de regularidade na disposição das
curvas de nı́vel. Um ponto onde o gradiente de uma função é o vetor nulo é chamado singular
ou crı́tico.
6 A regra de Leibniz
Prova.
Dado x0 ∈ U, existe δ0 > 0 tal que [x0 , x0 + sei ] ⊂ U, para todo s ∈ R com |s| < δ0 . Então,
pelo Teorema do Valor Médio, existe θ ∈ (0, 1) tal que:
Zb Zb
ϕ(x0 + sei ) − ϕ(x0 ) ∂f f(x0 + sei , t) − f(x0 , t) ∂f
− (x0 , t) dt = − (x0 , t) dt
s a ∂xi a s ∂xi
Zb
∂f ∂f
= (x0 + θsei , t) − (x0 , t) dt .
a ∂xi ∂xi
∂f
Como : U × [a, b] −→ R é contı́nua, temos, pelo teorema 11.4 do capı́tulo 1, que dado ε > 0,
∂xi
existe 0 < δ < δ0 tal que:
∂f ∂f ε
|s| < δ =⇒
(x0 + sθei , t) − (x0 , t) < ,
∂xi ∂xi 2(b − a)
para todo t ∈ [a, b]. Então,se 0 < |s| < δ,
Zb
ϕ(x0 + sei ) − ϕ(x) ∂f
− (x0 , t) dt < ε .
s ∂xi a
Prova. Zb
∂ϕ ∂f
Pelo teorema anterior, ϕ possui as n derivadas parciais e (x) = (x, t) dt para todo
∂xi a ∂xi
∂f
x ∈ U, i = 1, . . . , n. Além disso, como : U × [a, b] −→ R é contı́nua, para todo i = 1, . . . , n,
∂xi
∂ϕ
temos, pela aplicação do teorema 11.4 do capı́tulo 1, que : U −→ R é contı́nua para todo
∂xi
i = 1, . . . , n.
Prova. Zx
Seja g : [a, b] × [c, d] −→ R definida por g(x, t) = f(s, t) ds .
a
Zx
Para cada x ∈ [a, b] fixo, a função t 7−→ f(s, t) ds é contı́nua e, portanto, integrável. Além
a
∂g
disso, (x, t) = f(x, t) para todo (x, t) ∈ [a, b] × [c, d], pois o integrando s 7−→ f(s, t) é contı́nuo
∂x
para todo t ∈ [c, d].
∂g
Como = f : [a, b] × [c, d] −→ R é contı́nua, temos, pela Regra de Leibniz, que a função
∂x
ϕ : [a, b] −→ R, dada por
Zd Z d Z x
ϕ(x) = g(x, t) dt = f(s, t) ds dt ,
c c a
Zd Zd
∂g
é derivável e ϕ 0 (x) = (x, t) dt = f(x, t) dt.
c ∂x c
Como ϕ 0 : [a, b] −→ R é integrável (por ser contı́nua), temos, pelo Teorema Fundamental do
Cálculo, que Zb Z b Z d
0
ϕ(b) − ϕ(a) = ϕ (s) ds = f(s, t) dt ds .
a a c
Z d Z b
Sendo ϕ(a) = 0 e ϕ(b) = f(s, t) ds dt, obtemos
c a
Z d Z b Z b Z d
f(s, t) ds dt = f(s, t) dt ds .
c a a c
Corolário 6.2. Seja f : U×[a, b] −→ R uma função contı́nua, com derivadas parciais contı́nuas
∂f ∂f
,..., : U × [a, b] −→ R, e seja g : U −→ [a, b] uma função de classe C1 , onde U ⊂ Rn
∂x1 ∂xn
Z g(x)
é aberto. Então a função ϕ : U −→ R, definida por ϕ(x) = f(x, t) dt, é de classe C1 e suas
a
derivadas parciais são:
Z g(x)
∂ϕ ∂f ∂g
(x) = (x, t) dt + (x) f(x, g(x)) ,
∂xi a ∂xi ∂xi
para todo x ∈ U.
Prova. Zu
Seja ξ : U × [a, b] −→ R a função dada por ξ(x, u) = f(x, t) dt. Então, como a função
a
∂ξ
t 7−→ f(x, t) é contı́nua, (x, u) = f(x, u) para todo (x, u) ∈ U × [a, b].
∂u
Zu
∂ξ ∂f
Além disso, pela Regra de Leibniz, (x, u) = (x, t) dt .
∂xi a ∂xi
∂ξ
Afirmação: : U × [a, b] −→ R é contı́nua, para i = 1, . . . , n.
∂xi
∂f
De fato, como : U × [a, b] −→ R é contı́nua, temos, pelo teorema 11.4 do capı́tulo 1, que
∂xi
dados x0 ∈ U, u0 ∈ [a, b] e ε > 0, existe δ >
0 tal que
∂f ∂f
kx − x0 k < δ =⇒ (x, t) − (x0 , t) < ε 0 ,
∂xi ∂xi
ε ε
para todo t ∈ [a, b], onde ε 0 = se u0 = a e ε 0 = se u0 6= a.
2 2(u0 − a)
∂f ∂f
Sendo t 7−→
(x0 , t) contı́nua no compacto [a, b], existe M > 0 tal que (x0 , t) ≤ M para
∂xi ∂xi
∂f
todo t ∈ [a, b]. Assim, (x, t) ≤ N = ε 0 + M, para todo t ∈ [a, b] e x ∈ B(x0 , δ).
∂xi
ε
Então, se |u − u0 | < e kx − x0 k < δ,
2N
Zu Z u0
∂ξ ∂ξ ∂f ∂f
∂xi (x, u) − (x 0 , u0 ) = (x, t) dt − (x 0 , t) dt
∂xi ∂xi
a a ∂xi
Z u0 Z u0 Zu
∂f ∂f ∂f
≤ (x, t) dt − (x0 , t) dt + (x, t) dt
∂xi
a ∂xi a ∂xi u0
ε ε
≤ ε 0 |u0 − a| + N |u0 − u| < + = ε.
2 2
∂ξ ∂ξ
Logo ξ é de classe C1 , pois =fe , i = 1, . . . , n são contı́nuas.
∂u ∂xi
Sendo g e ξ são de classe C1 e, portanto, diferenciáveis, temos, pela Regra da Cadeia, que a
função composta ϕ(x) = ξ(x, g(x)) é diferenciável e, para todo i = 1, . . . , n,
Z g(x)
∂ϕ ∂ξ ∂ξ ∂g ∂f ∂g
(x) = (x, g(x)) + (x, g(x)) (x) = (x, t) dt + (x) f(x, g(x)) .
∂xi ∂xi ∂u ∂xi a ∂xi ∂xi
∂ϕ
Logo é contı́nua para todo i = 1, . . . , n, ou seja, ϕ é de classe C1 .
∂xi
7 O Teorema de Schwarz
Cabe, então, determinar sob quais hipóteses a ordem em que são tomadas as derivadas
parciais repetidas não influi no resultado final.
Prova.
Vamos supor, para simplificar a notação, que U ⊂ R2 e c = (a, b). Devemos, então, provar
∂2 f ∂2 f
que (a, b) = (a, b).
∂x ∂y ∂y ∂x
Seja ε > 0 tal que (a − ε, a + ε) × (b − ε, b + ε) ⊂ U. Para todo t ∈ (−ε, ε) e x ∈ (a − ε, a + ε),
sejam:
Então ϕ(t) = ξ(a + t) − ξ(a). Pelo Teorema do Valor Médio para funções de uma variável real,
existe θ ∈ (0, 1) tal que ϕ(t) = ξ 0(a + θt)t, ou seja,
∂f ∂f
ϕ(t) = (a + θt, b + t) − (a + θt, b) t.
∂x ∂x
∂f
Como a função : U −→ R é diferenciável no ponto c = (a, b) temos que:
∂x
∂f ∂f ∂2 f ∂2 f
• (a + θt, b + t) = (a, b) + 2 (a, b)θt + (a, b)t + ρ1 t , com lim ρ1 = 0 .
∂x ∂x ∂x ∂y ∂x t→0
e
∂f ∂f ∂2 f
• (a + θt, b) = (a, b) + 2 (a, b)θt + ρ2 t , com lim ρ2 = 0.
∂x ∂x ∂x t→0
∂2 f
Logo ϕ(t) = (a, b)t2 + (ρ1 − ρ2 )t2 , e, portanto,
∂y ∂x
ϕ(t) ∂2 f
lim 2 = (a, b) . (I)
t→0 t ∂y ∂x
Seja, agora, η(y) = f(a + t, y) − f(a, y). Então ϕ(t) = η(b + t) − η(b). Pelo teorema do Valor
0
Médio, existe θ ∈ (0, 1) tal que ϕ(t)
= η (b + θt) t, ou seja,
∂f ∂f
ϕ(t) = (a + t, b + θt) − (a, b + θt) t .
∂y ∂y
∂f
Como a função : U −→ R é diferenciável no ponto c = (a, b), temos que:
∂y
∂f ∂f ∂2 f ∂2 f
• (a + t, b + θ t) = (a, b) + (a, b)t + 2 (a, b)θt + ρ3 t , com lim ρ3 = 0 ,
∂y ∂y ∂x ∂y ∂y t→0
e
∂f ∂f ∂2 f
• (a, b + θt) = (a, b) + 2 (a, b)θt + ρ4 t , com lim ρ4 = 0.
∂y ∂y ∂ y t→0
∂2 f
Logo ϕ(t) = (a, b) + (ρ3 − ρ4 ) t2 , e, portanto,
∂x∂y
ϕ(t) ∂2 f
lim 2 = (a, b) . (II)
t→0 t ∂x ∂y
∂2 f ∂2 f
Assim, por (I) e (II), (a, b) = (a, b) .
∂y ∂x ∂x ∂y
∂2 f ∂2 f
Corolário 7.1. Se f : U −→ R é de classe C2 no aberto U ⊂ Rn , então (x) = (x)
∂xi ∂xj ∂xj ∂xi
para todo x ∈ U e para todo 1 ≤ i, j ≤ n.
xy(x2 − y2 )
Exemplo 7.1. Seja f : R2 −→ R a função dada por f(x, y) = , se (x, y) 6= (0, 0), e
x 2 + y2
f(0, 0) = 0.
∂f ∂f
∂2 f (0, t) − (0, 0) −t
• (0, 0) = lim ∂x ∂x = lim = −1 ;
∂y ∂x t→0 t t→0 t
∂f ∂f
(t, 0) − (0, 0)
∂2 f ∂y ∂y t
• (0, 0) = lim = lim = 1 .
∂x ∂y t→0 t t→0 t
Logo f possui derivadas parciais de segunda ordem em todos os pontos do plano, mas
∂2 f ∂2 f
(0, 0) 6= (0, 0) .
∂x, ∂y ∂y ∂x
∂f ∂f
Pode-se verificar também que e são contı́nuas em R2 , ou seja, f é de classe C1 em R2 ,
∂x ∂y
∂f ∂f
mas e não são diferenciáveis na origem. Logo f é diferenciável na origem, mas não é
∂x ∂y
duas-vezes diferenciável na origem.
∂2 f ∂2 f
Além disso, apesar das derivadas de segunda ordem e existirem em todos os pontos
∂x ∂y ∂y ∂x
do plano, elas não são contı́nuas na origem.
Daremos, agora, outra versão do Teorema de Schwarz que decorre da Regra de Leibniz.
∂f ∂2 f
Teorema 7.2. Seja f : U ⊂ Rn −→ R uma função tal que existem e em todos os
∂xi ∂xi ∂xj
∂f ∂2 f ∂2 f
pontos de U, e as funções , : U −→ R são contı́nuas. Então, a derivada existe
∂xj ∂xi ∂xj ∂xj ∂xi
∂2 f ∂2 f
em todos os pontos de U e ≡ .
∂xj ∂xi ∂xi ∂xj
Prova.
Vamos supor n = 2 para simplificar a notação.
Dado (x0 , y0 ) ∈ U, existe ε > 0 tal que I × J ⊂ U, onde I = (x0 − ε, x0 + ε) e J = (y0 − ε, y0 + ε).
Seja b ∈ J. Pelo Teorema Fundamental do Cálculo,
Z temos que y
∂f
f(x, y) = f(x, b) + (x, t) dt ,
b ∂y
∂f
para todo (x, y) ∈ I × J, uma vez que é contı́nua, e, portanto, integrável.
∂y
∂f ∂2 f
Como , : I × J −→ R são contı́nuas, por hipótese, temos, pela Regra de Leibniz, que:
∂y ∂x ∂y Zy 2
∂f ∂f ∂ f
(x, y) = (x, b) + (x, t) dt .
∂x ∂x b ∂x ∂y
Zy
∂2 f ∂2 f
Logo, como o integrando é contı́nuo, temos, também, que a função (x, t) dt é
∂x ∂y b ∂x ∂y
derivável em relação a y e Z y
∂ ∂2 f ∂2 f
(x, t) dt = (x, y) .
∂y b ∂x ∂y ∂x ∂y
∂f ∂2 f ∂2 f
Assim, possui derivada em relação a y e (x, y) = (x, y) para todo (x, y) ∈ I × J.
∂x ∂y ∂x ∂x ∂y
Observação 7.2. Seja f : U ⊂ R2 −→ R uma função três vezes diferenciável. Então as seis
derivadas mistas de terceira ordem satisfazem:
∂3 f ∂3 f ∂3 f ∂3 f ∂3 f ∂3 f
= = e = = .
∂x ∂x ∂y ∂x ∂y ∂x ∂y ∂x ∂x ∂y ∂y ∂x ∂y ∂x ∂y ∂x ∂y ∂y
De fato, pelo Teorema de Schwarz, 2
∂3 f ∂ ∂2 f ∂ ∂ f ∂3 f
= = = ,
∂x ∂x ∂y ∂x ∂x ∂y ∂x ∂y ∂x ∂x ∂y ∂x
∂f
e, fazendo g = , temos que
∂x
∂f
∂3 f ∂ ∂ ∂2 g ∂2 g ∂ ∂3 f
∂ ∂f
= = = = = ,
∂x ∂y ∂x ∂x ∂y ∂x ∂x ∂y ∂y ∂x ∂y ∂x ∂x ∂y ∂x ∂x
uma vez que f e g são duas vezes diferenciáveis.
Para demonstrar o caso geral, basta sabermos que podemos trocar a ordem de duas deriva-
das sucessivas e que qualquer mudança de ordem numa sequência finita pode ser obtida por
transposições sucessivas entre dois termos consecutivos da sequência.
Observação 8.1. dfp (a)(tv)p = tp dp f(a) vp , ou seja, dfp (a) é um polinômio homogêneo de
grau p nas coordenadas de v.
Observação 8.2. Usando a notação acima, a Regra da Cadeia enuncia-se do seguinte modo:
Seja f = (f1 , . . . , fn ) : U ⊂ Rm −→ Rn uma aplicação tal que fi : U −→ R é diferenciável em a
De fato,
X X X
m m n
!
∂(g ◦ f) ∂g ∂f
d(g ◦ f)(a) v = (a) αi = (f(a)) k (a) αi
∂xi ∂yk ∂xi
i=1 i=1 k=1
X
n X
m
∂g ∂fk X
m
∂g
= (f(a)) (a) αi = (f(a)) dfk (a) v
∂yk ∂xi ∂yk
k=1 i=1 k=1
Prova.
Seja ε > 0 tal que a + tv ∈ U para todo t ∈ (−ε, 1 + ε), e seja λ : (−ε, 1 + ε) −→ Rn o ca-
minho C∞ dado por λ(t) = a + tv. Então a função ϕ = f ◦ λ : (−ε, 1 + ε) −→ R é de classe Cp
em (−ε, 1 + ε) e é (p + 1)−vezes diferenciável em (0, 1).
Logo, pela Fórmula de Taylor com resto de Lagrange para uma função real de uma variável real,
existe θ ∈ (0, 1), tal que
ϕ 00 (0) ϕ(p) (0)
ϕ(1) = ϕ(0) + ϕ 0 (0) + + ... + + rp ,
2! p!
ϕ(p+1) (θ)
onde rp = . (I)
(p + 1)!
Afirmação: ϕ(i) (t) = d(i) f(a + tv) vi , 1 ≤ i ≤ p + 1 , t ∈ (0, 1).
De fato,
∂f X
n
∂f
0
ϕ (t) = (a + tv) = df(a + tv) v = (a + tv) αi .
∂v ∂xi
i=1
Suponhamos, por indução, o resultado válido para uma função p−vezes diferenciável.
∂f
Seja f : U −→ R uma função (p + 1)−vezes diferenciável em (a, a + v). Então : U −→ R é
∂xi
p−vezes diferenciável, para todo i = 1, . . . , n.
(i) i ∂f
Portanto, pela hipótese de indução, λj (t) = d (a + tv)vi , i = 1, . . . , p, onde
∂xj
∂f
λj (t) = (a + tv). Assim,
∂xj
X
n
(k)
Xn
∂f
(k+1) k k
ϕ (t) = λj (t)αj = d (a + tv) v αj
∂xj
j=1 j=1
∂f
X
n
X
n ∂k
∂xj
= (a + tv) αj1 . . . αjk
αj
∂xj1 . . . ∂xjk
j=1 j1 ,...,jk =1
X
n
∂k+1 f
= (a + tv) αj1 . . . αjk αj
∂xj1 . . . ∂xjk ∂xj
j,j1 ,...,jk =1
• Como ϕ(1) = f(a + v) , ϕ(0) = f(a) , ϕ(i) (0) = di f(a) vi e ϕp+1 (θ) = df(p+1) (a + θv) vp+1 ,
temos, por (I), que a fórmula de Taylor com resto de Lagrange também é válida para funções
reais de n−variáveis.
Prova.
Como ϕ = f ◦ λ é de classe Cp+1 em (−ε, 1 + ε), temos, pela Fórmula de Taylor com resto
integral para funções reais de uma variável real, que
ϕ(p) (0)
ϕ(1) = ϕ(0) + ϕ 0 (0) + . . . + + rp ,
p!
Z1
1
onde rp = (1 − t)p ϕ(p+1) (t) dt .
p! 0
Logo,
1 (p)
f(a + v) = f(a) + df(a) v + . . . + d (a) vp + rp (v) ,
p!
onde
Z1
1
rp (v) = (1 − t)p dp+1 f(a + tv) vp+1 dt .
p! 0
caráter geral.
Definição 8.2. Dizemos que uma função f : Rn −→ R é k−homogênea quando f(tx) = tk f(x)
para todo x ∈ Rn e t ∈ R.
para todo j = 1, . . . , k.
De fato, seja ϕ(t) = f(tx) = tk f(x). Então, como foi provado no Teorema 8.1, temos:
ϕ(i) (t) = di f(tx)xi , para todo i ∈ N.
k!
Mas, por outro lado, ϕ(i) (t) = tk−i f(x), para todo 1 ≤ i ≤ k, e ϕ(j) (t) = 0 para j > k.
(k − i)!
Logo di f(0)xi = 0 para i 6= k e dk f(0)xk = k! f(x).
1 k
Então f(x) = L(x, . . . , x), onde L = d f(0) é uma transformação k−linear simétrica.
k!
Como dk f(x) = dk f(0) para todo x ∈ Rn , temos que dk f(x) = k! L para todo x ∈ Rn .
x2 − y2
Exemplo 8.2. Seja f : R2 −→ R a função definida por f(x, y) = xy , (x, y) 6= (0, 0), e
x2 + y2
f(0, 0) = 0.
Então f(tx, ty) = t2 f(x, y) para todo t ∈ R e todo (x, y) ∈ R2 , ou seja, f é uma função
2−homogênea. Mas, f não é a forma quadrática de uma transformação bilinear. Isso ocorre
porque f é de classe C1 , mas f não é duas vezes diferenciável na origem (verifique!).
1
Afirmação 3: dj f(x)(v1 , . . . , vj ) = dk f(0)(x, . . . , x, v1 , . . . , vj ) para todo 1 ≤ j ≤ k.
(k − j)!
∂j f
Sejam 1 ≤ j ≤ k e g(x) = (x) , onde i1 , . . . , ij ∈ {1, . . . , n}. Como
∂xi1 . . . ∂xij
∂j f ∂j f
(tx) = tk−j (x),
∂xi1 . . . ∂xij ∂xi1 . . . ∂xij
temos que g é (k − j)−homogênea e, portanto, por (II), d(k−j) g(0)xk−j = (k − j)! g(x), ou seja,
jf
∂ ∂j f
dk−j (0)xk−j = (k − j)! (x) ,
∂xi1 . . . ∂xij ∂xi1 . . . ∂xij
n
para todo x ∈ R e quaisquer i1 , . . . , ij = 1, . . . , n.
1
= dk f(0)(x, . . . , x, v1 , . . . , vj ) .
(k − j)!
• Em particular, seja T : Rn × . . . × Rn −→ R uma transformação k−linear e f : Rn −→ R dada
por f(x) = T (x, . . . , x). Então, como f é k−homogênea e de classe C∞ , temos, por (II), que
1
f(x) = T (x, . . . , x) = dfk (0)(x, . . . , x) ,
k!
ou seja,
dfk (0)(x, . . . , x) = k! T (x, . . . , x) . (III)
Se k = 1, a afirmação é evidente.
Sejam v, w ∈ Rn e t ∈ R. Então,
k k−1
0 = U(v + tw, v + tw, . . . , v + tw) = t U(v, w, . . . , w)
k−1
k−2 k k
+t U(v, v, w, . . . , w) + . . . + t U(v, . . . , v, w) ,
k−2 1
para todo t ∈ R.
◦ dk f(x) = dk f(0) = TS ;
◦ dj f(x) = 0, se j > k.
1
◦ dj f(x)(v1 , . . . , vj ) = TS (x, . . . , x, v1 , . . . , vj ), se 1 ≤ j ≤ k, quaisquer que sejam
(k − j)!
v1 , . . . , vj ∈ Rn .
◦ dj f(0) = 0, se 1 ≤ j < k.
1 2 1
rp (v) = f(a + v) − f(a) − df(a) v − d f(a)v2 − . . . − dp f(a)vp .
2! p!
De fato, seja g : U0 −→ R dada por g(v) = f(a + v). Então g é p−vezes diferenciável na origem,
pois a função v 7−→ a + v é de classe C∞ e f é p−vezes diferenciável em a.
Para j = 1, temos, pela Regra da Cadeia (ver observação 8.2), que dg(0)v = df(a)v para todo
∂g ∂f
v ∈ Rn , ou seja, (0) = (a) para todo i = 1, . . . , n.
∂xi ∂xi
Suponhamos que o resultado seja válido para funções (p − 1)−vezes diferenciáveis no ponto
∂f
a ∈ U, p−1 ≥ 1. Seja f uma função p−vezes diferenciável no ponto a. Então é (p−1)−vezes
∂xi
diferenciável no ponto a, para todo i = 1, . . . , n.
∂f
Pela hipótese de indução, a função h dada por h(v) = (a + v), v ∈ U0 , é (p − 1)−vezes
∂xi
diferenciável na origem e
∂f
∂k
∂k h ∂xi
(0) = (a) , (V)
∂xi1 . . . ∂xik ∂xi1 . . . ∂xik
para 1 ≤ k ≤ p − 1, quaisquer que sejam i1 , . . . , ik ∈ {1, . . . , n}.
Prova.
(=⇒) Para p = 0, estamos supondo r contı́nua no ponto 0.
n
αi
Considerando R com a norma do máximo, temos que
≤ 1, para todo i = 1, . . . , n.
kvk
∂r
(θv v)
r(v) ∂xi
Logo lim = 0, uma vez que lim = 0, para todo i = 1, . . . , n.
v→0 kvkp v→0 kθv vkp−1
(⇐=) Para p = 0, lim r(v) = 0, e, portanto, r(0) = 0, pois estamos supondo r contı́nua na origem.
v→0
r(v)
Para p = 1, lim r(v) = lim kvk = 0. Então r(0) = 0, pois r é contı́nua na origem, uma vez
v→0 v→0 kvk
que r é diferenciável neste ponto. Além disso, como f é diferenciável na origem,
r(v) = r(0) + dr(0)v + r(v) = dr(0)v + r(v) ,
r(v) r(tv) r(tv)
onde lim = 0. Logo, para todo v ∈ Rn − {0} e para todo t ∈ R − {0}, = dr(0)v + .
v→0 kvk t t
Como
r(tv) r(tv)
lim = lim = 0,
t→0 ktvk t→0 ktvk
temos que
r(tv) r(tv) r(tv) r(tv)
dr(0)v = lim − lim = lim ±kvk − = 0,
t→0 t t→0 t t→0 ktvk ktvk
já que dj ϕ(0) = 0, j = 1, . . . , p, e dp+1 ϕ(0) = (p + 1)! dp+1 r(0), onde ϕ(v) = dp+1 r(0)vp+1 .
Então, para todo v ∈ Rn − {0},
1
r(tv) − dp+1 r(0)(tv)p+1
(p + 1)!
lim = 0,
t→0+ ktvkp+1
e, portanto,
1 dp+1 r(0)vp+1 r(tv)
= lim+ = 0.
(p + 1)! kvkp+1 t→0 ktvkp+1
X
n
∂2 f
2 2 2
Hf(a) v = d f(a) v = (a) αi αj ,
∂xi ∂xj
i,j=1
n
onde v = (α1 , . . . , αn ) ∈ R .
∂2 f
• Pelo teorama de Schwarz, a matriz (a) , chamada matriz Hessiana de f no ponto a,
∂xi ∂xj
é simétrica.
Definição 8.5. Dizemos que a função f tem um máximo (respectivamente, um mı́nimo) local
no ponto a ∈ U quando existe δ > 0 tal que
kvk < δ =⇒ f(a + v) ≤ f(a) (respectivamente, f(a) ≤ f(a + v)) .
De fato, neste caso o ponto 0 é um ponto de máximo (ou de mı́nimo) local para as funções reais
∂f
de uma variável real dadas por: ϕi (t) = f(a + tei ), i = 1, . . . , n. Logo (a) = ϕi0 (0) = 0, para
∂xi
todo i = 1, . . . , n.
Teorema 8.3. Seja f : U ⊂ Rn −→ R uma função duas vezes diferenciável. Todo ponto crı́tico
não-degenerado a ∈ U é um ponto crı́tico isolado.
Lema 8.2. Seja H : Rn −→ Rn uma transformação linear invertı́vel. Então existe c > 0 tal que
kH(x)k ≥ ckxk para todo x ∈ Rn .
Prova.
1
Seja = kH−1 k = sup kH−1 (x)k | kxk = 1 > 0. Então, para todo x ∈ Rn :
c
kH(x)k
kxk = kH−1 (H(x))k ≤ kH−1 k kH(x)k = ,
c
ou seja, kH(x)k ≥ ckxk.
Prova.
(Demonstração do teorema 8.4)
∂fi
onde lim ρi (x) = 0 e hij = (a) .
x→a ∂xj
Fazendo ρ(x) = (ρ1 (x), . . . , ρn (x)), temos que:
F(x) = F(a) + H(x − a) + ρ(x) kx − ak ,
Prova.
(Demonstração do teorema 8.3)
n ∂f ∂f
Seja F : U −→ R dada por F(x) = (x), . . . , (x) . Então F tem funções coordenadas
∂x1 ∂xn 2
∂f ∂fi ∂ f
fi = diferenciáveis no ponto a e a matriz (a) = (a) é a matriz Hessiana de
∂xi ∂xj ∂xj ∂xi
f no ponto a. Logo, pelo teorema 8.4, existe δ > 0 tal que 0 < kx − ak < δ =⇒ F(x) 6= F(a) = 0,
ou seja, grad f(x) 6= 0. Provamos, assim, que se 0 < kx − ak < δ, então x não é um ponto crı́tico
de f.
Corolário 8.1. O conjunto dos pontos crı́ticos não-degenerados de uma função duas vezes
diferenciável é enumerável.
Prova.
Basta lembrar que todo conjunto discreto é enumerável.
Corolário 8.2. Se todos os pontos crı́ticos de uma função f : U −→ R, duas vezes dife-
renciável, são não-degenerados, então em cada compacto K ⊂ U há apenas um número finito
deles.
Prova.
Como f é de classe C1 , o conjunto C dos pontos crı́ticos é um subconjunto fechado de U,
∂f ∂f
pois C = F−1 (0), onde F é a função contı́nua dada por F(x) = (x), . . . , (x) . Logo o
∂x1 ∂xn
conjunto dos pontos crı́ticos de f contidos num compacto K ⊂ U é fechado em K e é, portanto,
compacto. Como C ∩ K é compacto e discreto, temos que C ∩ K é finito.
X
n
Definição 8.7. Seja H : R −→ R a forma quadrática dada por H v =
n 2
hij αi αj , onde
i,j=1
hij = hji , i, j = 1, . . . , n, e v = (α1 , . . . , αn ) ∈ Rn .
Se uma forma quadrática é positiva ou negativa, dizemos que ela é definida. E dizemos que
uma forma quadrática H é indefinida quando existem v, w ∈ Rn tais que H v2 > 0 e H w2 < 0.
é indefinida.
Observação 8.7.
• H é positiva se, e somente se, todos os autovalores da matriz simétrica (hij ) são positivos.
• H é negativa se, e somente se, todos os autovalores da matriz simétrica (hij ) são negativos.
Podemos também provar isto, observando que se Hv2 6= 0 para todo v ∈ Rn − {0} então
6 0 para todo v ∈ Rn − {0}, onde H0 = (hij ). Logo H0 v 6= 0 para todo v ∈ Rn − {0}
Hv2 = hH0 v, vi =
e, portanto, H0 é invertı́vel.
• H é indefinida se, e somente se, H0 = (hij ) possui um autovalor positivo e outro negativo.
Teorema 8.5. Sejam f : U −→ R uma função duas vezes diferenciável no ponto crı́tico a ∈ U
e H a forma quadrática Hessiana de f no ponto a. Então:
Prova.
Seja δ0 > 0 tal que Bδ0 (a) ⊂ U. Então a + v ∈ U se 0 < kvk < δ0 .
Se H é indefinida, existem v, w ∈ Rn − {0} tais que Hv2 > 0 e Hw2 < 0. Então, para todo t 6= 0,
temos que H (tv)2 = t2 Hv2 > 0 e H (tw)2 = t2 Hw2 < 0. Logo, por (?),
f(a + tv) − f(a) r(tv) f(a + tw) − f(a) r(tw)
2
= Hv2 + 2 e 2
= Hw2 + 2 .
t t t t
r(tv) r(tw)
Como lim 2 = lim 2 = 0, segue-se que
t→0 t t→0 t
Exemplo 8.4. Seja f : Rm+n = Rm × Rn −→ R a função definida por f(x, y) = hx, xi − hy, yi,
∂f ∂f
onde x ∈ Rm e y ∈ Rn . Então = 2xi e = −2yj . Logo grad f(x, y) = 2(x, −y) e, portanto,
∂xi ∂yj
a origem é o único ponto crı́tico de f.
Para mn 6= 0, f não admite mı́nimo nem máximo na origem, que se chama um ponto de sela,
devido à forma do gráfico da função f(x, y) = x2 − y2 .
Observação 8.9. Como vimos na demonstração do teorema 8.5, se grad f(a) = 0 e Hv2 > 0
para algum v ∈ Rn , então existe δ > 0 tal que 0 < |t| < δ =⇒ f(a + tv) > f(a). Então se a é um
ponto de máximo local de f, a forma Hessiana de f no ponto a é não-positiva, isto é, Hv2 ≤ 0
para todo v ∈ Rn . De modo análogo, se a é um ponto de mı́nimo local de f, então a forma
Hessiana de f no ponto a é não-negativa, ou seja, Hv2 ≥ 0 para todo v ∈ Rn .
Mas a recı́proca destas afirmações são falsas, ou seja, quando a forma hessiana de f num ponto
crı́tico é ≤ 0 (ou ≥ 0) não se pode afirmar que a função tem um máximo (ou um mı́nimo) neste
ponto.
Então grad f(x, y) = (2x, 0), grad g(x, y) = (2x, 3y2 ), e as hessianas de f e g no ponto crı́tico
(0, 0) coincidem e são não-negativas, pois Hf(0, 0)v2 = Hg(0, 0)v2 = 2α2 para todo v = (α, β) ∈
R2 . Mas a origem é um ponto de mı́nimo para f e não é um mı́nimo local para g.
Fig. 9: Uma curva de classe Ck é, localmente, o gráfico de uma função de classe Ck
Definição 9.2. Um conjunto M ⊂ Rn+1 chama-se uma hipersuperfı́cie (ou hiperfı́cie) de classe
Ck , 0 ≤ k ≤ ∞, de Rn+1 quando M é localmente o gráfico de uma função de classe Ck de n
variáveis. Ou seja, todo ponto p ∈ M pertence a um aberto V ⊂ Rn+1 tal que V ∩ M é o gráfico
de uma função de classe Ck definida num aberto de Rn (existem um aberto U ⊂ Rn , uma função
ξ : U −→ R de classe Ck e um inteiro i ∈ {1, . . . , n + 1} tais que xi = ξ(x1 , . . . , xi−1 , xi+1 , . . . , xn+1 )
e x? = (x1 , . . . , xi−1 , xi+1 , . . . , xn+1 ) ∈ U).
Prova.
Dado p = (a1 , . . . , an+1 ) ∈ M, existem abertos V ⊂ Rn+1 , U ⊂ Rn , com p ∈ V, um inteiro
i ∈ {1, . . . , n + 1} e uma função ξ : U −→ R diferenciável tais que x ∈ V ∩ M ⇐⇒ xi = ξ(x? ),
onde x? = (x1 , . . . , xi−1 , xi+1 , . . . , xn+1 ) ∈ U.
X ∂ξ
Afirmação: Tp M = v = (α1 , . . . , αn+1 ) ∈ Rn+1 αi = (p? ) αj ,
∂xj
j6=i
Logo λi (t) = ξ(λ1 (t), . . . , λi−1 (t), λi+1 (t), . . . , λn+1 (t)) para todo t ∈ (−ε0 , ε0 ).
∂ξ ?
onde v = (α1 , . . . , αn+1 ) e cj = (p ). Ou ainda, Tp M é o gráfico do funcional linear
∂xj
Exemplo 9.6. Seja Sn = {x ∈ Rn+1 | hx, xi = 1}. Já sabemos que Sn é uma hipersuperfı́cie de
classe C∞ .
Então, como hλ(t), λ(t)i = 1 para todo t ∈ (−ε, ε) , temos que 2hλ 0 (0), λ(0)i = 0 , ou seja,
hv, pi = 0 . Logo Tp Sn ⊂ [p]⊥ e, portanto, Tp Sn = [p]⊥ , pois dim Tp Sn = dim[p]⊥ = n.
q
Portanto, v21 + v22 = 0, ou seja, v1 = v2 = v3 = 0.
Exemplo 9.8. Seja Y a superfı́cie de classe C0 dada por Y = {(x, y, z) ∈ R3 | z = |x|}. Então,
para p = (0, 0, 0), Tp Y = {(0, β, 0) | β ∈ R} é um espaço vetorial de dimensão 1 (6= 2) em R3 .
De fato, seja λ : (−ε, ε) −→ Y, λ(t) = (λ1 (t), λ2 (t), λ3 (t)), uma curva diferenciável em t = 0 com
λ(0) = (0, 0, 0) e λ 0 (0) = (v1 , v2 , v3 ) = v.
λ1 (t)
Então λ3 (t) = |λ1 (t)| e v1 = λ10 (0) = lim .
t→0 t
Suponhamos que v1 > 0. Então existe 0 < ε0 < ε tal que λ1 (t) > 0 para t ∈ (0, ε0 ) e λ1 (t) < 0
para t ∈ (−ε0 , 0). Assim,
λ3 (t) |λ (t)| λ (t)
v3 = λ30 (0) = lim± = lim± 1 = lim± ± 1 = ±v1 .
t→0 t t→0 t t→0 t
Logo v1 = 0, uma contradição. De modo análogo, podemos provar que v1 não pode ser negativo.
Reciprocamente, seja v = (0, β, 0) , β ∈ R. Então a curva λ : R −→ Y, dada por λ(t) = (0, βt 0),
é de classe C∞ , λ(0) = (0, 0, 0) e λ 0 (0) = (0, β, 0). Logo (0, β, 0) ∈ Tp Y para todo β ∈ R.
Assim, Tp Y = {(0, β, 0) ∈ R3 | β ∈ R} .
Como grad f(x, y) = (2x, 2y) para todo (x, y) ∈ R2 , temos que grad f(x, y) = (0, 0) se, e só se,
(x, y) = (0, 0). Logo f−1 (c) é um nı́vel regular para todo c ∈ R − {0}, pois f(0, 0) = 0.
para todo p ∈ M.
Exemplo 9.10. Seja f : Rn+1 −→ R a função de classe C∞ dada por f(x) = hx, xi. Como
∂f
grad f(x) = 2x, pois (x) = 2xi , para todo i = 1, . . . , n + 1, grad f(x) = 0 se, e somente se,
∂xi
x = 0, ou seja, se, e só se, f(x) = 0. Assim, f−1 (c) é um nı́vel regular para todo c ∈ R − {0},
sendo f−1 (c) = ∅, se c < 0, e f−1 (c) = Sn√c (0), se c > 0. Logo, pelo teorema acima, Sn√c é uma
hipersuperfı́cie de classe C∞ e
Tp Sn√c (0) = {v ∈ Rn+1 | hv, 2pi = 0} = [p]⊥ ,
∂ det
a restrição det : U −→ R é uma função C∞ sem pontos crı́ticos. De fato, se (X) = 0 para
∂xij
todo i, j = 1, . . . , n, então
X
n
det X = (−1)i+j xij X[i,j] = 0 ,
j=1
Em particular,
M = det−1 (1) = (conjunto das matrizes n × n que têm determinante igual a 1)
Observação 9.3. Toda hipersuperfı́cie M ⊂ Rn+1 , sendo localmente o gráfico de uma função
xi = ξ(x1 , . . . , xi−1 , xi+1 , . . . , xn+1 ) = ξ(x? ), de n variáveis, é também localmente a imagem
inversa f−1 (0) do valor regular 0 da função f(x) = xi − ξ(x? ), definida no aberto V ⊂ Rn+1 tal que
∂f
V ∩ M é o gráfico de ξ, pois (x) = 1 para todo x ∈ V e f−1 (0) = {x ∈ V | xi = ξ(x? )} = V ∩ M.
∂xi
Y
n+1 Y
Para isso, estamos supondo V = Ij , onde cada Ij é um intervalo aberto, e U = Ij é o
j=1 j6=i
domı́nio da função ξ.
Mas não é verdade que toda hipersuperfı́cie M ⊂ Rn+1 seja globalmente a imagem inversa de
um valor regular, pois se M = f−1 (c), a aplicação ϕ = grad f : M −→ Rn+1 fornece um campo
contı́nuo de vetores normais não-nulos ao longo de M, uma vez que ϕ(p) = grad f(p) ⊥ v para
todo v ∈ Tp M. As hipersuperfı́cies que admitem um campo contı́nuo de vetores normais não-
nulos ϕ : M −→ Rn+1 chamam-se hipersuperfı́cies orientáveis. Mas nem toda hipersuperfı́cie
em Rn+1 é orientável, como a faixa de Möbius em R3 (ver §14, Cap. V).
Portanto, existem hipersuperfı́cies em Rn+1 que não são globalmente a imagem inversa de um
valor regular.
Prova.
Dado x0 ∈ X, seja y0 = ξ(x0 ) ∈ K e seja {xn } uma sequência de pontos de X tal que xn −→ x0 .
Como a sequência {ξ(xn )} é limitada, pois ξ(xn ) ∈ K para todo n ∈ N, basta mostrar que toda
subsequência {ξ(xn )}n∈N 0 convergente em Rk tem limite y0 .
Seja N 0 ⊂ N tal que lim0 ξ(xn ) = y. Então y ∈ K, pois K é compacto. Além disso, como f é
n∈N
contı́nua e f(xn , ξ(xn )) = c para todo n ∈ N, temos c = lim0 f(xn , ξ(xn )) = f(x0 , y).
n∈N
Observação 9.4. Supondo K apenas limitado, o lema acima nem sempre é válido. Por exem-
plo, seja f : R × [0, 1) −→ R a função contı́nua definida por f(x, y) = (x2 + y2 )(ye|x| − 1). Então,
para cada x ∈ R, existe um único y ∈ [0, 1) tal que f(x, y) = 0, pois se x = 0, então y = 0, uma
vez que 1 6∈ [0, 1), e se x 6= 0, y = e−|x| ∈ [0, 1).
Logo f−1 (0) é o gráfico da função ξ : R −→ [0, 1) dada por ξ(0) = 0 e ξ(x) = e−|x| , se x ∈ R − {0},
que não é contı́nua em x = 0.
No teorema abaixo, representaremos os pontos de Rn+1 por pares (x, y), onde x ∈ Rn e
y ∈ R.
Prova.
∂f ∂f
Suponhamos que (x0 , y0 ) > 0. Como : U −→ R é contı́nua, existem δ 0 > 0 e ε > 0, tais
∂y ∂y
∂f
que B 0 × J ⊂ U e (x, y) > 0 para todo (x, y) ∈ B 0 × J, onde B 0 = Bδ 0 (x0 ) e J = (y0 − ε, y0 + ε).
∂y
Então, para todo x ∈ B 0 , a função y 7−→ f(x, y) é estritamente crescente no intervalo
J = [y0 − ε, y0 + ε]. Como f(x0 , y0 ) = c, temos que f(x0 , y0 − ε) < c e f(x0 , y0 + ε) > c.
Pela continuidade de f, existe 0 < δ < δ 0 tal que f(x, y0 − ε) < c e f(x, y0 + ε) > c para todo
x ∈ B = Bδ (x0 ). Então, pelo Teorema do Valor Intermediário, existe, para cada x ∈ B, um único
y = ξ(x) ∈ J tal que f(x, y) = c. Logo y = ξ(x) ∈ J e f−1 (c) ∩ (B × J) = f−1 (c) ∩ (B × J) é o
gráfico de uma função ξ : B −→ J a qual, pelo lema anterior, é contı́nua.
para todo t ∈ (−δ0 , δ0 ), onde δ0 foi escolhido de modo que x + tei ∈ B para todo t ∈ (−δ0 , δ0 ).
Pelo Teorema do Valor Médio, para todo t ∈ (−δ0 , δ0 ), existe θ = θ(t) ∈ (0, 1) tal que:
∂f ∂f
0 = f(x + tei , ξ(x) + k) − f(x, ξ(x)) = (x + θtei , ξ(x) + θk)t + (x + θtei , ξ(x) + θk)k.
∂xi ∂y
Logo,
∂f
(x + θtei , ξ(x) + θk)
ξ(x + tei ) − ξ(x) k ∂xi
= =−
t t ∂f
(x + θtei , ξ(x) + θk) .
∂y
Pela continuidade de ξ, lim k(t) = 0. Então, pela continuidade das derivadas parciais de f, a
t→0
∂ξ
derivada parcial (x) existe e é igual a
∂xi
∂f
(x, ξ(x))
∂ξ ∂x
(x) = − i (I)
∂xi ∂f
(x, ξ(x))
∂y
para todo i = 1, . . . , n.
∂ξ
Como f é de classe C1 e ξ é contı́nua, temos, por (I), que é contı́nua para todo i = 1, . . . , n,
∂xi
ou seja, ξ é de classe C1 .
Observação 9.5. No teorema da função implı́cita, não há nada especial a respeito da última
variável. Ou seja, vale o seguinte resultado:
(x1 , . . . , xn+1 ) ∈ Rn+1 | (x1 , . . . , xi−1 , xi+1 , . . . , xn+1 ) ∈ B e ξ(x1 , . . . , xi−1 , xi+1 , . . . , xn+1 ) = xi .
Além disso,
∂f
(x1 , . . . , xi−1 , ξ(x? ), xi+1 , . . . , xn+1 )
∂ξ ? ∂xj
(x ) = − ,
∂xj ∂f
(x1 , . . . , xi−1 , ξ(x? ), xi+1 , . . . , xn+1 )
∂xi
para todo x ∈ B e todo j = 1, . . . , n + 1 , j 6= i, onde x? = (x1 , . . . , xi−1 , xi+1 , . . . , xn+1 ).
Observação 9.6. No corolário acima, não basta supor que c é um valor regular de f. Por
exemplo, seja a função f : R2 −→ R de classe C∞ , dada por f(x, y) = x − y3 . Então, como
grad f(x, y) = (1, −3y2 ), todo c ∈ R é valor regular de f, mas a função contı́nua ξ : R −→ R,
√
dada por ξ(x) = 3 x, satisfaz f(x, ξ(x)) = 0 para todo x ∈ R e não é diferenciável na origem.
∂f
Observe que (x, 0) = 0 para todo x ∈ R.
∂y
Prova.
(do Teorema Global da Função Implı́cita)
∂f
Seja p ∈ f−1 (c). Como grad f(p) 6= 0, existe i ∈ {1, . . . , n + 1} tal que (p) 6= 0. Logo, pelo
∂xi
teorema da função implı́cita, existe um aberto V ⊂ Rn+1 tal que p ∈ V e V ∩ f−1 (c) é o gráfico de
uma função de classe Ck definida num aberto de Rn . Então M = f−1 (c) é uma hipersuperfı́cie
de classe Ck .
10 Multiplicador de Lagrange
Definição 10.1. Dizemos que p ∈ M é um ponto crı́tico de f|M se (f ◦ λ) 0 (0) = 0 para todo
∂f
caminho λ : (−ε, ε) −→ M diferenciável em t = 0 com λ(0) = p. Isto significa que (p) = 0
∂v
para todo v ∈ Tp M, ou seja, p ∈ M é um ponto crı́tico de f|M se, e só se, hgrad f(p), vi = 0 para
todo v ∈ Tp M, ou ainda, se, e somente se, o vetor grad f(p) é normal à hipersuperfı́cie M no
ponto p.
Observação 10.2. Todo ponto crı́tico de f em U que pertence a M é um ponto crı́tico de f|M ,
pois, neste caso, grad f(p) = 0 e, portanto, hgrad f(p), vi = 0 para todo v ∈ Rn+1 .
Mas pode existir um ponto crı́tico de f|M que não é ponto crı́tico de f em U, isto é, no qual grad f
não se anula.
Em geral, se a hipersuperfı́cie M ⊂ Rn+1 é compacta, então f|M admite pelo menos dois pontos
crı́ticos: os pontos onde f|M assume seus valores máximo e mı́nimo.
Prova.
Para todo ponto p ∈ M, temos Tp M = [grad ϕ(p)]⊥ , pois M é uma hipersuperfı́cie de nı́vel
de ϕ. Além disso, p é ponto crı́tico de f|M se, e só se, grad f(p) ⊥ Tp M.
Observação 10.3. A condição grad f(p) = λ grad ϕ(p) significa que a hipersuperfı́cie M é
tangente à hipersuperfı́cie de nı́vel de f que passa pelo ponto crı́tico p da função f|M . No caso
em que se podem esboçar as superfı́cies de nı́vel da função f, esta observação auxilia a localizar
os pontos crı́ticos (ver exemplo abaixo).
Observação 10.4. Quando a hipersuperfı́cie M não é dada como imagem inversa ϕ−1 (c)
de um valor regular, os pontos crı́ticos de f|M são simplesmente os pontos p ∈ M nos quais
grad f(p) é normal a M, ou seja, grad f(p) ⊥ v para todo v ∈ Tp M.
Exemplo 10.2. Seja f : R2 −→ R a função de classe C∞ dada por f(x, y) = ax + by, com
a2 + b2 6= 0, e seja S1 = ϕ−1 (1), onde ϕ : R2 −→ R é dada por ϕ(x, y) = x2 + y2 . Como 1 é valor
regular de ϕ, os pontos crı́ticos de f|S1 são os
pontos (x, y) ∈ S1 onde grad f(x, y) = (a, b)
e grad ϕ(x, y) = (2x, 2y) são múltiplos. Então
(a, b) = λ(x, y) e x2 + y2 = 1. Isto nos dá
a b
x= p e y= p ,
a2 + b2 a2 + b2
ou
a b
x = −p e y = −p .
a2 + b2 a2 + b2
Nestes pontos, f|S1 assume, respectivamente,
Fig. 15: Pontos crı́ticos de f|S1 .
p
seu valor máximo igual à a2 + b2 , e seu va-
p
lor mı́nimo igual a − a2 + b2 , pois
p
|f(x, y)| ≤ a2 + b2 para todo (x, y) ∈ S1 .
Exemplo 10.3. Dados uma hipersuperfı́cie M ⊂ Rn+1 e um ponto b ∈ Rn+1 tal que b 6∈ M,
determinar o ponto p ∈ M mais próximo a b. No caso em que M é fechada, um tal ponto sempre
existe.
Exemplo 10.4. Seja A : Rn −→ Rn uma transformação linear autoadjunta, isto é, hAx, yi =
hx, Ayi para quaisquer x, y ∈ Rn . Isto equivale a dizer que a matriz (aij ) de A com respeito à
base canônica é simétrica, pois aij = hAej , ei i = hAei , ej i = aji .
Um número real λ é um autovalor de A quando existe um vetor y ∈ Rn − {0} tal que Ay = λy. E
os autovetores associados ao autovalor λ são os vetores x ∈ Rn tais que Ax = λx.
Em geral, uma transformação linear A : Rn −→ Rn não precisa ter autovalores reais, como a
rotação de ângulo θ ∈ (0, π) no plano.
De fato, seja f : Rn −→ R a forma quadrática dada por f(x) = hAx, xi ou, em termos de
Xn
coordenadas, f(x) = aij xi xj .
i,j=1
de f na esfera unitária Sn−1 ⊂ Rn . Como Sn−1 = ϕ−1 (1), onde 1 é valor regular da função
ϕ(x) = hx, xi, temos que x ∈ Sn−1 é um ponto crı́tico de f|Sn−1 se, e só se, os vetores grad f(x)
∂f Xn
e grad ϕ(x) = 2x são múltiplos. Sendo (x) = 2 aij xj , temos que grad f(x) = 2Ax. Logo
∂xi
j=1
n−1
os pontos crı́ticos de f|Sn−1 são os pontos u ∈ S tais que Au = λu e, num tal ponto, temos
f(u) = hλu, ui = λ, pois hu, ui = 1.
Provamos, assim, que dada a forma quadrática f : Rn −→ R, f(x) = hAx, xi, onde A : Rn −→ Rn
é autoadjunta, um ponto u ∈ Sn−1 é um ponto crı́tico de f|Sn−1 se, e só se, Au = λu, onde
λ = f(u). Ou seja, λ = f(u) é um autovalor de A e u é um autovetor de norma 1 associado ao
autovalor λ.
Seja λ2 o valor máximo da forma quadrática f entre os vetores unitários pertencentes a E, e seja
u2 ∈ E tal que |u2 | = 1 e f(u2 ) = λ2 . Então λ2 é um autovalor de A e Au2 = λ2 u2 .
Então ϕ−1 (c) = Mc é uma hipersuperfı́cie de classe C∞ de Rn , pois grad ϕ(y) = (1, 1, . . . , 1) 6=
(0, 0, . . . , 0) para todo y ∈ U.
Como Mc é compacto, pois Mc ⊂ [0, c] × . . . × [0, c], existe z ∈ Mc tal que f(z) é o valor máximo
de f|Mc . Então z ∈ Mc , pois f(y) = 0 para todo y ∈ Mc − Mc e f(y) > 0 para todo y ∈ Mc .
∂f Y
n
Sendo (y) = yj , para todo i = 1, . . . , n, temos, pelo método do multiplicador de La-
∂yi
j=1
j 6= i
Y
grange, que grad f(z) = λ grad ϕ(z) = (λ, . . . , λ). Então z1 + . . . + zn = c, zi > 0 e zj = λ,
j6=i
para todo i = 1, . . . , n.
Y
n
Afirmação: Se z1 , . . . , zn ∈ R − {0} e zj = λ para todo i = 1, . . . , n, então z1 = . . . = zn .
j=1
j 6= i
Se n = 2, é claro que z1 = z2 .
c
Como z1 + . . . + zn = c, temos z1 = . . . = zn = .
n
c n
Logo f(x1 , . . . , xn ) ≤ f(z1 , . . . , zn ) = , pois (x1 , . . . , xn ) ∈ Mc . Assim,
n
x + . . . + x n
n
x1 . . . x n ≤ 1 ,
n
ou seja,
√ x1 + . . . + xn
n
x1 . . . x n ≤ ,
n
para quaisquer números reais positivos x1 , . . . , xn , e a igualdade vale se, e só se, x1 = . . . = xn .
X
n
∂ϕ ∂f
ϕ(X) = (xij )2 . Então, para todos i, j = 1, . . . , n, (X) = 2xij e (X) = (−1)i+j X[i,j] ,
∂xij ∂xij
i,j=1
onde X[i,j] é o determinante da matriz (n − 1) × (n − 1), obtida de X pela omissão da i−ésima
linha e da j−ésima coluna.
2 √
Mais precisamente, M é a esfera em Rn de centro na origem e raio n.
Então, pelo método do Multiplicador de Lagrange, uma matriz W = (wij ) é um ponto crı́tico de
X
n
f|M se, e só se, w2ij = n e grad f(W) = λ grad ϕ(W) para algum λ real, ou seja,
i,j=1
(−1)i+j W[i,j] = 2λwij , (?)
para quaisquer i, j = 1, . . . , n.
Se W é uma matriz onde f|M atinge seu valor máximo ou mı́nimo, então det W 6= 0 e, pela
X
n
2
igualdade acima, kXi k = w2ij = 1 para todo i = 1, . . . , n, ou seja, os vetores-linha têm norma
j=1
igual a 1.
X
n
Logo hWk , Wi i = 0 para k 6= i, pois (−1)i+j wkj W[i,j] = 0, por ser o desenvolvimento, em
j=1
relação à i−ésima linha, do determinante de uma matriz com duas linhas (a i−ésima e a
k−ésima) iguais a Wk .
Assim, todo ponto W ∈ M onde f|M atinge seu valor máximo ou mı́nimo é uma matriz cujas
linhas são vetores unitários dois a dois ortogonais, ou seja W é uma matriz ortogonal. Logo
det W = +1, se W é um ponto de máximo, e det W = −1, se W é um ponto de mı́nimo. Então
−1 ≤ det W ≤ 1 para todo W ∈ M, ou seja, −kX1 k . . . kXn k ≤ det X ≤ kX1 k . . . kXn k para toda
matriz X.
E a igualdade | det X| = kX1 k . . . kXn k ocorre se, e só se, X1 , . . . , Xn são vetores dois a dois
ortogonais, no caso em que det X 6= 0.
Aplicações diferenciáveis
r(v)
Seja a aplicação ρ : U0 −→ Rn , dada por ρ(v) = , se v 6= 0, e ρ(0) = 0, onde
kvk
U0 = {v ∈ Rm | a + v ∈ U} é um aberto que contém a origem. Então f é diferenciável no ponto a
se, e só se, lim ρ(v) = 0, ou seja, ρ é contı́nua na origem.
v→0
Observação 1.1. O fato de uma aplicação ser ou não diferenciável num determinado ponto
independe das normas tomadas em Rn e Rm .
Observação 1.2. Toda aplicação diferenciável no ponto a é contı́nua neste ponto, pois
r(v)
lim f(a + v) = f(a) + lim Tv + lim kvk = f(a) .
v→0 v→0 v→0 kvk
185
Análise
Seja δ > 0 tal que o segmento (a − δv, a + δv) está contido em U e considere o caminho
∂f
retilı́neo λ : (−δ, δ) −→ U, dado por λ(t) = a + tv. Então (a) é o vetor velocidade do caminho
∂v
f ◦ λ : (−δ, δ) −→ Rn no instante t = 0, pois
f ◦ λ(t) − f ◦ λ(0) f(a + tv) − f(a) ∂f
(f ◦ λ) 0 (0) = lim = lim = (a) .
t→0 t t→0 t ∂v
Se f = (f1 , . . . , fn ) então
∂f
∂f ∂fn
1
(a) = (a), . . . , (a) .
∂v ∂v ∂v
∂f
Quando v = ej é o j−ésimo vetor da base canônica de Rm , escrevemos (a) em vez de
∂xj
∂f
(a). Assim,
∂ej
∂f ∂f1 ∂f
(a) = (a), . . . , n (a) .
∂xj ∂xj ∂xj
com lim ρ(tv) = 0. Como T (tv) = t Tv e ktvk = |t| kvk, temos que
t→0
f(a + tv) − f(a)
lim = Tv ± lim ρ(tv)kvk = Tv ,
t→0 t t→0
∂f
Logo Tv = (a). Em particular, obtemos que a transformação linear que satisfaz (?) é única.
∂v
Esta transformação, designada por f 0 (a) ou Df(a), é chamada a derivada de f no ponto a.
∂fi
Assim, Jf(a) = (a) , onde f1 , . . . , fn : U ⊂ Rm −→ R são as funções-coordenada de f.
∂xj
ri (v)
para todo i = 1, . . . , n. Então lim = 0, para todo i = 1, . . . , n, uma vez que r(v) =
v→0 kvk
r(v)
(r1 (v), . . . , rn (v)) e lim = 0. Ou seja, se f é diferenciável no ponto a, então cada função-
v→0 kvk
coordenada de f é diferenciável no ponto a e f 0 (a)v = (df1 (a)v, . . . , dfn (a)v).
ri (v)
com lim = 0, para todo i = 1, . . . , n.
v→0 kvk
Assim, se r(v) = (r1 (v), . . . , rn (v)),
X X
m m
!
∂f1 ∂fn
f(a + v) = f(a) + (a)αj , . . . , (a)αj + r(v) ,
∂xj ∂xj
j=1 j=1
r(v)
com lim = 0. Logo f é diferenciável no ponto a e
v→0 kvk
X X
m m
!
∂f1 ∂fn
f 0 (a)v = (a)αj , . . . , (a)αj = (df1 (a)v, . . . , dfn (a)v) .
∂xj ∂xj
j=1 j=1
para todo v ∈ Rm .
∂fi ∂f
Observação 1.4. Para cada i = 1, . . . , n, a i−ésima linha (a), . . . , i (a) da ma-
∂x1 ∂xm
triz Jacobiana Jf(a) é a matriz 1 × m da diferencial, dfi (a) : Rm −→ R, da i−ésima função-
coordenada fi de f em relação à base canônica de Rm .
Prova.
Basta observar que as funções-coordenada de f são as funções-coordenada de g seguidas
das funções-coordenada de h.
Também, pelo teorema 1.1 acima, uma aplicação ϕ : U −→ L(Rm ; Rn ) é diferenciável no ponto
a ∈ U se, e só se, cada uma das funções ϕij : U −→ R é diferenciável no ponto a.
Prova.
∂fi
(1)=⇒(2) Por serem as derivadas parciais as funções-coordenada da aplicação f 0 .
∂xj
(2)=⇒(1) Pelo teorema 3.2 do capı́tulo 3, (2) implica que cada função-coordenada fi é dife-
renciável e, portanto, f é diferenciável pelo teorema 1.1 acima. Além disso, f 0 é contı́nua, pois
∂fi
suas funções-coordenada, , são contı́nuas.
∂xj
(2)=⇒(3) Seja v = (α1 , . . . , αn ) ∈ Rm . Pelo provado acima, f é diferenciável. Então
∂f Xm
∂f
= αj .
∂v ∂xj
j=1
∂fi ∂f ∂f
Como cada função-coordenada, , de é contı́nua, temos que é contı́nua para todo
∂xj ∂xj ∂xj
∂f
j = 1, . . . , m. Logo, para todo v ∈ Rm , : U −→ Rn é contı́nua.
∂v
∂f
(3)=⇒(2) Tomando v = ej , temos, por hipótese, que a derivada parcial : U −→ Rn existe e é
∂xj
contı́nua, para todo j = 1, . . . , m.
∂fi
Logo, cada uma das funções-coordenada : U −→ R existe e é contı́nua .
∂xj
Em particular, f ∈ C1 se, e só se, cada uma das suas funções-coordenada é de classe C1 .
Como no teorema 1.2, podemos mostrar que as três condições acima são equivalentes.
Então, f satisfaz a uma delas se, e só se, satisfaz a todas. Assim, f é duas vezes diferenciável
no ponto a se, e só se, cada função-coordenada fi é duas vezes diferenciável no ponto a.
Pelo teorema de Schwarz para funções, segue que fi00 (a) · v · w = fi00 (a) · w · v para todo
i = 1, . . . , n. Logo,
f 00 (a) · v · w = f 00 (a) · w · v ,
ou seja,
∂2 f ∂2 f
(a) = (a)
∂w ∂v ∂v ∂w
quando f : U −→ Rn é duas vezes diferenciável no ponto a.
X
m X X
m X
m m
!
∂2 f1 (a) ∂2 fn (a)
= αj βk , · · · , αj βk
∂xj ∂xk ∂xj ∂xk
k=1 j=1 k=1 j=1
X
m
∂2 f(a)
= αj βk ,
∂xj ∂xk
j,k=1
Para verificar as equivalências acima, basta provar, por indução, que uma aplicação
f : U ⊂ Rm −→ Rn é k−vezes diferenciável no ponto a ∈ U se, e só se, cada função-coordenada
fi de f é k−vezes diferenciável no ponto a.
Pode-se provar, por indução, que uma aplicação f : U −→ Rn é de classe Ck se, e só se, cada
função coordenada fi de f é de classe Ck .
Assim, f é de classe Ck se, e só se, existem e são contı́nuas em U todas as derivadas par-
ciais de ordem ≤ k das funções-coordenada de f, ou ainda, para todo v ∈ Rm , a aplicação
∂f
: U −→ Rn é de classe Ck−1 .
∂v
Para completar, dizemos que f é de classe C0 quando f é contı́nua, e é de classe C∞ quando
f ∈ Ck para todo k = 0, 1, . . ..
De fato, como
ϕ(a + v, b + w) = ϕ(a, b) + ϕ(v, b) + ϕ(a, w) + ϕ(v, w),
ϕ(v, w)
basta mostrar que lim = 0.
(v,w)→(0,0) k(v, w)k
Pela observação 6.43 do capı́tulo 1, existe uma constante c > 0 tal que
kϕ(v, w)k ≤ ckvks kwks ,
e, portanto,
kϕ(v, w)k ckvks kwks
≤ ≤ ckvks .
k(v, w)ks kvks + kwks
ϕ(v, w)
Então lim = 0.
(v,w)−→(0,0) k(v, w)ks
Além disso, a aplicação derivada
ϕ 0 : Rm × Rn −→ L(Rm × Rn ; Rp )
(a, b) 7−→ ϕ 0 (a, b) ,
é linear, pois
ϕ 0 (a + λa 0 , b + λb 0 )(v, w) = ϕ(a + λa 0 , w) + ϕ(v, b + λb 0 )
= ϕ(a, w) + λϕ(a 0 , w) + ϕ(v, b) + λϕ(v, b 0 )
= (ϕ 0 (a, b) + λϕ 0 (a 0 , b 0 ))(v, w) ,
para todo (v, w) ∈ Rm × Rn . Então, pelo exemplo anterior, ϕ 0 é de classe C∞ e, portanto, ϕ é
de classe C∞ .
respectivamente.
Pode-se provar, de modo análogo ao caso bilinear (k = 2), que existe c > 0 tal que
kϕ(v1 , . . . , vk )k ≤ ckv1 ks · . . . · kvk ks .
Então, como
X
n
ϕ(a1 + v1 , . . . , ak + vk ) = ϕ(a1 , . . . , ak ) + ϕ(a1 , . . . , ai−1 , vi , ai+1 , . . . , ak )
i=1
X
+ ϕ(a1 , . . . , ai−1 , vi , ai+1 , . . . , aj−1 , vj , aj+1 , . . . , ak )
i<j
+ . . . + ϕ(v1 , . . . , vk ) ,
De fato, como
X
ϕ(a1 , . . . , ai−1 , vi , ai+1 , . . . , aj−1 , vj , aj+1 , . . . , ak ) + . . . + ϕ(v1 , . . . , vk )
i<j
X
≤ M(2) kvi ks kvj ks + . . . + M(k) kv1 ks . . . kvk ks ,
i<j
onde M(2) , . . . , M(k) são constantes positivas que dependem de ka1 ks , . . . , kak ks e c, podemos
Por exemplo, se k = 3,
ϕ 0 (a, b, c)(u, v, w) = ϕ(u, b, c) + ϕ(a, v, c) + ϕ(a, b, w) .
X
n
det 0 (X) · V = det(X1 , . . . , Xk−1 , Vk , Xk+1 , . . . , Xn ) .
k=1
Em particular, se V = Eij =matriz cuja (i, j)−ésima entrada é igual a 1 e as demais são iguais a
zero, então
∂ det
(X) = det 0 (X)Eij = det(X1 , . . . , Xi−1 , ej , Xi+1 , . . . , Xn ) = (−1)i+j X[i,j] ,
∂xij
onde X[i,j] é o determinante da matriz (n − 1) × (n − 1) obtida de X pela omissão da i−ésima
linha e da j−ésima coluna, re-obtendo, assim, um fato já conhecido.
Exemplo 2.4. Seja U = GL(Rn ) ⊂ Rn2 o conjunto aberto formado pelas matrizes n × n que
são invertı́veis.
De fato, se
r(V) = (A + V)−1 − A−1 + A−1 VA−1 ,
e, portanto,
r(V) = (A + V)−1 (VA−1 )2 .
Logo
kr(V)k ≤ k(A + V)−1 k kA−1 k2 kVk2 .
r(V)
Assim, pelo lema abaixo, lim = 0.
v→0 kVk
Lema 2.1. Seja A ∈ Rn2 uma matriz invertı́vel. Então existe c > 0 tal que, para toda n × n
1
matriz V, com kVk ≤ c, A + V é invertı́vel e k(A + V)−1 k ≤ .
c
Prova.
1
Seja c = > 0. Então
2kA−1 k
kxk = kA−1 (Ax)k ≤ kA−1 k kA(x)k ,
Observação 2.1. Existem critérios indiretos, como o Teorema da Função Implı́cita, que per-
mitem concluir que uma certa aplicação é diferenciável, sem que se conheça sua derivada.
Na ausência destes métodos indiretos, fica o problema de obter um candidato razoável para a
derivada, sem o qual não se pode provar a diferenciabilidade da aplicação.
Um processo, quando pode ser aplicado, é o de desenvolver f(a + v) (ou cada uma de suas
funções-coordenada) em série de potências nas coordenadas de v, e destacar a parte de pri-
meiro grau em relação a v, que é a candidata a ser f 0 (a)v.
No exemplo acima,
f(A + V) = (A + V)−1 = ((I + VA−1 )A)−1 = A−1 (I + VA−1 )−1 .
Seja X ∈ Rn tal que kXk < 1. Então I − X é invertı́vel, pois se existisse v ∈ Rn − {0} tal que
2
1
Seja X = −VA−1 tal que kVk < .
kA−1 k
Como kXk < 1, temos, por (?), que
X
∞
(I + VA−1 )−1 = (−1)j (VA−1 )j .
j=0
Logo,
(A + V)−1 = A−1 (I + VA−1 )−1 = A−1 − A−1 VA−1 + r(V) ,
onde
X X
∞
r(V) = A−1 (−1)j (VA−1 )j = A−1 (VA−1 )2 (−1)j (VA−1 )j ,
j≥2 j=0
1
se kVk < .
kA−1 k
2 1
Para todo V ∈ Rn , com kVk < , temos que
2kA−1 k
kr(V)k ≤ 2kVk2 kA−1 k3 ,
pois
X∞
X
∞
j −1 j
1
(−1) (VA )
≤ = 2.
2j
j=0 j=0
r(V)
Então lim = 0 e, portanto, f é diferenciável em A e f 0 (A)V = −A−1 VA−1 .
v→0 kVk
! positiva {e1 , e2 } na base positiva {f (z)e1 , f (z)e2 } = {(a, b), (−b, a)},
0 0
orientação, pois leva a base
a −b
uma vez que det = a2 + b2 > 0.
b a
Além disso, como hf 0 (z)e1 , f 0 (z)e1 i = hf 0 (z)e2 , f 0 (z)e2 i = a2 + b2 = λ2 e hf 0 (z)e1 , f 0 (z)e2 i = 0,
temos que
hf 0 (z)X, f 0 (z)Yi = hx1 f 0 (z)e1 + x2 f 0 (z)e2 , y1 f 0 (z)e1 + y2 f 0 (z)e2 i
= (x1 y1 + x2 y2 )λ2 = λ2 hX, Yi ,
para quaisquer X = (x1 , x2 ), Y = (y1 , y2 ) ∈ R2 .
3 A regra da cadeia
Prova.
Sejam g1 , . . . , gp : V −→ R as funções-coordenada de g. Então, pelo teorema 1.1, g1 , . . . , gp
são diferenciáveis no ponto f(a) e, pela Regra da Cadeia para funções, as funções-coordenada
g1 ◦ f, . . . , gp ◦ f da aplicação g ◦ f são diferenciáveis no ponto a e
∂gi ◦ f Xn
∂gi ∂f
(a) = (f(a)) k (a) ,
∂xj ∂yk ∂xj
k=1
Como
(g ◦ f) 0 (a)ej = ((g1 ◦ f) 0 (a)ej , . . . , (gp ◦ f) 0 (a)ej ) ,
e
X
n
∂gi ∂fk
gi0 (f(a))(f 0 (a)ej ) = gi0 (f(a))(f10 (a)ej , . . . , fn0 (a)ej ) = (f(a)) (a) = (gi ◦ f) 0 (a)ej ,
∂yk ∂xj
k=1
para todo j = 1, . . . , m.
∂fk ∂gi
Corolário 3.1. Sejam Jf(a) = (a) , Jg(f(a)) = (f(a)) e J(g ◦ f)(a) =
∂xj n×m
∂yk p×n
∂(gi ◦ f)
(a) as matrizes Jacobianas de f, g e g ◦ f nos pontos indicados. Supondo f
∂xj p×m
diferenciável no ponto a e g diferenciável no ponto f(a), tem-se J(g ◦ f)(a) = Jg(f(a)) · Jf(a).
Prova.
Por (?), temos que:
∂(gi ◦ f)(a) X
n
∂gi ∂f
(J(g ◦ f)(a))ij = = (f(a)) k (a) = (Jg(f(a)) · Jf(a))ij ,
∂xj ∂yk ∂xj
k=1
Prova.
Sejam f : U ⊂ Rm −→ Rn , g : V ⊂ Rn −→ Rp , f(U) ⊂ V, duas aplicações de classe Ck .
Outra demonstração: Pela Regra da Cadeia, (g ◦ f) 0 (x) = g 0 (f(x)) ◦ f 0 (x) para todo x ∈ U.
Considerando as aplicações derivadas
f 0 : U −→ L(Rm ; Rn ) , g 0 : V −→ L(Rn ; Rp ) e (g ◦ f) 0 : U −→ L(Rm ; Rp ) ,
Assim, g ◦ f ∈ Ck .
Prova.
Como g ◦ f = IdU e f ◦ g = IdV temos, pela Regra da Cadeia, que g 0 (b) · f 0 (a) = Id : Rm −→ Rm
e f 0 (a) · g 0 (b) = Id : Rn −→ Rn . Assim, g 0 (b) = (f 0 (a))−1 e m = n.
Prova.
Sejam GL(Rm ) o conjunto das transformações lineares invertı́veis de Rm em si mesmo e
Inv : GL(Rm ) −→ GL(Rm ) a inversão de transformações lineares que, pelo exemplo 2.4, é
de classe C∞ .
Pelo corolário 3.3, g 0 (y) = [f 0 (g(y))]−1 . Logo a aplicação derivada g 0 : V −→ L(Rm , Rm ) pode
ser escrita como g 0 = Inv ◦ f 0 ◦ g.
Vamos provar, por indução, que se f é de classe Ck , então g = f−1 ’é de classe Ck .
O Teorema da Aplicação Inversa, que provaremos mais adiante, fornece uma recı́proca local
para este fato.
Prova.
As três primeiras propriedades resultam do teorema 4.1 do capı́tulo 3 aplicado às funções-
coordenada de f e g.
(4) Pela Regra da Cadeia e pelo exemplo 2.3, temos, para todo v ∈ Rm ,
[ϕ(f, g)] 0 (a) v = (ϕ ◦ (f, g)) 0 (a) v
= ϕ 0 (f(a), g(a)) (f 0 (a) v, g 0 (a) v))
= ϕ(f 0 (a) v, g(a)) + ϕ(f(a), g 0 (a) v) .
(5) Considere as aplicações (f, g) : U −→ Rn × Rp , α : Rn × Rn −→ Rn , c? : Rn −→ Rn e
q : Rn × (R − {0}) −→ Rn , dadas por
y
(f, g)(x) = (f(x), g(x)), α(y, z) = y + z, c? (y) = c y e q(y, z) = .
z
Então,
f
f + g = α ◦ (f, g) , cf = c? ◦ f , = q ◦ (f, g) e ϕ(f, g) = ϕ ◦ (f, g) .
g
para todo v ∈ Rm .
Segue-se também pela Regra da Cadeia que, em cada ponto x ∈ U onde f(x) 6= 0, a função
p
ϕ : U −→ R, dada por ψ(x) = kf(x)k = hf(x), f(x)i , é diferenciável no ponto x e
hf 0 (x) v, f(x)i
ψ 0 (x) v = ,
kf(x)k
para todo v ∈ Rm .
4 As fórmulas de Taylor
onde
∂2 f ∂ ∂p f ∂p−1 f
∂f ∂
00 2 (p) p
f (a) · v = 2 (a) = (a), . . . , f (a) v = p (a) = (a) .
∂v ∂v ∂v ∂v ∂v ∂vp−1
(2) Fórmula de Taylor com resto integral: Se f é de classe Cp+1 e [a, a + v] ⊂ U, então
Z1
1
rp (v) = (1 − t)p fp+1 (a + tv) vp+1 dt .
p! 0
(3) Fórmula de Taylor com resto de Lagrange: Sejam [a, a + v] ⊂ U, f uma aplicação de
classe Cp que é p + 1 vezes diferenciável em todo ponto do segmento aberto (a, a + v), com
kf(p+1) (x) wp+1 k ≤ M kwkp+1 para todo x ∈ (a, a + v) e todo w ∈ Rm . Então
M
krp (v)k ≤ kvkp+1 .
(p + 1)!
Prova.
Seja o caminho ϕ : [0, 1] −→ Rn dado por ϕ(t) = f(a + tv). Então ϕ é de classe Cp , (p + 1)−
vezes diferenciável no intervalo aberto (0, 1),
ϕ 0 (t) = f 0 (a + tv) v , ϕ 00 (t) = f 00 (a + tv) v2 , . . . , ϕ(p) (t) = f(p) (a + tv) vp ,
com
kϕ(p+1) (t)k ≤ M kvkp+1 ,
Então, pela Fórmula de Taylor com resto de Lagrange para caminhos, provada no capı́tulo 2,
temos
ϕ 00 (0) ϕ(p) (0)
ϕ(1) = ϕ(0) + ϕ 0 (0) + + ... + + rp ,
2! p!
com
M kvkp+1
krp k ≤ ,
(p + 1)!
ou seja,
f 00 (a) v2 f(p) (a) vp
f(a + v) = f(a) + f 0 (a) v + + ... + + rp (v) ,
2! p!
M kvkp+1
com krp (v)k ≤ .
(p + 1)!
rp (v)
com lim = 0, então ϕi vi = f(i) (a) vi para todo i = 1, . . . , p e todo v ∈ Rm .
v→0 kvkp
Prova.
O caminho λ : [0, 1] −→ Rn , definido por λ(t) = f(a + tv), é contı́nuo em [0, 1], diferenciável no
intervalo aberto (0, 1), λ(0) = f(a), λ(1) = f(a + v) e, pela Regra da Cadeia, λ 0 (t) = f 0 (a + tv) v.
Logo kλ 0 (t)k ≤ kf 0 (a + tv)k kvk ≤ M kvk para todo t ∈ (0, 1).
Então, pelo Teorema do Valor Médio para caminhos, demonstrado no capı́tulo 2, temos que
kλ(1) − λ(0)k ≤ Mkvk, ou seja, kf(a + v) − f(a)k ≤ M kvk.
Prova.
Como U é convexo, dados x, y ∈ U, temos que [x, y] ⊂ U. Logo, como f é contı́nua em [x, y] e
diferenciável em todos os pontos do segmento aberto (x, y), temos, pela Desigualdade do Valor
Médio, que
kf(y) − f(x)k = kf(x + (y − x)) − f(x)k ≤ M ky − xk ,
Prova.
Seja a ∈ U. Consideremos os conjuntos
A = {x ∈ U | f(x) = f(a)} e B = {x ∈ U | f(x) 6= f(a)} .
Afirmação: A é aberto.
De fato, dado x ∈ A, existe δ > 0 tal que Bδ (x) ⊂ U. Então, se |v| < δ, temos que [x, x + v] ⊂ U
e, portanto, pela Desigualdade do Valor Médio, kf(x + v) − f(x)k ≤ ε kvk para todo ε > 0, pois
f 0 (y) ≡ 0 para todo y ∈ U. Logo f(x + v) = f(x) = f(a) para todo v com kvk < δ, ou seja
f(y) = f(a) para todo y ∈ Bδ (x).
O corolário abaixo fornece uma estimativa para o resto r(v) = f(a + v) − f(a) − T v, quando
T = f 0 (a), e representa uma forma mais refinada da Desigualdade do Valor Médio, à qual se
reduz quando T = 0.
Prova.
Seja g : U −→ Rn a aplicação dada por g(x) = f(x) − Tx. Como g 0 (x) = f 0 (x) − T , temos
que
kg 0 (x)k = kf 0 (x) − T k ≤ M ,
para todo x ∈ (a, a + v). Logo, pela Desigualdade do Valor Médio aplicada a g, obtemos que
kg(a + v) − g(a)k ≤ M kvk ,
ou seja
Prova.
Pelo corolário 12.3 do capı́tulo 1, existe δ 0 > 0 tal que se x ∈ K e kvk < δ 0 , então [x, x + v] ⊂ U.
Como f 0 : U −→ L(Rm , Rn ) é contı́nua, pelo teorema 11.3 do capı́tulo 1, dado ε > 0 existe
0 < δ < δ 0 tal que
x ∈ K, kvk < δ =⇒ kf 0 (x + v) − f 0 (x)k < ε .
Então,
x ∈ K, kvk < δ, t ∈ [0, 1] =⇒ kf 0 (x + tv) − f 0 (x)k < ε ,
ou seja,
x ∈ K , kvk < δ , y ∈ [x, x + v] =⇒ kf 0 (y) − f 0 (x)k < ε .
Prova.
Seja δ 0 > 0 tal que se kvk < δ 0 então [c, c + v] ⊂ U. Pela definição de limite, dado ε > 0,
existe 0 < δ < δ 0 tal que
0 < kvk < δ =⇒ kf 0 (c + tv) − T k < ε ,
Então, pelo corolário 5.3, kr(v)k ≤ εkvk para todo 0 < kvk < δ, onde r(v) = f(c + v) − f(c) − T v.
para todo x ∈ X.
Observação 6.2. Se considerarmos o espaço L(Rm , Rn ) com a norma do sup, uma sequência
de aplicações gk : X −→ L(Rm , Rn ) converge para a aplicação g : X −→ L(Rm , Rn ) uniforme-
mente em X se, e só se, para todo ε > 0 dado, existe k0 ∈ N tal que
k ≥ k0 =⇒ kgk (x) v − g(x) vk ≤ ε kvk ,
para todo v ∈ Rn .
para todo x ∈ X.
Prova.
Suponhamos que fk −→ f uniformemente em X. Então, dado ε > 0, existe k0 ∈ N tal que
ε
k ≥ k0 =⇒ kfk (x) − f(x)k < ,
2
para todo x ∈ X. Logo, se k, j ≥ k0 , temos que
ε ε
kfk (x) − fj (x)k ≤ kfk (x) − f(x)k + kf(x) − fj (x)k < + = ε,
2 2
para todo x ∈ X.
Prova.
Dado ε > 0, existe k0 ∈ N tal que
ε
k ≥ k0 =⇒ kfk (x) − f(x)k < ,
3
para todo x ∈ X.
Prova.
Dado ε > 0, existe k0 ∈ N tal que
k, j ≥ k0 =⇒ kfj0 (x) − fk0 (x)k < ε 0 (1)
ε ε
para todo x ∈ U, onde ε 0 = min , e M = diam U.
3 2M
Como U é convexo, temos, pelo corolário 5.1, aplicado a fj − fk , que, para quaisquer x, y ∈ U,
j, k ≥ k0 =⇒ k(fj (y) − fk (y)) − (fj (x) − fk (x))k ≤ ε 0 ky − xk . (2)
Como cada fk é diferenciável no ponto x0 , para cada k ∈ N, existe δk (x0 ) > 0 tal que
kvk < δk (x0 ) =⇒ kfk (x0 + v) − fk (x0 ) − fk0 (x0 ) vk < ε 0 kvk . (4)
para todo x ∈ U.
Então, tomando k = k0 e δ = δk0 (x0 ), temos, por (3), (4) e (5), que:
kvk < δ =⇒ kf(x0 + v) − f(x0 ) − g(x0 ) vk
≤ kf(x0 + v) − f(x0 ) − [fk0 (x0 + v) − fk0 (x0 )]k
+kfk0 (x0 + v) − fk0 (x0 ) − fk0 0 (x0 )vk + kfk0 0 (x0 )v − g(x0 )vk
≤ 3ε 0 kvk ≤ εkvk .
Logo f é diferenciável em x0 e f 0 (x0 ) = g(x0 ).
Prova.
Como fk0 converge de modo localmente uniforme para g, para todo x ∈ U, existe uma bola
[
aberta Bx ⊂ U tal que fk0 −→ g uniformemente em Bx . Logo U = Bx e, pelo lema 6.1, se (fk )
x∈U
converge em algum ponto de Bx , então (fk ) converge uniformemente em Bx .
Seja A a reunião das bolas Bx nas quais (fk ) converge uniformemente, e B a reunião das bolas
Bx nas quais não há convergência em ponto algum. Como U = A ∪ B é uma cisão de U, U é
conexo e A 6= ∅, pois Bc ⊂ A, temos que U = A, ou seja, (fk ) converge de modo localmente
uniforme em U para uma aplicação f : U −→ Rn . Então, pelo lema 6.1, f é diferenciável e f 0 = g.
Observação 6.4. Mesmo supondo fk0 −→ g uniformemente no aberto conexo U e (fk (c))
convergente para algum c ∈ U, nem sempre é verdadeiro que (fk ) converge uniformemente em
x
U. Por exemplo, seja fk : R −→ R a sequência de funções dadas por fk (x) = .
k
1
Então fk0 ≡ −→ g ≡ 0 uniformemente em R, mas (fk ) não converge uniformemente em R.
k
Mas se existir um número real M > 0 tal que dois pontos quaisquer de U podem ser ligados
por uma poligonal de comprimento ≤ M contida em U, temos (por (2) do lema 6.1) que (fk )
converge uniformemente em U, se (fk0 ) convergir uniformemente em U e (fk (c)) convergir para
algum c ∈ U. Quando U é convexo e limitado isto ocorre.
Existe uma noção de diferenciabilidade, correspondente ao que seria classe C1 , mas onde
se supõe que a aplicação é diferenciável num único ponto. Trata-se da noção de diferenciabili-
dade forte que veremos mais abaixo.
(a) Se a transformação linear f 0 (a) : Rm −→ Rn é injetora, então existem c > 0 e δ > 0 tais que
kx − ak < δ =⇒ kf(x) − f(a)k ≥ ckx − ak .
Prova.
(a) Como a aplicação f 0 (a) : Sm−1 −→ Rn é contı́nua, por ser a restrição de uma aplicação
linear, temos que a função kf 0 (a)k : Sm−1 −→ R é contı́nua. Sendo Sm−1 compacta, existe
v0 ∈ Sm−1 tal que kf 0 (a) vk ≥ kf 0 (a) v0 k para todo v ∈ Sm−1 . Logo 2c = kf 0 (a) v0 k > 0, pois f 0 (a)
é injetora. Além disso, como f é diferenciável no ponto a,
f(x) = f(a) + f 0 (a)(x − a) + R(x) ,
R(x)
com lim = 0. Então, existe δ > 0 tal que
x→a kx − ak
kx − ak < δ =⇒ kR(x)k ≤ ckx − ak .
Logo,
kx − ak < δ =⇒ kf(x) − f(a)k ≥ kf 0 (a)(x − a)k − kR(x)k ≥ 2ckx − ak − ckx − ak = ckx − ak .
(b) Seja Bδ (a) ⊂ U a bola de centro a e raio δ > 0. Suponhamos, por absurdo, que kf(x)k ≤
kf(a)k para todo x ∈ Bδ (a). Então a é um ponto de máximo da função ξ : Bδ (a) −→ R,
ξ(x) = kf(x)k. Além disso, f(a) 6= 0, pois, caso contrário, f(x) = 0 para todo x ∈ Bδ (a) e,
Em particular, f 0 (a) v 6= f(a) para todo v ∈ Rm , uma contradição, pois f 0 (a) é sobrejetora.
De modo análogo, se f(a) 6= 0 e não existirem pontos y ∈ Bδ (a), para algum δ > 0, com
kf(y)k < kf(a)k, então a seria um mı́nimo para a função ξ(x) = kf(x)k, x ∈ Bδ (a), o que leva a
uma contradição como acima.
Observação 7.1. Cabem as perguntas: se f 0 (a) é injetora, existe uma bola B de centro a tal
que f|B é injetora? E se f 0 (a) é sobrejetora, f(a) ∈ int f(U)? A resposta a estas perguntas é
não, sem hipóteses adicionais.
Exemplo 7.1. No caso n = m = 1, f 0 (a) 6= 0 equivale a dizer que f 0 (a) é injetora ou sobreje-
tora.
1 x
Seja f : R −→ R a função dada por f(x) = x2 sen + , se x 6= 0, e f(0) = 0.
x 2
1
Então f é diferenciável em R e f 0 (0) = 6= 0.
2
Mas f não é injetora em intervalo algum da forma (−δ, δ).
4 1
⇐⇒ +1<1+
(2k + 1)π 2k
1 1 1
⇐⇒ 8k < (2k + 1)π ⇐⇒ < + ,
π 4 8k
1 1
e, portanto, ≤ , uma contradição.
π 4
De fato, para todo v = (x, y) ∈ R2 , f(v) = f(0) + v + r(v), onde r(v) = (0, x2 − y) se x > 0 e
0 < y < x2 , e r(v) = 0 nos demais pontos. Como a primeira coordenada é sempre zero e a
2
segunda está sempre compreendida
entre 0 e x , temos que
= p |r(v)| ≤ p x
r(v) 2
kvk ≤ |x| .
x 2 + y2 x2 + y2
r(v)
Logo lim = 0. Ou seja, f é diferenciável na origem e f 0 (0) v = v para todo v ∈ R2 .
v→0 kvk
Como em qualquer aberto contendo (0, 0) existe um segmento de reta vertical de extremos
(x, 0) e (x, x2 ), com x > 0, o qual é transformado por f num único ponto (x, x2 ), temos que f
não é injetora em vizinhança alguma de 0. Além disso, como nenhum ponto (x, y), com x > 0
e 0 < y < x2 , pertence à imagem de f, temos que f(0) = 0 não é um ponto interior a f(U) para
todo aberto U ⊂ R2 contendo (0, 0).
Observação 7.3. Podemos modificar um pouco o exemplo acima de modo a obter uma
aplicação contı́nua f : R2 −→ R2 diferenciável na origem, com f 0 (0) = Id, tal que f não é
injetora em nenhuma bola de centro 0 (ver exemplo abaixo).
Seja Uum aberto qualquer contendo a origem. Então, para x > 0 suficientemente pequeno,
x2
x, e (x, x2 ) pertencem a U.
4
x2
Logo, como f x, = f(x, x2 ) = (x, x2 ) , temos que f|U não é injetora. Assim, f não é injetora
4
em vizinhança alguma da origem.
Assim, f é fortemente diferenciável no ponto a ∈ U se, e só se, para todo ε > 0 dado, existe
δ > 0 tal que
x, y ∈ Bδ (a) =⇒ |ρa (x, y)| < ε ,
Na definição usual de derivada, temos apenas que a secante ao gráfico que passa pelos pontos
(a, f(a)) e (x, f(x)) tende à tangente no ponto (a, f(a)) quando x → a.
Prova.
Como f 0 (a) é injetora, já sabemos que existe c > 0 tal que kf 0 (a) vk ≥ 2ckvk para todo v ∈ Rm .
Assim,
x, y ∈ Bδ (a) =⇒ kf(x) − f(y)k ≥ kf 0 (a)(x − y)k − kra (x, y)k
≥ 2ckx − yk − ckx − yk
= ckx − yk .
Logo f : Bδ −→ Y = f(Bδ (a)) é uma bijeção e a inversa f−1 : Y −→ Bδ (a) é contı́nua, pois
1
kf−1 (w) − f−1 (z)k ≤ kw − zk para quaisquer z, w ∈ Y. Portanto, f : Bδ (a) −→ Y é um homeo-
c
morfismo.
Prova.
Basta observar que ra (x, y) = ra (x) − ra (y), pois ra (x, y) = f(x) − f(y) − f 0 (a)(x − y),
ra (x) = f(x) − f(a) − f 0 (a)(x − a) e ra (y) = f(y) − f(a) − f 0 (a)(y − a).
O teorema abaixo mostra que a única diferença entre a diferenciabilidade forte e a con-
tinuidade da derivada é que a primeira faz sentido mesmo quando a aplicação é diferenciável
num único ponto
Prova.
Suponhamos que f 0 é contı́nua no ponto a. Seja ra (x) = f(x) − f(a) − f 0 (a)(x − a). Então
ra é diferenciável, com derivada ra0 (x) = f 0 (x) − f 0 (a) contı́nua no ponto a e ra0 (a) = 0.
Logo, para todo ε > 0 dado, existe δ > 0 tal que Bδ (a) ⊂ U e x ∈ Bδ (a) =⇒ kra0 (x)k < ε.
Como Bδ (a) é convexo, temos, pelo corolário 5.1, que se x, y ∈ Bδ (a), então kra (x) − ra (y)k ≤
εkx − yk. Assim, pelo teorema 7.3, f é fortemente diferenciável no ponto a.
Somando as igualdades
f(x) − f(y) = f 0 (a)(x − y) + ra (x, y) e f(y) − f(x) = f 0 (x)(y − x) + rx (y) ,
obtemos que
(f 0 (x) − f 0 (a))(y − x) = −(ra (x, y) + rx (y)) . (?)
• f(an ) = g(an );
a2n − a2n+1
• f|[an+1 ,an ] é linear para todo n ∈ N, ou seja, f(x) = (x − an+1 ) + a2n+1 para todo
an − an+1
x ∈ [an+1 , an ].
a2n−1 − a2n
(x − an ) + a2n − a2n
f(x) − f(an ) an−1 − an
lim = lim+ = an−1 + an ,
x→a+n x − an x→an x − an
e, portanto, f 0 (a− 0 +
n ) = an + an+1 6= an−1 + an = f (an ).
• Se x ≤ 0 e y ≤ 0, então
2
|ra (x, y)| = |f(x) − f(y)| = |x2 − y2 | = |x + y| |x − y| ≤ |x − y| < ε |x − y| .
n0
1
h 1 1
i 1 1 1
• Se x ≤ 0 e 0 < y < , existe n ∈ N tal que y ∈ , . Então < ≤ e
n0 n+1 n n+1 n n0
1 1
|ra (x, y)| = |f(x) − f(y)| ≤ f(x) − f + f − f(y)
n+1 n+1
2 1 2 1 1
1
= x − + + y −
n+1 n n+1 n+1
1 1 1 1 1
= x + x − + + y −
n+1 n+1 n n+1 n+1
ε
1 ε 1
< −x + y−
2 n+1 2 n+1
ε ε
= (y − x) = |y − x| < ε |y − x| .
2 2
1 1 1 1
h i
• Se x > 0 e y > 0, existem j, k ∈ N, j ≥ k, tais que x ∈ , ey∈ , .
j+1 j k+1 k
1 1 1 1 1 1
Como < ≤ e < ≤ , temos, no caso j < k, que:
j+1 j n0 k+1 k n0
1 1
1 1
|ra (x, y)| = |f(x) − f(y)| ≤ f(x) − f
+ f − f + f − f(y)
j j k+1 k+1
2
aj − a2j+1
2 2
a − a
(x − aj+1 ) + a2j+1 − a2j + |a2j − a2k+1 | + k
k+1
= (y − ak+1 )
aj − aj+1 ak − ak+1
|a2j − a2j+1 |
= |x − aj | + |aj + ak+1 | |aj − ak+1 | + |ak + ak+1 | |y − ak+1 |
|aj − aj+1 |
ε
≤ | (aj − x) + (ak+1 − aj ) + (y − ak+1 )|
2
ε
= (y − x) < ε |y − x| .
2
1 1 1
E quando j = k, ou seja, ≤ x < y ≤ ≤ , temos que:
j+1 j n0
ε
|f(y) − f(x)| = (aj + aj+1 ) (y − x) ≤ (y − x) < ε |y − x| .
2
De fato, se f 0 (x) 6= 0 para todo x ∈ I, então, pelo Teorema de Darboux, temos que ou f 0 (x) > 0
para todo x ∈ I ou f 0 (x) < 0 para todo x ∈ I. No primeiro caso, f é um homeomorfismo crescente,
e, no segundo caso, f é um homeomorfismo decrescente. E, em qualquer caso, pelo Teorema
da Função Inversa para funções reais de uma variável real (ver Curso de Análise, Vol. I de
E. Lima) f−1 : J −→ I é diferenciável. Portanto, para n = 1, a resposta a nossa pergunta é
afirmativa.
Exemplo 8.3. Seja f : R2 −→ R2 a aplicação dada por f(x, y) = ex (cos y, sen y), ou, em
termos da variável complexa z = x + iy, f(z) = ez . Então f é de classe C∞ e f 0 (x, y) : R2 −→ R2
é dada por: ! !
ex cos y −ex sen y u
f 0 (x, y)(u, v) = ,
ex sen y ex cos y v
ou seja, f 0 (z) w = ez w é a multiplicação pelo número complexo z
! e , onde w = u + iv. Logo,
ex cos y −ex sen y
det Jf(x, y) = det x x
= e2x 6= 0
e sen y e cos y
para todo (x, y) ∈ R2 .
De fato, se f é um difeomorfismo local, temos, pela observação acima, que f(U) = V é aberto.
Se, além disso, f : U −→ V é uma bijeção, temos que f−1 : V −→ U é diferenciável, pois f−1
é diferenciável em todos os pontos f(x) ∈ V, uma vez que f−1 |Wx : Wx −→ Vx é diferenciável,
f(x) ∈ Wx e a diferenciabilidade é uma propriedade local.
Observação 8.9. A busca de uma solução x para uma equação do tipo f(x) = b reduz-se à
procura de um ponto fixo para a aplicação ξ, dada por ξ(x) = f(x) − b + x, pois ξ(x) = x se, e
só se, f(x) = b.
Teorema 8.1. (do ponto fixo para contrações – método das aproximações sucessivas)
Sejam F ⊂ Rm um subconjunto fechado e f : F −→ F uma contração. Então, dado qualquer
x0 ∈ F, a sequência x1 = f(x0 ), x2 = f(x1 ), . . . , xk+1 = f(xk ), . . . converge para um ponto a ∈ F,
que é o único ponto fixo de f.
Prova.
Unicidade: Sejam a, b ∈ F tais que f(a) = a e f(b) = b, e seja 0 ≤ λ < 1 tal que kf(x) − f(y)k ≤
λkx − yk para quaisquer x, y ∈ F. Então
ka − bk = kf(a) − f(b)k ≤ λka − bk ,
Existência: Seja x0 ∈ F e consideremos a sequência {xk } onde xk+1 = f(xk ) para todo k ≥ 0.
Então
kxk+1 − xk k = kf(xk ) − f(xk−1 )k ≤ λkxk − xk−1 k ,
para todo k ≥ 0.
Assim,
X
p−1
X
p−1
λk
kxk+p − xk k ≤ kxk+i+1 − xk+i k ≤ λk+i kx1 − x0 k ≤ kx1 − x0 k ,
1−λ
i=0 i=0
para todos k, p ∈ N.
para todo p ∈ N. Ou seja, a sequência {xk } é de Cauchy e, portanto, converge para um ponto a,
onde a ∈ F, pois F é fechado.
Além disso, como f é contı́nua, temos que f(a) = lim f(xk ) = lim xk+1 = a, isto é, a é um ponto
k→∞ k→∞
fixo de f.
Exemplo 8.4. O ponto fixo de uma aplicação f : F −→ F pode não existir quando tivermos
apenas kf(x) − f(y)k < kx − yk para quaisquer x, y ∈ F, x 6= y.
1 1 x
p
De fato, seja f : R −→ R a função f(x) = x + 1 + x2 . Como f 0 (x) = 1+ p ,
2 2 1 + x2
x < 1 para todo x ∈ R. Logo |f(x) − f(y)| < |x − y| para
temos que 0 < f 0 (x) < 1, pois p
1 + x2
quaisquer x, y ∈ F, x 6= y, mas f não possui um ponto fixo, pois f(x) > x para todo x ∈ R.
Com efeito, seja a ∈ K o ponto onde a função contı́nua ϕ : K −→ R, ϕ(x) = kf(x) − xk, atinge
seu mı́nimo c = kf(a) − ak. Se c 6= 0, ou seja, f(a) 6= a, terı́amos
kf(f(a)) − f(a)k < kf(a) − ak = c ,
uma contradição, pois ϕ(f(a)) seria menor do que o mı́nimo c. Logo f(a) = a, ou seja, a é um
ponto fixo de f.
Suponhamos agora que f(a) = a, f(b) = b e a 6= b. Então ka − bk = kf(a) − f(b)k < ka − bk,
um absurdo. Logo f possui um único ponto fixo.
Para garantir que uma contração f : X −→ Rm possui um ponto fixo, basta encontrar um
subconjunto F ⊂ X fechado em Rm tal que f(F) ⊂ F.
Prova.
Pelo teorema anterior, basta provar que f(B[a; r]) ⊂ B[a; r], o que ocorre, pois x ∈ B[a; r] =⇒
kx − ak ≤ r =⇒
Prova.
Para quaisquer x, y ∈ U, temos
kf(x) − f(y)k = kx − y + ϕ(x) − ϕ(y)k ≥ kx − yk − kϕ(x) − ϕ(y)k
≥ kx − yk − λkx − yk = (1 − λ)kx − yk .
Então f é uma bijeção de U sobre f(U) e a aplicação inversa f−1 : f(U) −→ U satisfaz a condição
de Lipschitz
kf−1 (z) − f−1 (w)k ≤ c kz − wk ,
1
com c = , para todos z, w ∈ f(U). Em particular, f é um homeomorfismo de U sobre f(U).
1−λ
Seja b ∈ f(U). Então existe a ∈ U tal que b = f(a) = ϕ(a) + a.
Então, pelo lema 8.1, ξy (B[a; r]) ⊂ B[a; r] e portanto, pelo Teorema do Ponto Fixo para Contrações,
existe x ∈ B[a; r] ⊂ U tal que ξy (x) = x, ou seja, existe x ∈ U tal que f(x) = y. Logo,
B[b; (1 − λ)r] ⊂ f(U) e, portanto, b ∈ int f(U). Como b ∈ f(U) é arbitrário, provamos que
f(U) é aberto em Rm .
Finalmente, se U = Rm então B[a; r] ⊂ Rm para todo r > 0. Logo, pelo provado acima,
B[f(a); (1 − λ)r] ⊂ f(U) para todo r > 0.
k
Se tomarmos rk = > 0, k ∈ N, teremos que B[f(a); k] ⊂ f(U) para todo k ∈ N. Assim,
[ 1−λ
Rm = B[f(a); k] ⊂ f(U), ou seja, f(U) = Rm .
k∈N
Prova.
Consideremos as aplicações g : U −→ Rm e ψ : U −→ Rm dadas por
g(x) = (T −1 ◦ f)(x) = x + (T −1 ◦ ϕ)(x) e ψ(x) = (T −1 ◦ ϕ)(x) .
Prova.
Fazendo g = f−1 e
s(w) = g(b + w) − g(b) − f 0 (a)−1 w , (1)
s(w)
precisamos mostrar que lim = 0.
w→0 kwk
Seja v = g(b + w) − g(b). Então
f(a + v) − f(a) = f(a + g(b + w) − g(b)) − f(a) = f(g(b + w)) − b = b + w − b = w .
Como v = g(b + w) − g(b) e w = f(a + v) − f(a), temos, por (1) e (2), que
v = (f 0 (a))−1 (f(a + v) − f(a)) + s(w)
= (f 0 (a))−1 (f 0 (a)v + r(v)) + s(w)
= v + (f 0 (a))−1 r(v) + s(w) .
Logo,
e
s(w) r(v) kvk
= −(f 0 (a))−1 . (4)
kwk kvk kwk
Pelo Teorema 7.1, existem c > 0 e µ > 0 tais que
kf(a + v) − f(a)k ≥ ckvk ,
Além disso, dado ε > 0, existe, pelo teorema 7.3, 0 < µ 0 < µ tal que
cε
u, v ∈ B(0; µ 0 ) =⇒ kr(u) − r(v)k ≤ ku − vk . (9)
k(f 0 (a))−1 k
Como g é contı́nua em b e u = g(b + z) − g(b), v = g(b + w) − g(b), existe δ > 0 tal que
kzk < δ , kwk < δ =⇒ kuk < µ 0 , kvk < µ 0 .
Prova.
Seja r(x) = f(x) − f(a) − f 0 (a)(x − a). Como f é fortemente diferenciável no ponto a, temos, pelo
1
teorema 7.3, que dado 0 < λ < , existe δ > 0 tal que
k(f 0 (a))−1 k
x, y ∈ B(a; δ) =⇒ kr(x) − r(y)k ≤ λkx − yk .
Como
• f 0 (a) : Rm −→ Rm é um isomorfismo;
• f(x) = f 0 (a) x + r(x) + f(a) − f 0 (a) · a e kϕ(x) − ϕ(y)k ≤ λkx − yk , para quaisquer
x, y ∈ V = B(a; δ), onde ϕ(x) = r(x) + f(a) − f 0 (a) · a;
temos, pelo corolário 8.1, que f é um homeomorfismo do aberto V sobre o aberto W = f(V).
Portanto, pelo lema 8.2, a inversa f−1 : W −→ V é fortemente diferenciável no ponto b = f(a).
Logo f : V 0 −→ W 0 é um difeomorfismo.
Prova.
Como U ⊂ Rm é aberto e convexo e kϕ 0 (x)k ≤ λ para todo x ∈ U, temos, pelo corolário
5.1, que ϕ é uma λ−contração. Logo, pelo teorema da perturbação da identidade, f é um
homeomorfismo de U sobre o aberto f(U).
Além disso, como f 0 (x) = Id + ϕ 0 (x) e kϕ 0 (x)k ≤ λ < 1, para todo x ∈ U, temos que f 0 (x) é um
isomorfismo para todo x ∈
U, pois, caso
contrário, existiria v ∈ Rm − {0} tal que ϕ 0 (x) v = −v,
0 v
= 1 ≤ kϕ 0 (x)k.
um absurdo, uma vez que
ϕ (x)
kvk
Portanto, pelo corolário 8.2, f é um difeomorfismo local. Como f : U −→ f(U) é injetora, f é um
difeomorfismo (global).
Exemplo 8.5. Seja f : Rn2 −→ Rn2 a aplicação definida por f(X) = Xk , onde k ∈ N. Então f é
de classe C∞ e
X
k
0
f (X) V = Xi−1 V Xk−i .
i=1
2 2 2
De fato, como f(X) = L(X, . . . , X), onde L : Rn × . . . × Rn −→ Rn é a aplicação k−linear,
não-simétrica dada por L(X1 , . . . , Xk ) = X1 · . . . · Xk , temos, pela observação 8.4 do capı́tulo 3,
que f é de classe C∞ e
(k − 1)! X X
k k
1
0
f (X) V = LS (X, . . . , X, V) = | · .{z
X . . · X} ·V · X
| · .{z
. . · X} = Xi−1 · V · Xk−i .
(k − 1)! (k − 1)!
i=1 i−1 k−i i=1
Mais geralmente, se P ⊂ R2 é qualquer semi-reta fechada partindo da origem que faz um ângulo
θ0 com o semi-eixo positivo das abscissas, podemos definir um sistema de coordenadas polares
ξ : (0, ∞) × (θ0 , θ0 + 2π) −→ U = R2 − P pela mesma fórmula ξ(r, θ) = reiθ .
Exemplo 9.2. Seja P = (x, 0, z) ∈ R3 | x ≥ 0 e seja V = (0, ∞) × (0, π) × (0, 2π). Então, a
aplicação ξ : V −→ R3 − P definida por
ξ(r, ϕ, θ) = (r sen ϕ cos θ, r sen ϕ sen θ, r cos ϕ) ,
De fato, se P = (x, y, z) = ξ(r, ϕ, θ), então r é a distância de P à origem, ϕ é o ângulo que o raio
OP faz com o semi-eixo positivo dos z e θ é o ângulo que (x, y, 0) faz com o semi-eixo positivo
dos x.
Com isto, é fácil verificar que ξ é injetora e ξ(V) = R3 − P. Além disso, como
sen ϕ cos θ r cos ϕ cos θ −r sen ϕ sen θ
2
det Jξ(r, ϕ, θ) = det sen ϕ sen θ r cos ϕ sen θ
r sen ϕ cos θ = r sen ϕ > 0 ,
cos ϕ −r sen ϕ 0
temos que ξ é um difeomorfismo de classe C∞ .
O Lema de Morse diz que numa vizinhança de um ponto crı́tico não-degenerado é possı́vel
obter um sistema de coordenadas que simplifica bastante a forma da função.
1 ∂2 f
para todo y = (y1 , . . . , yn ) ∈ V, onde aij = (a) .
2 ∂xi ∂xj
Prova.
Seja δ > 0 tal que B(a; δ) ⊂ U. Como f é de classe C2 e [a, x] ⊂ U para todo x ∈ B(a; δ),
temos, pela Fórmula de Taylor com resto integral, que
Z1
x ∈ B(a; δ) =⇒ f(x) = f(a) + (1 − t)d2 f (a + t(x − a))(x − a)2 dt
0
X
n
= f(a) + aij (x)(xi − a)(xj − a) ,
i,j=1
onde, Z1
∂2 f
aij (x) = (1 − t) (a + t(x − a)) dt , i, j = 1, . . . , n.
0 ∂xi ∂xj
∂2 f
Como as funções são de classe Ck−2 , k − 2 ≥ 1, temos, pela Regra de Leibniz, que as
∂xi ∂xj
funções aij : B(a; δ) −→ R são de classe Ck−2 , para todos i, j = 1, . . . , n. E, pelo Teorema de
Schwarz, a matriz A(x) = (aij (x)) é simétrica para todo x ∈ B(a; δ).
Logo B = ϕ−1 ◦ C é de classe Ck−2 , B(x)2 = C(x) para todo x ∈ B(a; δ 0 ) e B(a) = Id.
Então, como A(x) = A0 C(x) = A0 B(x)2 e A(x) é simétrica para todo x ∈ B(a; δ), temos, tomando
transpostas, que:
2 2 2
A(x) = A0 B(x)2 = B(x)T A0 =⇒ B(x)2 = A−1
0 B(x)T A0 = A−1 T
0 B(x) A0 .
Como A−1 T
0 B(a) A0 = Id, B(a) = Id e as aplicações
2 2
B : B(a; δ 0 ) −→ Rn e A−1 T 0
0 B(x) A0 : B(a, δ ) −→ R
n
Seja ψ : B(a; δ 00 ) −→ Rn a aplicação de classe Ck−2 dada por ψ(x) = B(x)(x − a).
Se φ : L(Rn ; Rn ) × Rn −→ Rn é a aplicação bilinear dada por φ(B, y) = B · y então, pela
Regra da Cadeia, para todo x ∈ B(a; δ 00 ) e v ∈ Rn , temos que
ψ 0 (x) v = φ 0 (B(x), (x − a)) (B 0 (x) v, v)
= φ(B 0 (x) v, (x − a)) + φ(B(x), v)
∂B
= (x)(x − a) + B(x)v .
∂v
Logo, para x = a, ψ 0 (a) · v = B(a) · v = v para todo v ∈ Rn , ou seja, ψ 0 (a) : Rn −→ Rn é a
aplicação identidade.
Então, pelo Teorema da Aplicação Inversa, existe 0 < δ 000 < δ 00 e um aberto V ⊂ Rn tais que
0 = ψ(a) ∈ V e ψ : W −→ V é um difeomorfismo de classe Ck−2 , onde W = B(a; δ 000 ).
Prova.
1 ∂2 f
Seja A0 = (aij ) a matriz simétrica de entradas aij = (a), dada pelo Lema de Morse.
2 ∂xi ∂xj
Então existe uma base ortonormal {u1 , . . . , um } de Rm tal que A0 uj = λj uj para todo j = 1, . . . , m.
Como A0 é invertı́vel, λj 6= 0 para todo j = 1, . . . , m. Sejam λ1 < 0, . . . , λi < 0 e λi+1 >
0, . . . , λm > 0, os autovalores negativos e positivos de A0 .
uj u
Para j ≤ i, seja vj = p e, para j > i, seja vj = p j .
−λj λj
Então {v1 , . . . , vm } é uma base ortogonal de R
m
tal que
0 se j 6= k
hA0 vj , vk i = −1 se j = k e j ≤ i
1 se j = k e j > i .
Consideremos agora a transformação linear invertı́vel T : Rm −→ Rm tal que Tej = vj para todo
j = 1, . . . , m. Sendo V0 = T −1 (V), onde V é o aberto que contém a origem obtido no Lema de
Morse, temos que η = ξ ◦ T : V0 −→ W é um difeomorfismo de classe Ck−2 tal que
Observação 9.2. O número i que aparece no corolário acima chama-se o ı́ndice do ponto
crı́tico a. Quando i = m, a é um ponto de máximo local para f; se i = 0, a é um ponto de mı́nimo
local. Para 0 < i < m, a é um ponto de sela de ı́ndice i.
Quando a é um ponto de máximo ou de mı́nimo local de f, temos que f ◦ η(z) = f(a) − (z21 + z22 )
e f ◦ η(z) = f(a) + z21 + z22 , respectivamente. Logo as curvas de nı́vel de f próximas de a são
imagens pelo difeomorfismo η dos cı́rculos z21 + z22 = const., tendo, portanto, a forma dada pela
figura 6. E quando a é um ponto de sela, temos que f ◦ η(z) = f(a) − z21 + z22 . Logo, as curvas
de nı́vel de f próximas de a são imagens pelo difeomorfismo η das curvas −y21 + y22 = const.,
tendo a forma dada pela figura 7.
Fig. 6: Curvas de nı́vel de f próximas do ponto crı́tico a Fig. 7: Curvas de nı́vel de f próximas do ponto crı́tico a
Observação 9.4. Os três parágrafos seguintes têm objetivo semelhante ao deste: a partir de
hipóteses sobre a derivada, obter sistemas de coordenadas convenientes, em relação aos quais
a aplicação se exprime por meio de fórmulas simples.
Observação 10.2. Já vimos que a derivada f 0 : U −→ L(Rm ; Rn ) é contı́nua no ponto a se,
e só se, f é fortemente diferenciável no ponto a. E, neste caso, se f 0 (a) : Rm −→ Rn é injetora
então, pelo teorema 7.2, existe δ > 0 tal que f : B(a; δ) −→ f(B(a; δ)) é um homeomorfismo. Em
particular, f|B(a;δ) é injetora.
Exemplo 10.1. Seja f : Rm −→ Rm × Rn a aplicação de inclusão dada por f(x) = (x, 0).
Como f é linear, f 0 (x) = f para todo x ∈ Rm . Logo f é uma imersão C∞ .
Mostraremos que toda imersão de classe Ck , k ≥ 1, coincide localmente, após uma mudança
do sistema de coordenadas, com a imersão f acima.
Mas, pelo teorema 7.1, existe δ > 0 tal que f(t) 6= f(t1 ) para todo
t ∈ J = (t1 − δ, t1 + δ) ⊂ I, t 6= t1 . Assim, L1 é a única reta
Fig. 8: Retas L1 e L2 tangentes à curva f
tangente no ponto f(t1 ) para o caminho f|J .
Por exemplo, f : R −→ R2 , f(t) = (t3 − t, t2 ), é uma imersão de classe C∞ da reta no plano tal
que f(1) = f(−1) = (0, 1). Como f 0 (1) = (2, 2) e f 0 (−1) = (2, −2), temos que
Exemplo 10.3. Seja o caminho g : R −→ R2 de classe C∞ dado por g(t) = (t−sen t, 1−cos t).
Como g 0 (t) = (1 − cos t, sen t), temos que g não é imersão, pois g 0 (t) = 0 para t = 2πk, k ∈ Z.
Fig. 9: Ciclóide
A imagem deste caminho é a curva chamada ciclóide. Ela possui uma infinidade de pontos
angulares (cúspides), nos quais o vetor velocidade é igual a zero.
Observação 10.3. Nem sempre podemos identificar os pontos onde a derivada de uma
aplicação não é injetora pela forma geométrica de sua imagem. Por exemplo, a imagem do
caminho f : R −→ R2 , f(t) = (t3 , t3 ), é uma reta. Para t = 0, o vetor velocidade f 0 (0) = (0, 0), o
que não se deve ao aspecto de f(R), mas à maneira como a reta está parametrizada por f.
para todo x ∈ V e h.
Prova.
Seja E = f 0 (a)(Rm ). Como f 0 (a) é injetora, dim E = m. Sejam {w1 , . . . , wm } uma base de E,
v1 , . . . , vn vetores linearmente independentes tais que {w1 , . . . , wm , v1 , . . . , vn } é uma base de
Rm+n e F o subespaço gerado pelos vetores v1 , . . . , vn . Então Rm+n = E ⊕ F.
Xn
0 0
ϕ (a, 0)(v, w) = f (a) v + β i vi . (1)
i=1
De fato,
X
n
ϕ(x, y) = f(x) + yi vi = ϕ(a, 0) + ϕ 0 (a, 0) · (x − a, y) + rϕ
(a,0) (x, y)
i=1
X
n
= f(a) + f 0 (a) (x − a) + yi vi + rϕ
(a,0) (x, y)
i=1
=⇒ rϕ
(a,0) (x, y) = f(x) − f(a) − f 0 (a) (x − a) = rfa (x) .
Como f é fortemente diferenciável no ponto a, dado ε > 0, existe δ > 0 tal que
x, x 0 ∈ B(a; δ) ⊂ Rm =⇒ krfa (x) − rfa (x 0 )k ≤ εkx − x 0 kS .
Então,
(x, y), (x 0 , y 0 ) ∈ B(a; δ) × Rn =⇒ krϕ ϕ 0 0 f 0 f 0
(a,0) (x, y) − r(a,0) (x , y )k = kra (x ) − ra (x)k ≤ εkx − x kS
≤ ε (kx 0 − xkS + ky 0 − ykS )
= ε k(x, y) − (x 0 , y 0 )kS .
Logo ϕ é fortemente diferenciável no ponto (a, 0), concluindo a prova da afirmação.
Além disso, como f 0 (a) : Rm −→ Rm+n é injetora e Rm+n = f 0 (a)(Rm ) ⊕ F, temos, por (1), que
ϕ 0 (a, 0) : Rm+n −→ Rm+n é um isomorfismo.
Pelo Teorema da Aplicação Inversa, existem um aberto contendo (a, 0), o qual podemos supor
da forma V × W, onde 0 ∈ W ⊂ Rn e a ∈ V ⊂ U, e um aberto Z ⊂ Rm+n , com f(a) ∈ Z, tais que
ϕ : V × W −→ Z é um homeomorfismo e h = ϕ−1 : Z −→ V × W é fortemente diferenciável no
ponto f(a). Como ϕ(x, 0) = f(x), temos que hf(x) = hϕ(x, 0) = (x, 0) para todo x ∈ V.
Observe que
∂f1 ∂f1
(a) (a) 0
∂f1 ∂f1
∂x ∂y
∂x (a) (a)
∂f2 ∂f2 ∂y
∂x (a)
det Jϕ(a, 0) = det (a) 0 = det ∂f2 ∂f2 6= 0 .
∂f ∂y
(a) (a)
3 ∂f3
∂x ∂y
(a) (a) 1
∂x ∂y
Pela forma local das imersões, existem abertos V ⊂ R2 , I ⊂ R, Z ⊂ R3 tais que a ∈ V, 0 ∈ I,
f(a) ∈ Z, ϕ : V × I −→ Z é um difeomorfismo de classe Ck e h ◦ f(x, y) = (x, y, 0) para todo
x, y ∈ V, onde h = ϕ−1 : Z −→ V × I é também de classe Ck .
Prova.
Seja h : Z −→ V × W a aplicação obtida no teorema acima. Então f(V) ⊂ Z. Seja ξ : Z −→ V a
aplicação definida por ξ(z) = π ◦ h(z), onde π : V × W −→ V, π(x, y) = x, é a projeção sobre a
primeira coordenada.
De fato,
ξ(f(a)) = π ◦ h(f(a)) = a, ξ 0 (f(a))(w) = π 0 (h(f(a))) ◦ h 0 (f(a))(w) = π(h 0 (f(a))(w)) ,
e, portanto,
ξ(z) = π(h(z)) = ξ(f(a)) + ξ 0 (f(a)) (z − f(a)) + rξf(a) (z)
= π(h(f(a))) + π(h 0 (f(a))(z − f(a))) + rξf(a) (z) .
Então rξf(a) (z) = π(rhf(a) (z)). Como h é fortemente diferenciável em f(a), dado ε > 0, existe δ > 0
tal que
z, w ∈ B(f(a); δ) =⇒ krhf(a) (z) − rhf(a) (w)kS ≤ εkz − wk .
Logo, como
kπk = sup {kπ(x, y)kS | k(x, y)kS = 1} = sup {kxkS | kxkS + kykS = 1} = 1 ,
temos que
z, w ∈ B(f(a); δ) =⇒ krξf(a) (z) − rξf(a) (w)kS = kπ(rhf(a) (z) − rhf(a) (w))kS
≤ krhf(a) (z) − rhf(a) (w)kS
≤ εkz − wk .
Portanto ξ é fortemente diferenciável no ponto f(a).
Como ξf(x) = πh(f(x)) = π(x, 0) = x para todo x ∈ V, temos que f : V −→ f(V) é uma bijeção
e ξ|f(V) = f−1 : f(V) −→ V.
De fato, como ξ ◦ f(x) = x para todo x ∈ V, temos que ξ 0 (f(x)) ◦ f 0 (x) = Id : Rm −→ Rm . Logo
f 0 (x) é injetora para todo x ∈ V.
Então a matriz A = (aij ) de T em relação às bases canônicas de Rm e Rm+n tem m colunas
linearmente independentes e, portanto, m linhas linearmente independentes, pois posto-linha
de uma matriz = posto-coluna da matriz.
Como Aik ∈ Rm para todo k = 1, . . . , m, {Ai1 , . . . , Aim } é uma base de Rm e, portanto, o deter-
minante da matriz m × m cujas linhas são Ai1 , . . . , Aim é diferente de zero.
Sendo a aplicação ϕ : L(Rm ; Rm+n ) −→ R, que associa a cada transformação linear S o deter-
minante da matriz m×m cujas linhas são as linhas i1 , . . . , im da matriz de S em relação às bases
canônicas de Rm e Rm+n , é contı́nua e ϕ(T ) 6= 0, existe ε > 0 tal que kS − T k < ε =⇒ ϕ(S) 6= 0.
Além disso, como f 0 : U −→ L(Rm ; Rm+n ) é contı́nua, tomando T = f 0 (a), existe δ > 0 tal que
kx − ak < δ =⇒ kf 0 (x) − f 0 (a)k < ε .
Logo ϕ(f 0 (x)) 6= 0 para todo x ∈ B(a; δ), ou seja, f 0 (x) tem posto m e, portanto, é injetora para
todo x ∈ B(a; δ).
Observação 11.1. Como um funcional linear é sobrejetivo ou nulo, temos que uma função
diferenciável f : U ⊂ Rm −→ R é uma submersão se, e só se, df(x) 6= 0 para todo x ∈ U, ou
seja, se, e só se, grad f(x) 6= 0 para todo x ∈ U.
Por exemplo, seja R3 = R2I ⊕ RJ , onde I = {1, 3} e J = {2}, ou seja, R2I é gerado por {e1 , e3 } e RJ é
gerado por {e2 }. Então todo z = (z1 , z2 , z3 ) ∈ R3 se escreve como z = (x, y), onde x = (z1 , 0, z3 )
e y = (0, z2 , 0).
Observação 11.3. Dada uma transformação linear sobrejetora T : Rm+n −→ Rn , existe uma
I ⊕ RJ tal que a restrição T |RJ : RJ −→ R é
decomposição em soma direta do tipo Rm+n = Rm n n
n n
um isomorfismo.
De fato, como os vetores {Te1 , . . . , Tem+n } geram Rn , existe J = {j1 , . . . , jn } ⊂ {1, . . . , m + n} tal
que {Tej1 , . . . , Tejn } é uma base de Rn .
Então T |RnJ : RnJ −→ Rn é um isomorfismo, pois transforma a base {ej1 , . . . , ejn } de RnJ na base
{Tej1 , . . . , Tejn } de Rn .
Então T |RnJ é um isomorfismo se, e só se, a submatriz n × n da matriz A cujas colunas são as n
colunas da matriz A cujos ı́ndices pertencem ao conjunto J tem determinante diferente de zero.
Como f é linear, temos f 0 (x, y) = f para todo z = (x, y) ∈ Rm+n . Logo f é uma submersão e a
matriz Jacobiana de f tem como linhas os vetores ej1 , . . . , ejn da base canônica de Rm+n .
O teorema abaixo diz que, dada uma submersão f de classe C1 , é possı́vel obter novas
coordenadas em torno de cada ponto do seu domı́nio de modo que f seja a projeção sobre
as n últimas coordenadas, ou seja, o exemplo 11.1 é, localmente, o caso mais geral de uma
submersão.
Prova.
Seja c = f(a) e consideremos a função ϕ : U −→ Rm × Rn definida por
x, f(x, y)) = ((zi1 , . . . , zim ), f(x, y)) ,
ϕ(x, y) = (e
onde z = x + y. Então,
X
m
0 0
ϕ (a)(v, w) = (e v, ∂1 f(a)v + ∂2 f(a)w) , onde v =
v, f (a)(v, w)) = (e vek eik e e
v = (ve1 , . . . , vf
m ).
k=1
De fato, como
ϕ(x, y) = (e a1 , f(a)) + ((e
x, f(x, y)) = (f f1 ), f 0 (a)(x + y − (a1 + a2 ))) + rϕ
x−a a (x, y) ,
temos que
rϕ f
a (x, y) = (0, ra (x + y)) .
Como f é fortemente diferenciável no ponto a = a1 + a2 , dado ε > 0, existe δ > 0 tal que
0 0 0 0
=⇒ krϕ ϕ f f
a (x, y) − ra (x , y )kS = k(0, ra (x + y) − ra (x + y ))kS
Então
h(e
x, w) = h1 (e
x, w) + h2 (e
x, w) = (h1 (e x, w)) ,
x, w), h2 (e
onde h1 : V × W −→ Rm n
I e h2 : V × W −→ RJ .
X
m
Como (e
x, w) = ϕh(e
x, w) = ϕ(h1 (e x, w)) , temos que h1 (e
x, w) + h2 (e x, w) = x k ei k e
k=1
f(h(e x, w) ∈ V × W, onde e
x, w)) = w para todo (e x = (x1 , . . . , xm ).
Prova.
Seja h : V × W −→ Z o homeomorfismo dado pelo teorema acima, e seja A ⊂ Z um con-
junto aberto. Então
f(A) = f ◦ h ◦ h−1 (A) = π ◦ h−1 (A) .
Como h é contı́nua, h−1 (A) é um conjunto aberto e, portanto, π(h−1 (A)) é aberto, pois a projeção
π : V × W −→ W é uma aplicação aberta.
∂fi
(a) , i ∈ {1, . . . , n}, j ∈ {j1 , . . . , jn } ,
∂xj n×n
De fato, seja h : V × W −→ Z o difeomorfismo de classe Ck dado pela forma local das sub-
mersões. Como f ◦ h = π, temos, pela Regra da Cadeia, que para todo (x, w) ∈ V × W,
f 0 (h(x, w)) h 0 (x, w) = π 0 (x, w) = π .
Logo f 0 (z) é sobrejetora para todo z ∈ Z, pois Z = h(V × W) e π é uma transformação linear
sobrejetora.
Este resultado também pode ser provado diretamente como no caso das imersões, pois
f 0 (a) : Rm+n −→ Rn é sobrejetora se, e só se, a matriz Jacobiana Jf(a) tem um menor de
ordem n com determinante 6= 0 (ver observação 10.4).
X
n
Observação 11.9. Se ξ(ex) = x)ej` , então
ξ` (e
`=1
X X
m m
Graf(ξ) = xk eik + ξ` (e x = (x1 , . . . , xm ) ∈ V .
x)ej` e
k=1 `=1
Prova.
Seja h : V × W −→ Z o homeomorfismo fortemente diferenciável no ponto (f
a1 , f(a)) = (f
a1 , c),
dado pela forma local das submersões, onde h(f a1 , f(a)) = a e
X m
h(ex, w) = (x, h2 (e
x, w)) = xk eik + h2 (e
x, w) .
k=1
x = (x1 , . . . , xk ) ∈ V.
para todo e
X
m X
n
Reciprocamente, se (x, y) = x k ei k + y` ej` ∈ Z, e
x = (x1 , . . . , xk ) ∈ V e f(x, y) = c, então
k=1 `=1
(x, y) = h ◦ ϕ(x, y) = h(e
x, c) = (x, h2 (e
x, c)) = (x, ξ(e
x)) .
Logo y = ξ(e
x).
v ∈ Rm :
Logo, pela regra da cadeia, para todo e
Suponhamos que R3 = RI ⊕ R2J é uma decomposição de R3 , onde I = {2}, J = {1, 3}, ou seja, RI
é gerado por {e2 } e R2J é gerado por {e1 , e3 } e, além disso, f 0 |R2J (a) é um isomorfismo.
Definimos ϕ : U −→ R × R2 por
ϕ(x, y, z) = (y, f1 (x, y, z), f2 (x, y, z)) .
Logo, pela forma local das submersões, existem abertos Z ⊂ R3 , I ⊂ R, W ⊂ R2 , tais que a ∈ Z,
a2 ∈ I, f(a) ∈ W, ϕ : Z −→ I × W é um difeomorfismo de classe Ck , h = ϕ−1 : I × W −→ Z,
(1) (2)
h(x, y, z) = (h2 (x, y, z), x, h2 (x, y, z))
para todo x ∈ I. Logo f−1 (c) ∩ Z é o gráfico da aplicação de classe Ck ξ : I −→ R2J , dada por
(1) (2)
ξ(x) = h2 (x, c1 , c2 )e1 + h2 (x, c1 , c2 )e3 ,
ou seja,
(1) (2)
f−1 (c) ∩ Z = h2 (x, c1 , e2 ), x, h2 (x, c1 , c2 ) x ∈ I .
12 O Teorema do Posto
Observação 12.1. O posto de T é igual a r se, e só se, a matriz de T possui um determinante
menor r × r não-nulo, mas qualquer determinante menor de ordem r + 1 é igual a zero.
• f tem posto 1 nos pontos (x, 0), com x 6= 0 e nos pontos (0, y), com y 6= 0;
Logo, como f 0 : U −→ L(Rn ; Rm ) é contı́nua, existe δ > 0 tal que este menor é não-nulo em
todos os pontos da bola de centro a e raio δ.
Prova.
Sejam (x, y1 ), (x, y2 ) ∈ U, e seja λ : [0, 1] −→ Rp o caminho λ(t) = f(x + (1 − t)y1 + ty2 ).
Então, como y2 − y1 ∈ RnJ ,
para todo t ∈ [0, 1]. Logo λ é constante em [0, 1]. Em particular, λ(0) = λ(1), ou seja,
f(x, y1 ) = f(x, y2 ).
Lema 12.2. Seja E ⊂ Rm+p um subespaço vetorial de dimensão m. Então existe uma decom-
p
posição em soma direta Rm+p = Rm
I ⊕ RJ tal que a projeção sobre a primeira coordenada
π : Rm+p −→ Rm m
I , π(x, y) = x, aplica E isomorficamente sobre RI .
Prova.
Seja {u1 , . . . , um } uma base de E. Se E = Rm+p , não há nada a demonstrar. Se E 6= Rm+p ,
existe j1 ∈ {1, . . . , m + p} tal que ej1 6∈ E. Então {u1 , . . . , um , ej1 } são LI e geram um subespaço
E1 de Rm+p de dimensão m + 1. Se E1 6= Rm+p , existe j2 ∈ {1, . . . , m + p} tal que ej2 6∈ E1 .
Então {u1 , . . . , um , ej1 , ej2 } são LI e geram um subespaço de Rm+p de dimensão m + 2. Pros-
seguindo desta maneira, obtemos p vetores ej1 , . . . , ejp , da base canônica de Rm+p tais que
{u1 , . . . , um , ej1 , . . . , ejp } é uma base de Rm+p .
Descrição do Teorema do Posto: Cada uma das fibras da vizinhança Z de a é transformada por
f num único ponto, do mesmo modo que cada segmento vertical x×W em V ×W é transformado
por β ◦ f ◦ α no ponto (x, 0).
Prova.
Seja E = f 0 (a)(Rm+n ) ⊂ Rm+p .
p
Como dim E = m, pelo lema 12.2, existe uma decomposição em soma direta Rm+p = Rm
I ⊕ RJ
tal que a projeção sobre a primeira coordenada π : Rm+p −→ Rm
I , π(x, w) = x, é um isomorfismo
quando restrita a E, ou seja, π : E −→ Rm
I é um isomorfismo.
Seja T : Rm+p −→ Rm+p a transformação linear tal que T (ek ) = eik , k = 1, . . . , m e T (ek ) = ejk−m ,
k = m + 1, . . . , m + p, e seja π = L ◦ T −1 ◦ π, onde L : Rm × {0} −→ Rm é dada por L(x, 0) = x.
Logo (π ◦ f) 0 (a) = π ◦ f 0 (a) : Rm+n −→ Rm é sobrejetora. Então, pela Forma Local das Sub-
mersões, existe um difeomorfismo α de classe Ck de um aberto V0 × W ⊂ Rm × Rn sobre um
aberto Z0 contendo a em Rm+n tal que π ◦ f ◦ α(x, w) = x.
X
m
Assim, f ◦ α(x, y) = xk eik + λ(x, y), onde a aplicação λ : V0 × W −→ RpJ , dada por
k=1
X
p
λ(x, y) = λ` (x, y)ej` , é de classe Ck .
`=1
Afirmação: ∂2 λ = 0.
!
Im×m Om×n
De fato, a matriz Jacobiana de T −1 ◦ f ◦ α tem a forma , onde Im×m
Ap×m
Bp×n
(m+p)×(m+n)
∂λi
é a matriz identidade m × m, Om×n é a matriz nula m × n e B = .
∂yk p×n
Além disso, como W pode ser tomado convexo, temos que V0 × W é verticalmente convexo e,
portanto, pelo lema 12.1, λ(x, y) não depende da variável y.
Prova.
(a) (⇐) Se f é uma imersão de classe C1 , então f é fortemente diferenciável no ponto a e
f 0 (a) : Rm −→ Rn é injetora para todo a ∈ U. Logo, pelo teorema 7.2, f é localmente injetora.
Ou ainda, pela Forma Local das Imersões, para cada a ∈ U, existe um aberto V ⊂ Rm , com
V ⊂ U e a ∈ V, e um difeomorfismo β : Z −→ V × W tal que β ◦ f(x) = (x, 0) para todo x ∈ V.
Logo f|V é injetora.
(⇒) Suponhamos que posto(f) = p < m. Então, pelo Teorema do Posto, a aplicação β ◦ f ◦ α :
(x, y) 7−→ (x, 0), definida no produto V × W dos abertos V ⊂ Rp e W ⊂ Rm−p não é injetora.
Como β e α são difeomorfismos, temos que f não é injetora em aberto algum contendo a, um
absurdo.
(⇒) Suponhamos que posto(f) = p < n. Sejam os difeomorfismos β e α dados pelo Teorema
do Posto. Então β ◦ f ◦ α(x, y) = (x, 0) para todo x ∈ V, y ∈ W, onde V é um aberto de Rp , W é
um aberto de Rm−p , (x, 0) ∈ Rp × Rn−p .
Prova.
Seja V ⊂ U um aberto não-vazio.
Afirmação: V ∩ A 6= ∅.
De fato, como o posto de f só assume um número finito de valores, existe a ∈ V tal que
r = posto(f(a)) = max{posto(f(x)) | x ∈ V}.
Então, pela observação 12.4, existe δ > 0 tal que B(a; δ) ⊂ V e posto(f(x)) ≥ r para todo
x ∈ B(a; δ). Logo posto(f(x)) = r para todo x ∈ B(a; δ) e, portanto, B(a; δ) ⊂ Ar .
Assim, ∅ 6= B(a; r) ⊂ Ar ∩ V ⊂ A ∩ V.
Prova.
Seja o conjunto aberto e denso A = A0 ∪ . . . ∪ Ap dado pelo teorema anterior. Como os abertos
A0 , A1 , . . . , Ap são dois a dois disjuntos, temos que se C é uma componente conexa de A e
C ∩ Aj 6= ∅ para algum j = 0, 1, . . . , r, então C ⊂ Aj , pois, caso contrário,
p
[
C = (Aj ∩ C) ∪ Ak ∩ C
k=1
k 6= j
Prova.
Seja a decomposição A = A0 ∪ . . . ∪ Ap dada pelo teorema 12.2. Em cada aberto Ai 6= ∅,
i = 0, . . . , p, f é localmente injetora e tem posto constante. Logo, pelo corolário 12.1, f|Ai é uma
imersão. Então m ≤ n e Ai = ∅ para todo i = 0, . . . , m − 1, ou seja, p = m e A = Am . Além
disso, pela observação 12.6, Am = {x ∈ U | f 0 (x) é injetora}.
Prova.
Seja a decomposição A = A0 ∪ . . . ∪ Ap dada pelo teorema 12.2. Como em cada aberto
Ai 6= ∅, f|Ai é uma aplicação aberta de posto constante temos, pelo corolário 12.1, que f|Ai é
uma submersão. Logo n ≤ m e Ai = ∅ para todo i = 0, . . . , n − 1. Ou seja, p = n e A = An .
Então, pela observação 12.6, An = {x ∈ U | f 0 (x) é sobrejetora}.
Observação 12.7. Quando m = 1, o corolário 12.3 pode ser demonstrado sem a ajuda do
Teorema do Posto.
Além disso, como f é localmente injetora, não pode existir um intervalo aberto J ⊂ I tal que
A ∩ J = ∅, ou seja, não pode existir J ⊂ I tal que f 0 (x) = 0 para todo x ∈ J, pois, neste caso, f
seria constante em J, e assim, f não seria localmente injetora.
Além disso, se A não fosse denso em U, seu complementar conteria uma bola aberta B. Como
df(x) = 0 para x ∈ B e B é conexo, f seria constante em B e, portanto, f(B) seria um conjunto
formado por apenas um ponto, logo não poderia ser aberto. Assim, A é denso em U.
Apêndice I
Já vimos que o Teorema da Aplicação Implı́cita pode ser obtido a partir do Teorema da
Aplicação Inversa. Vamos provar que a recı́proca também é verdadeira.
Prova.
De fato, seja f : U ⊂ Rm −→ Rm uma aplicação fortemente diferenciável no ponto a ∈ U
(ou de classe Ck ) tal que f 0 (a) : Rm −→ Rm é um isomorfismo.
Como f é fortemente diferenciável no ponto a e f 0 (a) é injetora, existe, pelo teorema 7.2, um
aberto U0 ⊂ U, com a ∈ U0 , tal que f : U0 −→ f(U0 ) é um homeomorfismo.
De fato, como
F(x, y) = x − f(y) = F(f(a), a) + (x − f(a)) − f 0 (a)(y − a) + rF(f(a),a) (x, y) ,
temos que
rF(f(a),a) (x, y) = −f(y) + f(a) + f 0 (a)(y − a) = −rfa (y) .
Além disso, como g 0 (f(a), a)(v, w) = v − f 0 (a) w , temos que F 0 (f(a), a)(0, w) = −f 0 (a)w e,
portanto, ∂2 F(f(a), a) : Rm −→ Rm é um isomorfismo, uma vez que f 0 (a) : Rm −→ Rm é um
isomorfismo.
Apêndice II
Provaremos o Teorema da Aplicação Inversa usando duas vezes o Teorema da Aplicação Implı́cita.
Como f(ϕ(x)) = x para todo x ∈ V1 , temos que ϕ é injetora e f 0 (ϕ(x) · ϕ 0 (x) · v = v para
todos x ∈ V1 e v ∈ Rn . Logo ϕ 0 (b) : Rn → Rn é um isomorfismo.
Assim, ξ(a) = f(a), ξ(z) ∈ V1 e ϕ(ξ(z)) = z, para todo z ∈ V. Logo f(ϕ(ξ(z))) = f(z), para
todo z ∈ V.
Como f ◦ ϕ(x) = x, para todo x ∈ V1 , temos que ξ(z) = f(z) e portanto, ϕ(f(z)) = z, para
todo z ∈ V.
FIM