You are on page 1of 10

Forma Canônica de Matrizes 2 × 2

Sylvie Olison Kamphorst


Departamento de Matemática - ICEx - UFMG

Versão 2.0 - Novembro 2005

!
a b
Seja A = uma matriz 2 × 2 real e seja T a transformação (operador) linear de R2
c d
induzida por A
T : R2 → R2 (1)
X 7→ T (X) = AX

Se P é uma matriz inversível, dizemos que matriz P −1 AP é semelhante a A. Como as colunas de


P são vetores linearmente independentes, elas formam uma base B de R2 e portanto P = [I]C B
representa a matriz de transição da base B para a base canônica. Assim a matriz
P −1 AP = [I]B C C B
C [T ]C [I]B = [T ]B

representa a transformação T na base B .

Nosso objetivo é escolher P de tal maneira que P −1 AP seja o mais simples possível. Equivalen-
temente queremos escolher uma base B de tal maneira que a transformação linear T seja a mais
simples possível geometricamente.

Dizemos que um número λ é autovalor de A, se existir um vetor v não nulo tal que Av = λv . Ou
seja, se o sistema de duas equações com duas incógnitas (A − λI)v = 0 tiver solução não trivial.
Portanto λ será autovalor de A se e somente se a matriz (A − λI) for não inversível, ou seja se
det(A − λI) = 0, já que se esta matriz tiver inversa, o sistema homogêneo terá apenas solução
trivial. Chamamos de polinômio característico de A
p(λ) = det(A − λI)

1 Autovalores Complexos

1.1 Modelo

Consideremos em R2 a matriz de rotação de um ângulo θ no sentido anti-horário.


!
cos θ − sen θ
Rθ = (2)
sen θ cos θ

1
O polinômio característico de Rθ é dado por
det(Rθ − λI) = λ2 − tr(Rθ )λ + det(Rθ ) = λ2 − 2 cos θ λ + 1

de tal maneira que os autovalores de Rθ (raízes do polinônio característico) são dados por
p
λ = cos θ ± cos2 θ − 1

Ou seja, temos um par de autovalores complexos: λ = cos θ + i sen θ e λ = cos θ − i sen θ (seu
complexo conjugado) .

Calculando os autovetores correspondentes temos para λ


! ! !
cos θ − sen θ x x
Rθ = = (cos θ + i sen θ)
sen θ cos θ y y
e portanto
cos θ x − sen θ y = (cos θ + i sen θ) x
sen θ x + cos θ y = (cos θ + i sen θ) y

o que implica que y = −i x e portanto um autovetor (complexo) é dado por w = (1, −i).

Analogamente, encontramos, associado a λ, o autovetor w = (1, i).

Note que os autovetores associados a λ e λ são realmente o complexo conjugado um do outro.


Os autovetores são w = (1, 0) ± i(0, 1). Ambos são uma combinação linear (com coecientes
complexos) dos vetores canônicos de R2 , ou melhor dizendo, cada um deles tem como parte real
e parte imaginária respectivamente os vetores e1 = (1, 0) e e2 = (0, 1) da base canônica.

1.2 Exemplo

! √
1 −1 1 3 π π
Seja A = . Seus autovalores são λ = ± i = cos ± i sen .
1 0 2 2 3 3

Queremos mostrar que A é semelhante à rotação de π/3, isto é, que existe uma matrix P ,
inversível tal que P −1 AP = Rπ/3 .

Observemos, no entanto, que se P é uma matriz ortogonal qualquer, então P −1 Rθ P = Rθ


para qualquer rotação. Geometricamente, isto traduz o fato que, qualquer que seja a base
ortonormal escolhida em R2 , a matriz que representao uma rotação de um ângulo θ tem sempre
o mesmo efeito sobre os vetores da base. Portanto, se A for semelhante a uma matriz de rotação,
necessariamente P não será ortogonal.

Vamos calcular os autovetores.



Para λ = 1
2 +i 2
3
temos
! ! √ ! !
1 −1 x1 1 3 x1
= +i
1 0 y1 2 2 y1

2
ou seja o autovetor w é dado por
! √ ! ! √ !
1 3 1 3
x1 +i 2
w= = 2 2 = +i 2
y1 1 1 0

Analogamente, para λ = 1
2 −i 2
3
obtemos o autovetor
√ ! ! √ !
1 3 1 3
−i 2
w= 2 2 = −i 2
1 1 0

Ou seja, w = u + iv e w = u − iv com
! √ !
1 3
u= 2 ,v = 2
1 0

vetores não nulos e linearmente independentes de R2 , de tal maneira que a matriz P = (v|u) é
inversível.

Efetuando as contas, vericamos que


√ !
1/2 − 3/2
P −1 AP = √ = Rπ/3
3/2 1/2

e portanto a matriz A é semelhante à matriz de rotação de π


3

1.3 Caso Geral e Demonstrações

!
a b
Seja A = , uma matriz 2 × 2, com entradas reais, tal que seu polinônio característico,
c d
p(λ) = det(A − λI) não tenha raízes reais.

Como as entradas de A são números reais, o seu polinômio característico

p(λ) = λ2 − (a + d)λ + (ad − bc)

tem coecientes reais e suas raízes são dadas por


p
(a + d) ± (a + d)2 − 4(ad − bc)
λ= .
2
Supondo que o discriminante de p seja negativo,

(a + d)2 − 4(ad − bc) = (a − d)2 + 4bc < 0

teremos duas raízes complexas.

λ = α + iβ , λ = α − iβ

com v
u a − d 2
u 
(a + d)
α= β = t + bc 6= 0

2 2

3
reais. Note que uma raiz é o complexo conjugado da outra. Assim, A tem um par de autovalores
complexos λ e λ.

Seja w = u + iv o autovetor (complexo) de A associado a λ. Temos assim


Aw = λw
A(u + iv) = (α + iβ)(u + iv)
Au + iAv = (αu − βv) + i(βu + αv)

e portanto
Av = αv + βu (3)
Au = −β v + α u

Assumindo (vamos demonstrar este fato mais tarde) que u e v são vetores linearmente indepen-
dentes, eles formam uma base para R2 . Se T é a transformação linear induzida pela matriz
A, dada em (1) e levarmos em conta as equações (3), na base B = {v, u} a transformação T é
representada pela matriz !
α −β
[T ]B
B = =M (4)
β α
 
ou seja, se P = v u = [I]C B é a matriz de mudança da base B para a base canônica C ,
então A = [T ]C = [I]B [T ]B [I]C = P M P −1 .
C C B B

Observamos que M pode ser ser reescrita como


!
cos θ − sin θ
M =r
sin θ cos θ

onde r = α2 + β 2 é um número real positivo e 0 ≤ θ < 2π é denido por cos θ = α/r, sin θ =
p

β/r. Portanto temos o seguinte resultado.

Teorema 1 Seja A uma matriz 2×2 real, tal que as raízes de seu polinômio característico sejam
complexas, λ = r(cos θ + i sen θ). Então A é semelhante a M = rRθ , onde Rθ é a matriz de
rotação de θ como em (2).

Assim, existe um sistema de coordenadas em R2 não necessariamente ortonormal em que a


transformação linear T , denida pela matriz A representa uma rotação de um ângulo θ seguida
de uma dilatação (contração ) de um fator r.

Vamos agora demonstrar que a parte real e a parte imaginária dos autovetores de uma matriz real
são vetores reais linearmente independentes. Tal demonstração na verdade, vale para matrizes
n × n.

Proposição 2 Seja A uma matriz quadrada, n × n, com entradas reais tal seu polinômio car-
acterístico tenha um par de as raízes complexas λ e λ. Então se w = u + iv é um autovetor tal
que A w = λw , u e v são vetores de Rn linearmente independentes.

4
Demonstração:

1. Se w ∈ C n é autovetor de A associado ao auto valor λ então o seu complexo conjugado w


é autovetor de A associado ao auto valor complexo conjugado , λ pois

Aw = λw ⇒ Aw = λw ⇒ Aw = λw ⇒ Aw = λw

2. Todo vetor w de C n se escreve como w = u + iv com u e v em Rn .


3. v 6= 0. O autovetor w = u + iv não pode ser real já que se ele fosse real w = w = u e
portanto teríamos da equação do item 1. acima que

λw = Aw = Aw = λ w = λ w ⇒ (λ − λ)w = 0

o que é impossível se w 6= 0 e λ 6= λ. Portanto devemos ter v 6= 0.


4. u 6= 0. O autovetor w = u + iv também não pode ser puramente imaginário pois neste caso
teriámos w = iv e
A(iv) = Aw = λw = λiv ⇒ Av = λv
portanto v seria um autovetor real de um autovalor complexo, o que é impossível como foi
demonstrado no item anterior.
5. Demonstramos portanto que todo autovetor w associado a um autovalor complexo de uma
matriz real tem parte real u e imaginária v ambas não nulas. Vamos mostrar que estes dois
vetores de Rn são linearmente independentes.
Suponhamos que u e v sejam linearmente dependentes, ou seja v = bu com b 6= 0. Neste
caso teremos

A w = λ w ⇒ A(u + i v) = λ(u + i v) ⇒ A (u + i bu) = λ(u + i b u)


⇒ (1 + i b)A u = (1 + i b)λ u ⇒ A u = λ u

Como u é real, não pode ser autovetor de A portanto u e v não podem ser linearmente
dependentes.

c.q.d

1.4 Exemplo

!
0 1
Seja A = .
−2 −2

O polinômio característico de A é p(λ) = λ2 + 2λ + 2 e portanto os autovalores são



−2 ± 22 − 4.2 √ −1 
1
 √  3π 3π

λ= = −1 ± i = 2 √ + i √ = 2 cos + i sen .
2 2 2 4 4

5
O autovetor w = (w1 , w2 ) associado a λ = −1 + i é dado por
! ! !
0 1 w1 w1
= −1 + i
−2 −2 w2 w2
! ! !
1 1 0
e portanto w2 = (−1 + i)w1 . Assim w = = +i
−1 + i −1 1
! !
1 0
Note que o autovetor associado a −1 − i é dado por −i
−1 1
! !
1 0
Temos assim 2 vetores reais u = ev = que são linearmente independentes e
−1 1
portanto constituem uma base B = {v, u} (não ortogonal) do plano R2 .
!
0 1
P =
1 −1

é a matriz de transição entre a base B e a base canônica. E


√ √ !

! ! ! !
1 1 0 1 0 1 −1 −1 −1/√2 −1/√2
= = 2
1 0 −2 −2 1 −1 1 −1 1/ 2 −1/ 2

Assim, na base B , temos uma rotação de 3π/4 seguida de uma dilatação de 2.

Infelizmente, como a base B não é ortonormal a tranferência destas informações para a base
canônica não é óbvia. Podemos ter uma idéia da geometria desta transformação se considerarmos
o efeito da mudança de base sobre círculos nas coordenadas (x0 , y 0 ) da base √
B . Isto porque, como
nestas coordenadas a transformação linear (a menos do fator multiplicativo 2) é uma rotação de
3π/4, podemos pensar que qualquer vetor roda sobre um círculo de raio igual ao seu comprimento.
Assim consideremos o círculo (x0 )2 +(y 0 )2 = 1 nas coordenadas da base B . Sabemos que a matriz
de transição da base canônica para a base B é P −1 , portanto
! ! !
x 1 1 x
=
y 1 0 y

e temos que

x0 = x + y
y0 = x

Substituindo as relações acima na equação do círculo obtemos

2x2 + 2xy + y 2 = 1

A equação acima representa uma elipse rodada com relação ao eixo x das coordenadas originais.
(Verique isto.)

6
2 Autovalores Repetidos

2.1 Modelo

Consideremos a matriz de cisalhamento


!
λ 1
Sλ = (5)
0 λ

cujo polinômio característico tem λ como raiz dupla (multiplicidade algébrica 2). A equação de
autovetores correspondentes é dada por λx + y = λx e portanto o conjunto dos autovetores, o
autoespaço Wλ , é gerado por wλ = (1, 0).

Se tomarmos o vetor v = (0, 1) ∈


/ Wλ temos que
! ! ! ! !
λ 1 0 1 1 0
Sλ v = = = +λ = wλ + λv
0 λ 1 λ 0 1

Note que esta conclusão é óbvia a partir da forma da matriz Sλ , já que a primeira coluna é a
imagem de (1,0) e a segunda a imagem de (0,1).

Na verdade, dado um vetor v = (x, y) qualquer temos


! ! ! ! !
λ 1 x λx + y 1 x
Sλ v = = =y +λ = wλ + λv
0 λ y λy 0 y

Geometricamente o efeito da transformação linear T , associada a matriz Sλ , sobre um vetor


qualquer, é de multiplicar o vetor por λ e em seguida adicionar um deslocamento na direção do
eixo x (ou seja dos autovetores) proporcional a y (veja na gura abaixo).

2.2 Exemplo

!
5 −1
Seja A = . Seu polinônio característico é p(λ) = λ2 − 8λ + 16 que possui como única
1 3
raiz λ = 4.

Os autovetores são dados por 5x − y = 4x e portanto o auto espaço W4 = ger{(1, 1)} tem
dimensão 1. Logo, A não é diagonalizável.

7
Tomando um vetor v = (x, y) qualquer temos
! ! ! ! !
5 −1 x 5x − y x 1
= =4 + (x − y)
1 3 y x + 3y y 1

Portanto concluímos que, como no modelo anterior, a imagem de um vetor qualquer é igual ao
mesmo vetor multiplicado pelo autovalor, somada a um autovetor, isto é
Av = λv + w , w ∈ Wλ .

Tomemos o vetor v = (1, −1) que é ortogonal ao autoespaço gerado por w = (1, 1). Temos que
Av = (−6, 2). Tomemos agora a matriz
!
1 −1
P = (w|v) =
1 1

Fazendo as contas, vericamos que


!
−1 4 −2
P AP =
0 4

Note que Av = (−6, 2) = −2(1, 1) + 4(−1, 1) = −2w + 4v .

Portanto A é semelhante a uma matriz tipo cisalhamento (a menos do -2 em vez do 1 fora da


diagonal).

Exercícios:

1. Repita o processo acima para outra escolha de v .


2. Encontre um v para o qual a matriz P − 1AP tenha exatamente a forma de (5), com 1 fora
da diagonal.

Note que Av = (−6, 2) = −2(1, 1) + 4(−1, 1) = −2w + 4v .

2.3 Caso geral e Demostrações

Suponhamos que o polinômio característico da matriz A, real e 2 × 2 tenha apenas uma raiz real
λ (de multiplicidade 2). Suponhamos também que a este autovalor esteja associado um único
autovetor, a menos de um fator multiplicativo, isto é que a dimensão autoespaço Wλ seja 1. A
idéia é estudar a ação de A sobre os vetores que não estão no subespaço Wλ .

Já sabemos que se w ∈ Wλ , então Aw = λw e queremos então caracterizar Av para v ∈


/ Wλ , ou
seja v não autovetor de A. Vamos demonstrar a seguinte

Proposição 3 Seja A uma matriz real, 2 × 2, tal que λ ∈ R é um autovalor de multiplicidade


algébrica 2 e multiplicidade geométrica 1, isto é dim(Wλ ) = 1. Então Av − λv ∈ Wλ para todo
v.

8
Segue da proposição acima que a transformação linear associada a A é um cisalhamento na
direção dos autovetores, já que a imagem de qualquer vetor v é obtida multiplicando o vetor pelo
autovalor e somando um autovetor, isto é Av = λv + w, com w autovetor.

Teorema 4 Seja A uma matriz real, 2 × 2, tal que λ ∈ R é um autovalor de multiplicidade


algébrica 2 e multiplicidade geométrica 1. Então A é semelhante ao cisalhamento Sλ , dado em
(5). Isto é existe P , inversível tal que P −1 AP = Sλ .

Demonstração: Fixemos um vetor v ∈/ Wλ qualquer. Pela Proposição 3


u = Av − λv ∈ Wλ

e portanto u e v são linearmente independentes.

Tomemos então B = {u, v} como base de R2 . Temos que


Au = λu
Av = u + λv

Portanto nesta base, a transformação linear T , associada à matriz A é representada pela matriz
de cisalhamento Sλ ou seja, se P = (u|v) = [I]C B é a matriz de mudança da base B para a base
canônica C , então A = [T ]C
C = [I]C [T ]B [I]B = P S P −1 .
B B C λ c.q.d.

Demonstração da Proposição 3: Seja v um vetor qualquer de R2 que não seja autovetor de


A, ou seja v ∈
/ Wλ .

Denimos u = Av − λv .

Vamos mostrar que u ∈ Wλ , ou seja u é um autovetor. .

1. u 6= 0:
Se u = 0, Av = λv , o que é impossível pois v ∈
/ Wλ .

2. u e v são linearmente independentes:


Se u fosse proporcional a v , isto é, u = bv teríamos
u = bv = (A − λI)v ⇒ Av = (b + λ)v

o que implica que v seria autovetor de A com auto valor b + λ .


3. u é autovetor de A:
Como B = {u, v} é l.i., é uma base para R2 . Assim um auto vetor w de A se escreve como
combinação linear dos vetores da base: w = au + bv , com a 6= 0 já que v não é autovetor.
(A − λI)w = 0 ⇒ (A − λI)(au + bv) = 0 ⇒ a(A − λI)u + b(A − λI)v = 0
⇒ a(A − λI)u + bu = 0 ⇒ Au = (λ + b/a)u

logo u é autovetor de A e devemos ter b = 0, já que λ é o único autovalor.

c.q.d.

9
2.4 Algoritmo

Dada uma matriz A, 2 × 2, com um único autovetor, vamos escolher uma matriz P tal que A
seja semelhante a matriz de cisalhamento. Em outras palavras, vamos escolher uma base B de
R2 tal que a transformação associada seja representada pela matriz de cisalhamento.

1. Dada A, calculamos seu autovalor λ e um autovetor w.


2. Escolhemos então um vetor v que não seja um autovetor (ou seja, que não seja proporcional
a w). Em particular podemos escolher um vetor v que seja ortogonal a w.
3. Calculamos u = Av − λv que deve ser proporcional a w.
4. P = (u|v) ou B = {u, v}.

2.5 Exemplo

!
5 1
A=
−4 1

Seu polinômio característico é p(λ) = λ2 − 6λ + 9 que tem como única raiz λ = 3.

A equação de autovetores nos dá


! ! !
5−3 1 x 0
=
−4 1 − 3 y 0

ou seja −2x = y . E portanto um autovetor é w = (1, −2)

Escolhemos v = (2, 1) . Temos então que


! ! ! !
5 1 2 1 5
u= −3 =
−4 1 1 −2 −10

Note que u = 5w.

Assim !
5 −10
P =
2 1

Exercíos:

1. Escolha outros v 's e verique o resultado.


2. É possível fazer uma escolha de v tal que P seja ortogonal?

10

You might also like