You are on page 1of 16

Descomposicion en valores singulares

Notas para los cursos 21 y 22 (J.L. Mancilla Aguilar)


1. Valores Singulares
Tanto los valores singulares como la descomposicion en valores singulares de una matriz son
conceptos de gran utilidad en las aplicaciones del algebra lineal a diversos problemas practicos
y teoricos.
A continuacion deniremos el concepto de valor singular de una matriz.
Dada una matriz A R
mn
, la matriz A
T
A es simetica, pues (A
T
A)
T
= A
T
(A
T
)
T
= A
T
A,
y semidenida positiva, ya que
x
T
A
T
Ax = (Ax)
T
(Ax) = Ax
2
0 x R
n
.
Por lo tanto los autovalores de A
T
A son reales y no negativos.
Denicion 1 Sea A R
mn
. Sean
1
,
2
, . . . ,
n
los autovalores de A
T
A ordenados en forma
decreciente, es decir,

1

2

n
0.
Entonces
i
=

i
es el i-esimo valor singular de A.
El primer y el ultimo valor singular de una matriz proporcionan la siguiente informacion.
Proposicion 1 Sea A R
mn
. Entonces, si
1
y
n
son, respectivamente, el mayor y el menor
valor singular de A, se tiene que
max
x=1
Ax =
1
y mn
x=1
Ax =
n
.
Demostracion. Sean
1
y
n
el maximo y el mnimo autovalor de A
T
A, respectivamente.
Entonces, por Rayleigh,
max
x=1
x
T
(A
T
A)x =
1
y mn
x=1
x
T
(A
T
A)x =
n
.
Luego

1
=
_

1
=
_
max
x=1
x
T
(A
T
A)x = max
x=1
_
Ax
2
= max
x=1
Ax,
valiendo la primera igualdad por la denicion de valor singular, la segunda por Rayleigh, la
tercera por la igualdad x
T
(A
T
A)x = Ax
2
y por ser la funcion (t) =

t monotona creciente
en [0, ) (si es una funcion escalar monotona creciente sobre la imagen de f(x) entonces
(max f(x)) = max (f(x)) y (mnf(x)) = mn(f(x)) ).
En forma similar se prueba que mn
x=1
Ax =
n
.
Como corolario de la Proposicion 1 resultan las desigualdades

n
x Ax
1
x x R
n
,
1
que acotan superior e inferiormente la magnitud de Ax en funcion de la magnitud de x.
En efecto, si x = 0 las desigualdades son obviamente ciertas. Si x = 0 tenemos que v = x/x
es unitario y por lo tanto
n
Av
1
. Pero Av = Ax/x, con lo cual

n

Ax
x

1
=
n
x Ax
1
x.
El siguiente resultado sera clave para la construccion de la descomposicion en valores sin-
gulares de una matriz. Recordemos que toda matriz simetrica n n con coecientes reales es
diagonalizable ortogonalmente, o, lo que es equivalente, existe una b.o.n. de R
n
compuesta por
autovectores de ella.
Teorema 1 Sea A R
mn
. Supongamos que
1
,
2
, . . . ,
n
son los autovalores de A
T
A y que

1

2

r
>
r+1
= =
n
= 0,
en otras palabras, los autovalores de A
T
A estan ordenados en forma decreciente y el n umero de
autovalores no nulos es r.
Sea {v
1
, . . . , v
n
} una b.o.n. de R
n
tal que A
T
Av
i
=
i
v
i
.
Entonces
1. {Av
1
, . . . , Av
n
} es un conjunto ortogonal y Av
i
=

i
=
i
para todo i = 1, . . . , n;
2. {
Av
1

1
, . . . ,
Av
r

r
} es b.o.n. de col(A);
3. {v
r+1
, . . . , v
n
} es b.o.n. de Nul(A);
4. rango(A) = r = n umero de v.s. no nulos de A.
Demostracion. Respecto del primer punto, como
(Av
i
, Av
j
) = (Av
i
)
T
(Av
j
) = v
T
i
(A
T
Av
j
) = v
T
i
(
j
v
j
) =
j
(v
T
i
v
j
) =
_

j
i = j
0 i = j
,
entonces Av
i
Av
j
si i = j y Av
i
=

i
=
i
para i = 1, . . . , n.
Respecto del punto 2., como por el punto 1. el conjunto {
Av
1

1
, . . . ,
Av
r

r
} es ortonormal, basta
probar que este genera el espacio columna de A. Para ello alcanza con ver que
gen{Av
1
, . . . , Av
r
} = col(A).
Consideremos la transformacion lineal T : R
n
R
m
, T(x) = Ax. Tenemos por un lado que
Im(T) = col(A). Por otra parte, como {v
1
, . . . , v
n
} es base de R
n
y T(v
i
) = Av
i
,
col(A) = Im(T) = gen{Av
1
, . . . , Av
n
} = gen{Av
1
, . . . , Av
r
},
la ultima igualdad debida al punto 1., ya que Av
i
=

i
= 0 si i r + 1.
El punto 4. es inmediato del 2. ya que el rango de A es la dimension del espacio columna de
la matriz y esta es r, que por otra parte es el n umero de autovalores no nulos de A
T
A, el cual
coincide con el n umero de v.s. no nulos de A.
Finalmente el punto 3. resulta del hecho que {v
r+1
, . . . , v
n
} es un conjunto ortonormal, que
Av
i
= 0 para todo i r + 1 y que dim(Nul(A)) = n r.
2
Ejemplo 1 Consideremos la matriz
A =
_
4 11 14
8 7 2
_
.
Como
A
T
A =
_
_
80 100 40
100 170 140
40 140 200
_
_
,
y sus autovalores son
1
= 360,
2
= 90 y
3
= 0, tenemos que los v.s. de A son

1
=

360 = 6

10,
2
=

90 = 3

10
3
= 0.
Notamos que el rango de A es 2 y que hay exactamente 2 v.s. no nulos como informa el Teorema
1.
Busquemos ahora una b.o.n. de R
3
compuesta por autovectores de A
T
A. Como
S

1
= gen
_
_
_
_
_
1
2
2
_
_
_
_
_
, S

2
= gen
_
_
_
_
_
2
1
2
_
_
_
_
_
y S

3
= gen
_
_
_
_
_
2
2
1
_
_
_
_
_
,
B = {v
1
, v
2
, v
3
}, con
v
1
=
1
3
_
_
1
2
2
_
_
, v
2
=
1
3
_
_
2
1
2
_
_
y v
3
=
1
3
_
_
2
2
1
_
_
,
es una de tales bases.
Calculemos Av
i
para i = 1, 2, 3,
Av
1
=
_
18
6
_
, Av
2
=
_
3
9
_
y Av
3
=
_
0
0
_
.
Notamos que Av
i
Av
j
si i = j y que Av
i
=
i
para i = 1, 2, 3.
En particular {v
3
} es b.o.n. de Nul(A) y {
Av
1

1
,
Av
2

2
} es b.o.n. de col(A), que en este caso
coincide con R
2
.
2. Descomposicion en valores singulares
En lo que sigue deniremos lo que se conoce como descomposicion en valores singulares
(DVS) de una matriz.
Denicion 2 Sea A R
mn
. Una descomposici on en valores singulares de A es una factoriza-
cion
A = U V
T
con U R
mm
y V R
nn
ortogonales y R
mn
con
=
_
D 0
r(nr)
0
(mr)r
0
(mr)(nr)
_
y D =
_

1
0 0
0
2
0
.
.
.
.
.
.
.
.
.
.
.
.
0 0
r
_

_
con
1

2

r
> 0.
0
kl
representa la matriz k l cuyos coecientes son nulos.
3
Notar que si A = U V
T
es una DVS de A, con como en la Denicion 2, y v
i
y u
i
son las
i-esimas columnas de V y U respectivamente, entonces es facil ver que A puede ser escrita en la
forma
A =
1
u
1
v
T
1
+
2
u
2
v
T
2
+ +
r
u
r
v
T
r
,
donde cada una de las matrices u
i
v
T
i
es de rango 1.
Denicion 3 Si A = U V
T
es una DVS de A, a los vectores que aparecen como columnas de
la matriz V se los denomina vectores singulares derechos de A mientras que a los que aparecen
como columnas de U se los denomina vectores singulares izquierdos de A.
El siguiente teorema nos dice que toda matriz admite una DVS.
Teorema 2 Sea A R
mn
. Entonces existe un descomposicion en valores singulares de A.
Demostracion. Sean
1
, . . . ,
n
los autovalores de A
T
A. Supongamos que estan ordenados en
forma decreciente y que exactamente r de ellos son no nulos (r podra ser n). Sea {v
1
, v
2
, . . . , v
n
}
una b.o.n. de R
n
tal que A
T
Av
i
=
i
v
i
para todo i = 1, . . . , n.
Denimos V = [v
1
v
2
v
n
], que es ortogonal, y
=
_
D 0
r(nr)
0
(mr)r
0
(mr)(nr)
_
con D =
_

1
0 0
0
2
0
.
.
.
.
.
.
.
.
.
.
.
.
0 0
r
_

_
donde
i
=
_

i
.
Con el objeto de denir U, consideremos los vectores
u
1
=
Av
1

1
, u
2
=
Av
1

2
, , u
r
=
Av
r

r
.
Entonces, de acuerdo con el Teorema 1, el conjunto {u
1
, . . . , u
r
} es ortonormal. Si r < m
buscamos vectores u
r+1
, . . . , u
m
de modo tal que {u
1
, . . . , u
m
} sea b.o.n. de R
m
. Luego denimos
U = [u
1
u
2
u
m
] que es una matriz ortogonal. Veamos ahora que A = U V
T
.
Por un lado
AV = [Av
1
Av
n
] = [
1
u
1
. . .
r
u
r
0 0]
ya que Av
i
=
i
u
i
para i = 1, . . . , r por la denicion de los vectores u
i
y Av
i
= 0 para i =
r + 1, . . . , n por el Teorema 1.
Por otro lado
U = [u
1
u
2
u
m
]
_

1
0 0 0 0
0
2
0 0 0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
0 0
r
0 0
0 0 0 0 0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
0 0 0 0 0
_

_
= [
1
u
1
. . .
r
u
r
0 0].
Por lo tanto, AV = U. Teniendo en cuenta que V
1
= V
T
, llegamos a la igualdad A = UV
T
.
4
Observacion 1 La demostracion del Teorema 2 nos da un metodo para construir una DVS de
una matriz A. Metodo que podemos resumir de la siguiente manera.
Sea A R
mn
.
1. Calcular los autovalores de A
T
A y ordenarlos de mayor a menor:
1

2

n
.
2. Hallar una b.o.n. {v
1
, . . . , v
n
} de R
n
tal que A
T
Av
i
=
i
v
i
, i = 1, . . . , n.
3. Calcular los v.s. de A,
i
=

i
.
4. Si r es el n umero de v.s. de A no nulos, es decir,
r
> 0 y
i
= 0 para todo i r + 1,
denir
u
1
=
Av
1

1
, u
2
=
Av
1

2
, , u
r
=
Av
r

r
.
5. Si r < m, hallar u
r+1
, . . . , u
m
tales que {u
1
, . . . , u
m
} sea b.o.n. de R
m
.
6. Denir las matrices V = [v
1
v
2
v
n
], U = [u
1
u
2
u
n
] y
=
_
D 0
r(nr)
0
(mr)r
0
(mr)(nr)
_
con D =
_

1
0 0
0
2
0
.
.
.
.
.
.
.
.
.
.
.
.
0 0
r
_

_
;
7. Entonces A = U V
T
es una DVS de A.
Ejemplo 2 Consideremos la matriz A del Ejemplo 1. Los autovalores de A
T
A son
1
= 360,

2
= 90 y
3
= 0 y los v.s.,

1
=

360 = 6

10,
2
=

90 = 3

10
3
= 0.
B = {v
1
, v
2
, v
3
} con
v
1
=
1
3
_
_
1
2
2
_
_
, v
2
=
1
3
_
_
2
1
2
_
_
y v
3
=
1
3
_
_
2
2
1
_
_
,
es b.o.n. de R
3
y A
T
Av
i
=
i
v
i
. Como hay dos v.s. no nulos, calculamos
u
1
=
Av
1

1
=
_
3

10
1

10
_
y u
2
=
Av
2

2
=
_
1

10

10
_
.
Como {u
1
, u
2
} es b.o.n. de R
2
, no hace falta completar el conjunto. Ahora denimos
V =
1
3
_
_
1 2 2
2 1 2
2 2 1
_
_
, U =
1

10
_
3 1
1 3
_
y =
_
6

10 0 0
0 3

10 0
_
,
y tenemos que A = U V
T
es una DVS de A.
5
Notamos que en la construccion de la DVS de A que hicimos en la demostracion del Teorema 2,
los elementos no nulos que aparecen en la diagonal principal de son los v.s. no nulos de A y
que las columnas de V , es decir, los vectores singulares derechos que utilizamos, son autovectores
de A
T
A. El siguiente resultado dice que lo anterior siempre ocurre, independientemente de la
forma en que la DVS haya sido obtenida.
Teorema 3 Sea A R
mn
y sea A = U V
T
una DVS de A.
Supongamos que
=
_
D 0
r(nr)
0
(mr)r
0
(mr)(nr)
_
y D =
_

1
0 0
0
2
0
.
.
.
.
.
.
.
.
.
.
.
.
0 0
r
_

_
con
1

2

r
> 0.
Entonces
1.
1
, . . . ,
r
son los v.s. no nulos de A;
2. Si V = [v
1
v
n
], {v
1
, . . . , v
n
} es una b.o.n. de R
n
tal que A
T
Av
i
=
2
i
v
i
si i = 1, . . . , r y
A
T
Av
i
= 0 si i = r + 1, . . . , n;
3. Si U = [u
1
u
m
], Av
i
=
i
u
i
para i = 1, . . . , r y Av
i
= 0 para i = r + 1, . . . , n.
Demostracion. Como A = U V
T
tenemos que
A
T
A = (U V
T
)
T
(U V
T
) = V (
T
)V
T
.
Pero
T
es la matriz n n

T
=
_

2
1
0 0 0 0
0
2
2
0 0 0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
0 0
2
r
0 0
0 0 0 0 0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
0 0 0 0 0
_

_
.
Por lo tanto A = V (
T
)V
T
es una diagonalizacion ortogonal de A
T
A. En consecuencia,
1
=

2
1
,
2
=
2
2
, . . . ,
r
=
2
r
, son los autovalores no nulos de A
T
A ordenados en forma decreciente.
Por lo tanto
1
, . . . ,
r
son los v.s. no nulos de A.
Tambien tenemos que las columnas de V conforman una b.o.n de R
n
y son autovectores de
A
T
A, mas precisamente, A
T
Av
i
=
2
i
v
i
para i = 1, . . . r, y A
T
Av
i
= 0 para i = r + 1, . . . , n, ya
que v
r+1
, . . . , v
n
son autovectores asociados al autovalor nulo.
Finalmente el punto 3. resulta inmediatamente de la igualdad AV = U .
Notemos que del Teorema 3 se desprende que los vectores singulares derechos son siem-
pre autovectores de A
T
A. En lo que sigue veremos que los vectores singulares izquierdos son
necesariamente autovectores de la matriz AA
T
.
Para ello es util el siguiente resultado.
6
Proposicion 2 Sea A = U V
T
una DVS de A R
mn
. Entonces
A
T
= V
T
U
T
es DVS de A
T
. En particular A y A
T
tienen los mismos v.s. no nulos.
Demostracion. Es inmediato a partir de la denicion de DVS que A
T
= V
T
U
T
es DVS de
A
T
. Que A y A
T
tienen los mismos v.s. no nulos se deduce del hecho que en aparecen los v.s.
no nulos de A y en
T
los v.s. no nulos de A
T
.
De la Proposicion 2 y del Teorema 3 deducimos que los vectores singulares izquierdos de una
matriz A son a la vez vectores singulares derechos de A
T
y por lo tanto autovectores de AA
T
.
Ejemplo 3 Hallar una DVS de
A =
_
1 2 2
1 2 2
_
.
Como los v.s. no nulos de A y de A
T
coinciden, calculamos los v.s. de A
T
, que son los autovalores
de AA
T
. Como
AA
T
=
_
9 9
9 9
_
,
sus autovalores son
1
= 18 y
2
= 0. Luego
1
=

18 = 3

2 es el unico v.s. no nulo tanto de


A
T
como de A. En particular, los restantes v.s. de A son
2
=
3
= 0.
Para hallar una DVS de A, lo que hacemos primero es hallar una DVS de A
T
. Calculando
obtenemos la siguiente b.o.n de R
2
compuesta por autovectores de AA
T
(ordenados seg un el
orden de los v.s.)
_
[
1

2

1

2
]
T
, [
1

2
1

2
]
T
_
. Designemos por u
1
y u
2
a los vectores de esa base.
Ambos son vectores singulares derechos de A
T
(u
1
corresponde a
1
y u
2
a
2
= 0) y por lo
tanto vectores singulares izquierdos de A.
Para obtener los vectores singulares izquierdos de A
T
que nos permitan luego construir una
DVS de A
T
, teniendo en cuenta que hay un solo valor singular no nulo, denimos
v
1
=
A
T
u
1

1
=
1
3
_
_
1
2
2
_
_
.
Para hallar los restantes vectores singulares izquierdos de A
T
debemos encontrar v
2
, v
3
tales
que {v
1
, v
2
, v
3
} sea b.o.n. de R
3
. Pero como v
2
y v
3
son a su vez vectores singulares derechos de
A y corresponden a valores singulares nulos de A, necesariamente Av
2
= 0 y Av
3
= 0. Luego
bastara con que hallemos una b.o.n. de Nul(A). Una posible b.o.n. es {v
2
, v
3
} con
v
2
=
1

2
_
_
0
1
1
_
_
y v
3
=
1
3

2
_
_
4
1
1
_
_
.
Note que {v
1
, v
2
, v
3
} es b.o.n. de R
3
. (Otra forma de computar v
2
, v
3
consiste en elegir v

2
y v

3
tales que {v
1
, v

2
, v

3
} sea l.i. y ortonormalizar el conjunto mediante Gram-Schmidt.)
7
Entonces
A
T
= V

U
T
con V = [v
1
v
2
v
3
], U = [u
1
u
2
] y

=
_
_
2

3 0
0 0
0 0
_
_
,
es DVS de A
T
y, por lo tanto, A = U V
T
con =
T
es DVS de A.
Como ejercicio, se propone al lector que calcule una DVS de A en forma directa.
3. DVS y los subespacios fundamentales de una matriz
En esta seccion veremos que las matrices U y V de una DVS de A estan compuestas por
bases ortonormales de los cuatro subespacios fundamentales de A.
Supongamos que A R
nm
es una matriz de rango r y que A = U V
T
es una DVS
de A. Entonces, si V = [v
1
v
n
] y U = [u
1
u
m
] y denimos las matrices V
r
= [v
1
v
r
],
V
nr
= [v
r+1
v
n
], U
r
= [u
1
u
r
] y U
mr
= [u
r+1
u
m
], se tiene que
1. {v
1
, , v
r
} es b.o.n. de l(A), V
T
r
V
r
= I y V
r
V
T
r
= P
l(A)
.
2. {v
r+1
, , v
n
} es b.o.n. de Nul(A), V
T
nr
V
nr
= I y V
nr
V
T
nr
= P
Nul(A)
.
3. {u
1
, , u
r
} es b.o.n. de col(A), U
T
r
U
r
= I y U
r
U
T
r
= P
col(A)
.
4. {u
r+1
, , u
m
} es b.o.n. de Nul(A
T
), U
T
mr
U
mr
= I y U
mr
U
T
mr
= P
Nul(A
T
)
.
La justicacion de este resultado es la siguiente. Como el rango de A es r, A tiene r valores
singulares no nulos, y por lo tanto A
T
A tiene r autovalores no nulos. Por el Teorema 3, los
vectores v
1
, . . . , v
n
son autovectores de A
T
A, estando los primeros r de ellos asociados a los
autovalores no nulos de A
T
A y los restantes al autovalor nulo de A
T
A. Por lo tanto, por el
Teorema 1, {v
r+1
, , v
n
} es b.o.n. de Nul(A) y, dado que {v
1
, , v
n
} es b.o.n. de R
n
, necesa-
riamente {v
1
, , v
r
} es b.o.n. de Nul(A)

= l(A). Con esto, y la forma en que se construyen


las matrices de proyeccion, quedan demostrados 1. y 2.
Respecto de 3. y 4., combinando el Teorema 1 con el Teorema 3, tenemos que {u
1
, , u
r
}
es b.o.n. de col(A) y, por lo tanto, dado que {u
1
, , u
m
} es b.o.n. de R
m
, {u
r+1
, , u
m
} es
b.o.n. de col(A)

= Nul(A
T
). De esto ultimo y la forma en que se construyen las matrices de
proyeccion, se deducen las restantes armaciones.
Ejemplo 4 Dada
A =
_
_
1 1 0
1 1 0
0 0 1
_
_
_
_

2 0 0
0

18 0
0 0 0
_
_
_

_
1

2
0
1

2
0 1 0

2
0
1

2
_

_
,
hallar los valores singulares de A, bases de sus cuatro subespacios fundamentales y calcular sus
matrices de proyeccion.
La descomposicion que tenemos de A es casi una DVS, salvo por el hecho de que la matriz
U

que aparece a la izquierda, si bien tiene columnas mutuamente ortogonales, estas no son de
8
norma 1. Procedemos entonces a normalizar las columnas de U

dividiendo cada una de ellas


por su norma. Para que el producto siga siendo A, es necesario multiplicar la la i de la matriz
central, por el n umero por el cual dividimos la columna i de U

. Queda entonces la factorizacion


A =
_

_
1

2
1

2
0
1

2

1

2
0
0 0 1
_

_
_
_
2 0 0
0 6 0
0 0 0
_
_
_

_
1

2
0
1

2
0 1 0

2
0
1

2
_

_
.
Esta factorizacion no es a un una DVS, porque los elementos de la diagonal de la matriz
central no estan ordenados de mayor a menor. Para ello lo que hacemos es permutar las dos
primeras columnas de la matriz de la izquierda y las dos primeras las de la matriz de la derecha.
Entonces obtenemos
A =
_

_
1

2
1

2
0

2
1

2
0
0 0 1
_

_
_
_
6 0 0
0 2 0
0 0 0
_
_
_

_
0 1 0
1

2
0
1

2
0
1

2
_

_
,
que ahora s es una DVS de A, ya que A = U V
T
con
U =
_

_
1

2
1

2
0

2
1

2
0
0 0 1
_

_
, =
_
_
6 0 0
0 2 0
0 0 0
_
_
y V =
_

_
0
1

2

1

2
1 0 0
0
1

2
1

2
_

_
.
Ahora podemos hallar lo solicitado. Los valores singulares de A son
1
= 6,
2
= 2 y
3
= 0.
Las primeras dos columnas de V son una b.o.n. de l(A), mientras que la ultima columna de
V es b.o.n. de Nul(A). Respecto de col(A), las dos primeras columnas de U son una b.o.n. de
ese subespacio, y la ultima columna de U es b.o.n. de Nul(A
T
). Respecto de las matrices de
proyeccion, estas son:
P
l(A)
=
_

_
0
1

2
1 0
0
1

2
_

_
_
0 1 0
1

2
0
1

2
_
=
_
_
1
2
0
1
2
0 1 0
1
2
0
1
2
_
_
,
P
Nul(A)
= I P
l(A)
=
_
_
1
2
0
1
2
0 0 0

1
2
0
1
2
_
_
,
P
Nul(A
T
)
=
_
_
0
0
1
_
_
_
0 0 1

=
_
_
0 0 0
0 0 0
0 0 1
_
_
,
P
col(A)
= I P
Nul(A
T
)
=
_
_
1 0 0
0 1 0
0 0 0
_
_
.
9
4. DVS reducida
Veremos ahora como a partir de una DVS, A = UV
T
, podemos obtener una descomposicion
de A que emplea matrices de tama no reducido. Empleando la notacion de la seccion anterior,
escribimos U = [U
r
U
mr
] y V = [V
r
V
nr
], donde r es el rango de A.
Entonces
A = U V
T
= [U
r
U
mr
]
_
D 0
r(nr)
0
(mr)r
0
(mr)(nr)
_ _
V
T
r
V
T
nr
_
= U
r
DV
T
r
.
A la factorizacion A = U
r
DV
T
r
se la denomina DVS reducida de A. Notar que la matriz D
es inversible, pues D es diagonal, y los elementos que aparecen en la diagonal principal son los
v.s. no nulos de A.
Ejemplo 5 Para la matriz A del Ejemplo 4,
A =
_

_
1

2
1

2
1

2
0 0
_

_
_
6 0
0 2
_
_
0 1 0
1

2
0
1

2
_
,
es una DVS reducida.
Notamos que es mas simple calcular una DVS reducida que una DVS, ya que solo se necesitan
los v.s. no nulos y conjuntos de vectores singulares derechos e izquierdos correspondientes a esos
valores singulares.
5. Solucion por cuadrados mnimos de norma mnima. Seudo-
inversa de Moore-Penrose
Si A R
mn
y b R
n
, la ecuacion Ax = b siempre admite soluciones por cuadrados mnimos
(c.m.). Si Nul(A) = {0}, o, equivalentemente, rango(A) = n, la solucion por c.m. es unica; en
caso contrario hay innitas soluciones por c.m., mas a un, si x
p
es una solucion por c.m., entonces
todas las demas son de la forma: x = x
p
+x
n
con x
n
Nul(A).
Es importante en el caso en que hay innitas soluciones por c.m. disponer de un criterio que
permita seleccionar una de estas innitas soluciones. Un posible criterio es el siguiente.
Denicion 4 x

es una solucion por c.m. de norma mnima de la ecuaci on Ax = b si x

es
solucion por c.m. y, ademas, x

x para todo x que sea solucion por c.m. de Ax = b.


En otras palabras, x

es, de todas las soluciones por c.m. de Ax = b, una que tiene la menor
norma (longitud) posible.
A continuacion veremos que existe una unica solucion por c.m. de norma mnima y daremos una
caracterizacion de ella que sera util para calcularla.
Proposicion 3 Consideremos la ecuacion Ax = b con A R
mn
y b R
n
. Entonces
1. Existe una unica solucion x

por c.m. de la ecuaci on Ax = b que pertenece a l(A).


2. x

es la unica solucion por c.m. de norma mnima de la ecuacion Ax = b.


10
Demostracion. Primero probamos que existe una solucion por c.m. que pertenece a l(A). Sea
x
p
una solucion por c.m. de la ecuacion Ax = b. Sea x

= P
l(A)
x
p
. Veamos que x

tambien es
solucion por c.m. de la ecuacion. Como l(A) = Nul(A)

,
x
p
= P
l(A)
x
p
+P
Nul(A)
x
p
= x

+P
Nul(A)
x
p
.
Luego, dado que x
p
una solucion por c.m. de la ecuacion Ax = b,
P
col(A)
b = A x
p
= A(x

+P
Nul(A)
x
p
) = Ax

,
y por lo tanto x

es solucion por c.m. de la ecuacion Ax = b y pertenece a l(A).


Ahora veamos que x

es la unica solucion por c.m. que pertenece a l(A). Supongamos


que x

es una solucion por c.m. que pertenece a l(A). Entonces Ax

= Ax

= P
col(A)
b. Luego
x

Nul(A). Como x

l(A) y l(A) = Nul(A)

, resulta x

= 0, y, por lo tanto,
x

= x

.
Hasta aqu hemos probado el punto 1. de la proposicion. Ahora probamos que x

es la unica
solucion por c.m. de norma mnima de la ecuacion Ax = b.
Primero vemos que x

es solucion por c.m. de norma mnima. Sea x una solucion por c.m.
de la ecuacion. Entonces x x

Nul(A). Luego
x
2
= x

+ ( x x

)
2
= x

2
+ x x

2
pues l(A) = Nul(A)

. Entonces x
2
x

2
y x

es de norma mnima.
Finalizamos la demostracion viendo que x

es la unica solucion de norma mnima. Supon-


gamos que y tambien es solucion de norma mnima. Entonces necesariamente y = x

. Por
otro lado, dado que y x

Nul(A) y que x

l(A),
y
2
= x

+ (y x

)
2
= x

2
+y x

2
.
Entonces, necesariamente y x

= 0, y, por lo tanto, y = x

.
De acuerdo con la Proposicion 3, para hallar la solucion por c.m. de norma mnima, debemos
buscar entre las soluciones por c.m. de la ecuacion la solucion x

que pertenece a l(A). Para


hallar tal solucion podemos proceder como sigue.
Supongamos que A = U
r
D V
T
r
es una DVS reducida de A. Entonces, por lo expuesto en la
Seccion 3, U
r
U
T
r
= P
col(A)
, U
T
r
U
r
= I, las columnas de V
r
son b.o.n. de l(A) y D es inversible.
Luego, como x

pertenece a l(A), existe R


r
tal que x

= V
r
. Como ademas x

es
solucion por c.m. de Ax = b entonces
P
col(A)
b = Ax

= AV
r
.
Luego, usando que U
r
U
T
r
= P
col(A)
, V
T
r
V
r
= I y A = U
r
D V
T
r
, tenemos que
U
r
U
T
r
b = U
r
D V
T
r
V
r
= U
r
D.
Multiplicando por izquierda por U
r
y usando que U
T
r
U
r
= I, obtenemos
D = U
T
r
b = = D
1
U
T
r
b,
y, por lo tanto,
x

= V
r
= V
r
D
1
U
T
r
b.
Notemos que hemos probado que la solucion por c.m. de norma mnima de la ecuacion Ax = b
se obtiene multiplicando b por la matriz V
r
D
1
U
T
r
.
11
Denicion 5 Sea A = U
r
D V
T
r
es una DVS reducida de A. La matriz A
+
= V
r
D
1
U
T
r
es la
matriz seudoinversa de Moore-Penrose de A.
Notamos que del hecho que para todo b R
n
, x

= A
+
b es la unica solucion por c.m. de longitud
mnima de la ecuacion Ax = b, se deduce que A
+
no depende de la DVS reducida empleada
para calcularla. En efecto, si A = U

r
DV

r
T
es otra DVS reducida de A, tenemos la igualdad
(V
r
D
1
U
T
r
)b = x

= (V

r
D
1
U

r
T
)b b R
n
.
Pero entonces, necesariamente
V
r
D
1
U
T
r
= V

r
D
1
U

r
T
.
Teorema 4 Sea A R
mn
y sea A
+
la matriz seudoinversa de Moore-Penrose de A. Entonces
1. Para todo b R
n
, x

= A
+
b es la unica solucion por c.m. de longitud mnima de la
ecuacion Ax = b.
2. A
+
A = P
l(A)
y AA
+
= P
col(A)
Demostracion. El punto 1. ya fue probado, el punto 2. se deduce inmediatamente del hecho
que A
+
A = V
r
V
T
r
y que AA
+
= U
r
U
T
r
.
Observacion 2 Del punto 2. del Teorema 4 deducimos inmediatamente que
A
+
A = I l(A) = R
n
rango(A) = n.
AA
+
= I col(A) = R
m
rango(A) = m.
Si A es inversible, entonces A
1
= A
+
.
Cuando rango(A) = n, la ecuacion Ax = b tiene una unica solucion por cuadrados mnimos
x, que esta dada por la formula x = A

b, con A

= (A
T
A)
1
A
T
. Como en el caso en que la
solucion por c.m. es unica, esta es necesariamente la de norma mnima, tambien tenemos que
x = A
+
b. Luego
A

b = A
+
b b R
n
= A

= A
+
.
La siguiente expresion de A
+
a partir de una DVS de A es util en algunas circunstancias.
Supongamos que A = U V
T
es una DVS de A R
mn
, y que A es de rango r. Denamos

+
=
_
D
1
0
r(mr)
0
(nr)r
0
(nr)(mr)
_
R
nm
.
Entonces A
+
= V
+
U
T
, como puede comprobar facilmente el lector, usando las expresiones
V = [V
r
V
T
nr
] y U = [U
r
U
T
mr
] y efectuando el producto.
Ejemplo 6 Hallar la seudoinversa de Moore-Penrose de
A =
_
2 4
6 12
_
.
Notemos que el rango de A es 1, y por lo tanto A carece de inversa. Vamos a buscar entonces
una DVS reducida de A.
12
Como
A
T
A =
_
40 80
80 160
_
,
sus autovalores son
1
= 200 y
2
= 0. Luego, A tiene un unico v.s. no nulo,
1
=

200 = 10

2.
Para construir una DVS reducida debemos hallar un vector singular derecho v
1
de A asociado
a
1
, o, lo que es lo mismo, un autovector unitario de A
T
A asociado a
1
, por ejemplo, v
1
=
1

5
[1 2]
T
. Ahora, a partir de v
1
denimos el vector singular izquierdo
u
1
=
Av
1

1
=
1

10
_
1
3
_
.
Entonces
A =
_
1

10
3

10
_
[10

2]
_
1

5
2

5
_
es una DVS reducida de A y
A
+
=
_
1

5
2

5
_
_
1
10

2
_ _
1

10
3

10
_
=
1
100
_
1 3
2 6
_
.
6. Imagen de la esfera unitaria
En esta seccion veremos como una DVS de una matriz A R
mn
nos permite determinar
facilmente cual es la imagen de la esfera unitaria S
n1
= {x R
n
: x = 1} a traves de la
transformacion lineal T(x) = Ax.
Supongamos que A = U V
T
es una DVS de A y que rango(A) = r. Con el objeto de
determinar que clase de conjunto es
T(S
n1
) = {z R
m
: z = Ax con x S
n1
},
consideremos el cambio de variable x = V y. Notamos que x = y por ser V ortogonal.
Entonces
z T(S
n1
) z = Ax con x = 1 z = AV y con y = 1 z = Uy con y = 1.
Llamando U = [u
1
u
m
] y teniendo en cuenta que A tiene r v.s. no nulos
1
, . . . ,
r
, tenemos
que Uy =
1
y
1
u
1
+
2
y
2
u
2
+ +
r
y
r
u
r
.
Entonces
z T(S
n1
) z =
1
y
1
u
1
+
2
y
2
u
2
+ +
r
y
r
u
r
con y = 1.
Si consideramos la base ortonormal B = {u
1
, . . . , u
m
} de R
m
, y [z]
B
= [w
1
w
m
]
T
es el
vector de coordenadas de z en la base B, tenemos entonces que
z T(S
n1
)
_

_
w
1
=
1
y
1
w
2
=
2
y
2
.
.
.
.
.
.
.
.
.
w
r
=
r
y
r
w
r+1
= 0
.
.
.
.
.
.
.
.
.
w
m
= 0
con y = 1.
13
Como y
i
= w
i
/
i
para i = 1, . . . , r y

n
i=1
y
2
i
= 1, nalmente llegamos a la siguiente
conclusion:
1. Si r = n
z T(S
n1
)
w
2
1

2
1
+ +
w
2
n

2
n
= 1 w
n+1
= w
n+2
= = w
m
= 0.
Con lo cual T(S
n1
) resulta ser un elipsoide n-dimensional (Si n = 1 es un par de puntos
y cuando n = 2 es una elipse) contenido en el subespacio generado por {u
1
, . . . , u
n
}, que
es col(A), y tiene por ejes a las rectas generadas por los vectores u
1
, u
2
, . . . , u
n
.
2. Si r < n,
w
2
1

2
1
+ +
w
2
r

2
r
=
r

i=1
y
2
i
1,
y, por lo tanto,
z T(S
n1
)
w
2
1

2
1
+ +
w
2
r

2
r
1 w
r+1
= w
r+2
= = w
m
= 0.
Luego T(S
n1
) resulta ser un elipsoide r-dimensional solido (si r = 1 es un segmento,
si r = 2 es una elipse junto con su interior), contenido en el subespacio generado por
{u
1
, . . . , u
n
} ( col(A)), y tiene por ejes a las rectas generadas por los vectores u
1
, u
2
, . . . , u
r
.
Ejemplo 7 Supongamos que A R
22
y que A = UV
T
es DVS de A. Sean u
1
y u
2
la primera
y segunda columna de U, y
1
y
2
el primer y segundo v.s. de A. Entonces, la imagen de la
circunsferencia unitaria S
1
R
2
a traves de la transformacion T(x) = Ax depende del rango de
A de la siguiente forma:
1. si rango(A) = 0, A es la matriz nula y T(S
1
) = {0}.
2. Si rango(A) = 1,
1
> 0,
2
= 0 y
T(S
1
) =
_
z R
2
: z = w
1
u
1
+w
2
u
2
,
w
2
1

2
1
1, w
2
= 0
_
=
_
z R
2
: z = tu
1
,
1
t
1
_
,
es el segmento de extremos P
1
=
1
u
1
, P
2
= u
1
.
3. Si rango(A) = 2,
1

2
> 0, y
T(S
1
) =
_
z R
2
: z = w
1
u
1
+w
2
u
2
,
w
2
1

2
1
+
w
2
2

2
2
= 1
_
,
resulta una elipse con centro en el origen, eje mayor de longitud 2
1
contenido en la recta
generada por u
1
y eje menor de longitud 2
2
contenido en la recta u
2
(Figura 1).
Ejemplo 8 Supongamos ahora que A R
33
y que A = UV
T
es DVS de A. Sea U = [u
1
u
2
u
3
]
y
1
,
2
,
3
los v.s. de A. Entonces tenemos las siguientes posibilidades para la imagen de la esfera
unitaria S
2
R
3
a traves de la transformacion T(x) = Ax:
14
2 1.5 1 0.5 0 0.5 1 1.5 2
1.5
1
0.5
0
0.5
1
1.5
x
1
x
2

2
u
2

1
u
1
T(S
1
)
Figura 1: T(S
1
) caso rango 2
1. si rango(A) = 0, A es la matriz nula y T(S
2
) = {0}.
2. Si rango(A) = 1,
1
> 0,
2
=
3
= 0 y la imagen de es el conjunto
T(S
2
) =
_
z R
3
: z = w
1
u
1
+w
2
u
2
+w
3
u
3
,
w
2
1

2
1
1, w
2
= w
3
= 0
_
=
_
z R
3
: z = tu
1
,
1
t
1
_
,
que es el segmento de extremos P
1
=
1
u
1
, P
2
= u
1
.
3. Si rango(A) = 2,
1

2
> 0,
3
= 0 y
T(S
2
) =
_
z R
3
: z = w
1
u
1
+w
2
u
2
+w
3
u
3
,
w
2
1

2
1
+
w
2
2

2
2
1; w
3
= 0
_
,
es la supercie contenida en el plano generado por u
1
y u
2
(que es col(A)), que contiene
al origen y esta limitada por la elipse centrada en el origen, cuyo eje mayor tiene longitud
2
1
y esta contenido en la recta generada por u
1
y su eje menor, contenido en la recta u
2
,
tiene longitud 2
2
(Figura 2.)
4. Finalmente, si rango(A) = 3,
1

2

3
> 0 y
T(S
2
) =
_
z R
3
: z = w
1
u
1
+w
2
u
2
+w
3
u
3
,
w
2
1

2
1
+
w
2
2

2
2
+
w
2
3

2
3
= 1
_
,
resulta un elipsoide centrado en el origen, con ejes de longitudes 2
1
, 2
2
y 2
3
contenidos
en la rectas generadas por u
1
, u
2
y u
3
, respectivamente (Figura 3.).
15
4
2
0
2
4
5
0
5
4
2
0
2
4
col(A)

1
u
1

2
u
2
u
3 T(S
2
)
Figura 2: T(S
2
) caso rango 2

1
u
1

2
u
2

3
u
3
T(S
2
)
Figura 3: T(S
2
) caso rango 3
16

You might also like