Descomposicion en Valores Singulares Apunte de Mancilla

Descomposicion en valores singulares
Notas para los cursos 21 y 22 (J.L. Mancilla Aguilar)

1. Valores Singulares
Tanto los valores singulares como la descomposicion en valores singulares de una matriz son
conceptos de gran utilidad en las aplicaciones del algebra lineal a diversos problemas practicos
y teoricos.
A continuacion deniremos el concepto de valor singular de una matriz.
Dada una matriz A R
mn
, la matriz A
T
A es simetica, pues (A
T
A)
T
= A
T
(A
T
)
T
= A
T
A,
y semidenida positiva, ya que
x
T
A
T
Ax = (Ax)
T
(Ax) = Ax
2
0 x R
n
.
Por lo tanto los autovalores de A
T
A son reales y no negativos.
Denicion 1 Sea A R
mn
. Sean
1
,
2
, . . . ,
n
los autovalores de A
T
A ordenados en forma
decreciente, es decir,
1

2

n
0.
Entonces
i
=
i
es el i-esimo valor singular de A.
El primer y el ultimo valor singular de una matriz proporcionan la siguiente informacion.
Proposicion 1 Sea A R
mn
. Entonces, si
1
y
n
son, respectivamente, el mayor y el menor
valor singular de A, se tiene que
max
x=1
Ax =
1
y mn
x=1
Ax =
n
.
Demostracion. Sean
1
y
n
el maximo y el mnimo autovalor de A
T
A, respectivamente.
Entonces, por Rayleigh,
max
x=1
x
T
(A
T
A)x =
1
y mn
x=1
x
T
(A
T
A)x =
n
.
Luego
1
=
_
1
=
_
max
x=1
x
T
(A
T
A)x = max
x=1
_
Ax
2
= max
x=1
Ax,
valiendo la primera igualdad por la denicion de valor singular, la segunda por Rayleigh, la
tercera por la igualdad x
T
(A
T
A)x = Ax
2
y por ser la funcion (t) =
t monotona creciente
en [0, ) (si es una funcion escalar monotona creciente sobre la imagen de f(x) entonces
(max f(x)) = max (f(x)) y (mnf(x)) = mn(f(x)) ).
En forma similar se prueba que mn
x=1
Ax =
n
.
Como corolario de la Proposicion 1 resultan las desigualdades
n
x Ax
1
x x R
n
,
1
que acotan superior e inferiormente la magnitud de Ax en funcion de la magnitud de x.
En efecto, si x = 0 las desigualdades son obviamente ciertas. Si x = 0 tenemos que v = x/x
es unitario y por lo tanto
n
Av
1
. Pero Av = Ax/x, con lo cual
n

Ax
x

1
=
n
x Ax
1
x.
El siguiente resultado sera clave para la construccion de la descomposicion en valores sin-
gulares de una matriz. Recordemos que toda matriz simetrica n n con coecientes reales es
diagonalizable ortogonalmente, o, lo que es equivalente, existe una b.o.n. de R
n
compuesta por
autovectores de ella.
Teorema 1 Sea A R
mn
. Supongamos que
1
,
2
, . . . ,
n
son los autovalores de A
T
A y que
1

2

r
>
r+1
= =
n
= 0,
en otras palabras, los autovalores de A
T
A estan ordenados en forma decreciente y el n umero de
autovalores no nulos es r.
Sea {v
1
, . . . , v
n
} una b.o.n. de R
n
tal que A
T
Av
i
=
i
v
i
.
Entonces
1. {Av
1
, . . . , Av
n
} es un conjunto ortogonal y Av
i
=
i
=
i
para todo i = 1, . . . , n;
2. {
Av
1
1
, . . . ,
Av
r
r
} es b.o.n. de col(A);
3. {v
r+1
, . . . , v
n
} es b.o.n. de Nul(A);
4. rango(A) = r = n umero de v.s. no nulos de A.
Demostracion. Respecto del primer punto, como
(Av
i
, Av
j
) = (Av
i
)
T
(Av
j
) = v
T
i
(A
T
Av
j
) = v
T
i
(
j
v
j
) =
j
(v
T
i
v
j
) =
_
j
i = j
0 i = j
,
entonces Av
i
Av
j
si i = j y Av
i
=
i
=
i
para i = 1, . . . , n.
Respecto del punto 2., como por el punto 1. el conjunto {
Av
1
1
, . . . ,
Av
r
r
} es ortonormal, basta
probar que este genera el espacio columna de A. Para ello alcanza con ver que
gen{Av
1
, . . . , Av
r
} = col(A).
Consideremos la transformacion lineal T : R
n
R
m
, T(x) = Ax. Tenemos por un lado que
Im(T) = col(A). Por otra parte, como {v
1
, . . . , v
n
} es base de R
n
y T(v
i
) = Av
i
,
col(A) = Im(T) = gen{Av
1
, . . . , Av
n
} = gen{Av
1
, . . . , Av
r
},
la ultima igualdad debida al punto 1., ya que Av
i
=
i
= 0 si i r + 1.
El punto 4. es inmediato del 2. ya que el rango de A es la dimension del espacio columna de
la matriz y esta es r, que por otra parte es el n umero de autovalores no nulos de A
T
A, el cual
coincide con el n umero de v.s. no nulos de A.
Finalmente el punto 3. resulta del hecho que {v
r+1
, . . . , v
n
} es un conjunto ortonormal, que
Av
i
= 0 para todo i r + 1 y que dim(Nul(A)) = n r.
2
Ejemplo 1 Consideremos la matriz
A =
_
4 11 14
8 7 2
_
.
Como
A
T
A =
_
_
80 100 40
100 170 140
40 140 200
_
_
,
y sus autovalores son
1
= 360,
2
= 90 y
3
= 0, tenemos que los v.s. de A son
1
=
360 = 6
10,
2
=
90 = 3
10
3
= 0.
Notamos que el rango de A es 2 y que hay exactamente 2 v.s. no nulos como informa el Teorema
1.
Busquemos ahora una b.o.n. de R
3
compuesta por autovectores de A
T
A. Como
S
1
= gen
_
_
_
_
_
1
2
2
_
_
_
_
_
, S
2
= gen
_
_
_
_
_
2
1
2
_
_
_
_
_
y S
3
= gen
_
_
_
_
_
2
2
1
_
_
_
_
_
,
B = {v
1
, v
2
, v
3
}, con
v
1
=
1
3
_
_
1
2
2
_
_
, v
2
=
1
3
_
_
2
1
2
_
_
y v
3
=
1
3
_
_
2
2
1
_
_
,
es una de tales bases.
Calculemos Av
i
para i = 1, 2, 3,
Av
1
=
_
18
6
_
, Av
2
=
_
3
9
_
y Av
3
=
_
0
0
_
.
Notamos que Av
i
Av
j
si i = j y que Av
i
=
i
para i = 1, 2, 3.
En particular {v
3
} es b.o.n. de Nul(A) y {
Av
1
1
,
Av
2
2
} es b.o.n. de col(A), que en este caso
coincide con R
2
.
2. Descomposicion en valores singulares
En lo que sigue deniremos lo que se conoce como descomposicion en valores singulares
(DVS) de una matriz.
Denicion 2 Sea A R
mn
. Una descomposici on en valores singulares de A es una factoriza-
cion
A = U V
T
con U R
mm
y V R
nn
ortogonales y R
mn
con
=
_
D 0
r(nr)
0
(mr)r
0
(mr)(nr)
_
y D =
_
1
0 0
0
2
0
.
.
.
.
.
.
.
.
.
.
.
.
0 0
r
_
_
con
1

2

r
> 0.
0
kl
representa la matriz k l cuyos coecientes son nulos.
3
Notar que si A = U V
T
es una DVS de A, con como en la Denicion 2, y v
i
y u
i
son las
i-esimas columnas de V y U respectivamente, entonces es facil ver que A puede ser escrita en la
forma
A =
1
u
1
v
T
1
+
2
u
2
v
T
2
+ +
r
u
r
v
T
r
,
donde cada una de las matrices u
i
v
T
i
es de rango 1.
Denicion 3 Si A = U V
T
es una DVS de A, a los vectores que aparecen como columnas de
la matriz V se los denomina vectores singulares derechos de A mientras que a los que aparecen
como columnas de U se los denomina vectores singulares izquierdos de A.
El siguiente teorema nos dice que toda matriz admite una DVS.
Teorema 2 Sea A R
mn
. Entonces existe un descomposicion en valores singulares de A.
Demostracion. Sean
1
, . . . ,
n
los autovalores de A
T
A. Supongamos que estan ordenados en
forma decreciente y que exactamente r de ellos son no nulos (r podra ser n). Sea {v
1
, v
2
, . . . , v
n
}
una b.o.n. de R
n
tal que A
T
Av
i
=
i
v
i
para todo i = 1, . . . , n.
Denimos V = [v
1
v
2
v
n
], que es ortogonal, y
=
_
D 0
r(nr)
0
(mr)r
0
(mr)(nr)
_
con D =
_
1
0 0
0
2
0
.
.
.
.
.
.
.
.
.
.
.
.
0 0
r
_
_
donde
i
=
_
i
.
Con el objeto de denir U, consideremos los vectores
u
1
=
Av
1
1
, u
2
=
Av
1
2
, , u
r
=
Av
r
r
.
Entonces, de acuerdo con el Teorema 1, el conjunto {u
1
, . . . , u
r
} es ortonormal. Si r < m
buscamos vectores u
r+1
, . . . , u
m
de modo tal que {u
1
, . . . , u
m
} sea b.o.n. de R
m
. Luego denimos
U = [u
1
u
2
u
m
] que es una matriz ortogonal. Veamos ahora que A = U V
T
.
Por un lado
AV = [Av
1
Av
n
] = [
1
u
1
. . .
r
u
r
0 0]
ya que Av
i
=
i
u
i
para i = 1, . . . , r por la denicion de los vectores u
i
y Av
i
= 0 para i =
r + 1, . . . , n por el Teorema 1.
Por otro lado
U = [u
1
u
2
u
m
]
_
1
0 0 0 0
0
2
0 0 0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
0 0
r
0 0
0 0 0 0 0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
0 0 0 0 0
_
_
= [
1
u
1
. . .
r
u
r
0 0].
Por lo tanto, AV = U. Teniendo en cuenta que V
1
= V
T
, llegamos a la igualdad A = UV
T
.
4
Observacion 1 La demostracion del Teorema 2 nos da un metodo para construir una DVS de
una matriz A. Metodo que podemos resumir de la siguiente manera.
Sea A R
mn
.
1. Calcular los autovalores de A
T
A y ordenarlos de mayor a menor:
1

2

n
.
2. Hallar una b.o.n. {v
1
, . . . , v
n
} de R
n
tal que A
T
Av
i
=
i
v
i
, i = 1, . . . , n.
3. Calcular los v.s. de A,
i
=
i
.
4. Si r es el n umero de v.s. de A no nulos, es decir,
r
> 0 y
i
= 0 para todo i r + 1,
denir
u
1
=
Av
1
1
, u
2
=
Av
1
2
, , u
r
=
Av
r
r
.
5. Si r < m, hallar u
r+1
, . . . , u
m
tales que {u
1
, . . . , u
m
} sea b.o.n. de R
m
.
6. Denir las matrices V = [v
1
v
2
v
n
], U = [u
1
u
2
u
n
] y
=
_
D 0
r(nr)
0
(mr)r
0
(mr)(nr)
_
con D =
_
1
0 0
0
2
0
.
.
.
.
.
.
.
.
.
.
.
.
0 0
r
_
_
;
7. Entonces A = U V
T
es una DVS de A.
Ejemplo 2 Consideremos la matriz A del Ejemplo 1. Los autovalores de A
T
A son
1
= 360,
2
= 90 y
3
= 0 y los v.s.,
1
=
360 = 6
10,
2
=
90 = 3
10
3
= 0.
B = {v
1
, v
2
, v
3
} con
v
1
=
1
3
_
_
1
2
2
_
_
, v
2
=
1
3
_
_
2
1
2
_
_
y v
3
=
1
3
_
_
2
2
1
_
_
,
es b.o.n. de R
3
y A
T
Av
i
=
i
v
i
. Como hay dos v.s. no nulos, calculamos
u
1
=
Av
1
1
=
_
3
10
1
10
_
y u
2
=
Av
2
2
=
_
1
10
10
_
.
Como {u
1
, u
2
} es b.o.n. de R
2
, no hace falta completar el conjunto. Ahora denimos
V =
1
3
_
_
1 2 2
2 1 2
2 2 1
_
_
, U =
1
10
_
3 1
1 3
_
y =
_
6
10 0 0
0 3
10 0
_
,
y tenemos que A = U V
T
es una DVS de A.
5
Notamos que en la construccion de la DVS de A que hicimos en la demostracion del Teorema 2,
los elementos no nulos que aparecen en la diagonal principal de son los v.s. no nulos de A y
que las columnas de V , es decir, los vectores singulares derechos que utilizamos, son autovectores
de A
T
A. El siguiente resultado dice que lo anterior siempre ocurre, independientemente de la
forma en que la DVS haya sido obtenida.
Teorema 3 Sea A R
mn
y sea A = U V
T
una DVS de A.
Supongamos que
=
_
D 0
r(nr)
0
(mr)r
0
(mr)(nr)
_
y D =
_
1
0 0
0
2
0
.
.
.
.
.
.
.
.
.
.
.
.
0 0
r
_
_
con
1

2

r
> 0.
Entonces
1.
1
, . . . ,
r
son los v.s. no nulos de A;
2. Si V = [v
1
v
n
], {v
1
, . . . , v
n
} es una b.o.n. de R
n
tal que A
T
Av
i
=
2
i
v
i
si i = 1, . . . , r y
A
T
Av
i
= 0 si i = r + 1, . . . , n;
3. Si U = [u
1
u
m
], Av
i
=
i
u
i
para i = 1, . . . , r y Av
i
= 0 para i = r + 1, . . . , n.
Demostracion. Como A = U V
T
tenemos que
A
T
A = (U V
T
)
T
(U V
T
) = V (
T
)V
T
.
Pero
T
es la matriz n n
T
=
_
2
1
0 0 0 0
0
2
2
0 0 0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
0 0
2
r
0 0
0 0 0 0 0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
0 0 0 0 0
_
_
.
Por lo tanto A = V (
T
)V
T
es una diagonalizacion ortogonal de A
T
A. En consecuencia,
1
=
2
1
,
2
=
2
2
, . . . ,
r
=
2
r
, son los autovalores no nulos de A
T
A ordenados en forma decreciente.
Por lo tanto
1
, . . . ,
r
son los v.s. no nulos de A.
Tambien tenemos que las columnas de V conforman una b.o.n de R
n
y son autovectores de
A
T
A, mas precisamente, A
T
Av
i
=
2
i
v
i
para i = 1, . . . r, y A
T
Av
i
= 0 para i = r + 1, . . . , n, ya
que v
r+1
, . . . , v
n
son autovectores asociados al autovalor nulo.
Finalmente el punto 3. resulta inmediatamente de la igualdad AV = U .
Notemos que del Teorema 3 se desprende que los vectores singulares derechos son siem-
pre autovectores de A
T
A. En lo que sigue veremos que los vectores singulares izquierdos son
necesariamente autovectores de la matriz AA
T
.
Para ello es util el siguiente resultado.
6
Proposicion 2 Sea A = U V
T
una DVS de A R
mn
. Entonces
A
T
= V
T
U
T
es DVS de A
T
. En particular A y A
T
tienen los mismos v.s. no nulos.
Demostracion. Es inmediato a partir de la denicion de DVS que A
T
= V
T
U
T
es DVS de
A
T
. Que A y A
T
tienen los mismos v.s. no nulos se deduce del hecho que en aparecen los v.s.
no nulos de A y en
T
los v.s. no nulos de A
T
.
De la Proposicion 2 y del Teorema 3 deducimos que los vectores singulares izquierdos de una
matriz A son a la vez vectores singulares derechos de A
T
y por lo tanto autovectores de AA
T
.
Ejemplo 3 Hallar una DVS de
A =
_
1 2 2
1 2 2
_
.
Como los v.s. no nulos de A y de A
T
coinciden, calculamos los v.s. de A
T
, que son los autovalores
de AA
T
. Como
AA
T
=
_
9 9
9 9
_
,
sus autovalores son
1
= 18 y
2
= 0. Luego
1
=
18 = 3
2 es el unico v.s. no nulo tanto de

A
T
como de A. En particular, los restantes v.s. de A son
2
=
3
= 0.
Para hallar una DVS de A, lo que hacemos primero es hallar una DVS de A
T
. Calculando
obtenemos la siguiente b.o.n de R
2
compuesta por autovectores de AA
T
(ordenados seg un el
orden de los v.s.)
_
[
1
2

1
2
]
T
, [
1
2
1
2
]
T
_
. Designemos por u
1
y u
2
a los vectores de esa base.
Ambos son vectores singulares derechos de A
T
(u
1
corresponde a
1
y u
2
a
2
= 0) y por lo
tanto vectores singulares izquierdos de A.
Para obtener los vectores singulares izquierdos de A
T
que nos permitan luego construir una
DVS de A
T
, teniendo en cuenta que hay un solo valor singular no nulo, denimos
v
1
=
A
T
u
1
1
=
1
3
_
_
1
2
2
_
_
.
Para hallar los restantes vectores singulares izquierdos de A
T
debemos encontrar v
2
, v
3
tales
que {v
1
, v
2
, v
3
} sea b.o.n. de R
3
. Pero como v
2
y v
3
son a su vez vectores singulares derechos de
A y corresponden a valores singulares nulos de A, necesariamente Av
2
= 0 y Av
3
= 0. Luego
bastara con que hallemos una b.o.n. de Nul(A). Una posible b.o.n. es {v
2
, v
3
} con
v
2
=
1
2
_
_
0
1
1
_
_
y v
3
=
1
3
2
_
_
4
1
1
_
_
.
Note que {v
1
, v
2
, v
3
} es b.o.n. de R
3
. (Otra forma de computar v
2
, v
3
consiste en elegir v
2
y v
3
tales que {v
1
, v
2
, v
3
} sea l.i. y ortonormalizar el conjunto mediante Gram-Schmidt.)
7
Entonces
A
T
= V
U
T
con V = [v
1
v
2
v
3
], U = [u
1
u
2
] y
=
_
_
2
3 0
0 0
0 0
_
_
,
es DVS de A
T
y, por lo tanto, A = U V
T
con =
T
es DVS de A.
Como ejercicio, se propone al lector que calcule una DVS de A en forma directa.
3. DVS y los subespacios fundamentales de una matriz
En esta seccion veremos que las matrices U y V de una DVS de A estan compuestas por
bases ortonormales de los cuatro subespacios fundamentales de A.
Supongamos que A R
nm
es una matriz de rango r y que A = U V
T
es una DVS
de A. Entonces, si V = [v
1
v
n
] y U = [u
1
u
m
] y denimos las matrices V
r
= [v
1
v
r
],
V
nr
= [v
r+1
v
n
], U
r
= [u
1
u
r
] y U
mr
= [u
r+1
u
m
], se tiene que
1. {v
1
, , v
r
} es b.o.n. de l(A), V
T
r
V
r
= I y V
r
V
T
r
= P
l(A)
.
2. {v
r+1
, , v
n
} es b.o.n. de Nul(A), V
T
nr
V
nr
= I y V
nr
V
T
nr
= P
Nul(A)
.
3. {u
1
, , u
r
} es b.o.n. de col(A), U
T
r
U
r
= I y U
r
U
T
r
= P
col(A)
.
4. {u
r+1
, , u
m
} es b.o.n. de Nul(A
T
), U
T
mr
U
mr
= I y U
mr
U
T
mr
= P
Nul(A
T
)
.
La justicacion de este resultado es la siguiente. Como el rango de A es r, A tiene r valores
singulares no nulos, y por lo tanto A
T
A tiene r autovalores no nulos. Por el Teorema 3, los
vectores v
1
, . . . , v
n
son autovectores de A
T
A, estando los primeros r de ellos asociados a los
autovalores no nulos de A
T
A y los restantes al autovalor nulo de A
T
A. Por lo tanto, por el
Teorema 1, {v
r+1
, , v
n
} es b.o.n. de Nul(A) y, dado que {v
1
, , v
n
} es b.o.n. de R
n
, necesa-
riamente {v
1
, , v
r
} es b.o.n. de Nul(A)
= l(A). Con esto, y la forma en que se construyen

las matrices de proyeccion, quedan demostrados 1. y 2.
Respecto de 3. y 4., combinando el Teorema 1 con el Teorema 3, tenemos que {u
1
, , u
r
}
es b.o.n. de col(A) y, por lo tanto, dado que {u
1
, , u
m
} es b.o.n. de R
m
, {u
r+1
, , u
m
} es
b.o.n. de col(A)
= Nul(A
T
). De esto ultimo y la forma en que se construyen las matrices de
proyeccion, se deducen las restantes armaciones.
Ejemplo 4 Dada
A =
_
_
1 1 0
1 1 0
0 0 1
_
_
_
_
2 0 0
0

18 0
0 0 0
_
_
_
_
1
2
0
1
2
0 1 0
2
0
1
2
_
_
,
hallar los valores singulares de A, bases de sus cuatro subespacios fundamentales y calcular sus
matrices de proyeccion.
La descomposicion que tenemos de A es casi una DVS, salvo por el hecho de que la matriz
U
que aparece a la izquierda, si bien tiene columnas mutuamente ortogonales, estas no son de
8
norma 1. Procedemos entonces a normalizar las columnas de U
dividiendo cada una de ellas

por su norma. Para que el producto siga siendo A, es necesario multiplicar la la i de la matriz
central, por el n umero por el cual dividimos la columna i de U
. Queda entonces la factorizacion

A =
_
_
1
2
1
2
0
1
2

1
2
0
0 0 1
_
_
_
_
2 0 0
0 6 0
0 0 0
_
_
_
_
1
2
0
1
2
0 1 0
2
0
1
2
_
_
.
Esta factorizacion no es a un una DVS, porque los elementos de la diagonal de la matriz
central no estan ordenados de mayor a menor. Para ello lo que hacemos es permutar las dos
primeras columnas de la matriz de la izquierda y las dos primeras las de la matriz de la derecha.
Entonces obtenemos
A =
_
_
1
2
1
2
0
2
1
2
0
0 0 1
_
_
_
_
6 0 0
0 2 0
0 0 0
_
_
_
_
0 1 0
1
2
0
1
2
0
1
2
_
_
,
que ahora s es una DVS de A, ya que A = U V
T
con
U =
_
_
1
2
1
2
0
2
1
2
0
0 0 1
_
_
, =
_
_
6 0 0
0 2 0
0 0 0
_
_
y V =
_
_
0
1
2

1
2
1 0 0
0
1
2
1
2
_
_
.
Ahora podemos hallar lo solicitado. Los valores singulares de A son
1
= 6,
2
= 2 y
3
= 0.
Las primeras dos columnas de V son una b.o.n. de l(A), mientras que la ultima columna de
V es b.o.n. de Nul(A). Respecto de col(A), las dos primeras columnas de U son una b.o.n. de
ese subespacio, y la ultima columna de U es b.o.n. de Nul(A
T
). Respecto de las matrices de
proyeccion, estas son:
P
l(A)
=
_
_
0
1
2
1 0
0
1
2
_
_
_
0 1 0
1
2
0
1
2
_
=
_
_
1
2
0
1
2
0 1 0
1
2
0
1
2
_
_
,
P
Nul(A)
= I P
l(A)
=
_
_
1
2
0
1
2
0 0 0
1
2
0
1
2
_
_
,
P
Nul(A
T
)
=
_
_
0
0
1
_
_
_
0 0 1

=
_
_
0 0 0
0 0 0
0 0 1
_
_
,
P
col(A)
= I P
Nul(A
T
)
=
_
_
1 0 0
0 1 0
0 0 0
_
_
.
9
4. DVS reducida
Veremos ahora como a partir de una DVS, A = UV
T
, podemos obtener una descomposicion
de A que emplea matrices de tama no reducido. Empleando la notacion de la seccion anterior,
escribimos U = [U
r
U
mr
] y V = [V
r
V
nr
], donde r es el rango de A.
Entonces
A = U V
T
= [U
r
U
mr
]
_
D 0
r(nr)
0
(mr)r
0
(mr)(nr)
_ _
V
T
r
V
T
nr
_
= U
r
DV
T
r
.
A la factorizacion A = U
r
DV
T
r
se la denomina DVS reducida de A. Notar que la matriz D
es inversible, pues D es diagonal, y los elementos que aparecen en la diagonal principal son los
v.s. no nulos de A.
Ejemplo 5 Para la matriz A del Ejemplo 4,
A =
_
_
1
2
1
2
1
2
0 0
_
_
_
6 0
0 2
_
_
0 1 0
1
2
0
1
2
_
,
es una DVS reducida.
Notamos que es mas simple calcular una DVS reducida que una DVS, ya que solo se necesitan
los v.s. no nulos y conjuntos de vectores singulares derechos e izquierdos correspondientes a esos
valores singulares.
5. Solucion por cuadrados mnimos de norma mnima. Seudo-
inversa de Moore-Penrose
Si A R
mn
y b R
n
, la ecuacion Ax = b siempre admite soluciones por cuadrados mnimos
(c.m.). Si Nul(A) = {0}, o, equivalentemente, rango(A) = n, la solucion por c.m. es unica; en
caso contrario hay innitas soluciones por c.m., mas a un, si x
p
es una solucion por c.m., entonces
todas las demas son de la forma: x = x
p
+x
n
con x
n
Nul(A).
Es importante en el caso en que hay innitas soluciones por c.m. disponer de un criterio que
permita seleccionar una de estas innitas soluciones. Un posible criterio es el siguiente.
Denicion 4 x
es una solucion por c.m. de norma mnima de la ecuaci on Ax = b si x
es
solucion por c.m. y, ademas, x
x para todo x que sea solucion por c.m. de Ax = b.

En otras palabras, x
es, de todas las soluciones por c.m. de Ax = b, una que tiene la menor
norma (longitud) posible.
A continuacion veremos que existe una unica solucion por c.m. de norma mnima y daremos una
caracterizacion de ella que sera util para calcularla.
Proposicion 3 Consideremos la ecuacion Ax = b con A R
mn
y b R
n
. Entonces
1. Existe una unica solucion x
por c.m. de la ecuaci on Ax = b que pertenece a l(A).

2. x
es la unica solucion por c.m. de norma mnima de la ecuacion Ax = b.

10
Demostracion. Primero probamos que existe una solucion por c.m. que pertenece a l(A). Sea
x
p
una solucion por c.m. de la ecuacion Ax = b. Sea x
= P
l(A)
x
p
. Veamos que x
tambien es
solucion por c.m. de la ecuacion. Como l(A) = Nul(A)
,
x
p
= P
l(A)
x
p
+P
Nul(A)
x
p
= x
+P
Nul(A)
x
p
.
Luego, dado que x
p
una solucion por c.m. de la ecuacion Ax = b,
P
col(A)
b = A x
p
= A(x
+P
Nul(A)
x
p
) = Ax
,
y por lo tanto x
es solucion por c.m. de la ecuacion Ax = b y pertenece a l(A).

Ahora veamos que x
es la unica solucion por c.m. que pertenece a l(A). Supongamos

que x
es una solucion por c.m. que pertenece a l(A). Entonces Ax
= Ax
= P
col(A)
b. Luego
x
Nul(A). Como x
l(A) y l(A) = Nul(A)
, resulta x
= 0, y, por lo tanto,
x
= x
.
Hasta aqu hemos probado el punto 1. de la proposicion. Ahora probamos que x
es la unica
solucion por c.m. de norma mnima de la ecuacion Ax = b.
Primero vemos que x
es solucion por c.m. de norma mnima. Sea x una solucion por c.m.
de la ecuacion. Entonces x x
Nul(A). Luego
x
2
= x
+ ( x x
)
2
= x
2
+ x x
2
pues l(A) = Nul(A)
. Entonces x
2
x
2
y x
es de norma mnima.
Finalizamos la demostracion viendo que x
es la unica solucion de norma mnima. Supon-

gamos que y tambien es solucion de norma mnima. Entonces necesariamente y = x
. Por
otro lado, dado que y x
Nul(A) y que x
l(A),
y
2
= x
+ (y x
)
2
= x
2
+y x
2
.
Entonces, necesariamente y x
= 0, y, por lo tanto, y = x
.
De acuerdo con la Proposicion 3, para hallar la solucion por c.m. de norma mnima, debemos
buscar entre las soluciones por c.m. de la ecuacion la solucion x
que pertenece a l(A). Para

hallar tal solucion podemos proceder como sigue.
Supongamos que A = U
r
D V
T
r
es una DVS reducida de A. Entonces, por lo expuesto en la
Seccion 3, U
r
U
T
r
= P
col(A)
, U
T
r
U
r
= I, las columnas de V
r
son b.o.n. de l(A) y D es inversible.
Luego, como x
pertenece a l(A), existe R

r
tal que x
= V
r
. Como ademas x
es
solucion por c.m. de Ax = b entonces
P
col(A)
b = Ax
= AV
r
.
Luego, usando que U
r
U
T
r
= P
col(A)
, V
T
r
V
r
= I y A = U
r
D V
T
r
, tenemos que
U
r
U
T
r
b = U
r
D V
T
r
V
r
= U
r
D.
Multiplicando por izquierda por U
r
y usando que U
T
r
U
r
= I, obtenemos
D = U
T
r
b = = D
1
U
T
r
b,
y, por lo tanto,
x
= V
r
= V
r
D
1
U
T
r
b.
Notemos que hemos probado que la solucion por c.m. de norma mnima de la ecuacion Ax = b
se obtiene multiplicando b por la matriz V
r
D
1
U
T
r
.
11
Denicion 5 Sea A = U
r
D V
T
r
es una DVS reducida de A. La matriz A
+
= V
r
D
1
U
T
r
es la
matriz seudoinversa de Moore-Penrose de A.
Notamos que del hecho que para todo b R
n
, x
= A
+
b es la unica solucion por c.m. de longitud
mnima de la ecuacion Ax = b, se deduce que A
+
no depende de la DVS reducida empleada
para calcularla. En efecto, si A = U
r
DV
r
T
es otra DVS reducida de A, tenemos la igualdad
(V
r
D
1
U
T
r
)b = x
= (V
r
D
1
U
r
T
)b b R
n
.
Pero entonces, necesariamente
V
r
D
1
U
T
r
= V
r
D
1
U
r
T
.
Teorema 4 Sea A R
mn
y sea A
+
la matriz seudoinversa de Moore-Penrose de A. Entonces
1. Para todo b R
n
, x
= A
+
b es la unica solucion por c.m. de longitud mnima de la
ecuacion Ax = b.
2. A
+
A = P
l(A)
y AA
+
= P
col(A)
Demostracion. El punto 1. ya fue probado, el punto 2. se deduce inmediatamente del hecho
que A
+
A = V
r
V
T
r
y que AA
+
= U
r
U
T
r
.
Observacion 2 Del punto 2. del Teorema 4 deducimos inmediatamente que
A
+
A = I l(A) = R
n
rango(A) = n.
AA
+
= I col(A) = R
m
rango(A) = m.
Si A es inversible, entonces A
1
= A
+
.
Cuando rango(A) = n, la ecuacion Ax = b tiene una unica solucion por cuadrados mnimos
x, que esta dada por la formula x = A
b, con A
= (A
T
A)
1
A
T
. Como en el caso en que la
solucion por c.m. es unica, esta es necesariamente la de norma mnima, tambien tenemos que
x = A
+
b. Luego
A
b = A
+
b b R
n
= A
= A
+
.
La siguiente expresion de A
+
a partir de una DVS de A es util en algunas circunstancias.
Supongamos que A = U V
T
es una DVS de A R
mn
, y que A es de rango r. Denamos
+
=
_
D
1
0
r(mr)
0
(nr)r
0
(nr)(mr)
_
R
nm
.
Entonces A
+
= V
+
U
T
, como puede comprobar facilmente el lector, usando las expresiones
V = [V
r
V
T
nr
] y U = [U
r
U
T
mr
] y efectuando el producto.
Ejemplo 6 Hallar la seudoinversa de Moore-Penrose de
A =
_
2 4
6 12
_
.
Notemos que el rango de A es 1, y por lo tanto A carece de inversa. Vamos a buscar entonces
una DVS reducida de A.
12
Como
A
T
A =
_
40 80
80 160
_
,
sus autovalores son
1
= 200 y
2
= 0. Luego, A tiene un unico v.s. no nulo,
1
=
200 = 10
2.
Para construir una DVS reducida debemos hallar un vector singular derecho v
1
de A asociado
a
1
, o, lo que es lo mismo, un autovector unitario de A
T
A asociado a
1
, por ejemplo, v
1
=
1
5
[1 2]
T
. Ahora, a partir de v
1
denimos el vector singular izquierdo
u
1
=
Av
1
1
=
1
10
_
1
3
_
.
Entonces
A =
_
1
10
3
10
_
[10
2]
_
1
5
2
5
_
es una DVS reducida de A y
A
+
=
_
1
5
2
5
_
_
1
10
2
_ _
1
10
3
10
_
=
1
100
_
1 3
2 6
_
.
6. Imagen de la esfera unitaria
En esta seccion veremos como una DVS de una matriz A R
mn
nos permite determinar
facilmente cual es la imagen de la esfera unitaria S
n1
= {x R
n
: x = 1} a traves de la
transformacion lineal T(x) = Ax.
Supongamos que A = U V
T
es una DVS de A y que rango(A) = r. Con el objeto de
determinar que clase de conjunto es
T(S
n1
) = {z R
m
: z = Ax con x S
n1
},
consideremos el cambio de variable x = V y. Notamos que x = y por ser V ortogonal.
Entonces
z T(S
n1
) z = Ax con x = 1 z = AV y con y = 1 z = Uy con y = 1.
Llamando U = [u
1
u
m
] y teniendo en cuenta que A tiene r v.s. no nulos
1
, . . . ,
r
, tenemos
que Uy =
1
y
1
u
1
+
2
y
2
u
2
+ +
r
y
r
u
r
.
Entonces
z T(S
n1
) z =
1
y
1
u
1
+
2
y
2
u
2
+ +
r
y
r
u
r
con y = 1.
Si consideramos la base ortonormal B = {u
1
, . . . , u
m
} de R
m
, y [z]
B
= [w
1
w
m
]
T
es el
vector de coordenadas de z en la base B, tenemos entonces que
z T(S
n1
)
_
_
w
1
=
1
y
1
w
2
=
2
y
2
.
.
.
.
.
.
.
.
.
w
r
=
r
y
r
w
r+1
= 0
.
.
.
.
.
.
.
.
.
w
m
= 0
con y = 1.
13
Como y
i
= w
i
/
i
para i = 1, . . . , r y

n
i=1
y
2
i
= 1, nalmente llegamos a la siguiente
conclusion:
1. Si r = n
z T(S
n1
)
w
2
1
2
1
+ +
w
2
n
2
n
= 1 w
n+1
= w
n+2
= = w
m
= 0.
Con lo cual T(S
n1
) resulta ser un elipsoide n-dimensional (Si n = 1 es un par de puntos
y cuando n = 2 es una elipse) contenido en el subespacio generado por {u
1
, . . . , u
n
}, que
es col(A), y tiene por ejes a las rectas generadas por los vectores u
1
, u
2
, . . . , u
n
.
2. Si r < n,
w
2
1
2
1
+ +
w
2
r
2
r
=
r
i=1
y
2
i
1,
y, por lo tanto,
z T(S
n1
)
w
2
1
2
1
+ +
w
2
r
2
r
1 w
r+1
= w
r+2
= = w
m
= 0.
Luego T(S
n1
) resulta ser un elipsoide r-dimensional solido (si r = 1 es un segmento,
si r = 2 es una elipse junto con su interior), contenido en el subespacio generado por
{u
1
, . . . , u
n
} ( col(A)), y tiene por ejes a las rectas generadas por los vectores u
1
, u
2
, . . . , u
r
.
Ejemplo 7 Supongamos que A R
22
y que A = UV
T
es DVS de A. Sean u
1
y u
2
la primera
y segunda columna de U, y
1
y
2
el primer y segundo v.s. de A. Entonces, la imagen de la
circunsferencia unitaria S
1
R
2
a traves de la transformacion T(x) = Ax depende del rango de
A de la siguiente forma:
1. si rango(A) = 0, A es la matriz nula y T(S
1
) = {0}.
2. Si rango(A) = 1,
1
> 0,
2
= 0 y
T(S
1
) =
_
z R
2
: z = w
1
u
1
+w
2
u
2
,
w
2
1
2
1
1, w
2
= 0
_
=
_
z R
2
: z = tu
1
,
1
t
1
_
,
es el segmento de extremos P
1
=
1
u
1
, P
2
= u
1
.
3. Si rango(A) = 2,
1

2
> 0, y
T(S
1
) =
_
z R
2
: z = w
1
u
1
+w
2
u
2
,
w
2
1
2
1
+
w
2
2
2
2
= 1
_
,
resulta una elipse con centro en el origen, eje mayor de longitud 2
1
contenido en la recta
generada por u
1
y eje menor de longitud 2
2
contenido en la recta u
2
(Figura 1).
Ejemplo 8 Supongamos ahora que A R
33
y que A = UV
T
es DVS de A. Sea U = [u
1
u
2
u
3
]
y
1
,
2
,
3
los v.s. de A. Entonces tenemos las siguientes posibilidades para la imagen de la esfera
unitaria S
2
R
3
a traves de la transformacion T(x) = Ax:
14
2 1.5 1 0.5 0 0.5 1 1.5 2
1.5
1
0.5
0
0.5
1
1.5
x
1
x
2
2
u
2
1
u
1
T(S
1
)
Figura 1: T(S
1
) caso rango 2
1. si rango(A) = 0, A es la matriz nula y T(S
2
) = {0}.
2. Si rango(A) = 1,
1
> 0,
2
=
3
= 0 y la imagen de es el conjunto
T(S
2
) =
_
z R
3
: z = w
1
u
1
+w
2
u
2
+w
3
u
3
,
w
2
1
2
1
1, w
2
= w
3
= 0
_
=
_
z R
3
: z = tu
1
,
1
t
1
_
,
que es el segmento de extremos P
1
=
1
u
1
, P
2
= u
1
.
3. Si rango(A) = 2,
1

2
> 0,
3
= 0 y
T(S
2
) =
_
z R
3
: z = w
1
u
1
+w
2
u
2
+w
3
u
3
,
w
2
1
2
1
+
w
2
2
2
2
1; w
3
= 0
_
,
es la supercie contenida en el plano generado por u
1
y u
2
(que es col(A)), que contiene
al origen y esta limitada por la elipse centrada en el origen, cuyo eje mayor tiene longitud
2
1
y esta contenido en la recta generada por u
1
y su eje menor, contenido en la recta u
2
,
tiene longitud 2
2
(Figura 2.)
4. Finalmente, si rango(A) = 3,
1

2

3
> 0 y
T(S
2
) =
_
z R
3
: z = w
1
u
1
+w
2
u
2
+w
3
u
3
,
w
2
1
2
1
+
w
2
2
2
2
+
w
2
3
2
3
= 1
_
,
resulta un elipsoide centrado en el origen, con ejes de longitudes 2
1
, 2
2
y 2
3
contenidos
en la rectas generadas por u
1
, u
2
y u
3
, respectivamente (Figura 3.).
15
4
2
0
2
4
5
0
5
4
2
0
2
4
col(A)
1
u
1
2
u
2
u
3 T(S
2
)
Figura 2: T(S
2
) caso rango 2
1
u
1
2
u
2
3
u
3
T(S
2
)
Figura 3: T(S
2
) caso rango 3
16

Descomposicion en Valores Singulares Apunte de Mancilla

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Descomposicion en Valores Singulares Apunte de Mancilla

Uploaded by

Copyright:

Available Formats

Descomposicion en valores singulares

Notas para los cursos 21 y 22 (J.L. Mancilla Aguilar)

2 es el unico v.s. no nulo tanto de

= l(A). Con esto, y la forma en que se construyen

dividiendo cada una de ellas

. Queda entonces la factorizacion

es una solucion por c.m. de norma mnima de la ecuaci on Ax = b si x

x para todo x que sea solucion por c.m. de Ax = b.

por c.m. de la ecuaci on Ax = b que pertenece a l(A).

es la unica solucion por c.m. de norma mnima de la ecuacion Ax = b.

es solucion por c.m. de la ecuacion Ax = b y pertenece a l(A).

es la unica solucion por c.m. que pertenece a l(A). Supongamos

es una solucion por c.m. que pertenece a l(A). Entonces Ax

l(A) y l(A) = Nul(A)

es la unica solucion de norma mnima. Supon-

que pertenece a l(A). Para

pertenece a l(A), existe R

You might also like