You are on page 1of 6

Preguntas de examen

Sergio Gómez
14 de septiembre de 2010

1. Pregunta 2
Dado el siguiente problema de maximización, resuelve para el caso general
con n variables

n
1X 3
maximizar x (1)
3 i=1 i
n
X
sujeto a: xi = 0 (2)
i=1
Xn
x2i = n (3)
i=1

Se define la función Lagrangiana:


n n n
!
1X 3 X X
L(x, λ, µ) = x −λ xi − µ x2i − n
3 i=1 i i=1 i=1

Con condiciones de primer orden obtenemos:


 2     
x1 1 x1
 ..   .  .. 
 .  = λ  ..  + 2µ  (4)

. 
x2n 1 xn

Sumando sobre cada entrada se obtiene la siguiente ecuación:


n
X n
X
x2i = nλ + 2µ xi
i=1 i=1

Ahora usando (2) obtenemos la siguiente igualdad para λ

1
n
1X 2
λ= x
n i=1 i

Pero con la restricción (3) concluyo:


n
1X 2 1
λ= x = n=1 (5)
n i=1 i n

Por otra parte multiplicando (4) en cada entrada por la correspondiente xi


se obtiene:
 3     2 
x1 x1 x1
 ..   ..   .. 
 .  = λ  .  + 2µ  . 
x3n xn x2n

De lo cual, si se nos ocurre sumar cada entrada aprendemos que:


n
X n
X n
X
x3i =λ xi + 2µ x2i
i=1 i=1 i=1

y maniobrando con las restricciones descritas en (2) y en (3) se obtiene:


n n
1X 3 2 X 2 2
f (x) = xi = µ xi = nµ (6)
3 i=1 3 i=1 3

Ahora si utilizo a (4) como un sistema de ecuaciones de segundo grado


observo:

x2i − 2µxi − 1 = 0 ∀ i = 1...n

y resolviendo para xi obtenemos una relación importante:


p
2µ ± 4µ2 + 4 p
xi = = µ ± µ2 + 1 ∀ i = 1...n (7)
2

Ahora lo fuerte es descubrir que signo deben llevar las soluciones para las
xi ´s, para eso usamos a la restricción explicada en (2) en conjunto con el des-
cubrimiento de (7). Pero antes voy a inventarme unos números:

2
Sea α la cantidad de valores de x con signo negativo y β la cantidad de valo-
res de x con signo positivo. Con estas definiciones hago un par de observaciones:
α+β = n y por la restricción en (2) no puede ser que α = 0 o que β = 0 a menos
que xi = 0 ∀ i = 1 . . . n, solución que ciertamente no sirve para maximizar
la función f (x). Con esto en mente escribo:

n
X p p
0 = xi = nµ − α µ2 + 1 + β µ2 + 1
i=1
p p
⇒ 0 = nµ + (α − β) µ2 + 1 ⇒ nµ = (α − β) µ2 + 1

(α − β)2
Si elevo al cuadrado: (nµ)2 = (α − β)2 (µ2 + 1) ⇒ µ2 =
n2 − (α − β)2

Ahora dado que ese último denominador es positivo pues: n2 − (α − β)2 =


(β + α)2 − (α − β)2 = 4βα ≥ 0. Vemos que:
(
0 si α = β
µ= √ 2(α−β) 2 si α =6 β
n −(α−β)

Si estamos en el caso µ = 0 nuestra solución para x es un vector con α entradas


igual a −1 y β entradas iguales a 1. De otra forma si µ 6= 0 habrá una cantidad
β de variables xi 3
s
α−β (α − β)2
xi = p + +1
n2 − (α − β)2 n − (α − β)2
2

α−β n
⇒ xi = p +p
n2 − (α − β)2n2 − (α − β)2
n+α−β
r
2α α
⇒ xi = p =√ =
2
n − (α − β) 2 4αβ β

y una cantidad α de variables xi 3


s
α−β (α − β)2
xi = p − +1
n2 − (α − β)2 n2 − (α − β)2

α−β n
⇒ xi = p −p
n2 − (α − β)2 n − (α − β)2
2

3
r
α−β−n −2β β
⇒ xi = p =√ =−
2
n − (α − β)2 4αβ α

También con ayuda de las observaciones de que α 6= 0 y β 6= 0 y pensando


en la relación de nuestra función objetivo con el multiplicador de lagrange µ que
guardamos en (6) tengo:

2n(α − β) n(α − β)
f (x) = p = √
2
3 n − (α − β)2 3 αβ

Ahora trataré con el problema:


n(α − (n − α)) n(2α − n)
maximizar: f (α) = =
3(α(n − α)) 3α(n − α)
sujeto a: n−1≥α≥1

Pero estudiando la función f (α):

n 2(n − α) − (2n − α)(n − 2α) n 2α2 − 2nα + n2


f 0 (α) = 2 2
=
3 α (n − α) 3 α2 (n − α)2
2

0 2n α2 − nα + n4 n 3n2
⇒ f (α) = +
3 α2 (n − α)2 3 4(α2 (n − α)2 )
2n(α − n2 )2 n3
⇒ f 0 (α) = 2 2
+ 2 ≥0
3α (n − α) 4α (n − α)2

Con esto descubrimos que la función f (α) es siempre creciente ası́ que el valor
que maximiza será el α más grande permitido el cual es: α = n − 1. Esto tiene
más sentido, si nos percatamos de que ası́ la única variable positiva aumenta de
tamaño y las múltiples variables negativas se hacen pequeñitas y de este modo
en la función f (x) que tiene a los valores de xi elevados al cubo, es mejor que
haya un sólo termino que domine a muchos otros términos negativos pero muy
pequeõs. Por eso escojo α = n − 1 y β = 1. Con esta nueva información, la
solución queda para n ≥ 3:

α = n − 1, β = 1, λ = 1
(n − 2) (n − 2) n−2
µ= p =√ = √
n2 − (n − 2)2 4n − 4 2 n−1
Se escogerán n − 1 variables xi negativas
1
xi = − √
n−1

4
y una variable xi positiva √
xi = n−1

n(n − 2)
f (x∗ ) = √
3 n−1

2. Pregunta 3
Dado el siguiente problema de maximización

1 T
minimizar dTgk + d Bk d (8)
2
sujeto a: kdk2 ≤ ∆k (9)

Responda las siguientes preguntas:


Formule las condiciones de primer orden del problema de minimización.
Construyo la función lagrangiana.
1 T
L(d, λ) = dTgk + d Bk d − λ(∆2k − dTd)
2

∇d L(d, λ) = gk + Bk d − 2λd = 0

Bk (I + 2λ)d = −gk (10)


λ(∆2k − dTd) = 0 (11)
λ = 0 (12)

¿Es posible encontrar una solución analı́tica?


Tenemos dos casos a revisar:

• Si λ = 0 entonces tenemos como condición: Bk d = −gk lo cual tiene


solución ya que Bk es positiva definida. Ası́ la solución serı́a:
λ = 0, d = Bk−1 d

• Si λ > 0 estamos en problemas ya que no es fácil el encontrar la


solución analı́tica.
d = −(Bk (I + 2λ))−1 gk
por (11) uno obtiene que kdk2 = ∆k con esto
dTd = gkT ((Bk (I + 2λ))−1 )T (Bk (I + 2λ))−1 gk = ∆k

5
Pero esa relación no sirve para despejar a λ. Como conclusión tenemos
que a veces es posible hallar la solución analı́tica y en ocasiones no.
¿Cómo depende la dirección d del radio de la región de confianza ∆k ?

Al usar un modelo cuadrático para obtener una dirección de descenso se


está apostando a la dirección de Newton. Pero si esta dirección de Newton
(dN = −(Bk )−1 gk ) posee una norma euclideana mayor al radio de la región
de confianza. Esto es: kdk2 = k(Bk )−1 gk k2 > ∆k , entonces esta dirección
no cumple la restricción (9) y ası́ nuestra dirección debe ser ajustada, pero
el cambio depende mucho de las curvas de nivel elı́pticas del modelo (8)
cuya información se recoge en la matriz Bk y con esto encontrar el ajuste
es un problema que no es analı́ticamente soluble.

You might also like