Professional Documents
Culture Documents
Problemas de decisin
Tipo particular de problemas de optimizacin
Sistemas que evolucionan con el tiempo
Se toman decisiones en momentos sucesivos de
tiempo
Decisiones dependen del estado del sistema
Polticas ptimas: mejores decisiones para un
estado dado
Programacin dinmica
2
Problema de inventarios
Demanda prevista para los prximos 12 meses:
250 200 200 250 300 300 350 300 250 250 200 350
Costes
Costes de pedido - fijos: 200
- variables: 10
Costes de inventario: 2
Costes de ventas perdidas: 25
Ejemplo 1
3
Variables:
Meses en los que se hace un pedido
Tamao del pedido
Supondremos que los valores posibles son prefijados:
0 100 200 300 400 500
Funcin objetivo:
Coste total de operacin del sistema
Restricciones:
Tamao de los inventarios, ventas perdidas
Ejemplo 1
4
Generacin de energa elctrica
Precios estimados para prximas 12 horas
45 45 47 49 51 49 51 47 45 49 52 49
Variables
Niveles de produccin de una unidad
Objetivo
Mximo beneficio
Ejemplo 2
5
Costes de generacin
C () = 41
E + 0.015
E
2
Zona de operacin permisible:
100 300 Mwh
Coste de arranque:
20000
Costes de cambios en el nivel de generacin:
150
Mxima tasa de cambio:
50 Mwh/h
Ejemplo 2
6
Variables:
Niveles de generacin
Supondremos los siguientes valores aceptables
0 - 100 - 150 - 200 - 250 - 300
Restricciones:
Mximo cambio en los niveles de generacin
Mximo/mnimo nivel de generacin
Incluido en los valores aceptables
Ejemplo 2
7
Formulacin del problema
Elementos del problema
Variables de estado
Informacin necesaria para conocer la situacin del
sistema, x
t
Variables de decisin
Acciones a tomar para modificar el estado, y
t
Ley de movimiento
Relacin entre variables de estado y de decisin
x
t+1
= g
t
( x
t
, y
t
)
8
Formulacin del problema
Elementos del problema (ii)
Funcin de costes
t
|
t
f
t
( x
t
, y
t
) + +( x
T
)
Factor de descuento, |
t
Medida de preferencia por ingresos actuales frente a
ingresos futuros
Solo es importante para horizontes largos
Valor final, +( x
T
)
Preferencia por que el sistema termine en un estado u otro
T , horizonte de planificacin
9
Formulacin del problema
Problema de programacin matemtica
Min
t
|
t
f
t
( x
t
, y
t
) + +( x
T
)
s.a x
t+1
= g
t
( x
t
, y
t
)
y
t
e Y
Se quiere calcular la poltica ptima
Funciones y
t
= a
t
( x
t
) que proporcionen el ptimo
para el problema anterior
No solo los valores ptimos de las variables
Solucin ms robusta
10
Clculo de soluciones
Demasiado costoso explorar todas las alternativas
Seleccionar algunas alternativas:
Principio del mximo
Solo algunas alternativas satisfacen condiciones
necesarias para estar en un mximo
Se estudian distintas partes de la solucin
Todas ellas deben parecer ser parte del ptimo
Principio del Mximo
11
Variables de estado:
Situacin del sistema en cada periodo
Inventarios, nivel de generacin
Variables de control:
Decisiones a tomar
Momentos de pedido, tamaos de pedido, cambios en
niveles de generacin
Principio del Mximo
12
Descripcin
Problema a resolver en un intervalo de tiempo
[0,T ] partiendo de x
0
Trayectoria ptima de variables de estado,
x
t
*
, t e [0,T ]
Propiedad de la trayectoria ptima:
Si empezamos desde x
t
*
, obtenemos la misma
trayectoria
Principio del Mximo
13
Consecuencias:
Construir una trayectoria ptima a partir de partes
pequeas
El problema se reduce a una serie de problemas de menor
tamao
Ventajoso si costes de solucin crecen ms rpido que
linealmente
Problemas menores: para un periodo nico
Limitacin:
Como x
t
*
no se conoce, probar todos los valores
Principio del Mximo
14
Ilustracin
x
t T
x
0
Principio del Mximo
15
Ilustracin
x
t+1 T t
x
t
x
t
1
2
1>2?
Principio del Mximo
16
Aplicacin
Partimos de la situacin en T
Para cada estado, coste del estado V
T
(x
)
Para cada periodo de tiempo y cada estado,
calculamos:
accin ptima en t
compatible con costes ptimos de t +1 a T
Principio del Mximo
17
Aplicacin
Formalmente, calculamos una funcin de valor
V
t
(
x
) = min
y
{ f
t
( x
, y
) + V
t+1
(g
t
( x
, y
)) }
para cada valor de x
y de t
Una vez obtenidos los valores para t = 0
Seleccionar valor correspondiente a estado inicial
Reconstruir camino de mnimo coste
Principio del Mximo
18
Principio del Mximo
Procedimiento de solucin
1. Se calcula el valor de la funcin V
T
(
x
) = +( x
)
2. Para el periodo T 1 se calcula V
T-1
(
x
) como
V
T-1
(
x
) = min
y
{ f
T-1
( x
, y
) + V
T
(g
T-1
( x
, y
)) }
Para cada valor de x se calcula el valor de
f
T-1
( x
, y
) + V
T
(g
T-1
( x
, y
))
para todos los valores de y
Se selecciona el menor y se conserva el valor de y(x) que
corresponde al mnimo (poltica ptima)
19
Principio del mximo
Procedimiento de solucin
3. Se repite el proceso hasta t = 0
Se obtiene V
0
(
x
0
)
4. Se reconstruye la trayectoria ptima a partir de
los valores de y(x)
Se parte de
x
0
y se obtiene
y
0
= y(x
0
)
Se calcula
x
1
= g
0
( x
0
, y
0
)
Se repite el proceso hasta obtener x
T
20
Gestin de inventarios
Estado: nivel de inventario
Variables de control: pedidos
Objetivo: costes
Horizonte de tiempo: 12 periodos
Valor final
Valoracin inventarios periodo 13
V
13
(I
13
) = -10I
13
Ejemplo 1
21
Aplicacin del procedimiento
Para el periodo 12,
V
12
(I
) = min
P
{f (I,P
) + V
13
(I
13
(I
,P
))}
I
13
(I
,P
) = max (0, I +
P
- D
12
)
Clculo de valores (I = 100, P = 300):
I
13
= I +
P
- D = 100 + 300 - 350 = 50
f (I,P
) = K + cP + hI = 100 + 10300 + 2100 = 3300
V (I,P
) = f (I,P
) + V
(I
13
) = 3300 - 500 = 2800
Ejemplo 1
22
Valores para I = 100,
Valor ptimo para I = 100,
V
12
(100) = 2800, si P = 300 400
Valores ptimos
Ejemplo 1
P 0 100 200 300 400
V 3950 3550 3050 2800 2800
I 0 50 100 150 200 250 300
V 3600 3200 2800 2400 2000 1600 1200
P 400 400-300 400-300 400-200 400-200 400-100 400-100
23
Repetir proceso para otros periodos
Clculos para I = 150, P = 0, t = 11:
I
12
=I +P
-D = 150 + 0 - 200 = -50, I
12
= 0
f (I,P
)= hI + sD