Professional Documents
Culture Documents
J. M. Sotoca
11Junio 2002
ndice:
1.1 Introduccin.
1.1.1 Proyeccin en perspectiva.
1.1.2 Proyeccin ortogrfica.
1.2 Modelos paramtricos.
1.2.1 Movimiento 2D.
1.2.2 Estimacin en perspectiva..
1.2.3 Estimacin afn.
1.3 Modelos no paramtricos.
1.3.1 Mtodos (OFE).
1.3.2 Mtodos por bloques.
1.3.3 Mtodos recursivos.
1.3.4 Mtodos bayesianos.
1.4 Nociones sobre compresin de vdeo (H.261, MPEG-1 y MPEG-2).
1.1 Introduccin.
Se presentan modelos de la variacin espacio-temporal de la
intensidad espacial en la imagen sc(x1, x2, t) o sc(xc,yc,t).
Esto supone la variacin de los objetos de la escena 3D
proyectados sobre el plano imagen 2D. Bsicamente es:
Modelo 3D de
escena
Formacin de
imagen
Muestreo
espacio-temporal
ruido
Movimientos de rotacin, traslacin y escalado.
Cuerpos rgidos- Cuerpos no rgidos (modelos de deformidad).
Supone pasar de un sistema (Xc, Yc, Zc, t) a un sistema (xc, yc, t)
donde = Zcf es un factor de escala, (Xc, Yc, Zc, 1)t son las coordenadas
del punto M en 3D.
6
Yc
y c 0 1 0 Z
c
11Junio 2002
10
los dos frames son globalmente desplazados uno respecto del otro. Ej: Una
escena esttica tomada desde dos posiciones de la cmara.
11
1.2.1 Movimiento 2D
Movimientos relacionados con la cmara:
12
1.2.1 Movimiento 2D
Fig 5.2: Al hacer un zoom, las lneas salen de manera radial respecto de un
punto que recibe el nombre de foco de expansin (FOE).
Fig 5.3: En la figura de abajo se realiza una traslacin pura en el eje X (hacia
la derecha). Se puede observar como las lneas de flujo son paralelas y de
modulo creciente a mayor profundidad.
Fig 5.5: Se observa el flujo de imagen producido por movimiento combinado
de traslacin en el eje Z (hacia delante) y de rotacin pura en el sentido
negativo del eje Y. (a la derecha). El FOE parece que se ha desplazado hacia
la derecha, aunque es un efecto engaoso y sigue situado en el centro.
13
Modelos no-paramtricos:
El objeto en movimiento no tiene que ser rgido. Podemos distinguir las
siguientes aproximaciones:
Basados en la ecuacin de flujo ptico (OFE): Se basan en el uso de
gradientes espacio-temporal de la intensidad de la imagen. Es necesario
una suavidad en la variacin espacio-temporal entre vecinos. Esta
necesidad causa imprecisin ante la existencia de oclusin en la frontera.
En color se analizan las tres bandas de color por separado.
15
17
W g h 1
xc
y
c
1
c
Xw
Y g h 1 1
w
xc
1
g h 1 yc
18
1
Yw
dx c ey c f
gx c hy c 1
gYw x c hYw y c Yw dx c ey c f
Si despejamos Xw e Yw y aadimos ceros tenemos:
X w x c a y c b c 0d 0e 0 f X w x c g X w y c h
Yw 0a 0b 0c x c d y c e f Yw x c g Yw y c h
El problema se reduce a n correspondencias entre puntos de los dos
sistemas, donde se tienen 2n ecuaciones con 8 variables desconocidas.
As si n = 4, la solucin es exacta, mientras que si n > 4, H est
sobredeterminada y puede ser estimada mediante un esquema
sobredeterminado. Ej: Descomposicin en valores singulares (SVD).
19
x2
0
x3
0
x
4
0
y1
0
y2
0
y3
0
y4
0
1 0
0 x1
1 0
0 x2
1 0
0 x3
1 0
0 x4
0
y1
0
y2
0
y3
0
y4
0 X 1 x1
1 Y1 x1
0 X 2 x2
1 Y2 x 2
0 X 3 x3
1 Y3 x 3
0 X 4 x4
1 Y4 x 4
X 1 y1
Y1 y1
X 2 y2
Y2 y 2
X 3 y3
Y3 y 3
X 4 y4
Y4 y 4
a
X1
b
Y
1
c
X2
d Y2
e
X3
f
Y3
g
X
4
h
Y4
20
21
22
11Junio 2002
dsc ( x1 , x2 , t )
0
dt
donde x1 y x2 varan con t de acuerdo al movimiento. Esta derivada es una
derivada total que denota el cambio de intensidad a lo largo de la trayectoria
de movimiento. Pasando a derivada parciales:
s c ( x, t )
s ( x, t )
s (x, t )
v 1 (x, t ) c
v 2 ( x, t ) c
0
x1
x2
t
donde v1(x,t) = dx1/dt y v2(x,t) = dx2/dt son las componentes del vector
velocidad. Esta ecuacin es conocida como ecuacin de flujo ptico.
Alternativamente:
sc (x, t ), v ( x, t )
sc (x, t )
0
t
v ( x, t )
sc (x, t )
sc (x, t )
d sc (x, t )
0
dt
Una estimacin del flujo ptico puede darse a partir de la siguiente expresin:
v
1
v
2
2 sc (x, t )
x2
2 1
sc (x, t )
x x
1 2
2 sc (x, t )
x2 x1
2 sc (x, t )
x22
2 sc (x, t )
t x1
2 sc (x, t )
t x2
25
sc ( x , t )
s ( x, t )
s ( x, t )
v1 (t ) c
v2 ( t ) c
x B
1
2
v
1
v
2
sc (x, t ) sc (x, t )
x1
x1
x B
sc (x, t ) sc (x, t )
x1
x2
x B
sc (x, t ) sc (x, t )
x1
x2
x B
sc (x, t ) sc (x, t )
x2
x2
x B
sc (x, t ) sc (x, t )
x
t
x B
1
s
(
x
,
t
)
s
(
x
,
t
)
c
c
xB x2
t
26
sc ( x, t )
t
v1
2
2
2
E s ( v (x, t )) v1 (x, t ) v2 (x, t )
v1
v2
v2
min E of2 ( v ) 2 E s2 ( v ) dx
v ( x ,t )
27
sc
x1
v1 (x, t )
sc sc
s sc
v2 (x, t ) 2 2 v1 (x, t ) c
x1 x2
x1 t
sc
sc sc
v1 (x, t )
x1 x2
v2 ( x , t ) v 2 ( x , t )
2
sc sc
x2 t
sc ( n )
sc ( n )
sc
v
(
x
,
t
)
v
(
x
,
t
)
1
2
(
n
1
)
(
n
)
s x1
x2
t
v1
(x, t ) v1 (x, t ) c
2
2
x1
s
c
c
2
x1
x2
sc ( n )
sc ( n )
sc
v
(
x
,
t
)
v
(
x
,
t
)
1
2
(
n
1
)
(
n
)
sc x1
x2
t
v2
( x , t ) v2 ( x , t )
2
2
x2
s
c
c
2
x1
x2
28
sc ( x1 , x 2 , t ) ai i ( x1 , x 2 , t )
i 0
29
30
PSNR = 10log10
255 x 255
2
s
(
n
,
n
,
k
1
)
s
(
n
d
(
n
,
n
),
n
d
(
n
,
n
),
k
)
1
1 1 2
2
2 1 2
1 2
H=-
d1
d2
s n1, n 2 , k s n1 d1, n 2 d 2 , k l
d1 y d2 son las coordenadas de desplazamiento. Por tanto la cuestin se
reduce a encontrar una correlacin entre bloques en los frames k y k+l.
En este proceso puede darse superposicin de bloques como se ve en la
figura. Cuando no hay superposicin al bloque entero se asigna un vector de
movimiento. En el otro caso se calcula el movimiento promedio en la regin de
solapamiento.
32
(1)
donde Sk(f1,f2) denota la transformada de fourier del frame k para las variables
espaciales x1 y x2. La diferencia de fase en el plano de frecuencias f1 y f2
vendr dado por 2 (d1f1+d2f2). Un problema que aparece en el plano imagen
es que a veces este movimiento queda oculto. En otras situaciones aparecen
varios objetos movindose dentro del bloque y no es fcil su identificacin.
El mtodo de correlacin de fase, facilita estas tareas por medio del
desplazamiento relativo de bloques mediante una funcin de correlacin
computada en el espacio de frecuencias.
El poder espectral entre los frames k y k+1 es definida como:
36
MSE( d1, d 2 )
1
N1 N 2
s n1, n 2 , k s n1 d1, n 2 d 2 , k 1
( n1 , n 2 )B
1
N1N 2
s n , n , k s n d , n
1
2 d2, k 1
( n1 , n 2 )B
(right) Cross-search
38
(Malo et al, 99): Exploiting perceptual feedback in multigrid motion estimation for
video coding an improved DCT quantization scheme.
40
41
d( x, t, t ) d ( x, t, t ) u( x, t, t ) (1)
sc ( x1 d 1 (x), x 2 d 2 (x), t t )
s ( x, t )
s ( x, t )
sc ( x , t )
sc ( x , t ) d 1 ( x ) c
d 2 ( x) c
t
On
x1
x2
t
(3)
43
44
E( x, d ) df d( x, d )
sc x d, t t sc x d i , t t
dd
i
i
x sc x d, t t
i O x, d
d d
45
dd
df d x, d df d x, d i
i
i
x sc x d, t t
i O x, d
d d
d i 1 x d i x df d x, d i x sc x d i , t t
( 6)
46
1
i
2 x sc x d , t t
1
i
x sc x d , t t
donde el trmino 2, impide una divisin por cero en el caso de reas con
intensidad constante donde el gradiente espacial es casi cero. Un tpico valor
de 2 = 100. Experimentalmente se comprueba que con 5 iteraciones los
resultados suelen ser satisfactorios.
Extensin a un modelo de bloques:
La cuestin consiste en dado un pxel x, crear partiendo de los pxeles vecinos
un bloque B de forma variable, tal que se minimice la siguiente DFD:
E( x, d )
2
d
f
d
(
x
,
d
)
x b B
df d x
x b B
i
i
b , d ( x ) x s c x b d ( x ), t t
48
u i x = d x d i x
donde d(x) es el vector desplazamiento real del bloque. Sea un bloque con N
vecindades del pxel x, entonces a partir de la expresin (6) podemos obtener
la siguiente forma matricial:
z = u x n
49
s x (1) di , t t
c b
-df d( x (1), d i ( x ))
b
x1
s c x b ( 2 ) d i , t t
-df d( x b ( 2), d i ( x )) =
z=
x1
i
-df d( x b ( N ), d ( x ))
s c x b ( N ) d i , t t
x1
sc x b (1) d i , t t
x 2
O( x (1), d i )
b
i
O( x b ( 2), d )
s c x b ( 2 ) d , t t
x 2
i
O( x b ( N ), d i )
s c x b ( N ) d , t t
x 2
u( x ) I
i+1
( x ) d ( x ) I
Tz
50
p d1, d 2 | g k , g k 1
p g k | d1, d 2 , g k 1 p d1, d 2 | g k 1
p g k | g k 1
51
p g k | d1, d 2 , g k 1 2
12d ( )
exp
x
g k (x ) g k 1(x d(x )) 2
2
53
Q e
w
Q e U ( z)/ T
54
(left) Digital video studio standards. (Right) Wold standards for image
compression.
55
59