You are on page 1of 39

Transformada de Fourier (Parte 2).

Pagina 1

TRANSFORMADA DISCRETA DE FOURIER ( DFT )

Acabamos de ver las características de la transformada de Fourier continua. A partir de ahora,


hemos de tener en cuenta que una imagen se caracteriza por ser unasecuencia finita. Sin embargo,
la transformada de Fourier continua, bien sea uni o bidimensional, de secuencias finitas ( y por tanto,
representables por un número finito de valores ), no ofrece una representación eficiente en el dominio
de la frecuencia. Por tanto, hemos de recurrir a una nueva versión de la transformada de Fourier: Se
trata de la transformada discreta de Fourier( DFT, del inglés Discrete Fourier Transform ). La
DFT representa a una secuencia finita en el dominio de la frecuencia con un número finito de valores.

Por tanto, la DFT sirve como aproximación a la transformada continua y, como se verá
en el apartado 2.1.3., puede calcularse eficientemente por medio de algoritmos FFT.

La representación de una señal mediante su DFT se deriva de su serie discreta de Fourier


( DFS, del inglés Discrete Fourier Series ). Se tratará brevemente la DFS en el caso bidimensional
( apartado 2.1.2.2 ), ya que ésta nos facilitará la comprensión de la DFT. Pero antes, veamos de forma
breve la DFT para el caso unidimensional.

DFT UNIDIMENSIONAL

Partimos de una función continua f(x), que es discretizada [ f(m) ]. Como consecuencia de
esto, obtenemos la siguiente secuencia: {f(m0),f(m0+)m), f(m0+2)m), ........, f(m0+ (N-1) )m}.
Como puede observarse, la secuencia consta deN muestras separadas una cantidad )m. Así, se
puede escribir que f(m)=f(mo+m)m), con m=0,1,2,....., N-1. En la siguiente figura se puede
observar la representación gráfica de la función f(m) , obtenida a partir de la función continua f(x).

Figura 2.11: Muestreo de una señal continua.

Definimos a continuación el par que caracteriza a la transformada discreta de Fourier:


Transformada de Fourier (Parte 2). Pagina 2

(1)
TRANSFORMADA DISCRETA DE FOURIER UNIDIMENSIONAL

para k=0,1,2,....., N-1 y m = 0,1,2,....., N-1.

En la transformada discreta de Fourier F(k), los valores k=0,1,2,....., N-1 corresponden a


las muestras de la transformada continua en los valores 0,)k, 2 )k, ..... (N-1))k. Puede deducirse
fácilmente que la relación entre )m y )k es:

( 2.5 )

Ejemplo 2.3:Cálculo de la DFT unidimensional de una función. Sea una función f(x) muestreada en
los valores 1.3, 1.6, 1.9 y 2.2:
f(1.3)=2
f(1.6)=f(1.3+0.3)=1
f(1.9)=f(1.3+2 A0.3)=4
f(2.2)=f(1.3+3 A0.3)=2

(1) Nota acerca de las constantes de multiplicación: Algunos autores sitúan todas las constantes de multiplicación
en la ecuación de la transformada inversa. Esto no debe tomarse como algo trascendente, puesto que lo importante
es que se empleen las ecuaciones de un mismo par transformado.

Calculamos F(0) ( DFT en el origen ): . Obtenemos que

Puede comprobarse que F(2) toma el valor 3/4 y que F(3)=(1/4)(-2-j).


Transformada de Fourier (Parte 2). Pagina 3

Al contrario que en el caso continuo, no tenemos que plantearnos bajo qué condiciones existe
la transformada discreta de Fourier, dado que ésta (sea uni o bidimensional)siempre existe. Esto
puede demostrarse con una simple sustitución de la expresión de f(m) en la de F(k); al hacer esto,
obtenemos la identidad F(k)=F(k). Si hubiéramos sustituido la expresión de F(k) en la de f(m),
habríamos obtenido la identidad f(m)= f(m).

DFT BIDIMENSIONAL

Según se comentó, antes de comenzar con la DFT bidimensional, comentaremos brevemente


las series discretas de Fourier:

SERIES DISCRETAS DE FOURIER ( DFS )

La DFS es una representación en el dominio de la frecuencia de una secuencia periódica.


Sea f p(m,n) una secuencia periódica de períodoMxN, es decir, f p(m,n)=f p(m+M,n)=f p(m,n+N) œ
(m,n). La señalf p(m,n) puede obtenerse mediante combinaciones de funciones exponenciales
complejas de la forma siguiente:

Esta expresión representa todas las secuencias exp. complejas periódicas de período MxN.

La secuencia Fp(k,l) representa la amplitud de cada exponencial compleja y puede obtenerse


a partir de f p(m,n). El par que define la DFS es el siguiente:

SERIE DISCRETA DE FOURIER BIDIMENSIONAL

A los términos Fp(k,l) ( de períodoMxN) se les conoce como coeficientes de la serie discreta
de Fourier de f p(m,n). Y a f p(m,n) se la denomina DFS inversa de Fp(k,l).
Transformada de Fourier (Parte 2). Pagina 4

Así, la señalf p(m,n) queda representada por Fp(k,l) para 0 #k #M-1 y 0#l#N-1 ( es decir,
por un período de Fp(k,l) ).

Tras repasar la DFS, podemos pasar a ver la DFT:

La DFT es una representación en el dominio de la frecuencia de secuencias finitas.


Consideremos la señalfp(m,n) periódica de períodoMxN. A continuación, construimos la señal finita
f(m,n) conservando un período de f p(m,n) y poniendo el resto de valores a 0 [ Esto se efectúa
multiplicando a f p(m,n) por una función " ventana " r(m,n) ].

De la misma manera, a partir deFp(k,l) ( coeficientes de la DFS defp(m,n) ), construimos la


señal finita F(k,l) conservando un período de Fp(k,l) y poniendo a cero el resto de valores ( de nuevo,
con una ventana).

Así, f(m,n) está relacionada con F(k,l) de esta manera:

f(m,n) : f p(m,n) : Fp(k,l) : F(k,l)

El par transformado DFT es el siguiente:

TRANSFORMADA DISCRETA DE FOURIER BIDIMENSIONAL

De esta manera, f(m,n) ( deMxN puntos ) queda representada en el dominio de la frecuencia


por F(k,l) ( de MxN puntos ).

A F(k,l) se le llama DFT de f(m,n), y a f(m,n) se le llama DFT inversa de F(k,l).

La relación entre F(k,l) y F( T1,T2) ( transformada de Fourier de señales discretas ) es la siguiente:

( 2.6 )

para 0 #k #M-1 y 0 #l #N-1 .


Transformada de Fourier (Parte 2). Pagina 5

La expresión ( 2.6 ) establece que los coeficientes de la DFT de f(m,n) son muestras de
F(T 1,T 2) equiespaciadas desde T1= T2=0.

Veamos ahora las propiedades más importantes de la DFT, así como las aplicaciones que éstas
tienen en el tratamiento de la imagen:

Los espectros de muchas imágenes decrecen rápidamente con la frecuencia, por lo que los
términos de alta frecuencia tienden a oscurecerse cuando se muestran en forma de imagen. Para
compensar este defecto, lo mejor es comprimir los valores de los coeficientes. Así, en lugar de mostrar
el módulo de la transformada, se mostrará la siguiente función:
( 2.7 )
La representación de esta nueva función facilita enormemente la interpretación visual de la
transformada de Fourier. En la Fig. ( 2.12 ) se muestran ambas representaciones. La Fig. 2.12(a)
muestra una imagen del planeta Saturno, la Fig. 2.12(b) muestra el módulo de la transformada y la Fig.
2.12(c), la representación de D(k,l).

Figura 2.12: (a) Imagen original (b) Modulo de su transformada (c) Representación logarítmica.
Transformada de Fourier (Parte 2). Pagina 6

A) Separabilidad.

Las ecuaciones del par transformado DFT pueden expresarse de forma separada: Un
sumatorio de exponenciales y otro sumatorio de exponenciales multiplicadas por la secuencia.

La principal ventaja que ofrece esta propiedad es que tanto la secuencia original como la
transformada pueden obtenerse en dos pasos aplicando transformadas de Fourier unidimensionales
directas o inversas, según corresponda. Así, F(k,l) puede calcularse de esta manera :

( 2.8 )

B) Traslación.

Esta propiedad viene dada por las siguientes relaciones:


( 2.9 )

( 2.10 )

La mayor parte de la información de las imágenes está en la parte central del espectro. Por tanto, es
muy habitual efectuar un desplazamiento en frecuencia ( en ambos ejes, k y l ) deN/2 puntos, siendo
la imagen de dimensión NxN. Así, si k 0=l 0=N/2, .

Y por lo tanto, . De esta manera, desplazar al centro el

espectro equivale a multiplicar a la secuencia original por (-1)m+n .

Hay que notar que un desplazamiento en f(m,n) no afecta para nada al módulo de su transformada (
ya que el módulo de la exponencial es la unidad ).

C) Periodicidad y Simetría Conjugada.


Transformada de Fourier (Parte 2). Pagina 7

La transformada discreta de Fourier y su inversa son periódicas de período N, es decir:


F(k,l)=F(k+ " N,l)=F(k,l+ $N) , con " ,$=0,±1,±2,....

La DFT bidimensional de una imagen es esencialmente una representación de la serie de


Fourier de un campo bidimensional. Para que sea válida la representación de la serie de Fourier, el
campo debe serperiódico. La imagen original, por tanto, debe considerarse periódica tanto horizontal
como verticalmente.

Si la imagen representa un campo de luminancias, f(m,n) será una función real positiva. Sin
embargo, su transformada será compleja por lo general. Debido a que el dominio transformado
contiene 2N2 componentes ( la matriz original contiene N2 componentes, pero los puntos
transformados, al ser complejos, necesitan ser almacenados en dos matrices: una con las partes reales
y otra con las partes imaginarias ), puede pensarse que la transformada de Fourier provoca un
incremento en la dimensión. Sin embargo, esto no es así porqueF(k,l) cumple la propiedad de la
simetría conjugada:

F(k,l)=F*(-k+ " N,-l+ $N) , con ",$=0,±1,±2,.... , de donde se deduce que*F(k,l) *= *F(-k+ " N,-
l+ $N) *.

Por lo tanto, la periodicidad indica queF(k,l) tiene un períodoNxN y la simetría indica que el
módulo de la transformada está centrado en el origen.

Para mostrar un período completo, es necesario desplazar el espectro una cantidad N/2, que
como se comentó anteriormente, equivale a multiplicar a f(m,n) por (-1) m+n.

En la siguiente figura se observa el efecto que provoca un desplazamiento en frecuencia para


poder observar un período completo y poder observar la simetría.

Figura 2.13: (a) Imagen original (b) Espectro de Fourier (c) Espectro desplazado al punto medio.
Transformada de Fourier (Parte 2). Pagina 8

D) Rotación.

Las funcionesf(m,n) y F(k,l) pueden expresarse, empleando las coordenadas polares, comof(r,2)
y F( T,N) , respectivamente.

Así, m=r cos 2 , n=r sen 2 , k= T cos N , l= T sen N .

Se cumple que f(r,2+ 20) : F(T,N+20) ; es decir, al rotarf(m,n) un ángulo 20 , entonces


F(k,l) queda rotado ese mismo ángulo. De la misma manera ocurre al revés.

En la siguiente figura podemos observar esta propiedad.

Figura 2.14: (a) Imagen original (b) Su espectro (c) Imagen girada (d) Espectro resultante.

E) Distributividad y Escalado.

A partir de la definición, se deduce que:

ö{a f 1(m,n) + b f 2(m,n)} = a ö{f 1(m,n)} + b ö{f 2(m,n)}

y que, en general:

ö{f 1(m,n) A f 2(m,n)} … ö{f 1(m,n)} A ö{f 2(m,n)}


Transformada de Fourier (Parte 2). Pagina 9

La transformada de Fourier y su inversa son distributivas respecto de la suma, pero no


respecto del producto.

Para dos escalares a y b, se cumple que: a f(m,n) : a F(k,l) , y

también: .

F) Valor medio.

Se define el valor medio de una función bidimensional discreta como .

Veamos ahora la expresión de F(0,0):

Estas dos últimas expresiones están, por tanto, relacionadas por la siguiente expresión: .

Es decir, podemos calcular el valor medio de f(m,n) mediante el valor de la DFT en el origen.

G) Laplaciano.

Se define el laplaciano de una función f(m,n) como sigue(1): . Veamos cuál

es su transformada de Fourier:
ö{L 2f(m,n)} : -(2 B) 2 A (k 2+l 2) F(k,l) . Hay que recordar que el operador laplaciano es útil para
detectar bordes en una imagen.

H) Convolución y Correlación.

Estas dos operaciones son de gran interés en el procesado de imágenes. Previamente, recordemos la
definición de estas operaciones:
Transformada de Fourier (Parte 2). Pagina 10

(1) Aunque las variables m y n están siendo usadas como discretas, en realidad, el laplaciano se aplica a una función
continua f(x,y).

- La convolución de f(m,n) con g(m,n) se define de esta manera:

( 2.11 )

Esta operación tiene la siguiente transformada: f(m,n)*g(m,n) : F(k,l) AG(k,l) .

Esta propiedad facilita enormemente el tratamiento de señales, puesto que una convolución en
el espacio se convierte en el dominio transformado en un simple producto de las transformadas. En el
dominio del espacio aparece una convolución siempre que una señal pasa por un sistema:

Figura 2.15: Una convolución en el espacio equivale a un producto en frecuencia.

Y además, f(m,n) Ag(m,n) : F(k,l)*G(k,l) .

Veamos gráficamente una convolución bidimensional:

(e) (f)
Transformada de Fourier (Parte 2). Pagina 11

Figura 2.16: Convolución bidimensional. (a) Señal f ( f(i,j)=1 ) (b) Señal g ( g(i,j)=i ) ( Función rampa a lo largo
del eje i ) (c) Convolución resultante de f con g (d) Perfil de la convolución (e) Alzado de la convolución (f)
Planta de la convolución.

Esta figura representa la convolución entre un plano ( funciónf ) y una rampa a lo largo
del eje i ( función g ). Para obtener esta convolución es necesarioinvertir la función g ( obtención de
la función g(-i,-j) ), la cual será desplazada a lo largo de los dos ejes para quesea multiplicada por
la función f. Estos productos parciales se irán acumulando para obtener el resultado final.

En la Fig. 2.16(c) se ha representado una vista general de la convolución resultante ( según


la misma orientación de las funciones originales ( figuras 2.16(a) y 2.16(b) ) ( ver disposición de
ejes ) ).

En las figuras 2.16(d) a 2.16(f) se representan respectivamente el perfil, el alzado y la planta


de esta convolución, con el fin de ofrecer vistas interesantes de la misma, especialmente con el perfil
y la planta. La planta ofrece la forma del soporte de la convolución.

Se recomienda al lector interesado que razone la forma de esta convolución. Si es necesario,


puede ayudarse de las matrices que representen a las funcionesf y g para efectuar dicha convolución
numéricamente.

- La correlación de dos funciones f(m,n) y g(m,n) se define así:

( 2.12 )

Un caso especial consiste en quef(m,n)=g(m,n). En este caso, a la función resultante se la denomina


función de autocorrelación.

La correlación tiene la siguiente transformada: f(m,n) B g(m,n) : F*(k,l) AG(k,l) .


Y además, f *(m,n) Ag(m,n) : F(k,l) B G(k,l) .

Un dato interesante a tener en cuenta es que los datos altamente correlados contienen poca energía en
las frecuencias espaciales altas.

Una de las principales aplicaciones de la correlación en el tratamiento de imágenes consiste en el


reconocimiento de patrones, donde el problema reside en encontrar el mayor parecido entre una
imagen desconocida y un conjunto de imágenes conocidas.

Una aproximación a este problema consiste en calcular la correlación entre la imagen


desconocida y cada una de las imágenes conocidas ( patrones ). La imagen desconocida será
identificada con una de las conocidas cuando la función de correlación tenga el máximo valor. Dado
que las correlaciones resultantes son funciones bidimensionales, es necesario buscar la amplitud más
grande de cada función.
Transformada de Fourier (Parte 2). Pagina 12

I) Muestreo.

La transformada de Fourier y el teorema de la convolución constituyen las herramientas


necesarias para llegar a un estudio más profundo de este problema.

Interesa conocer cuántas muestras deben tomarse para no perder información en el proceso
de muestreo. Es decir, interesa conocer bajo qué condiciones de muestreo puede recuperarse
completamente una imagen a partir de un conjunto de muestras.

El proceso de muestreo puede abordarse partiendo de la distribuciónDelta de Dirac, *(x,y),

que cumple la siguiente relación: .

La función de muestreo es un tren de impulsos ( Deltas de Dirac ) separados una cantidad )x


a lo largo del eje x y una cantidad )y a lo largo del eje y.

Una función f(x,y) limitada en banda ( su transformada de Fourier se extiende desde -W hasta
W, siendo W una cantidad finita ) puede recuperarse completamente a partir de muestras cuya
separación venga dada por )x=1/(2W u) y por )y=1/(2W v) .

Cuando f(x,y) está limitada en el dominio del espacio, lo que sucede es que la transformada
de la función muestreada queda distorsionada por la convolución de la respuesta en frecuencia del filtro
y del espectro de la señal original muestreado ( hecho periódico ). Esta distorsión, debida a la
naturaleza de las imágenes digitales, impide la completa recuperación def(x,y) a partir de sus muestras.
Esto no es así para funciones periódicas, pero es muy raro encontrar imágenes que satisfagan esta
condición.

Para una imagen NxN, se obtiene la relación dada en la Ec. ( 2.5 ). Y análogamente,)v=1/
(N)y) . Con estas relaciones entre separaciones entre muestras, se garantiza la recuperación de un
período completo por parte deNxN valores equiespaciados tanto en el dominio espacial como en el
de frecuencias.
Transformada de Fourier (Parte 2). Pagina 13

A continuación, se resumen en forma de tabla las propiedades más importantes de la DFT.

Operación espacial Operación en frecuencia Comentarios


1. Linealidad Linealidad En ambos dominios aparece la linea- af1(m,n)+bf2(m,n)
aF 1(k,l)+bF2(k,l) lidad. El espectro de la suma de imágenes discre-
tas es igual a la suma de los espectros.

2. Cambio de escala Depende de a y b Debido a la naturaleza discreta de f(am,bn)


la señal muestreada, el escalado implica una
interpolación. Un caso especial consiste en que
a=b=-1, en el que la función espacial es
invertida , en cuyo caso, los ejes k,l quedan
multiplicados por -1.

3. Desplazamiento de la posición Adición de fase lineal Desplazar o trasladar la función espacial una
f(m-m0, n-n0) F(k,l)A exp[-j(km0+ln0)/N] determinada cantidad añade al espectro una
fase lineal. De la misma manera, la adición de
una fase lineal al espectro produce una traslación
de la imagen. El módulo del espectro es invariante
a la traslación.

4. Modulación F(k-k0, l-l0) La multiplicación de una función espacial por


exp[j(k0m+l0n)/N]A f(m,n) una sinusoide compleja hace que su espectro
se traslade al centro de las frecuencias de la
sinusoide.

5. Convolución Multiplicación La convolución de dos funciones espaciales


f(m,n)*g(m,n) F(k,l)A G(k,l) discretas corresponde al producto de los
espectros individuales.

6. Multiplicación Convolución El producto de dos funciones espaciales discretas


f(m,n)A g(m,n) F(k,l)*G(k,l) corresponde a la convolución de sus espectros
discretos.

7. Correlación Producto conjugado La correlación periódica de dos funciones


f(m,n)B g(m,n) F(k,l)A G*(k,l) corresponde al producto de un espectro
multiplicado por el espectro conjugado de la otra
función.

8. Rotación Rotación La rotación de una función discreta un


f(mcos 2+nsen2, -msen2+ncos2) F(kcos2+lsen2, -ksen2+lcos2) múltiplo de 90º corresponde a una rotación del
espectro exactamente el mismo ángulo. Otras
rotaciones implican una interpolación.

9. Diferenciación F(k,l)A [1-exp(-jk/N)] La derivada es aproximada por unaecuación en


f(m,n)-f(m-1,n) diferencias. Su espectro será un filtro paso alto.

10. Integración F(k,l)A [1+exp(-jk/N)] La integral es aproximada por una ecuación de


f(m,n)+f(m-1,n) integración numérica (sumas). Su espectro tendrá
la forma de filtro paso bajo.
Transformada de Fourier (Parte 2). Pagina 14

Tabla 2.2: Cuadro-resumen de las propiedades más importantes de la DFT.


Tras repasar las propiedades más importantes de la DFT, se ofrece a continuación un ejemplo
práctico que muestra cuántas operaciones son necesarias usando DFT's.

Ejemplo 2.4: Número de operaciones necesarias empleando DFT's

Supongamos una imagen de tamaño 512x512 pixels. La respuesta al impulso de un filtro puede
tener, aproximadamente, 10x10 puntos. Si la imagen, caracterizada por la señalf(m,n), fuera filtrada
mediante convolución directa, necesitaríamos realizar unas 100 multiplicaciones y 100 sumas por
muestra.

Una alternativa a la convolución es realizar la DFT inversa de F(k,l) AH(k,l) ( H(k,l) es


la respuesta en frecuencia del filtro ), donde el tamaño de la DFT se elige de forma que sea mayor o
igual que (512+10-1) x (512+10-1). Existen algoritmos FFT ( se verá en el próximo apartado ) que
efectúan DFT's bidimensionales directas e inversas de forma muy eficiente. Si se usan estos métodos
en los cálculos de DFT's directas e inversas, realizar la DFT inversa deF(k,l)AH(k,l) necesita menos
operaciones que realizar la convolución.

Un problema, sin embargo, es que se necesita la señalf(m,n) antes de calcular F(k,l) y


además, se deben almacenar F(k,l) y H(k,l) .

En el ejemplo que nos ocupa, el tamaño de la DFT ha de ser superior o igual a 521x521.

Como se comentará más adelante, los algoritmos FFT son más eficientes cuando el tamaño
tiene la forma 2 px2 q . Así, si p=q=9, el tamaño es 512x512 y, como necesitábamos, al menos, un
tamaño de 521x521, con p=q=10, obtenemos 2 10x210 = 1024x1024, es decir, un tamaño4 veces
superior al original.

Para reducir la cantidad de memoria y operaciones que se necesitan en este ejemplo, un


método consiste en usar DFT's directas e inversas de tamaño 512x512. Esto llevará al uso de
convoluciones circulares. Si la imagen no está degradada ni afectada por ruido, la convolución
circular proporciona buenos resultados, pero si no es así, la convolución circular origina efectos visibles
en los límites de la imagen.

Si suponemos que DFT's de tamaño 512x512 necesitan todavía demasiada memoria y además
queremos realizar convoluciones lineales pero aprovechando la eficiencia de los algoritmos FFT,
existen dos métodos que satisfacen estas necesidades: Método" overlap-add " y método" overlap-
save ". No entramos en la explicación de ambos métodos por apartarse de nuestro cometido.

Ya vimos en la propiedad de separabilidad (Ec. 2.8 ) que una DFT bidimensional (directa o
inversa) puede calcularse en dos pasos (como dos DFT's unidimensionales). Pues bien, ahora podemos
ver una demostración de que una DFT inversa puede tratarse como una DFT de la conjugada (si la
función es real):
Transformada de Fourier (Parte 2). Pagina 15

Partimos de la siguiente definición de DFT inversa:

[Se ha considerado una imagen cuadrada de dimensiónN]. Calculamos a continuación la conjugada


de f(m,n):
.

Si f es real, f *(m,n)=f(m,n). Entonces,


.

Es decir, f(m,n) puede escribirse como: f(m,n)=ö k,l{F*(k,l)}= ök{öl{F*(k,l)}}

A continuación, se incluye un algoritmo de cálculo de la DFT a modo de pseudocódigo. En el


Anexo D se encuentra la implementación de este algoritmo en lenguaje C.

Algoritmo 2.1: Cálculo de la DFT de una imagen cuadrada de dimensión N


Algoritmo DFT (IMAGEN, N, DFT_R, DFT_I)
Inicio
Para cada k desde 0 hasta N-1 hacer
Para cada l desde 0 hasta N-1 hacer
SUM_R 7 0
SUM_I 7 0
Para cada m desde 0 hasta N-1 hacer
Para cada n desde 0 hasta N-1 hacer
ARG 7 2BA (km+ln) / N
SUM_R 7 SUM_R + IMAGEN [m,n] A cos (ARG)
SUM_I 7 SUM_I + IMAGEN [m,n] A sen (ARG)
FinPara
FinPara
DFT_R [k,l] 7 SUM_R / N
DFT_I [k,l] 7 - SUM_I / N
FinPara
FinPara
Fin
Transformada de Fourier (Parte 2). Pagina 16

Significado de las variables empleadas


IMAGEN Matriz cuadrada de tamaño N ( Secuencia original )
N Dimensión de la imagen
DFT_R Variable que devuelve la parte real de la DFT

DFT_I Variable que devuelve la parte imaginaria de la DFT


k,l Indices para recorrer la tabla correspondiente a la transformada
m,n Indices para recorrer la tabla correspondiente a la imagen
SUM_R Variable que acumula los resultados parciales ( reales )
SUM_I Variable que acumula los resultados parciales ( imaginarios )
ARG Argumento de las funciones trigonométricas

El estudio llevado a cabo hasta este momento puede verse desde otro punto de vista: Puede
estudiarse de forma matricial. Así, la DFT puede usarse para determinar los autovalores de una matriz
Circulant ( matriz que sirve para realizar convoluciones circulares ). Partimos para ello de la
exponencial que interviene en la transformada discreta. Esta exponencial puede expresarse de forma
separable:
.

Llamamos a partir de ahora, por simplificar la notación,Wmk a . Análogamente,


a la otra exponencial, la
llamamos W n l . Estas
exponenciales son las
funciones base de esta
transformada.
Transformada de Fourier (Parte 2). Pagina 17

Figura 2.17: Diagrama fasorial que ilustra las N raíces de la unidad (N=8).

Cada factor puede describirse como solución a la ecuación WN=1. Esto indica que sólo hay
N raíces de la unidad distintas. En la siguiente figura podemos ver un diagrama de fasores que muestra
las N raíces de la unidad ( con N=8 ).

Los valores de W km para k,m=0,1,....., N-1 pueden disponerse en forma de matriz:

Figura 2.18: Matriz que representa la DFT para N=8.

Esta matriz es unitaria , es decir , el producto interno de cualquier columna / fila por el
conjugado de cualquier columna / fila es igual a cero, a no ser que las dos columnas / filas sean
idénticas.

La segunda expresión dada por ( 2.8 ) puede escribirse matricialmente como:

[A]=[B]A[C] 6 , donde:

Es decir, [Fml]=[f]A[W] ( 2.13 )

Y la primera expresión de ( 2.8 ) puede escribirse como [A]=[B]A[C] , siendo:


Transformada de Fourier (Parte 2). Pagina 18

De esta manera, se puede escribir la transformada como [Fkl]=(1/N) A[W]A[Fml] .


Sustituyendo en esta expresión la Ec. ( 2.13 ), queda:
[Fkl]=(1/N) A[W]A[f]A[W] ( 2.14 )

Por lo que la Ec. ( 2.14 ) calcula la DFT directa. Como la matriz [W] es unitaria y simétrica,
su inversa es igual a su conjugada.

La transformada inversa bidimensional se consigue por el mismo procedimiento, dejando al


lector la oportunidad de comprobarlo [ Se debe partir de la expresión def(m,n) análoga a la Ec. ( 2.8
) ]. Su expresión es: [f]=(1/N) A[W *]A[Fkl]A[W *] .

Hay que recordar que, por las fórmulas de Euler ( e ±j"=cos " ±jAsen" ), una exponencial
compleja puede expresarse en forma de senos y cosenos, en la que la parte real la forman los cosenos
y la parte imaginaria, los senos. Por esto, se pueden representar las componentes en coseno y en seno
de las funciones base de la transformada discreta de Fourier para una determinada dimensión ( N ).
En la siguiente figura se muestran estas componentes de las funciones base de la DFT unidimensional
para N=16. Vemos que las funciones base son una tosca aproximación a las formas sinusoidales
continuas. Además, pueden observarse redundancias entre estas componentes en seno y coseno.

Figura 2.19: Funciones base de la DFT unidimensional para N=16. A la izquierda, la parte imaginaria (
componente seno ) y a la derecha, la parte real ( componente coseno ).

Recordemos que el concepto de " función base " es equivalente a otros como " vector
base "o autovector o "imagen base "( matriz base ). Lo que hay que tener claro es que el concepto
es siempre el mismo; sólo varía la forma en que son representados:
Transformada de Fourier (Parte 2). Pagina 19

- La Fig. ( 2.19 ) muestra las funciones base de la DFT unidimensional para N=16.

- La representación de los vectores base de esta transformada paraN=8 es la mostrada en la siguiente


figura.

Figura 2.20: Vectores base de la DFT para N=8. El número de onda viene representado por " p ".
(a) Parte real ( componente coseno ) (b) Parte imaginaria ( componente seno ).

- Y las imágenes base son representaciones de los vectores o funciones base en forma de imagen o
matriz. Se verán imágenes base en posteriores capítulos.

APLICACIONES DE LA DFT

La DFT constituye una herramienta con aplicaciones en campos muy diversos, entre los que
se pueden citar los siguientes:

EXTRACCIÓN DE CARACTERÍSTICAS DE UNA IMAGEN A PARTIR DE SU DFT (1)


Transformada de Fourier (Parte 2). Pagina 20

Se pueden extraer características de una imagen bien observando directamente su DFT o bien
filtrando esta transformada parcialmente.

En la respuesta en frecuencia de una imagen, las altas frecuencias espaciales ( parte alta del
espectro ) corresponden a los contornos, bordes y detalles finos de la imagen ( zonas pequeñas ), y
las bajas frecuencias ( parte baja del espectro ) corresponden a las zonas grandes de la imagen.
Generalmente, la aparición de líneas aisladas informan de la orientación de un objeto en la imagen.
Las características de la transformada son especialmente útiles cuando las imágenes son
proporcionadas ya en el dominio transformado, como ocurre en los sistemas visuales, en los cuales
mediante una lente adecuada, se obtiene directamente su DFT.

(1) Aunque, en general, se pueden extraer características de cualquier transformada, se cita en este apartado por ser
la DFT una de las transformadas más extendidas.

La utilidad de estas transformadas está en que conociendo las transformadas de Fourier de varias
figuras sencillas ( cuadrados, rectángulos, rectas, círculos, .... ), podemos compararlas con la
transformada de Fourier de una imagen desconocida e intentar identificar objetos o incluso determinar
orientaciones. Por ejemplo, supongamos la Fig. 2.21(a):

Figura 2.21: (a) Imagen original (b) Módulo de su DFT .

Como vemos, se trata de una imagen que consta de varias rectas paralelas que forman un
ángulo 2 con la vertical. En su DFT ( Fig. 2.21(b) ), predomina una línea gruesa ( alta concentración
de energía ) formando un ángulo de 2+( B/2) con la vertical.

A continuación se ofrece una serie de imágenes con su DFT, de las que se pueden extraer
conclusiones importantes. Estas imágenes pueden clasificarse en: imágenes simples ( rectángulos,
elipses, líneas, rombos, .... ), imágenes periódicas ( "tablero de ajedrez ", mallas, .... ) y otras
representaciones geométricas.

A lo largo de esta colección de imágenes, se irán comentando las más representativas, pero
se propone al lector la interpretación de cada par de imágenes. Debe prestarse atención a cada
transformada, intentando identificar cada una de sus zonas o características con las de la imagen
original.
Transformada de Fourier (Parte 2). Pagina 21

Figura 2.22

Obsérvese la diferencia entre los espectros de la primera imagen ( un punto ) y la tercera ( dos
puntos dispuestos horizontalmente ). Hay que notar la diferencia de tamaños, además del espectro
discontinuo de la tercera imagen.

En cuanto al segundo par de imágenes, la línea espectral horizontal indica que la energía en la
imagen original se encuentra verticalmente ( línea vertical ).

Veamos la siguiente figura:


Transformada de Fourier (Parte 2). Pagina 22

Figura 2.23

Vemos que la primera imagen es discontinua tanto vertical como horizontalmente; de ahí que
el espectro se disponga en forma de " malla ".

Las dos aspas de la segunda imagen contribuyen a que el espectro tenga la forma " + ", y los
triángulos pequeños contribuyen a la formación en " x ".

Figura 2.24
Transformada de Fourier (Parte 2). Pagina 23

En la Fig. ( 2.24 ), como el rectángulo tiene mayor su dimensión vertical, la línea espectral
horizontal es más larga que la vertical.

En esta otra figura, como el espectro tiene ambas ramas iguales, podemos deducir que se trata
de un cuadrado.

Es interesante comparar estos dos últimos pares de imágenes con el fin de conocer el efecto
que provoca la aparición de figuras concéntricas.
Transformada de Fourier (Parte 2). Pagina 24

En la imagen original de la Fig. ( 2.30 ) se pueden observar zonas de diverso tamaño. Esto hace
que aparezcan frecuencias espaciales bajas ( debido a los cuadros grandes de la imagen ), medias (
debido a los cuadros medianos ) y altas ( debido a los cuadros pequeños ).

Figura 2.31

En esta figura se puede apreciar el efecto que provoca en el dominio de Fourier la escasa
separación entre las líneas. Esto hace que aparezcan frecuencias espaciales muy altas ( la imagen
original contiene detalles muy finos ). Como las separaciones se disponen horizontalmente, estas
frecuencias se encuentran en la dirección del eje horizontal.

Figura 2.32

En esta imagen cabe destacar que aparecerán frecuencias muy altas puesto que la imagen tiene
muchos cambios espaciales ( mucho detalle ).

Figura 2.33
Transformada de Fourier (Parte 2). Pagina 25

En la Fig. 2.33(a), vemos que hay líneas horizontales, que dan lugar a las rayas espectrales
verticales, y líneas oblícuas , que dependiendo de su sentido, darán lugar a rayas espectrales
perpendiculares en un sentido u otro.

Figura 2.34

Figura 2.35

Figura 2.36

Figura 2.37

Figura 2.38

Figura 2.39
Transformada de Fourier (Parte 2). Pagina 26

Debe prestarse atención a la diferencia entre las figuras 2.40 y 2.41.

Figura 2.40

Figura 2.41

Figura 2.42

Figura 2.43

Figura 2.44

Veamos ahora un par de imágenes algo más complejas para


ver qué tipo de características pueden obtenerse a partir de
sus DFT's:
Transformada de Fourier (Parte 2). Pagina 27

Figura 2.45: DFT's unitarias de imágenes. De izquierda a derecha y de arriba abajo: Imagen original ( de
alta resolución ); Su DFT; Imagen binaria; Su DFT.

En cuanto a la DFT de la primera imagen, podemos observar que contiene frecuencias altas,
por lo que la imagen original correspondiente se trata de una imagen con gran resolución ( imagen que
contiene detalles muy finos ). La escasa separación entre las líneas de la imagen original es la que
provoca precisamente la aparición de esas altas frecuencias.

En cuanto a la DFT de la segunda imagen, se aprecia que existen también altas frecuencias. Las
dos líneas paralelas que aparecen corresponden al carácter " / " de la imagen original.

Hasta ahora hemos visto que a partir del módulo de la DFT de una imagen es posible extraer
ciertas características de la misma. No ocurre así con el espectro de fase de la DFT. En la siguiente
figura se puede apreciar la fase de una imagen.

Figura 2.46: A la izquierda, imagen original; a la derecha, su fase.

A la vista de la fase de esta imagen (aunque ésta sea una imagen compleja), puede
comprenderse fácilmente que los espectros de fase no aportan información alguna.

Por último conviene resaltar la importancia que tiene esta aplicación en el tratamiento digital de
imagen, puesto que gracias a ella se pueden extraer conclusiones importantes sobre las características
más destacables que posee una determinada imagen. Y debe recordarse que estas conclusiones pueden
obtenerse o bien mediante una simple inspección de la DFT de la imagen o mediante el filtrado parcial
de esta DFT. En la siguiente aplicación pueden encontrarse diversos tipos de filtrado, así como diversos
ejemplos.
Transformada de Fourier (Parte 2). Pagina 28

CONVOLUCIÓN Y FILTRADO

Volviendo a la Fig. ( 2.15 ),f(m,n) es la imagen de entrada y g(m,n) es, por lo general, la
respuesta al impulso de un filtro. Para hallar la imagen resultante ( imagen filtrada ), es más sencillo
multiplicar los espectros de la imagen y el filtro.Así, se obtiene en el dominio de Fourier la función de
salida.

El último paso consiste en calcular la transformada inversa de este producto para recuperar la
imagen en el dominio espacial y ya filtrada.

Así, la convolución de las funciones f y g puede escribirse de esta manera:

f(m,n)*g(m,n)= ö -1{ F(k,l) AG(k,l) }.

El diseño del filtro (G(k,l) ) consiste en la selección del mismo para que satisfaga los requerimientos
concretos de una aplicación y su implementación. La implementación es un proceso prácticamente
directo. Sin embargo, hay que recordar varios puntos:

- La transformada de Fourier de una imagen limitada en el espacio ( tamaño finito ) es ilimitada


en frecuencia. Entonces, al limitar la ventana, ya de por sí se eliminan las frecuencias altas de la señal.
Es decir, conviene que la imagen a filtrar ocupe la mayor parte posible de la ventana para que su
espectro se reduzca al máximo.

- El filtro, en general, consta de partes real e imaginaria, aunque en la mayor parte de los casos,
se limitará a parte real.

- No conviene que el filtro presente bordes muy abruptos, pues el efecto " ringing " puede
llegar a distorsionar por completo el resultado.

- Siguiendo este método puede implementarse, en general, cualquier filtro que sea lineal.

Para obtener el filtro, lo más sencillo es partir de la respuesta en frecuencia unidimensional (


atenuación en función de la frecuencia ) y " rotarlo " 360º alrededor del eje de ordenadas, en la
frecuencia cero. De esta manera, la curva característica del filtro será una superficie circular que
corresponde al mismo filtro en su versión bidimensional. Por ejemplo, si partimos de un filtro de banda
eliminada, éste dará lugar a una corona circular, que representa la banda en frecuencias que será
eliminada.

Pero, ¿por qué no realizamos el filtrado en el dominio espacial?. Efectivamente, podríamos


realizar un filtrado espacial empleando el teorema de la convolución. El problema reside en que la
máscara de convolución tiene el mismo tamaño, en pixels, que la máscara del filtro en frecuencias, lo
que supondría convolucionar con una matriz de, aproximadamente el tamaño de la imagen, algo inviable
en tiempo.
Transformada de Fourier (Parte 2). Pagina 29

Resumiendo, son dos las características que hacen que el filtrado en el dominio de Fourier sea
una herramienta deseable:

1) Por un lado la flexibilidad, que nos permite diseñar cualquier tipo de filtro sin más que girar
una vuelta completa la respuesta en frecuencia unidimensional.

2) Por otro lado, se produce un ahorro de tiempo cuando se desea implementar un filtro poco
trivial, que no puede ser definido por una máscara de 3x3 ó 5 x5 pixels de lado.

En la transformada de Fourier de una imagen, tenemos una representación directa de las


componentes frecuenciales. Por consiguiente, podemos llevar a cabo un determinado tipo de filtrado
mediante la manipulación directa de estas componentes. A continuación veremos tres posibles tipos
de filtrado y trataremos algunas dificultades que pueden surgir:

El filtro ideal.

Un filtro ideal es aquel que deja pasar un determinado conjunto de frecuencias ( sin sufrir ningún
cambio ), mientras que bloquea o elimina completamente el resto. Estos filtros no pueden realizarse
directamente utilizando componentes electrónicos y todos los filtros prácticos distan mucho del ideal.
Esto presenta algunas características desagradables, como veremos.

Consideremos un filtro paso bajo. Este filtro toma el valor 1 desde el origen hasta una cierta
frecuencia Tc , a partir de la cual toma el valor 0.

Figura 2.47: (a) Filtro ideal de radio 60 pixels (b) Logaritmo del módulo de la DFT del tren (c) Versión
filtrada de (b) (d) Imagen tras la transformación inversa ( imagen filtrada ).
Transformada de Fourier (Parte 2). Pagina 30

La Fig. 2.47(a) muestra un filtro de tamaño 512x512 pixels, de los cuales, los que están fuera
de un radio de 60 no han sido eliminados. En esta imagen, el blanco representa una atenuación nula del
filtro y el negro representa el 100% de atenuación. Si realizamos una transformada óptica de la imagen
que pretendemos filtrar y multiplicamos esta transformada por el filtro, fijaremos a cero todos los
componentes de la transformada de frecuencia mayor queTc. La transformada, y por tanto la imagen
después de la transformación inversa ( regreso al dominio espacial) ha sido " filtrada paso bajo ".

La Fig. 2.47(b) muestra la DFT de la imagen del tren. El círculo brillante indica el área de la
transformada que se mantendrá invariable después del filtrado. La figura representa el logaritmo del
espectro para que puedan apreciarse las altas frecuencias. Sin embargo, conviene señalar que el filtrado
tiene lugar sobre la propia transformada, y no sobre su logaritmo.

La Fig. 2.47(c) muestra la tranformada después del filtrado. Claramente, todas las
componentes fuera del radio del filtro se han fijado a cero.

Por último, la Fig. 2.47(d) presenta el resultado de la transformación inversa en el dominio


espacial, donde se observa que la imagen ha sido suavizada.

El filtro raíz.

El filtro ideal utiliza un método simple, pero drástico, para reducir la amplitud de las altas
frecuencias de la imagen. Un modo bastante más delicado de enfocar la cuestión es reducir la amplitud
de las altas frecuencias con respecto a la de las bajas. Por ejemplo, las raíces de una serie de valores
presentan un rango dinámico más bajo que los propios valores. La Fig. ( 2.48 ) expone una serie de
valores y sus correspondientes raíces cuadradas.

x 1 4 9 16 25 36 49 64

/x 1 2 3 4 5 6 7 8

Figura 2.48

Vemos que los valores tienen un rango dinámico de 64, mientras que el de las raíces cuadradas
es de sólo 8. La consecuencia de esta reducción en el rango dinámico es que los valores de baja
amplitud se han incrementado en relación con los de amplitud mayor.

Ya hemos visto que las componentes de alta frecuencia de la DFT tienden a tener bajas
amplitudes. Por lo tanto, es necesario reducir el rango dinámico del espectro para que tales frecuencias
se puedan ver. Por consiguiente, aplicando la raíz cuadrada al módulo de la DFT, tenderemos a
incrementar la baja amplitud de las altas frecuencias con respecto a la elevada amplitud de las bajas
frecuencias.
Transformada de Fourier (Parte 2). Pagina 31

Esta es la base del filtro raíz que, de esta manera, puede considerarse como un filtro paso alto
o de perfilado (provoca el efecto de agudizar los detalles finos de la imagen). Podemos expresar el filtro
raíz en el dominio de Fourier como:

( 2.15 )
En la Fig. 2.49(a) queda reflejado el efecto del filtrado raíz de la imagen del tren con "=0.5
(filtro raíz cuadrada).

Figura 2.49: (a) Filtrado raíz del tren con "=0.5 (b) Con "=1.5 (c) Con "=0.

Aunque hemos hablado de este filtro como filtro raíz, valores de " mayores que 1 permitan una
cierta flexibilidad de este filtro que lo hace más potente. Invirtiendo el razonamiento del filtro raíz para
"<1, cabe esperar que si">1, tendremos un filtro "raíz "que será paso bajo, ya que incrementará la
elevada amplitud de las bajas frecuencias con respecto a la escasa amplitud de las altas frecuencias.
La Fig. 2.49(b) presenta el efecto provocado para "=1.5. El filtro produce, en efecto, un suavizado
en la imagen.

Como último ejemplo del filtro raíz, consideramos el caso en que"=0. Esto tiene el efecto de
forzar a que la amplitud de cada componente sea la misma, la unidad. Por lo que cualquier variación
que aparezca en el resultado del dominio espacial se deberá totalmente al efecto de la fase. La Fig.
2.49(c) muestra el efecto de este tipo de filtrado raíz aplicado sobre la imagen del tren. Se observa que
el contorno de la locomotora es perceptible a pesar de que esta imagen fué reconstruida esencialmente
sin ninguna información de amplitud.

El cepstrum generalizado.

Ya hemos usado logaritmos para reducir el rango dinámico del espectro de Fourier con el
objetivo de distinguir los detalles finos ( altas frecuencias ) de la imagen transformada. También hemos
visto que el filtrado paso alto puede realizarse mediante la reducción del rango dinámico del módulo
de la transformada empleando el filtro raíz.
Transformada de Fourier (Parte 2). Pagina 32

El cepstrum generalizado ( alteración de varias letras de spectrum ( espectro ) ) de una


imagen se lleva a cabo de la misma forma que el filtrado raíz, pero en lugar de tomar la raíz del módulo,
se toma el logaritmo. Podemos expresar, por tanto, la operación en el dominio de Fourier como:
( 2.16 )
De nuevo, esta operación es un filtro paso alto. La Fig. 2.50(b) ilustra el cepstrum generalizado
de la imagen del tren.

Figura 2.50: (a) Imagen original (b) Cepstrum generalizado de (a).

A continuación, se muestran las respuestas en frecuencia de algunos filtros típicos:


Transformada de Fourier (Parte 2). Pagina 33

Figura 2.51: (a) Respuesta al impulso del filtro (b) Respuesta en frecuencia del filtro ( Módulo de la DFT de
la respuesta al impulso ) ( Filtro Paso Bajo ).

Hay que notar que en en la Fig. 2.51(a), los coeficientes de la respuesta al impulso ( máscara
espacial ) suman la unidad. Esto significa que se trata de unamáscara de media espacial, lo que
equivale en el dominio de Fourier, a un filtro paso bajo ( Fig. 2.51(b) ). La aplicación de un filtro
paso bajo ( atenúa las altas frecuencias ) a una imagen hará que ésta quede difuminada, suavizada.

Figura 2.52: (a) Respuesta al impulso del filtro (b) Respuesta al impulso separada en dos funciones
unidimensionales (c) Respuesta en frecuencia del filtro ( Módulo de la DFT de la respuesta al impulso )
( Filtro Paso Alto ).

La aplicación de un filtro paso alto (atenúa las componentes de baja frecuencia) a una imagen
hará que en ésta queden resaltados los detalles (altas frecuencias). Es útil además, en detección de
bordes.

En la siguiente figura, aparece la respuesta al impulso correspondiente a un filtro paso bajo ideal
de simetría circular (cilindro).
Transformada de Fourier (Parte 2). Pagina 34

Figura 2.53: Respuesta al impulso de un filtro paso


bajo ideal de simetría circular [Función SINC]
( DFT inversa de la respuesta en frecuencia de
dicho filtro ).

Para comprobar el efecto de los filtros paso bajo, paso alto y paso banda, consideremos la
siguiente figura:

Figura 2.54: Filtrado lineal generalizado utilizando la DFT. Para cada uno de los tres grupos de imágenes,
se encuentran de izquierda a derecha y de arriba abajo: Imagen original, imagen filtrada paso bajo, imagen
filtrada paso banda e imagen filtrada paso alto.

Obsérvese el suavizado ya comentado que provoca la aplicación de un filtro paso bajo a cada
una de las imágenes mostradas. Debe notarse que en el tercer grupo de imágenes, el carácter " / "
aparece muy distorsionado. Esto es así porque la forma de este carácter genera altas frecuencias, por
lo que éstas serán eliminadas tras el filtrado paso bajo.

El filtro paso banda permite obtener las zonas de frecuencias medias ( elimina las frecuencias
altas y bajas ), mientras que el filtro paso alto obtiene las altas frecuencias.

En las siguientes figuras, podemos ver tres pares de transformadas en cada uno de los cuales,
la figura de la izquierda representa la imagen original y la de la derecha, el módulo de su DFT. Pero por
dualidad, también puede considerarse ( y de hecho es más interesante interpretarlo así ) que la figura
Transformada de Fourier (Parte 2). Pagina 35

de la izquierda es la respuesta en frecuencia ( módulo de la DFT ) y la de la derecha, la respuesta al


impulso correspondiente.

Figura 2.55: A la izquierda, función bidimensional. A la derecha, representación logarítmica del módulo de su
DFT ( o viceversa, sin tener en cuenta el tomar logaritmo ).

Figura 2.56: A la izquierda, función bidimensional. A la derecha, el módulo de su DFT ( o viceversa ).

Figura 2.57: A la izquierda, función bidimensional. A la derecha, el módulo de su DFT ( o viceversa ).


Transformada de Fourier (Parte 2). Pagina 36

BÚSQUEDA DE PATRONES (CORRELACIÓN )

La correlación es útil para la búsqueda de patrones de imagen y el seguimiento de objetivos,


donde el problema radica en encontrar el punto de la segunda imagen donde más se parece a la
primera. Este punto puede localizarse como el valor máximo def(m,n)Bg(m,n). La expresión de la
correlación ( Ec. ( 2.12 ) ) es muy parecida a la de la convolución ( Ec. ( 2.11 )).

La correlación, al final, no deja de ser una convolución en la que una señal se conjuga y la otra
señal no se refleja.

En una correlación, es necesario un gran número de operaciones. Por esto, para señales con
una dimensión grande o media, es aconsejable efectuar esta operación en el dominio de la frecuencia.
Así, la transformada de Fourier ofrece un método asequible en tiempo y cálculos, de determinar el
punto de una imagen donde se localiza un objeto conocido. Entonces, la correlación entre dos imágenes
f(m,n) y g(m,n) la efectuaríamos de esta manera: f(m,n) B g(m,n)= ö -1{F *(k,l) AG(k,l)}.

Esta última expresión representa un mapa de correlación que marca, como un máximo global,
el desplazamiento relativo entre ambas imágenes, siendo el valor del máximo un indicador del parecido
entre ambas.

DESCRIPTORES DE FOURIER

Los descriptores de Fourier son un conjunto de valores complejos que ayudan a la definición
de objetos, independientemente de su posición, orientación o tamaño, y que se aplican
fundamentalmente al campo del reconocimiento de formas.

La Fig. ( 2.58 ) muestra un objeto cualquiera, cuyo contorno se describe por una serie de
puntos que vienen dados por sus coordenadas.

Figura 2.58: Contorno de un objeto.


Transformada de Fourier (Parte 2). Pagina 37

Si consideramos estas coordenadas como valores complejos, obtendremos una secuencia de


números cuya transformada discreta de Fourier recibe el nombre dedescriptores de Fourierdel
contorno del objeto.

Así, cualquier contorno puede definirse por medio de los descriptores de Fourier de los puntos
que lo componen.

Debido a que la transformada de Fourier es un proceso esencialmente reversible,no se pierde


información en el paso de los puntos a sus descriptores. Además, ciertas manipulaciones sencillas a la
representación del objeto en el dominio de la frecuencia permiten eliminar dependencias del mismo con
respecto al tamaño, posicióny orientación. Esto se conoce con el nombre denormalización de los
descriptores de Fourier.

La normalización en tamaño obedece a la propiedad de la transformada de Fourier, según la


cual un cambio en las dimensiones del objeto se logra sin más que multiplicar sus descriptores de
Fourier por una constante.

Para girar el objeto, basta con multiplicar la secuencia de descriptores por una fase e j2, donde
2 representa el valor del ángulo de giro.

La normalización en posición se alcanza sin más que considerar que un desplazamiento en el


dominio espacial se logra sumándole una fase lineal a la secuencia de descriptores.

Así pues, los descriptores de Fourier constituyen un método válido para representar contornos,
si bien topan con el obstáculo de requerir un muestreo uniforme, en distancia, sobre el perímetro del
objeto a representar. Otros problemas van asociados al requisito del algoritmo FFT, que precisa 2 n
muestras para operar correctamente, obligando a muestrear el contorno según este criterio. El ruido
de cuantificación y su efecto sobre el contorno recuperado es otra desventaja de este método frente
a otros más utilizados, como es el de los momentos.

OTRAS APLICACIONES

Hay otras muchas aplicaciones de la DFT en el tratamiento de imagen. Entre ellas, se citan las
siguientes:

- Filtro inverso. Se trata de una técnica de restauración que intenta corregir las deficiencias que
se producen en un sistema de adquisición de imágenes.

- Filtro Wiener. Es otra técnica de restauración para corregir las deficiencias que aparecen al
adquirir una imagen.
Transformada de Fourier (Parte 2). Pagina 38

- " Mapeado " de la transformada.Se trata de una técnica de compresión basada en la


representación de la imagen en el dominio de Fourier.

Como se ha visto, la DFT es una transformada muy útil que encuentra muchas aplicaciones
en el tratamiento de imágenes. Se trata de una transformada que ofrece muchas facilidades, de ahí que
sea una de las más extendidas.

La DFT es la transformada que lleva a la práctica la teoría de la transformada de Fourier


continua, debido a que puede calcularse a través de un ordenador ( ya que se trabaja con secuencias
finitas, que son las que representan a las imágenes ). De hecho, se suelen emplear algoritmos FFT, que
necesitan calcular DFT's directas e inversas.

La importancia de la DFT hace que ésta aparezca en posteriores análisis: Además de la citada
aparición en los algoritmos FFT, la transformada discreta del coseno ( DCT ) está muy relacionada con
la DFT. La transformada de Fourier aparecerá, como veremos más adelante, en transformadas como
la de Mellin, Hilbert, Radon o Hartley.

Como último apunte, conviene recordar que la representación en el dominio de Fourier de una
imagen constituye una perspectiva diferente de la misma. Además, otra ventaja de trabajar en el
dominio de la frecuencia es la posibilidad de definir con exactitud el filtro a aplicar, según las
necesidades, y sus parámetros.

SÍNTESIS
* La DFT representa a una secuencia finita en el dominio de la frecuencia con un número finito de valores, por lo que
se trata de una aproximación a la transformada de Fourier continua.

* No debemos preocuparnos por la existencia de la DFT, puesto que ésta siempre existe.

* La representación logarítmica del módulo de la DFT facilita en gran medida su interpretación visual.

* El par transformado DFT es separable, es decir, que una DFT bidimensional puede tratarse como dos DFT's
unidimensionales.

* Las funciones base de la DFT son funciones exponenciales complejas y por tanto, separables en parte real (
componentes en coseno ) y parte imaginaria ( componentes en seno ).

* La DFT puede calcularse eficientemente mediante algoritmos FFT.


Transformada de Fourier (Parte 2). Pagina 39

* Por último, recordemos sus principales aplicaciones: extracción de características, filtrado, convolución, búsqueda
de patrones de imágenes ( correlación ), descripción de los contornos de los objetos ( descriptores de Fourier ).

You might also like