You are on page 1of 7

ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA 299004 PROCESAMIENTO DIGITAL DE SEALES Actividad 07: Reconocimiento Unidad 2

WAVELETS Las wavelets son funciones definidas sobre un intervalo finito y con valor medio cero. La idea bsica de la transformada wavelet es representar arbitrariamente una funcin como superposicin de un conjunto de wavelets o funciones bsicas. Estas wavelets se obtienen a partir de una wavelet prototipo denominada wavelet madre, mediante dilataciones, escalados y traslaciones. Se pueden aplicar a todo tipo de problemas sobre el procesado de la seal: eliminacin de ruidos, sismologa, msica, criminologa y visin, entre otras. A menudo, las wavelets se utilizan como alternativa al anlisis de Fourier. Por ejemplo, en la base de datos de huellas digitales del FBI, las wavelets reemplazan la tcnica de Fourier con JPEG. TRANSFORMADA WAVELET DISCRETA La transformada wavelet discreta (DWT) se emplea para obtener una nueva representacin de la imagen, ms apropiada para el proceso de compresin. EMBEDDED ZERO-TREE WAVELET El mtodo de compresin EZW fue propuesto por Shapiro en 1993. Este mtodo de compresin se aprovecha de las propiedades aportadas por la DWT para obtener unos resultados satisfactorios en la compresin. El EZW es sensible a la significancia del grupo de bits transmitidos. Adems, consigue altas tasas de compresin con unas buenas calidades en las imgenes reconstruidas. ALGORITMO SPIHT El mtodo de compresin Set Partitioning In Hierarchical Trees no es una simple ampliacin de los mtodos tradicionales de compresin, sino que representa un gran avance en este campo. El SPIHT se aprovecha de las ventajas aportadas por la utilizacin de las wavelets. Al igual que el EZW permite la transmisin progresiva de la informacin por orden de bits ms significativos, y tambin logra imgenes con una gran calidad y altas tasas de compresin. ANLISIS DE SEALES MEDIANTE WAVELETS Las tcnicas de anlisis wavelet emplean regiones de tamao variable, para el anlisis de las seales deja usar durante largo tiempo intervalos donde se necesita mucha informacin que precisa poca frecuencia y pequeas regiones donde la informacin necesita altas frecuencias.

ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA 299004 PROCESAMIENTO DIGITAL DE SEALES Actividad 07: Reconocimiento Unidad 2

Esquema del anlisis wavelet. El anlisis wavelet es capaz de mostrar aspectos de la seal que otras tcnicas no logran encontrar. TRANSFORMADA WAVELET La transformada wavelet consiste en comparar la seal con ciertas funciones wavelet, las cuales se obtienen a partir de las wavelet madre. La comparacin permite obtener unos coeficientes que son susceptibles de interpretacin y posterior manipulacin. En cualquier caso, un requisito bsico es la posibilidad de invertir la transformada, recuperando la seal a partir de esos coeficientes wavelet calculados. Wavelet madre creada por Daubechies TRANSFORMADA WAVELET DISCRETA (DWT) El clculo de la transformada wavelet para todas las posibles escalas supone una gran cantidad de informacin. Escoger solo aquellas escalas y posiciones que resulten interesantes para ciertos estudios es una tarea difcil. Si se escogen aquellas escalas y posiciones basadas en potencias de dos, los resultados sern ms eficaces. Este anlisis se denomina DWT. Para muchas seales la informacin ms importante se encuentra en las frecuencias bajas, mientras que en las altas frecuencias se encuentran los detalles o matices de la seal. Por ejemplo, en el caso de la voz humana, si eliminamos los componentes con altas frecuencias, la voz suena diferente pero se sigue entendiendo su mensaje. En cambio, si lo que se elimina son las componentes de bajas frecuencias, el mensaje se vuelve irreconocible. Por eso el anlisis wavelet permite descomponer la seal en aproximaciones y detalles, a ste

ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA 299004 PROCESAMIENTO DIGITAL DE SEALES Actividad 07: Reconocimiento Unidad 2

proceso se le conoce con el nombre de anlisis. Este filtrado nos proporciona el doble de datos de los que son necesarios, este problema se soluciona con la operacin de downsampling.

Proceso de descomposicin (anlisis). El proceso de reconstruccin, tambin denominado sntesis, se encarga de la obtencin de la seal a partir de los detalles y aproximaciones. ste proceso se lleva a cabo con la transformada wavelet discreta inversa.

La eleccin de los filtros (wavelets) influye notablemente en los resultados finales. La DWT aplicada a imgenes proporciona una matriz de coeficientes, conocidos como coeficientes wavelet. Si a una imagen le aplicamos la DWT obtenemos cuatro tipos de coeficientes: aproximaciones, detalles horizontales, detalles verticales y detalles diagonales. La aproximacin contiene la mayor parte de la energa de la imagen, es decir, la informacin ms importante, mientras que los detalles tienen valores prximos a cero.

ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA 299004 PROCESAMIENTO DIGITAL DE SEALES Actividad 07: Reconocimiento Unidad 2

La eleccin de las wavelets analizadoras juega un papel muy importante en los resultados finales. Entre las caractersticas ms importantes a tener en cuenta se encuentran: soporte compacto, simetra, etc. Las wavelets biortogonales son las ms eficientes para un posterior proceso de compresin, y en particular, aquellas con pocos coeficientes, ya que el coste de obtencin de los coeficientes se incrementa con su nmero. ORGANIZACIN DE LOS COEFICIENTES WAVELET Generalmente, la energa de las imgenes se concentra en las frecuencias bajas. Una imagen tiene un espectro que se reduce con el incremento de las frecuencias. Estas propiedades de las imgenes quedan reflejadas en la transformada wavelet discreta de la imagen. Los niveles ms bajos de compresin se corresponden con las bandas de alta frecuencia. En particular, el primer nivel representa la banda de ms alta frecuencia y el nivel ms fino de resolucin. A la inversa, el ltimo nivel (n) de descomposicin corresponde con la banda de frecuencia ms baja y la resolucin ms tosca. As, al desplazarse de los niveles ms altos a los ms bajos, o sea, de baja resolucin a alta resolucin, se observa una disminucin de la energa contenida en las sub-bandas recorridas. Si los coeficientes wavelet obtenidos por medio de la transformada wavelet discreta (DWT) para un nivel concreto poseen pequeas magnitudes (valores prximos a cero), se espera que esos coeficientes wavelet estn en los primeros niveles de descomposicin. El aumento del nivel de descomposicin wavelet produce unos coeficientes con mayores magnitudes. Adicionalmente, se puede comprobar como existen similitudes espaciales a travs de las subbandas.

ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA 299004 PROCESAMIENTO DIGITAL DE SEALES Actividad 07: Reconocimiento Unidad 2

Imagen original de Barbara.

Organizacin de los coeficientes wavelet.

En la figura anterior se puede observar los contornos de Brbara en los distintos niveles y cmo son ms bastos en el primer nivel de descomposicin, adems de cierta similitud entre los distintos niveles. REDUNDANCIA DE DATOS Hay que resaltar la diferencia entre informacin y datos, ya que en muchas ocasiones se utilizan como sinnimos y no lo son. Los datos son una forma representar la informacin; as, una misma informacin puede ser representada por distintas cantidades de datos. Por tanto, algunas representaciones de la misma informacin contienen datos redundantes. La compresin de datos se define como el proceso de reducir la cantidad de datos necesarios para representar eficazmente una informacin, es decir, la eliminacin de datos redundantes. En el caso de las imgenes, existen tres maneras de reducir el nmero de datos redunda ntes: eliminar cdigo redundante, eliminar pxeles redundantes y eliminar redundancia visual. CDIGO REDUNDANTE El cdigo de una imagen representa el cuerpo de la informacin mediante un conjunto de smbolos. La eliminacin del cdigo redundante consiste en utilizar el menor nmero de smbolos para representar la informacin. Las tcnicas de compresin por codificacin de Huffman y codificacin aritmtica utilizan clculos estadsticos para lograr eliminar este tipo de redundancia y reducir la ocupacin original de los datos.

ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA 299004 PROCESAMIENTO DIGITAL DE SEALES Actividad 07: Reconocimiento Unidad 2

PIXELES REDUNDANTES La mayora de las imgenes presentan semejanzas o correlaciones entre sus pxeles. Estas correlaciones se deben a la existencia de estructuras similares en las imgenes, puesto que no son completamente aleatorias. De esta manera, el valor de un pxel puede emplearse para predecir el de sus vecinos. REDUNDANCIA VISUAL El ojo humano responde con diferente sensibilidad a la informacin visual que recibe. La informacin a la que es menos sensible se puede descartar sin afectar a la percepcin de la imagen. Se suprime as lo que se conoce como redundancia visual. La eliminacin de la redundancia esta relacionada con la cuantificacin de la informacin, lo que conlleva una prdida de informacin irreversible. Tcnicas de compresin como JPEG, EZW o SPIHT hacen uso de la cuantificacin. CLASIFICACIN Los mtodos de compresin se pueden agrupar en dos grandes clases: mtodos de compresin sin prdida de informacin y mtodos con prdida de informacin. LOSSLESS Los mtodos de compresin sin prdida de informacin (lossless) se caracterizan porque la tasa de compresin que proporcionan est limitada por la entropa (redundancia de datos) de la seal original. Entre estas tcnicas destacan las que emplean mtodos estadsticos, basados en la teora de Shannon, que permite la compresin sin prdida. Por ejemplo: codificacin de Huffman, codificacin aritmtica y Lempel-Ziv. Son mtodos idneos para la compresin dura de archivos. LOSSY Los mtodos de compresin con prdida de informacin (lossy) logran alcanzar unas tasas de compresin ms elevadas a costa de sufrir una prdida de informacin sobre la imagen original. Por ejemplo: JPEG, compresin fractal, EZW, SPIHT, etc. Para la compresin de imgenes se emplean mtodos lossy, ya que se busca alcanzar una tasa de compresin considerable, pero que se adapte a la calidad deseada que la aplicacin exige sobre la imagen objeto de compresin. JPEG (Joint Photographic Experts Group) es el mtodo de compresin ms utilizado actualmente para la compresin de imgenes con prdida. Este mtodo utiliza la transformada discreta del coseno (DCT), que se calcula empleando nmeros enteros, por lo que se aprovecha de algoritmos de computacin veloces. El JPEG consigue una compresin ajustable a la calidad de la imagen que se desea reconstruir.

ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA 299004 PROCESAMIENTO DIGITAL DE SEALES Actividad 07: Reconocimiento Unidad 2

TRANSFORMADA DISCRETA DEL COSENO La imagen de entrada es dividida en bloques de NxN pxeles. El tamao del bloque se escoge considerando los requisitos de compresin y la calidad de la imagen. En general, a medida que el tamao del bloque es mayor, la relacin de compresin tambin resulta mayor. Esto se debe a que se utilizan ms pxeles para eliminar las redundancias. Pero al aumentar demasiado el tamao del bloque la suposicin de que las caractersticas de la imagen se conservan constantes no se cumple, y ocurren algunas degradaciones de la imagen, como bordes sin definir. Los resultados en la experimentacin han demostrado que el tamao del bloque ms conveniente es de 8x8 pxeles. CUANTIFICACIN Los coeficientes de la transformada son cuantificados en base a un nivel de umbral para obtener el mayor nmero de ceros posibles. Para la cuantificacin se utiliza una matriz de normalizacin estndar, y se redondean los resultados a nmeros enteros. Este es el proceso donde se produce la prdida de informacin. El paso siguiente consiste en reordenar en zig-zag la matriz de coeficientes cuantificados. CODIFICACIN Codificando con longitud variable los coeficientes, la imagen se puede comprimir an ms. El codificador ms utilizado es el algoritmo de Huffman, que se encarga de transmitir los coeficientes ordenados. Una razn para utilizar el codificador de Huffman es que es fcil de implementar. Para comprimir los smbolos de los datos, el codificador de Huffman crea cdigos ms cortos para smbolos que se repiten frecuentemente y cdigos mas largos para smbolos que ocurren con menor frecuencia. Imagen sin comprimir Imagen comprimida con JPEG

http://coco.ccu.uniovi.es/immed/compresion/descripcion/fundamentos/fundamentos.htm