You are on page 1of 5

Diseo de algoritmo de compresin /descompresin de audio utilizando la transformada Wavelet.

Cesar Paladines#1, Carlos Valdivieso#1, Katty Rohoden#2


#1

Profesionales en formacin, Universidad Tcnica Particular de Loja #2 Docente EET, Universidad Tcnica Particular de Loja Loja, Ecuador

capaladines1@utpl.edu.ec,1cavaldivieso@utpl.edu.ec,2karohoden@utpl.edu.ec

Resumen.- El siguiente trabajo fue realizado por dos estudiantes de la escuela de electrnica y telecomunicaciones en la materia de Transmisin de datos, como proyecto de fin de bimestre. Palabras clave.- Cdec, Compresin/descompresin pulmonares. Transformada de audio, wavelet, sonidos

necesaria para conseguir una cierta calidad de seal) es un criterio de diseo importante. C. Calidad de la seal decodificada En algunas aplicaciones se precisa calidad transparente (no existe diferencia audible entre la seal original y la seal decodificada) o casi transparente. Para asegurar esta calidad el sistema de codificacin debe superar pruebas de calidad muy exigentes.[2]

I.

INTRODUCCION D. Editabilidad Desde el punto de vista de codificacin el requisito de editabilidad est relacionado con el de break-in, y consiste en la posibilidad de comenzar la decodificacin en cualquier punto de la secuencia de bits sin que esto suponga un elevado tiempo de sincronizacin. III. METODOLOGA

En el siguiente trabajo se resume la realizacin de un cdec para compresin/descompresin de audio. Es necesario introducirse en la codificacin y decodificacin en la trasmisin de datos, con la finalidad de enviar la informacin con diferente tamao, facilitando as la forma y la capacidad de los canales a transmitir. II. MARCO TEORICO A. Requisitos de los sistemas de codificacin de audio A la hora de definir un sistema de codificacin de audio, es necesario tener en cuenta los requisitos que se le piden. Dependiendo de la aplicacin, algunos de ellos sern ms relevantes que otros. Los principales criterios que se tienen en cuenta a la hora de disear un esquema de codificacin perceptual son los siguientes: B. Eficiencia de compresin En muchas aplicaciones, obtener la mayor tasa de compresin para la misma calidad de servicio se traduce directamente en ahorro de costes. Por tanto, la calidad de seal para una tasa binaria dada (o la tasa binaria

Segn la tcnica de compresin de la transformada de wavelet se deber seguir los pasos a consideracin. Descomposicin del sonido utilizando wavelet Anlisis de los coeficientes de detalle y aproximacin Quantizacion de los coeficientes de detalle y aproximacin Desquantizacion de los coeficientes de detalle y aproximacin Recuperacin de la seal

Se realiz la descomposicin de la seal descomponiendo las frecuencias de alta frecuencia y eliminndolos mediante filtros pasa bajas, los mismos

que a su vez dividirn a la seal en los coeficientes de aprocimacion y de detalle.

propios de esta transformada (coeficientes de detalle y de aproximacin). Con la transformada y filtros pasa-bajas y pasa-altas se divide la seal en los coeficientes de aproximacin y de detalle, esta seal 'Broncovesicular normal.wav' se sac 11025 bits por segundo con cada muestra de 8 bits. A continueacion se resume el cdigo que se utilizo en software MATLAB. Introduccin de la seal de Audio, de la seal WAV en un vector de q contiene la informacin del sonido .WAV (seal de entrada, frecuencia de muestreo, y bits por muestra).

Fig. 1 Descomposicin wavelet en rbol Una vez configurado los coeficientes de aproximacin y de detalle se procede a cuantizar a los mismos que se les ubicar un nmero correspondiente de bits. En la siguiente figura se muestra como se cuantiza los coeficientes, y el mtodo que se sigue. clear all; clc; [Y,Fs,Bit]=wavread('Broncovesicular normal.wav'); f=length(Y); rep=f/220; i=0; Con los comandos appcoef y detcoef se procede a calcular los coeficientes de aproximacin y de detalle de la seal de entrada y el tipo de wavelet a utilizar as tambin el nivel de descomposicin, por esta razn el nivel desciende en cada reduccin, ya que se utiliza la transformada wavelet en rbol. En nuestro caso los coeficientes de detalle son los que nos interesan por trabajar ya que estn para bajas frecuencias. cA5=appcoef(C,L,'sym2',5); coeficientes de aproximacin cD5= detcoef(C,L,5); coeficientes de detalle cD4= detcoef(C,L,4); cD3= detcoef(C,L,3); cD2= detcoef(C,L,2); cD1= detcoef(C,L,1); % %

Fig. 2 Algoritmo de cuantizacion que se utiliz [7] IV. MATERIALES A. MATLAB El software que utilizamos para realizar nuestro algoritmo es MATLAB por su facilidad para realizar clculos con matrices las cuales son el resultado de descomponer los sonidos. El mtodo que utilizaremos esta dado mediante la transformada de wavelet, con el mtodo de SYMLET, Se descompone el sonido original en sub-bandas, mediante procesos de diezmacion y con ayuda de coeficientes

Al final de la suma y de la rutina, se obtiene la nueva seal descomprimida y se la transcribe en un lugar en especfico. Se grafica los espectros de las imgenes en el dominio del tiempo y su parecido a la seal original, as se muestra tambin la tasa de compresin que indica las veces que se comprime las seales. wavwrite(XX,Fs,Bit,'C:\Users\Us uario\Desktop\8vo ciclo\Transmision\pruebas codigo\codificacion_wavelet\son ido');

wavplay(X,Fs) figure(3) plot(X) grid on Nombre

Tabla 1. Sonidos de bases de datos

Tamao Original 72,0 KB 448 KB 256 KB 48,0 KB

Tamao compreso 39,1 KB 78,1 KB 78,1 KB 39,1 KB

Taza de Compresin 5.5153 5.0231 4.5396 5.0135

Broncovesicular normal Bronquial normal Dificul expirat Friction

Tabla 2. Sonidos despus de la compresion

C. Editor Fig. 3 Grafica de la compresa en el dominio del tiempo. Se realizara tambin la comparacin con un algoritmo de compresin sin perdidas llamado MP3-qualitymodifier, el cual nos va a permitir evaluar la tasa de cambio de tamao de la seal.

Fig. 4 Grafica de la seal descomprimida en el dominio del tiempo.

Fig. 5 Interface grfica del software MP3-qualitymodifier [9]

B. Bases de Datos Como ya se mencion en avances anteriores, nuestra base de datos se la obtuvo de un software especializado en sonidos respiratorios el cual es utilizado por mdicos profesionales. Este software se llama R.A.L.E. Lung Sounds Nuestra base de datos consta de 4 sonidos respiratorios diferentes, los cuales se describen a continuacin: Nombre Broncovesicular normal Bronquial normal Dificul expirat Friction Tamao 72,0 KB 448 KB 256 KB 48,0 KB Frecuencia de Muestreo 11025 Hz 22050 Hz 22050 Hz 11025 Hz Bits 8 16 16 8

V. RESULTADOS A, Estudio de los mtodos de validacin Para comprobar la capacidad de nuestro algoritmo de compresin de audio es necesario validarlo comparndolo con tcnicas de compresin ya establecidas. Las tcnicas de validacin que utilizaremos deben cumplir con los siguientes pasos, lo haremos con una elaboracin metdica: Establecer una validacin apropiada para los algoritmos, de manera que se pueda ver el resultado de la compresin. Utilizar tcnicas de validacin que estn acorde con el desarrollo del algoritmo, es decir hacerlo con algoritmos ya probados y reconocidos. El mtodo que utilizo otro desarrollador de

algoritmos de compresin con wavelets es el de descomposicin de Wavelets en rbol, el cual obtiene en un sonido de una duracin de 3 segundos la siguiente tasa de compresin. Tomado en cuenta el mtodo que se utiliz para realizar el algoritmo es necesario comparar los resultados y hacer las conclusiones necesarias. En la siguiente tabla podemos apreciar las tasas de compresin, entre los siguientes algoritmos. Algoritmo de compresin de audio ya realizado. (Sonido Bronco vesicular Normal.wav).

Tabla 6. ALgoritmo realizado por los autores

Se realizara tambin la comparacin con un algoritmo de compresin sin perdidas llamado MP3quality-modifier, el cual nos va a permitir evaluar la tasa de cambio de tamao de la seal. Bit rate (Sonido Bronco vesicular Normal.mp3). Cambio de tamao

Tamao Tamao original compreso (KB) (KB) 150 51,40% 100 50.1 Tabla 7. Cdec de compresin MP3-quality-modifier

Bit rate 155

Tasa de compresin 5.3548

Tamao original (KB) 72

Tamao compreso (KB) 36,36

Cambio de tamao 50.5%

Dificultad al respirar.mp3 Cambio de tamao

Bit rate

Tabla 3. ALgoritmo ya realizado

Bit rate 155

(Dificultad al respirar.wav). Tasa de compresin 5.48 Tamao original (KB) 72 Tamao compreso (KB) 21 Cambio de tamao 29%

Tamao Tamao original compreso (KB) (KB) 150 50,44% 70 34,5 Tabla 8. Cdec de compresin MP3-quality-modifier Validacin por un profesional Mtodo (ACR) [1]

Tabla 4. ALgoritmo ya realizado

Algoritmo de compresin de audio realizado por los autores (Sonido Bronco vesicular Normal.wav).

Debido a que en nuestro algoritmos de compresin utilizaremos sonidos respiratorios con y sin anomalas es necesario la opinin de un profesional entendido en la materia para comprobar si los sonidos comprimidos/descomprimidos son lo ms parecido a los sonidos sin haberlos tratado. De tal manera se realiz una tabla en la cual el profesional pueda dar su opinin, ya que no existe un mtodo para la validacin, lo hacemos de la forma experimental o prueba de escritorio, la tabla consiste de lo siguiente: En un rango de 1 al 9 que tanto el sonido (con y sin patologas) se escucha como los originales. En un rango de 1 al 9 que tanto el sonido (con y sin patologas), es vlido para un diagnstico. En este caso utilizaremos el ITU escala de calidad del 9 puntos. [1]

Bit rate

Tasa de compresi n 5.51

3191 1

Tama o original (KB) 72

Tamao compres o (KB) 39

Cambi o de tamao 54,1

Tabla 5. ALgoritmo realizado por los autores

Bit rate

Sonido (Dificultad al respirar.wav). Tasa de compresi n 6,53 Tama o original (kB) 256 Tamao compres o (KB) 78,1 Cambi o de tamao 30,46% Sonido patologas Sonido patologas

Rango parecido Rango sonido audible vlido para diagnstico sin 8 6 con 8 6

3191 1

Tabla 9. Mtodo de validacin por un profesional en sonidos respiratorios

VI. CONCLUSIONES Se estim que 5 niveles de descomposicin son ptimos para obtener un resultado auditivo aceptable. En cada sub-banda se puede calcular su energa, esto nos indica en que parte del ancho de banda de la seal est representada la mayor informacin, y con ello poner atencin en esa parte de la seal. La transformada Wavelet es una solucin para los inconvenientes de la transformada de Fourier, en el anlisis de Wavelet el uso de una ventana escalable modulada, resuelve el problema de resolucin de donde cortar la seal. VII. REFERENCIAS
.http://www.grc.upv.es/docencia/tra/PDF/codificacion.pdf. DESARROLLO DE TCNICAS DE CODIFICACIN DE AUDIO BASADAS EN MODELOS DE SEAL PARAMTRICOS, Universidad de Alcal, Vera Pedro, Ao 2006. .http://escuela.med.puc.cl/Publ/AtlasRuidos/basesAcusticas.ht ml. CODIFICACIN DE VOZ MEDIANTE WAVELET, Moreno Enriquez Moises, Vadillo Bravo Felipe Salim, OCTUBRE 2001.

[3] [4] [5] [6]

http://www.mathworks.com/ CODIGOS DE COMPRESION DE AUDIO EN MATLAB. http://es.wikipedia.org/wiki/C%2B%2B CODIGOS DE COMPRESION DE AUDIO EN MATLAB. http://www.gnu.org/software/octave/ SOFTWARE OCTAVE PARA COMPRESION DE AUDIO. http://148.206.53.231/UAM4065.PDF CODIFICACIN DE VOZ MEDIANTE WAVELET,

[7]

[1]

[2]

http://ific.uv.es/tical/Publications/Conferences/2007Bienal_po vedat.pdf VALIDACION DE ALGORITMOS. [8] .http://w3.iec.csic.es/URSI/articulos_modernos/articulos_zarag oza_2000/ursi2000/trabajos/ps0100.pdf COMPARACIN ENTRE ALGORTIMO HUFFMAN Y EL METODO ARITMETICO. [9] http://www.rale.ca/ , SOFTWARE PARA BASES DE DATOS. [10] [12]. http://www.adobe.com/es/products/audition.html , SOFTWARE PARA EDICION DE ARCHIVOS DE AUDIO. [11] [13]. http://www.steinberg.net/en/products/wavelab.html , SOFTWARE PARA EDICION DE ARCHIVOS DE AUDIO.

You might also like