You are on page 1of 5

Pontificia Universidad Catlica de Valparaso Escuela de Ingeniera Elctrica

Trabajo N6 de Investigacin

Formato Compresin de Audio MP3

Autor: Fernndez Segovia Jose Luis Herrera Peralta Pablo Vargas Prez Cristian Profesor: Juan Vignolo Barchiesi EIE 452 02 Sistemas Computacionales Fecha de entrega: 04/11/2013
1

Introduccin Uno de los formatos de compresin de audio ms usados hoy en da es el MP3, el siguiente trabajo aborda la historia del nacimiento del este formatos, temas tcnicos relacionados al clculo del espacio que utilizan estos archivos, tasa de muestreo, tasa de compresin lograda y el algoritmo que permite obtener dicha compresin. El odo humano juega un rol fundamental en la compresin MP3, se vern estas caractersticas y la relacin con la calidad del sonido del audio en este formato.

La Compaa MPEG; Nacimiento del MP3 El formato MP3 fue desarrollado en el ao 1986 por Karlheinz Brandenburg, director de tecnologas de medios electrnicos en el Instituto Fraunhofer IIS, quien propuso desarrollar un mtodo para transmitir audio en un formato digital comprimido, creando un algoritmo (tambin llamado codec) capaz de comprimir el sonido sin perder la calidad de este. Aunque fue desarrollada aos atrs solo en julio de 1995 Brandenburg utiliz por primera vez la extensin .mp3 para los archivos que guardaba en su computadora. En 1992, la compaa Motion Picture Experts Group (MPEG) aprob la tecnologa creada en Alemania as y naci el MP3 (MPEG-1 Audio Layer III). Tiempo despus se aprob el MPEG-II Audio Layer III, que fue anunciado en 1994 como el nuevo estndar de codificacin de vdeo que permita seales de vdeo entrelazadas, audio en multicanal, Dolby 5.1, codificacin de audio en frecuencias ms bajas (que supona an ms compresin que su predecesor MPEG-I). El Odo Humano; Efecto Enmascaramiento El odo humano puede percibir entre un rango de frecuencias de los 20 Hz. y los 20 KHz. La sensibilidad del odo se hace mayor en la zona alrededor de los 2 a 4 KHz. de forma que el sonido resulta ms difcilmente audible en cuanto ms cercano a los extremos de esta escala se est. El enmascaramiento es aquel efecto que se produce cuando dos seales de frecuencia similar se superponen. Entonces solo se puede percibir aquella que posee ms volumen y, por lo tanto, la de volumen menor es susceptible de ser eliminada.

Este efecto se produce cuando una componente de una seal que tiene una energa elevada y que est a cierta frecuencia, el odo no puede percibir componentes de menor energa en frecuencias cercanas, tanto inferiores como superiores. A una cierta distancia de la frecuencia enmascaradora, el efecto se reduce tanto que resulta despreciable; el rango de frecuencias en las que se produce el fenmeno se denomina banda crtica (critical band). Las componentes que pertenecen a la misma banda crtica se influyen mutuamente y no afectan ni se ven afectadas por las que aparecen fuera de ella. La amplitud de la banda crtica es diferente segn la frecuencia, datos se obtienen por experimentos psicoacsticos, que se realizan con expertos entrenados en percepcin sonora, dando origen con sus impresiones a los modelos psicoacsticos. Muestreo; Digitalizacin de una Seal Las seales digitales requieren un ancho de banda mucho mayor que una seal analgica, por ello se realiza un estudio intensivo en lo referente a la compresin de datos. El proceso de digitalizacin se compone de dos fases, muestreo y cuantificacin. En el muestreo se divide el eje del tiempo en segmentos discretos, es decir, la frecuencia de muestreo ser la inversa del tiempo que medie entre una medida y la siguiente. En estos momentos se realiza la cuantificacin, que, en su forma ms sencilla, consiste simplemente en medir el valor de la seal en amplitud y guardarlo. El teorema de Nyquist garantiza que la frecuencia necesaria para muestrear una seal que tiene sus componentes ms altas a una frecuencia dada es como mnimo 2 veces esa frecuencia. Por tanto, la frecuencia que garantiza un muestreo adecuado para cualquier sonido audible ser de unos 40 KHz. En lo referente a la cuantificacin, entre ms bits se utilicen para la divisin del eje de la amplitud, ms fina ser la particin y menor el error al atribuir una amplitud concreta al sonido en cada instante. El proceso completo (muestreo y cuantificacin) se denomina habitualmente PCM (Pulse Code Modulation) Audio MP3; Grabacin en un CD La digitalizacin de la seal mediante PCM es la forma ms simple de codificacin de la seal, y es la que utilizan los CDs convencionales. El muestreo PCM inevitablemente aade ruido a la seal, y cuantos menos bits se usen en el muestreo y cuantificacin, mayor ser el error al aceptar valores discretos para la seal continua.

Para evitar que el ruido alcance un alto nivel se emplea un gran nmero de bits, de forma que muestreando a 44.1 KHz. (con esta frecuencia se obtiene sonido de alta calidad en un CD), graba 44.100 muestras de 16 bit (2 bytes) en cada segundo. Al multiplicar 2 bytes * 44.100 para una seal de doble canal (estreo) se obtiene que se necesitan 88.200 bytes por segundo en cada canal. Multiplicando por 60 (segundos), se aprecia que en un solo minuto de grabacin en calidad CD ocupa 10.584.000 bytes, es decir, 10.09 Mb por minuto.) Gran parte de esta informacin es innecesaria y ocupa un ancho de banda que podra liberarse, aumentando la complejidad del sistema que decodifica incurriendo en la prdida de calidad del sonido. Calidad Telfono Radio AM Radio FM CD DAT Muestreo 8 KHz 11.025 Khz 22.050 Khz 44.1 Khz 48 Khz Bits/Muestra 8 8 16 16 16 Modo Mono Mono Estreo Estreo Estreo Tasa de Bits 64 kbps 88 kbps 705.6 kbps 1411.2 kbps 1536 kbps

Una mejor manera de codificar la seal es mediante PCM no-lineal o cuantificacin logartmica, que consiste en dividir el eje de la amplitud de tal forma que los escalones sean mayores cuanta ms energa tiene la seal, con lo que se consigue una relacin seal/ruido igual o mejor con menos bits. Con este mtodo se puede reducir el canal de CD audio a 350 kbps, lo cual es una mejora, aunque puede reducirse mucho ms. Otros sistemas similares llevan a la cuantificacin adaptativa (APCM), diferencial (DPCM) y la mezcla de ambas, ADPCM. As prosigue la reduccin del ancho de banda, pero sin llegar a los niveles que proporciona el tener en cuenta los efectos del enmascaramiento. El Bitrate; Tasa de Compresin Este formato permite seleccionar la relacin de compresin del archivo de origen. Los mrgenes a nivel domstico se sitan entre los 8 Kbps y los 340 Kbps, siendo 128 Kbps la tasa de transferencia equivalente a la calidad CD. El Bitrate es la unidad de medida de la tasa de transferencia de datos de lectura de un archivo MP3. En cuanto mayor sea la tasa bitrate de un archivo MP3, mayor ser la cantidad de datos que un reproductor puede obtener en un segundo. A ms contenido instrumental o calidad que contiene un archivo de audio mayor es la tasa de transferencia que este requerir para reproducir con totalidad
4

la informacin, as es como se define la calidad del archivo MP3, ya que si al comprimir el archivo se reduce ese ancho de banda, se sacrifican algunos de esos datos, traducindose a prdidas de informacin que influirn en el resultado final de la conversin. Conclusiones El formato descrito presenta una gran ventaja al momento de elegir un archivo de menor tamao para introducirlo en un dispositivo de audio que reproduzca MP3. La calidad de estos archivos sin embargo es mucho menor si se comprimen a una baja tasa (bitrate), el ms utilizado es el de 128 Kbps pero hoy en da los amantes de la msica que utilizan el MP3 comprimen sus archivos a una tasa de 320 Kbps que si bien es ms pesada ofrece una mayor calidad sonora. Existen muchos formatos de audio como por ejemplo WAV, AIFF o AU (sin prdidas); FLAC,MPEG-4 SLS, MPEG-4 ALS, MPEG-4 DST, WavPack, Shorten, TTA, ATRAC (comprimidos sin prdidas) y Vorbis, Musepack, AAC y WMA (con prdidas). A pesar de la variedad el MP3 sigue siendo el principal formato que reina en internet.

Referencias http://wikipedia.org /Definiciones, Historia http://howstuffworks.com/mp3 / Muestreo, Bitrate http://www.pcdoctor.com.mx /Informacin general http://www.configurarequipos.com /Bitrate http://whatis.techtarget.com /Definiciones, informacin general

You might also like