You are on page 1of 8

EL REPRODUCTOR

DE FORMATO MP3
DE SAMSUNG
Miguel Angel Sosa Garca*

Con el auge de la red Internet se ha


popularizado el formato MP3, un
sistema de compresin de datos que Generalidades
permite almacenar en computadora
archivos de audio de alta calidad, en A la fecha, escuchar algn formato de grabacin
un espacio mnimo. Hasta hace poco, digital con la misma calidad de CD, requiere una
gran cantidad de espacio de almacenamiento.
dicho formato no se adecuaba a las
Si usted tiene grabado un sonido de alta calidad
necesidades de desplazamiento de en su computadora, habr notado que diez se-
los usuarios (slo quienes posean gundos de audio con buena calidad ocupan un
una computadora porttil podan espacio de 1.5 MB, aproximadamente. Esto se
acceder a esta posibilidad); sin debe a que los discos compactos son grabados
embargo, con el diseo de en un formato cuya frecuencia de muestreo es
de 44.1 KHz a 16 bits por segundo (dos bytes
reproductores similares al walkman,
cada segundo).
ahora cualquier usuario puede Si multiplicamos dos bytes por 44,100 mues-
portar consigo decenas de canciones tras, sabremos que se necesitan 88,200 bytes por
grabadas en memoria. En este segundo en cada canal estreo. As que es ne-
artculo, explicaremos qu es el
formato MP3 y la manera en que se
procesa la seal; para ello, nos
basaremos en el reproductor YEPP * Este artculo est producido con el apoyo de Samsung
Electronics Mxico, S.A. de C.V. (www.samsung.com.mx), don-
de Samsung, uno de los diseos ms de el autor colabora en el rea de Ingeniera. Agradecemos
especialmente el apoyo del Ing. Guillermo Ramrez Barbosa,
avanzados en la actualidad. Gerente de Servicio.

34 ELECTRONICA y servicio No.25

Sin ttulo-16 34 3/25/05, 3:23 AM


cesario procesar 176,400 bytes por segundo en Puntualizando: gracias a los formatos de com-
una grabacin estereofnica. Y si multiplicamos presin de datos, es posible intercambiar archi-
esta cantidad por 60 segundos, observaremos vos de audio de alta calidad por Internet, o des-
que un solo minuto de grabacin en alta calidad cargarlos de los servidores de la misma red, en
de un disco compacto ocupa aproximadamente un tiempo breve, pues tales archivos son relati-
10 MB. vamente pequeos, como se explic en el art-
Por tal motivo, una meloda de cuatro minu- culo El formato de codificacin de datos MPEG,
tos necesita un espacio de 40 MB, aproximada- publicado en el nmero 23 de esta revista.
mente. Y si tenemos en cuenta que un disco com- Sin que sea un parmetro estricto, podemos
pacto de msica contiene 10 tracks, en promedio, decir que un minuto de sonido estereofnico
entonces se necesitan unos 400 MB de espacio MP3, con calidad cercana al formato de CD, con-
para almacenar dicha informacin. En este sen- sume ms o menos 1 MB; de manera que, si en
tido, surge una pregunta: es posible reducir el un disco compacto caben aproximadamente 640
espacio que ocupan las grabaciones de audio minutos, grabando el audio en formato MP3 se
manteniendo una calidad casi equivalente a la puede almacenar ms de 10 horas de msica. Y
de un disco compacto? gracias a esto, una cancin de duracin prome-
dio, puede descargarse de Internet en unos 10
La solucin al problema 20 minutos, dependiendo de la velocidad del
mdem y del congestionamiento de la red.
Queda claro, entonces, que la grabacin digital Pero qu significa MP3? De ello nos ocupa-
de audio en alta calidad requiere una gran can- remos enseguida.
tidad de espacio de almacenamiento, y por lo
tanto es muy complicado guardar y transportar El formato MP3
en disquete los archivos informticos respecti-
vos; y tambin por lo mismo es prcticamente No se trata de una abreviatura de MPEG 3 (como
imposible distribuirlos a travs de Internet. Por muchas personas lo creen), pues mientras estas
ejemplo, suponiendo que una conexin prome- ltimas siglas corresponden a Motion Picture
dio permite descargar informacin a un ritmo Experts Group (el grupo de creadores de normas
de unos 3 KB/seg, para bajar un megabyte de para estndares de compresin de imgenes en
informacin se requiere alrededor de cinco mi- movimiento), MP3 se refiere a MPEG 1 layer 3
nutos y medio. Sin embargo, precisamente el (algoritmo de codificacin perceptual); es decir,
auge de Internet ha estimulado a diversas com- se refiere al tercer nivel de compresin de audio
paas y laboratorios en todo el mundo, a bus- del formato MPEG original, y con una
car alternativas manejables por el ancho de ban- estandarizacin como norma: la ISO-MPEG
da de la red de redes (y sobre todo el ancho de audio layer 3.
banda que maneja el usuario tpico). Dicho formato de audio de alta calidad fue
Los primeros intentos consistieron en dismi- creado en el Instituto Fraunhofer (una importante
nuir el rango de muestreo y en emplear un solo entidad alemana de investigacin), y gracias a
canal, dando por resultado un audio monofnico su enorme grado de compresin, est despla-
de baja calidad. Posteriormente, se utilizaron zando a otros mtodos de codificacin digital de
algoritmos de compresin de datos que permi- sonido. Y aunque el formato MP3 ya tiene bas-
tieron mejorar la calidad del audio; y es de he- tante tiempo, no fue sino hasta pocas recientes
cho la tendencia que se ha seguido, y sobre la que los procesadores digitales alcanzaron la
que descansa el formato MP3, sin duda el ms potencia necesaria para efectuar la
exitoso de todos, aunque no el nico. Otra pla- descompresin de datos en tiempo real, situa-
taforma de audio por Internet, que trabaja sobre cin que afortunadamente coincidi con el auge
la base de la compresin de la informacin, es de la red de redes.
Real Jukebox.

ELECTRONICA y servicio No.25 35

Sin ttulo-16 35 3/25/05, 3:24 AM


Caractersticas del formato Tabla 2
Ancho de Bits por Rango
Se ales Muestreo
banda muestra de bits
El formato MP3 es capaz de comprimir un soni-
Calidad
do original en un factor de 12 a 1, sin perder telefnica
300-3400 Hz 8 Khz 8 64 Kbps
mucha calidad. Pero incluso con factores de 24 128
Voz 50-700 Hz 16 Khz 8
a 1, se mantiene una calidad de sonido superior Kbps
a la que se obtendra con la reduccin del rango Audio de
384
banda 10-11000 Hz 24 Khz 16
de muestreo. En la tabla 1 se especifican las ca- media
Kbps
ractersticas de compresin en MPEG 1. Audio de
768
banda 10-22000 Hz 48 Khz 16
Kbps
ancha
Tabla 1
1410
CD estreo 10-22000Hz 44.1 Khz 16
Formatos Compresin Kb/seg. Kbps

Layer 1 4a1 384


Layer 2 6a1y8a1 256 y 192
sos para reducir el espacio que ocupa una gra-
Layer 3 10 a 1 y 12 a 1 128 y 112
bacin de audio de calidad, y permitir as trans-
portarla en una tarjeta o disco flexible (figura 1).

Estos formatos son para una seal mono o Reduccin de rango de bit
estreo, y utilizan la misma estructura bsica (en La principal razn para reducir el rango de bits,
la figura 8, que explicaremos posteriormente, se es la necesidad de minimizar el costo de trans-
ilustra este punto). El decodificador o algoritmo misin (es decir, transmitir lo mismo pero en
es similar en ambos casos (lo que vara es la menos tiempo); para esto se requiere de ciertas
cantidad de informacin en su entrada), y lo que condiciones relacionadas con el formato de com-
se intenta es la reduccin del volumen de infor- presin de audio, tales como:
macin, sacrificando en cierta medida la fideli-
dad original; adems, en el layer 3 se agrega un Mantenimiento de una alta calidad en la seal
elemento que aumenta la resolucin en la fre- reconstruida, en el caso de seales multica-
cuencia. nales (seales estereofnicas).
Inmunidad contra la aleatoriedad, cadenas ro-
Codificacin de audio PCM tas de bits y paquetes perdidos.
La informacin de audio es codificada mediante Baja complejidad y bajo poder de consumo en
la modulacin por pulsos codificados (PCM). Esto los codificadores y decodificadores.
significa que a una muestra se le asigna un va-
lor de uno o dos bytes, dependiendo de la reso-
lucin sonora que se necesite (8 16 bits). Para
Figura 1
que la prdida de informacin sea mnima en un
muestreo de audio, se tiene que aumentar el ran-
go del muestreo mismo (tabla 2); y es por ello
que el audio en el formato de CD se muestrea
con una resolucin de 16 bits.
Es importante mencionar que se utiliza este
tipo de modulacin, para mejorar el factor de
compresin; pero estrictamente hablando, la
modulacin PCM no incluye ningn tipo de com-
presin, as que en este paso todava se mantie-
Vista interna del
ne la relacin de 10 MB/minuto de sonido. Por bloque en el cual se
inserta el disco
lo tanto, es necesario an efectuar otros proce-
flexible.

36 ELECTRONICA y servicio No.25

Sin ttulo-16 36 3/25/05, 3:24 AM


En aplicaciones profesionales, las cadenas de Figura 3
Banda crtica (bark)
bits codificadas deben poder editarse
80 1KHz
dinmicamente, mezclarse, etc. 250Hz
1KHz 4KHz 8KHz
60 500Hz

El hecho de que la percepcin de la intensidad 40

del sonido con respecto a la frecuencia no es 20

lineal, se aprovecha para la codificacin y com- 0

presin de la informacin; adems, el sistema 0 5 10 15 20 25

auditivo sirve como un filtro pasa-banda, que se


subdivide en 26 frecuencias crticas de hasta 24
KHz. Estas bandas de frecuencia no son linea- es la de Bark (figura 3). A partir de esta grfica y
les, porque el ancho de banda de cada una vara de un modelo psicoacstico, se determina cu-
de 50 a 100 Hz en frecuencias por debajo de 500 les frecuencias se enmascaran y cules no.
Hz, y hasta 5000 Hz en frecuencias altas (esto En palabras llanas, podemos decir que el fe-
debido al comportamiento logartmico de las nmeno de enmascaramiento se crea cuando en
seales de audio). una cierta banda de frecuencias se produce un
sonido de muy alta intensidad, y este sonido hace
Enmascaramiento muy difcil que un escucha promedio se percate
de la presencia de otros sonidos simultneos de
El enmascaramiento simultneo es un efecto en baja intensidad en bandas cercanas. Qu caso
la frecuencia, donde una seal de bajo nivel pue- tiene entonces registrar absolutamente toda la
de ser opacada (enmascarada) por una seal informacin, si la mayora de los escuchas slo
simultnea de ms alto nivel (figura 2). Esto se percibirn el sonido de alta intensidad? Para re-
aprovecha en la codificacin para eliminar ban- ducir espacio de almacenamiento, siempre que
das del espectro. se da un fenmeno de este tipo, las bandas late-
rales que son enmascaradas por el sonido in-
tenso simplemente no se registran, pero el audi-
torio final en raras ocasiones advierte esta
A(db)
Figura 2 prdida (se necesita tener el odo extremadamen-
Enmascaradora
te entrenado para notarlo).
Umbral de mscara

Sonido
Proceso de compresin
enmascarado
Ya con esta informacin, veamos cmo se com-
prime la informacin original PCM para
almacenarla en formato MP3:

Frecuencia (Khz) 1. Mediante filtros, la seal de audio se divide


en bandas de frecuencia que a su vez confor-
man 32 sub-bandas crticas.
Para poder cuantizar el fenmeno del enmas- 2. Se determina el nivel de potencia de cada ban-
caramiento, se cre un concepto llamado banda da crtica, y se toma en cuenta el fenmeno
crtica con el que se identifica al ancho de banda de enmascaramiento por las bandas conti-
mximo alrededor de una frecuencia. nuas a partir de un modelo psicoacstico.
Para que no haya enmascaramiento, las ban- 3. Una banda no se codifica cuando su potencia
das se distribuyen de acuerdo con una escala es menor que el umbral de sensibilidad.
logartmica con la que se representa la percep- 4. En caso contrario, se determina el nmero de
cin del odo. Una escala de medida perceptual bits necesarios para conformar el coeficiente

ELECTRONICA y servicio No.25 37

Sin ttulo-16 37 3/25/05, 3:24 AM


del ruido que se introduce en la cuantizacin, Figura 5
Entrada
y que debe ser menor que el efecto de en- de seal Codificacin
mascaramiento. Filtro pasa Medidor de
por
bandas nivel
algoritmos
5. Por ltimo, se crea la trama de datos codifica-
dos.

Codificacin por
Es un proceso complicado, pero en la actuali- enmascaramiento Salida
de seal
dad, gracias a microprocesadores muy podero-
sos y a las avanzadas tcnicas de integracin
electrnica, todos estos pasos pueden realizar-
se en un par de chips de muy alta escala de inte- ferencia de layer 1 y layer 2, el banco de filtros
gracin; y tambin gracias a esto los equipos de hbridos ya no es dividido en 32 sub-bandas, sino
codificacin MP3 no son costosos (como lo hu- en 576 sub-bandas.
bieran sido hace pocos aos). El banco de filtros trabaja en sub-bandas de
En la figura 4 se muestra la tarjeta principal 41.67 Hz, cuando tiene una seal que vara
donde se lleva a cabo el proceso de compresin; aproximadamente 24 KHz. Esto propicia una
observe que la integracin de microchips es la mejor resolucin en frecuencia.
que permite el tamao reducido del equipo. Despus que se entregan las seales
cuantizadas de una manera no uniforme, se
comparan con una tabla de 32 cdigos que se
Figura 4 llama algoritmo de Huffman. Dichos cdigos re-
presentan los ms eficientes ndices de cuanti-
zacin; es como comparar la muestra con los
datos del cdigo, a fin de hacer una aproxima-
cin a la que ms se le parezca. De esta forma
se logra una compresin de los datos enviados.
Todos los algoritmos dinmicos de codifica-
cin se utilizan para suavizar la prdida de in-

Tarjeta principal Figura 6


donde se lleva a
cabo el proceso de A A
compresin
Seal original

0 256 512 768 1024


Al ser procesada en una codificacin digital,
una seal original debe permitir que la onda de B
B
salida sea lo ms similar posible a la onda de Seal
reconstruida
entrada (figura 5). Pero cuando en la seal an- con bloque de
loga se presentan cambios bruscos, en los 1024 muestras

codificadores poco eficientes el nivel de decisin 0 256 512 768 1024

del codificador hace que se introduzcan peque-


os errores en la cadena recuperada; lo que se C C
Seal
hace entonces para corregir este fenmeno, es reconstruida
codificar bloques ms pequeos para suavizar con bloque de
256 muestras
el error (figura 6).
0 256 512 768 1024
El layer 3 de MPEG es el nico que puede co-
dificarse a diferentes rangos de muestreo. A di-

38 ELECTRONICA y servicio No.25

Sin ttulo-16 38 3/25/05, 3:25 AM


Figura 7 Kb-seg Calidad de sonido Tabla 3
Distribucin de bits con un rango de 128 Kbps 8 kbps Mono
16 kbps Mono
16

14 24 kbps Mono
12
32 kbps Mono
10
56 kbps Est reo/mono
8
64 kbps Est reo/mono
6

4 96 kbps Est reo


2
112 kbps Est reo
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
128 kbps Est reo
256 kbps Est reo
Distribucin de bits con un rango de 64 Kbps

16

14
entonces afecta directamente a la calidad del
12
sonido a grabar; y es que al tomarse menos
10

8
muestras, se reduce la calidad de la reproduc-
6 cin del sonido.
4

2
Formas de codificacin en grabacin
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

En la figura 8 tenemos un diagrama que ilustra


el proceso al que es sometida una seal original
para convertirse en archivo MP3. En este caso,
formacin. As que se reduce el espacio ocupa- el elemento que se encarga de procesarla es la
do por la informacin de audio, sin necesidad computadora y el que la comprime es el soft-
de que sta sufra merma cualitativa alguna. ware correspondiente (tabla 3).
Tomando en cuenta los parmetros del odo Y como ya mencionamos, otro aparato por el
humano, todos los modelos de cuantizacin y que dicha seal puede ser procesada y comprimi-
codificacin Huffman se basan en los modelos da es el reproductor YEPP, de Samsung (figura 9).
acsticos. En la figura 7 podemos ver grfica-
mente cmo la informacin es comprimida y Qu significa YEPP
queda lista para enviarse en rangos de bit por
segundo. La palabra YEPP no tiene significado en s; se
De acuerdo con lo que observamos en las gr- trata simplemente de las iniciales de diversos
ficas, cuando se reduce a la mitad el rango de conceptos que se tienen para estos reproductores
muestreo, la informacin codificada se altera y de audio porttiles: Young Energetic Personal

Figura 8
Entrada Filtro de Algoritmo Codificacin
Cuantizacin
PCM bancos dinmico Huffman
MUX

FFT Codificacin
Enmascaramiento
de lado

Salida Algoritmo Medio


Filtro de Decodificacin
PCM dinmico inverso Decuantizacin
bancos Huffman
Demux
Decodificacin
de lado

ELECTRONICA y servicio No.25 39

Sin ttulo-16 39 3/25/05, 3:25 AM


Figura 9 Figura 11
Vista general del bloque en el que se
realiza la grabacin de voz.

liar de un amplificador; de este modo se dis-


Passionate. Es de hecho un nuevo e innovador pone de una fuente de audio de gran calidad.
producto de Samsung, creado para brindar di- d) En vista de que se trata de un formato total-
versin y versatilidad en un formato de calidad mente digital, la reproduccin de cualquier
musical para las nuevas generaciones (figura 10). archivo en MP3 es posible aun cuando el
reproductor YEPP est en movimiento (el
Prestaciones principales de los equipo no posee partes mviles). Esta es una
reproductores YEPP gran ventaja ante los reproductores de audio
que ya conocemos, muchos de los cuales to-
a) En tanto que un track convencional (propio dava enfrentan el problema de sufrir altera-
de las grabaciones en audiocasete o en CD) ciones en su funcionamiento cuando son agi-
ocupa un espacio de aproximadamente 30 tados (pues su mecanismo se desajusta); y si
Mbytes, los YEPP pueden almacenar depen- bien algunos equipos como los llamados
diendo del tipo de grabacin hasta ms de antishock, a prueba de saltos o perturbacio-
30 canciones. nes poseen memorias especiales para alma-
b) Con el apoyo de algunos elementos comple- cenamiento, no alcanzan an a compararse
mentarios, el reproductor YEPP puede ser el con un reproductor YEPP.
sustituto idneo de algunos equipos de repro-
duccin musical (caja de discos compactos Caractersticas de los reproductores YEPP
para automvil, walkman, discman, grabado-
ras porttiles, radios, etc.), pues cuenta con Se fabrican aparatos YEPP con capacidad de 32
salida amplificada (figura 11). y 64 MB, y tarjetas de expansin de 8, 16 y 32
c) Con una interfaz de salida a RCA (figura 12), MB. Est dotado con una pantalla de cristal l-
se puede colocar en cualquier entrada auxi- quido que, dependiendo del modelo, despliega

Figura 10
Figura 12

Conexin de interfaz

40 ELECTRONICA y servicio No.25

Sin ttulo-16 40 3/25/05, 3:26 AM


Figura 13 Tabla 4
Vista interna del display. Capacidad de memoria Interna 32 MB de memoria flash
Observe nuevamente que la
integracin de dispositivos LCD con 3 lneas de datos y 10
Pantalla
digitales es lo que permite la caracteres
reduccin en el diseo del Dos pilas tamao AAA, para 10
equipo Batera
horas de reproduccin
Velocidad de transmisi n 1.3 Mbps
Tarjeta de expansin de
32, 64 MB
memoria
Grabacin de voz Con formato ADPCM 128 min.
Relaci n S/R 90 dB
Salida de audio musical 7 mW
Rango de frecuencia 20Hz a 20 kHz
Ecualizador Classic, Jazz, Rock

Por las caractersticas hasta aqu enunciadas,


no podemos descartar la posibilidad de que en
un futuro cercano, los reporteros empleen un
equipo YEPP para grabar sus entrevistas; tam-
el titulo de las canciones y nombre del artista o poco, que los automviles tengan radios con MP3
mantiene los datos de una agenda personal (fi- de 1 GB de capacidad o que haya telfonos con
gura 13). MP3, etc. Todo esto puede parecernos sorpren-
Otra caracterstica importante que hay que dente, pero es apenas una pequea muestra de
sealar, es que el software del YEPP es muy lo mucho que es posible realizar con el formato.
amigable y fcil de manejar, y puesto que los
tracks se descargan en memoria con gran rapi- Legalidad en su uso
dez, casi no hay prdida de tiempo; comnmen-
te, en menos de 30 segundos puede descargarse En Estados Unidos, la ley establece que es legal
una grabacin en el YEPP. En la figura 14 obser- tener en casa archivos MP3 con la informacin
vamos la plataforma que se emplea para editar de audio (temas musicales, discursos, etc.) que
canciones y descargar la informacin en el YEPP. cada usuario prefiera, pero prohbe el intercam-
Y en la tabla 4 se muestran los datos tcnicos bio o lucro con discos con copyright (como es el
ms sobresalientes de estos equipos. caso de cualquier creacin con derechos de au-
tor).
En nuestro pas, tambin se han legalizado
Figura 14 ciertas acciones relacionadas con el uso del MP3.
Hoy, algunos artistas y sellos discogrficos es-
tn utilizando este formato para regalar a los
usuarios una de las canciones que contiene el
lbum en cuestin, para estimular as las ven-
tas.
Tambin, por medio del MP3, los comprado-
res digitales adquieren por separado canciones
provenientes de diversas colecciones (como ya
se ha mencionado en otros artculos, le recomen-
damos que visite el sitio www.mp3.com).

ELECTRONICA y servicio No.25 41

Sin ttulo-16 41 3/25/05, 3:26 AM

You might also like