You are on page 1of 3

El sonido digital

Tecnologa del Audio y de la Msica


Master en Artes Digitales octubre 2003
Sergi Jord
sergi.jorda@iua.upf.es http://www.iua.upf.es/~sergi http://www.tecn.upf.es/~sjorda

Digital vs. analgico El sonido analgico El sonido digital Muestreo en frecuencia El Aliasing Cuantificacin Rango dinmico Tamaos y compresiones

Sonido Analgico Qu es?

El trmino analgico se utiliza actualmente en contraposicin a digital, especialmente en el campo del sonido, pero tambin en el de la imagen. Las seales analgicas son funciones de variables continuas (frecuentemente del voltaje) y se denominan as porque sus evoluciones temporales imitan (son una analoga de) las seales originales La representacin grfica de un sonido grabado analgicamente tendr la misma forma que el sonido original, pero la curva indicar va riaciones de voltaje, en lugar de variaciones de presin de aire. Estas nuevas seales analgicas se obtienen por medio de transductores (un transductor es un dispositivo capaz de convertir una magnitud fsica en otra)

Grabacin analgica del sonido

El micrfono convierte la variacin de la presin de aire ejercida sobre su membrana en una seal de voltaje variable en el tiempo La variacin de este voltaje se puede grabar analgicamente utilizando diferentes tecnologas, sobre una cinta magntica o en los surcos de un disco de vinilo En el caso del disco de vinilo, por ejemplo, los surcos dibujan, sobre la espiral del disco, trayectorias que reproducen las formas (son una analoga) de la seal original Cuando deseamos reproducir el sonido, la seal elctrica generada por el cabezal de la pletina o la aguja del tocadiscos se amplifica y enva a los altavoces, donde un nuevo transductor la convierte en un campo magntico capaz de desplazar y de hacer que oscilen (con las frecuencias originales) los conos de papel de los altavoces

Calidad del sonido analgico

Al contrario de lo que opina la mayora, una grabacin analgica no tiene porqu sonar peor que una grabacin digital (en condiciones ptimas suena, de hecho, mejor). Sus inconvenientes radican en que: la seal analgica se degrada mucho ms rpidamente (las cintas magnticas se desmagnetizan, y tanto las agujas como los surcos en el vinilo se desgastan) en cada nueva generacin se produce una pequea pero inevitable prdida, de forma que, a cada nueva copia, la seal se parece cada vez menos a la original

Sesin de grabacin grabacin, , finales s. XIX

Por estas razones, el sonido digital ha tomado definitivamente el relevo del analgico. En ste y los siguientes mdulos se estudiar por qu y cmo el sonido digital aporta un sinfn de nuevas y excitantes posibilidades en la produccin, manipulacin, creacin y experimentacin sonoras.

Sonido Digital

El principio fundamental del audio digital consiste en discretizar las seales sonoras continuas (como las captadas por un micrfono) para convertirlas en secuencias de nmeros. La discretizacin de estas seales se lleva a cabo en dos escalas diferentes, la temporal y la de la amplitud.

Muestreo en frecuencia

discretizar convertir valores continuos en discretos muestrear tomar muestras a intervalos de tiempo regulares Para digitalizar un sonido es, pues, necesario muestrearlo, pero con qu frecuencia o regularidad?

Teorema de Nyquist

para muestrear correctamente una seal peridica de cualquier frecuencia, se requiere como mnimo una frecuencia de muestreo doble cualquier seal digitalizada slo puede representar correctamente frecuencias inferiores a la mitad de la frecuencia de muestreo. Esta frecuencia mitad se denomina frecuencia de Nyquist (las 2 proposiciones son equivalentes)

Aliasing

cul podr ser pues la frecuencia de muestreo correcta que nos permita digitalizar cualquier sonido?
(teniendo en cuenta que el odo humano es capaz de detectar frecuencias sonoras de hastaaproximadamente 20.000 Hz.)

Muestreo a bajas frecuencias

Muestrear a 44.100 Hz significa tomar 44.100 muestras del sonido cada segundo, lo que para sonidos largos puede llegar a significar una considerab le cantidad de memoria o de espacio en el disco duro. Por ello, en aplicaciones no estrictamente musicales en las que la calidad ya no es lo primordial, es frecuente almacenar los sonidos con frecuencias inferiores, para ahorrar espacio En un sonido con una frecuencia de muestreo de, por ejemplo, 20. 000 Hz, slo se podrn representar correctamente los componentes frecuenciales s ituados por debajo de los 10.000 Hz (la mitad de la frecuencia de muestreo) Para las aplicaciones que no precisen la mxima fidelidad, esto es ms que suficiente. El sonido resultante ser un poco menos brillante, pero se parec er todava bastante al original, pues la zona frecuencial con mayor energa suele estar aproximadamente entre los 1.000 y los 3.000 Hz A continuacin, se muestran algunos resultados a partir de dos s onidos diferentes Sonido de batera digitalizado a 44.100 Hz El mismo sonido de batera a 22.050 Hz Sonido de saxo digitalizado a 44.100 Hz El mismo sonido de saxo a 11.025 Hz La misma batera a 2.000 Hz
En estos ejemplos se puede apreciar que el sonido de batera a 22.050 Hz ha perdido mayor calidad que el sonido de saxo a 11.025 Hz. Esta aparente paradoja se debe a que el sonido de batera, al ser ms agudo, pierde ms componentes en el proceso de submuestreo, y se obtiene un sonido ms mate o apagado. Sin embargo, en el saxo, este efecto es casi imperceptible, ya que el sonido original carece prcticamente de componentes por encima de los 5.000 Hz

El trmino resolucin de un sonido digital indica el nmero de bits que se han utilizado para almacenar cada muestra La resolucin determina el nmero de posibles valores diferentes, o rango, que cada muestra de sonido puede tomar As, un sonido digitalizado a 8 bits posee 256 niveles posibles, mientras que un sonido a 16 bits presenta 65.536 niveles posibles

Cuantificacin

Rango dinmico Relacin seal/ruido

El rango dinmico de una sistema de sonido (expresado en decibelios), depende del cociente la mxima y la mnima amplitud que el sistema puede producir En un aparato electrnico, la relacin seal/ruido indica la diferencia entre el nivel mximo que el dispositivo puede emitir, y el nivel de ruido existente cuando la seal es silencio (el ruido de fondo). Cuanto mayor sea esta diferencia, ms limpio ser el sonido del dispositivo Una forma aproximada y rpida de calcular el rango dinmico de un sistema digital es mediante la frmula: nmero de bits*6 La resolucin en bits de un sonido digital incide directamente en el rango dinmico y en el ruido de fondo Cuantos ms bits utilicemos, ms ntido y con menos ruido se percibir el sonido

Rango dinmico : Valores tpicos

La grabacin digital

Cunto ocupa un segundo de sonido digital estreo de 16 bits y 44.100 Hz?


En un sonido de 16 bits, cada muestra ocupa dos bytes (un byte son ocho bits), y si la frecuencia de muestreo es de 44.100 Hz, significa que cada segundo requiere 44.100 muestras Si el sonido es estreo, utiliza dos canales, por lo que estas necesidades se ven duplicadas 2 bytes/muestra * 44.100 muestras/segundo * 2 (canales) = 176.400 bytes/segundo 172,2 Kb/s Realizando una multiplicacin ms, se observa que un minuto de sonido digital estreo de calidad CD (16 bits y 44.100 Hz) ocupa un valor muy cercano a los 10 Mb

Distorsin digital

Compresin de audio
Al igual que ocurre con la imagen, existen tcnicas sin
prdida y tcnicas con prdida

La compresin MP3
El formato MP3, abreviacin con que se conoce popularmente el MP EG-1 Layer III, utiliza algoritmos mucho ms sofisticados inspirados en la psicoacstica, y que tienen en cuenta, por lo tanto, la forma en que los humanos percibimos (o mejor dicho no percibimos!) determinados sonidos Con este mtodo, descubierto a mediados de los aos ochenta en el Instituto Fraunhofer, en Alemania, se logran espectaculares compresiones del orden del 90%, y se consigue que un fragmento musical comprimido ocupe una dcima parte de su tamao original, con una prdida de calidad casi imperceptible Para conseguir esta reduccin, el MP3 se basa en el fenmeno del enmascaramiento descrito en el mdulo que explica cmo, en determinadas condicio nes, ciertos sonidos dejan de percibirse totalmente, ocultados o enmascarados por otr os. El MPEG- 1 Layer III aprovecha estas imperfecciones auditivas humanas para eliminar la informacin que no podemos percibir, manteniendo la mxima calidad en las zonas de mayor sensibilidad (de forma similar al caso de que, en una imagen 3D, eliminsemos toda la informacin de los objetos tapados por planos ms prximos al observador) Con e s t e mtodo se consiguen reducciones del 90% con muy poca prdida de calidad La tasa que se utiliza en la mayora de los ficheros disponibles en Internet es la de 128 Kbits/s, es decir un valor cercano al 9% del que ofrece el audio digital convencional a 44.100 Hz y 16 bits

Un factor importante en los sistemas de compresin de


audio es que interesa que sean capaces de comprimir y descomprimir en tiempo

You might also like