You are on page 1of 30

Captulo 6.

Mezcla e interferencias de dos sonidos simples

Luis Colomer Blasco

Este captulo esta disponible on-line en: http://cursodeacusticamusical.blogspot.com.es/2015/


07/capitulo-6-mezcla-e-interferencias-de.html

Resumen
Este captulo analiza los fenomenos acusticos y psicoacusticos que se producen
cuando se superponen dos sonidos simples. Mediante vdeos construidos a partir
de Matlab, muestra que estos fenomenos dependen tanto de la distancia entre las
frecuencias de los sonidos que se mezclan, como de la razon matematica que hay
entre ellas. Ademas, puesto que estos fenomenos estan presentes en la combinacion
de cualquier numero de componentes, permite entender los fundamentos acusticos
de la mezcla armonica, la cual es la propia del sonido musical. Muestra tambien que
las consonancias entre sonidos simples se producen cuando sus frecuencias estan en
razon de conmensurabilidad proxima. Ademas, explica por que se producen interfe-
rencias entre sonidos de frecuencias muy proximas (batidos de primer orden) o de
frecuencias muy proximas a relaciones consonantes (batidos de segundo orden) y
como esas interferencias sirven para afinar los instrumentos musicales. Por ultimo,
muestra el efecto de la distorsion en la mezcla de sonidos simples.

1. Introduccion

Los sonidos que omos todos los das, sean o no musicales, no suelen ser sonidos sim-
ples, sino el resultado de la superposicion de un conjunto de vibraciones que coinciden
en un momento dado. En el caso de la musica, que es lo que nos interesa ahora, estas
superposiciones se pueden producir en cualquier lugar: en el cuerpo mismo de los ins-
trumentos, en el espacio por el que se transmiten las ondas sonoras o en el interior de
nuestro odo.
Cuando se mezclan las vibraciones sonoras se producen diversos fenomenos acusticos,
fenomenos que dan lugar a las diferentes cualidades sonoras que omos. Estas mezclas,
dependiendo de sus caractersticas, pueden ser combinaciones armonicas que percibimos
como notas musicales o pueden ser otro tipo de combinaciones en las que apreciamos
simplemente ruido. En efecto, los fenomenos acusticos derivados de las distintas combi-
naciones de sonidos simples (es decir, de componentes sinusoidales) generan buena parte

1
de la riqueza sonora de nuestro entorno. En lo que concierne a la musica, los fenomenos
que se crean al combinarse las vibraciones de distintos sonidos o de distintos compo-
nentes de un mismo sonido constituyen buena parte del fundamento acustico de nuestro
sistema musical.
Como se estudia en el captulo siguiente, el sonido armonico o musical, hablando en gene-
ral, esta formado por una serie de componentes simples cuyas vibraciones se superponen
de una manera especial. Las caractersticas de las mezclas y combinaciones de sonidos
simples que dan lugar al sonido musical son la causa de su particular naturaleza sonora.
Estas caractersticas explican, ademas, los principios fsicos que rigen las consonancias,
los pilares del lenguaje musical.
En este sentido, este captulo prepara el estudio del sonido armonico, es decir, de la
estructura armonica creada por la combinacion de componentes simples que mantienen
entre s unas determinadas relaciones. Puesto que los principios que rigen la superposicion
de dos componentes simples son los mismos que los que estan detras de la mezcla de
cualquier numero de componentes, conviene experimentar como son los fenomenos que
se crean cuando interfieren entre s las vibraciones de dos sonidos simples y analizar a
que se deben esos fenomenos. Despues sera sencillo entender las especiales relaciones
de conmensurabilidad que se establecen entre las frecuencias de un numero cualquiera
de componentes simples cuando se superponen unos con otros para formar un sonido
armonico.
As pues, en este captulo vamos a comprobar que los fenomenos acusticos que se crean en
las diferentes tipos de mezclas de sonidos simples son el resultado bien de la diferencia
aritmetica entre las frecuencias de los sonidos que se superponen o bien de la razon
numerica que hay entre esas frecuencias, y que estos fenomenos estan condicionados por
la anchura de la banda crtica correspondiente a sus respectivas frecuencias. Ademas,
vamos a atender a los fundamentos acusticos de las consonancias musicales, es decir, a
los fenomenos que se producen cuando se mezclan dos sonidos simples cuyas frecuencias
mantienen unas especiales relaciones de conmensurabilidad.
Por otra parte, al estudiar todos estos fenomenos, vamos a entender el mecanismo acusti-
co que permite la afinacion de los instrumentos musicales. Comprenderemos como, a lo
largo de la historia, de manera natural y sin recurrir a ninguna herramienta externa, ha
sido posible afinar con precision los instrumentos y, a partir de esas afinaciones, han sido
establecidas las diferentes escalas musicales. En efecto, podremos experimentar que las
interferencias que se crean cuando se mezclan entre s los sonidos permiten determinar
de manera emprica las alturas tonales que dan lugar a los intervalos y a las escalas, y
que eso se hace con tanta exactitud que muy ligeras variaciones son interpretadas por
nuestra percepcion como extranas a esa escala o desafinadas.
Experimentaremos tambien los lmites de nuestra capacidad para discernir individual-
mente sonidos simultaneos, comprobando que estos lmites dependen de la anchura de
la banda crtica correspondiente a cada zona frecuencial.

2
Y, por ultimo, mediante la introduccion de una distorsion artificial en la senal, compro-
baremos los efectos que esta puede ocasionar en la mezcla de sonidos simples, al dar lugar
a la aparicion de componentes espurios. Esta es la razon de que, para poder apreciar
correctamente las caractersticas sonoras que se muestran en los vdeos, sea necesario
que la distorsion del equipo de audio en el que los reproduzcamos sea pequena, como he
indicado en el captulo introductorio.
A mi juicio, el modo mas sencillo que tenemos hoy en da para estudiar los fenomenos
acusticos y psicoacusticos que se crean al mezclarse los sonidos es observar como se com-
portan dos sonidos fabricados por ordenador. El hecho de utilizar sonidos artificiales nos
garantiza su estabilidad y permite que sus parametros esten perfectamente controlados.
Mediante vdeos que simulan un osciloscopio creados a partir de Matlab, a lo largo de
este captulo vamos a escuchar como suenan las diferentes mezclas de interes musical de
dos sonidos simples y observar la forma de la vibracion de la senal resultante, atendiendo
tanto a los fenomenos acusticos en s mismos, como a la manera en la que nosotros los
percibimos.

2. El Principio de Superposicion Lineal de Ondas

Antes de analizar cada uno de los casos de interes musical que se producen cuando se
mezclan dos sonidos simples, vamos a prestar atencion brevemente al principio general
que rige toda mezcla de sonidos. Puesto que el sonido es un movimiento vibratorio
que se transmite en forma de ondas, cuando se mezclan dos sonidos en las situaciones
habituales se cumple el Principio de Superposicion Lineal de Ondas. El Principio de
Superposicion Lineal de Ondas dice que cuando en un tiempo dado coinciden
en un punto dos o mas ondas la alteracion total que se produce en ese punto es
igual a la suma de las alteraciones que cada onda individual habra producido.
Es decir, cuando dos ondas interfieren, el comportamiento individual de cada una de ellas
no se ve afectado por el de la otra.
Si pensamos en terminos de senal de audio, podemos decir que la senal que resulta de la
reunion de dos senales independientes es una nueva senal cuyas muestras son simplemente
la suma de las muestras de cada una de ellas.
Hay que tener en cuenta que para que se cumpla el Principio de Superposicion Lineal
de Ondas es necesario que el medio por el que se transmite el sonido no altere la forma
de la vibracion, es decir, que no distorsione la senal de audio. Si esto no se cumple
(por ejemplo, si el equipo reproductor de sonido presenta una distorsion significativa)
surgiran componentes extranos no presentes en la senal original. Un ejemplo de los efectos
de tales distorsiones son los llamados Tonos de Tartini, que no son componentes reales
que pertenezcan a la vibracion sonora en s misma, sino el resultado de la pequensima
distorsion que introduce nuestro propio odo.
A continuacion vamos a estudiar una serie de fenomenos fsicos, todos ellos de interes

3
musical, que surgen al mezclarse dos sonidos simples. Todos estos fenomenos, as como la
forma en la que nosotros los percibimos, dependen de tres factores: la distancia aritmetica
entre las frecuencias de los sonidos que se mezclan; la razon numerica que se establece
entre sus frecuencias; y la region frecuencial a la que pertenecen. Generalizados a la
mezcla de cualquier numero de componentes, estos fenomenos y la forma en la que
nosotros los percibimos constituyen el fundamento acustico sobre el que se ha construido
nuestro Sistema Musical.

3. Mezcla de dos sonidos simples de la misma frecuencia: Unsono

Empecemos analizando lo que ocurre cuando se superponen en el mismo espacio y tiempo


dos sonidos simples que tienen exactamente la misma frecuencia, es decir, que forman
un unsono.
He confeccionado un vdeo que nos va a permitir observar que el resultado de la
superposicion de dos sonidos simples de igual frecuencia es siempre otro
sonido simple de la misma frecuencia, cuya amplitud depende no solo de la
de cada sonido, sino tambien del desfase que hay entre ellos.
En el vdeo se emiten cinco veces dos sonidos simultaneos que tienen la misma frecuencia,
220 Hz, un la3 en la afinacion estandar. En cada emision omos el sonido resultante de
la mezcla de ambos componentes.
Para reconocer con facilidad la forma de la senal de cada componente en el simulador
del osciloscopio, he generado los sonidos con una ligera diferencia entre sus amplitudes.
Si fueran exactamente iguales, las graficas de ambas senales se superpondran y no
podramos distinguirlos, particularmente en el momento en el que estan en fase. La
amplitud de la senal azul es 0,20 y la de la senal magenta 0,22.
En cada repeticion los sonidos componentes se van desfasando entre s: la primera vez
que suenan tienen la misma fase inicial; luego la fase inicial del sonido representado por
la senal azul se adelanta un poco, de modo que los dos sonidos quedan desfasados entre
s 45o ; a continuacion la senal azul se adelanta todava mas, siendo el desfase entre los
componentes de 90o ; luego el desfase es de 135o ; y, finalmente, de 180o , es decir, ambos
sonidos estan en oposicion de fase.

4
Figura 1: Vdeo con dos sonidos unsonos que van incrementando su desfase.

Podemos ver en el osciloscopio dos senales finas sinusoidales de amplitudes muy pareci-
das, una magenta y otra azul, que representan los sonidos simples componentes. Vemos
tambien una senal mas gruesa de color verde, que es la resultante de la mezcla y que
corresponde al sonido que estamos escuchando en el vdeo.
En cada una de las cinco repeticiones percibimos un solo sonido simple. Comprobamos,
as pues, que la mezcla de dos sonidos simples de la misma frecuencia produce un so-
nido simple que conserva el mismo periodo y, por lo tanto, la misma frecuencia que los
componentes, en este caso 220 Hz. En efecto, en el osciloscopio vemos que la grafica de
la senal resultante, de color verde, es tambien una senal sinusoidal. Al escuchar como
suenan podemos apreciar que la mezcla ha sido tan perfecta que los sonidos que la han
compuesto han sido fundidos, de modo que omos un solo sonido simple.
Veamos ahora en que se diferencian las distintas repeticiones de esa nota. Enseguida
nos damos cuenta de que el volumen sonoro que percibimos es diferente en cada caso.
No voy a explicar ahora como se puede calcular la amplitud y la fase inicial del sonido
resultante de la mezcla, pues no es relevante para nuestro objetivo; nos basta comprobar
en el osciloscopio que la amplitud de la senal verde, la del sonido que omos, disminuye
conforme aumentan los desfases en las sucesivas emisiones. Como casos especiales pode-
mos observar que cuando los dos sonidos estan en fase la primera emision, desfase de
0o , la amplitud del sonido resultante es la suma de las amplitudes de cada uno de los
componentes (0,20 + 0,22 = 0,42), mientras que cuando ambas senales estan en oposi-
cion de fase la ultima emision, desfase de 180o , la amplitud de la senal resultante es
la diferencia de las amplitudes de los componentes (0,22 0,20 = 0,02).
Para ver en detalle lo que sucede, la figura de abajo presenta una instantanea de la forma
de la vibracion en cada una de las cinco emisiones, de modo que cada grafica corresponde
a uno de los desfases que hemos visto en el vdeo.

5
Figura 2: Formas de la vibracion de dos sonidos simples unsonos con diferentes desfases.

Puesto que cada muestra de la senal resultante es, segun el Principio de Superposicion
Lineal, la suma de las correspondientes muestras de las senales componentes, vemos que,
conforme se van incrementando los desfases, la perdida de sincrona da lugar a que la
amplitud resultante vaya disminuyendo. En la grafica de la quinta fila, en la que ambas
senales estan en oposicion de fase, podemos apreciar que los valores de todas las muestras
son practicamente opuestos, de modo que resulta facil deducir que si ambos componentes
hubieran tenido la misma amplitud, el sonido resultante hubiera tenido una amplitud de
0, es decir, hubiera desaparecido por completo.
As pues, en este vdeo hemos podido observar que el resultado de la mezcla de dos
sonidos simples de igual frecuencia siempre es otro sonido simple de la misma frecuencia
y que el cambio en la fase inicial solo modifica la amplitud del sonido simple resultante
y, por lo tanto, solo repercute en el volumen sonoro que apreciamos, sin que afecte a la
cualidad sonora que percibimos.
Los cambios en el volumen sonoro derivados de los desfases entre dos sonidos unsonos
explican algunos problemas que pueden surgir al realizar una grabacion en un estudio.
En el caso de que la misma fuente sonora sea recogida por dos microfonos, pudiera su-
ceder que algunos componentes llegaran a cada microfono casi en oposicion de fase, lo
que podra dar lugar a que, al realizarse la mezcla, esos componentes quedaran signifi-
cativamente atenuados. Si esto ocurre se puede percibir una especie de agujero acustico
en el sonido grabado. Para evitar este problema las mesas de mezclas suelen llevar un
dispositivo que permite invertir la fase de cada senal de entrada. En la audicion directa
este problema queda minimizado por el hecho de que disponemos de dos odos y porque

6
los sonidos habitualmente llegan hasta nosotros con multiples desfases, debido a que,
por regla general, provienen de diversos lugares, como consecuencia de las reflexiones en
las paredes, techos y suelos.

4. Mezcla de dos sonidos simples de frecuencias muy proximas: Batidos


de primer orden

Vamos a estudiar ahora lo que ocurre cuando se mezclan dos sonidos simples cuyas
frecuencias estan separadas entre s por una pequena distancia, menos de 15 Hz aproxi-
madamente. El fenomeno acustico que se produce se denomina batidos de primer orden
y ha sido empleado desde tiempos muy antiguos para la afinacion de los instrumentos
musicales y la determinacion de las escalas.

4.1. Los batidos de primer orden

Para experimentar como son los batidos o pulsaciones, he fabricado un vdeo en el que
se oyen sucesivamente seis sonidos, cada uno de los cuales es el resultado de la mezcla
de dos componentes simples de frecuencias muy proximas. En cada nuevo sonido las
frecuencias de los dos componentes estan cada vez mas cercanas.

Figura 3: Vdeo con diferentes casos de batidos de primer orden.

En el osciloscopio se representan dos senales finas, que pertenecen a cada uno de los dos
componentes que se mezclan y una senal mas gruesa, que es la del sonido resultante de la
mezcla y que es el que omos. La senal de color magenta es la del componente mas grave y
la de color azul es la del componente mas agudo, mientras que la de color verde pertenece
al sonido resultante. Para poder distinguir bien cada uno de los dos componentes y para

7
que la profundidad del batido no sea excesiva, he elegido amplitudes diferentes para cada
componente: la amplitud del primero es 0,2 y la del segundo es 0,1.
En cada uno de los seis sonidos que escuchamos, la frecuencia del primer componente es
de 220 Hz (un la3 en la afinacion estandar) mientras que la del segundo va cambiando,
de modo que la diferencia entre los dos componentes es cada vez mas pequena, hasta
llegar a coincidir en el ultimo sonido: en el primer sonido la frecuencia del componente
agudo es de 228 Hz, por lo que la diferencia respecto al componente grave es de 8 Hz;
en el segundo, el componente agudo tiene una frecuencia de 224 Hz, de modo que tiene
una diferencia de 4 Hz respecto al grave; en el tercero, la frecuencia del componente
agudo es de 222 Hz, por lo que estan a 2 Hz de distancia del grave; en el cuarto caso
la frecuencia del agudo es de 221 Hz, estando solo a 1 Hz del primer componente; en el
quinto sonido la frecuencia del agudo es de 220,5 Hz, por lo que solo estan separados
0,5 Hz; y, finalmente, en el ultimo caso, los dos componentes tienen la frecuencia de 220
Hz,de modo que suenan al unsono.
A excepcion del ultimo sonido, en todos los casos omos una especie de sonido tremolado,
es decir, unos batidos o pulsaciones que se repiten de manera periodica y que coinciden
con la oscilacion de la amplitud de la senal verde que vemos en el osciloscopio. Si pres-
tamos atencion al vdeo comprobamos que el numero de batidos por segundo que omos
(es decir, la frecuencia de los batidos) coincide con la diferencia que hay entre la frecuen-
cia de los dos componentes que han intervenido en la mezcla. En efecto, en el primer
caso omos 8 batidos por segundo; en el segundo 4; en el tercero 2; en el cuarto 1; en
el quinto 1 batido cada dos segundos (es decir, 0,5 cada segundo); y en el ultimo los
batidos desaparecen y los dos componentes se quedan fundidos plenamente en un solo
sonido estable y continuo.
Ahora bien, si detenemos el vdeo en cualquier momento, con independencia de que haya
o no batidos, observaremos que en todos los casos la vibracion sigue teniendo una forma
sinusoidal. Esto explica que en todos esos sonidos, incluso cuando estan formados por
dos componentes de diferente frecuencia, omos un solo sonido simple, con una altura
tonal bien definida.
En resumen, cuando se producen los batidos de primer orden la amplitud del
sonido oscila periodicamente, pero su frecuencia permanece estable durante
toda su duracion.
Si tenemos un odo muy fino podremos apreciar que la altura tonal desciende ligersi-
mamente de un sonido a otro, conforme se van aproximando mas las frecuencias de
los dos sonidos componentes. La frecuencia del sonido resultante depende de la
frecuencia y la amplitud de los componentes que lo forman. Si la amplitud de
ambos componentes hubiera sido la misma, la frecuencia resultante de la mezcla hubiera
sido la media aritmetica de las frecuencias de los dos componentes; pero como en todos
los casos de este vdeo el componente mas grave tiene mayor amplitud, la frecuencia
resultante se aproxima mas a la de este componente. Por ello la frecuencia de los seis
sonidos que omos desciende ligeramente de un caso a otro: desde 222 Hz en el primero,

8
hasta 220 Hz en el ultimo cuando desaparecen los batidos y ambos componentes suenan
al unsono.

4.2. Causas de los batidos de primer orden

Para ver en detalle a que se debe este fenomeno, vamos a centrar nuestra atencion en las
senales del primer caso del vdeo, cuando las frecuencias de los dos componentes estan
a una distancia de 8 Hz. Veamos una grafica que corresponde a 2 decimas de segundo
de este primer sonido, en concreto, las que estan entre los segundos 1 y 1,2. En esta
grafica las senales estan mas comprimidas que en la ventana del osciloscopio, donde se
representan solo 50 milesimas de segundo, con lo que ahora podremos apreciar la forma
de los batidos.

Figura 4: Detalle de un batido de primer orden.

La grafica representa algo mas de un batido y medio. En ella podemos ver que la ligera
diferencia entre las frecuencias de los dos componentes provoca unos desfases que van
cambiando durante toda la emision del sonido. As, vemos que la senal azul y la senal
magenta (que, recordemos, corresponden respectivamente al componente de 220 Hz y
al de 228 Hz) pasan alternativamente por momentos en los que estan en fase y por
momentos en los que estan en oposicion de fase. En el primer caso la senal resultante
tiene la maxima amplitud y en el segundo, la mnima.
Por ejemplo, podemos observar que en torno a los segundos 1,07 y 1,20 las senales
magenta y azul coinciden en sus fases, con lo que en ese momento, al sumarse la amplitud
de ambos componentes, la senal verde adquiere su maxima amplitud (0,2 + 0,1 = 0,3).
Por el contrario, en torno a los segundos 1,00 y 1,13 ambas senales se encuentran en
oposicion de fase, por lo que en ese momento la amplitud resultante es la diferencia

9
entre la amplitud de ambos componentes, teniendo su valor mas bajo (0,3 0,2 = 0,1).
La profundidad del batido es la diferencia entre la amplitud maxima y mnima de la
senal resultante, por lo que en este caso es de 0,2 (como en el resto de los sonidos del
vdeo en los que hay batidos).
La variacion en los desfases entre los componentes es la causa de que la amplitud de
la senal resultante vaya modificandose a lo largo del tiempo, oscilando tambien de una
forma sinusoidal. Ese cambio periodico de la amplitud es lo que origina los batidos que
escuchamos. El ritmo de los batidos o pulsaciones es la diferencia aritmetica entre las
frecuencias de los componentes.
Para entenderlo mejor podemos imaginarnos la senal de cada componente simple como si
fuera el resultado de un movimiento circular uniforme, similar al del panel de la izquierda
del vdeo de la figura 2 del captulo 4. En un segundo el componente de color magenta
dara 220 vueltas, mientras que el componente de color azul dara 228 vueltas. Por lo
tanto, como si se tratara de una carrera de coches, en un segundo el componente magenta
habra doblado 8 veces al componente azul. Y cada vez que lo doble sus fases volveran
a sincronizarse, de modo que en la vuelta de despues de la sincronizacion, en la que ambos
componentes iran casi a la vez, se producira la maxima amplitud del sonido resultante;
por el contrario, como consecuencia de los desfases, cuando ambos componentes esten
en oposicion, el sonido resultante alcanzara su amplitud mnima.
En resumen, cuando se mezclan dos sonidos de frecuencias muy proximas, el
resultado es un solo sonido simple, cuya frecuencia se encuentra entre la
de los dos componentes y cuya amplitud oscila de forma sinusoidal tantas
veces por segundo como la diferencia que hay entre la frecuencia de los dos
componentes, dando lugar a los batidos de primer orden.
Hay que tener en cuenta que para que se perciban los batidos la diferencia entre las
frecuencias de los componentes debe ser inferior a 15 Hz, aproximadamente, pues nuestro
sistema perceptivo no tiene capacidad para distinguir con nitidez cambios mas rapidos
en la variacion de los parametros sonoros.

4.3. Batidos y afinacion

Cualquier musico que tiene que afinar su instrumento esta habituado a poner el odo, es
decir, a prestar atencion y escuchar las pequenas oscilaciones en el volumen sonoro que se
producen cuando las frecuencias de dos sonidos distintos que se emiten simultaneamente
estan muy proximas, pero no son identicas. En efecto, como el fenomeno de los batidos se
produce de manera natural siempre que se mezclan sonidos de frecuencias muy proximas,
su observacion ha sido el metodo habitualmente utilizado para afinar los instrumentos
musicales: si se conoce la frecuencia de un sonido que se utiliza de referencia, este metodo
permite la determinacion precisa de la frecuencia de otro.
El vdeo de la figura 3 nos sirve para entender como se utilizan los batidos para la afi-

10
nacion. Por ejemplo, para afinar la cuerda de una guitarra, tomando como referencia la
nota ya afinada de una cuerda inferior, empezaremos tensandola de manera aproximada
para acercarla al sonido de referencia y, una vez en ese rango, iremos ajustando su ten-
sion hasta que los batidos desaparezcan por completo. En el vdeo vemos que, conforme
las frecuencias de los componentes estan mas proximas, el ritmo de los batidos va dis-
minuyendo, hasta desaparecer cuando los sonidos estan completamente afinados.
Incluso cuando no se busca una coincidencia exacta, el numero de batidos que se produce
cada cierto tiempo proporciona al musico una medida precisa de la diferencia entre las
frecuencias de los dos sonidos. El numero de batidos que se produce por segundo (es
decir, la frecuencia de los batidos) es un medio para determinar con precision el grado
de desafinacion.
Este procedimiento no solo es valido para afinar notas unsonas, sino tambien para deter-
minar la afinacion de las principales consonancias musicales y, a partir de ah, la escala
entera. Aunque en este captulo estamos estudiando el modelo de dos sonidos simples
cuyas frecuencias se superponen en un momento dado, tenemos que tener presente que
la mayora de los sonidos que emiten los instrumentos musicales no son simples, sino que
estan formados por muchos componentes armonicos, como se estudia en el captulo 7.
Por ello, en la afinacion natural la frecuencia de algun importante componente armonico
de una nota coincidira exactamente con la frecuencia de otro armonico de la otra nota.
En la afinacion temperada, donde ya no se produce esa coincidencia exacta, el numero
de batidos permite bajar con precision las quintas, exactamente en la pequena cantidad
requerida. Este es el metodo habitualmente utilizado por los afinadores de pianos.

5. Mezclas de dos sonidos simples en funcion de la distancia entre sus


frecuencias y de la anchura de su banda crtica

Debido a las caractersticas de nuestro sistema auditivo, cuando se mezclan dos sonidos
simples de diferente frecuencia es necesario que entre ellos exista suficiente distancia
frecuencial para que podamos percibirlos individualmente. Esta separacion mnima, a la
que llamamos anchura de la banda crtica, no es igual en todas las regiones frecuencia-
les, pues la capacidad de resolucion de nuestra percepcion auditiva depende de la zona
frecuencial en la que estan situados los sonidos que se mezclan.
En efecto, segun la separacion entre las frecuencias de dos sonidos simples emitidos
simultaneamente, se pueden producir cuatro situaciones diferentes:
a) Cuando la diferencia es menor de unos 15 Hz omos un solo sonido tremolado, los
batidos de primer orden que acabamos de ver.
b) A partir de 15 Hz, aproximadamente, de distancia entre ellos, dejamos de or un
solo sonido tremolado y empezamos a escuchar una especie de zumbido aspero, sin que
todava seamos capaces de distinguir dos alturas tonales diferenciadas.

11
c) Cuando la separacion esta cerca de la anchura de la banda crtica correspondiente a
la zona frecuencial en la que se hallan los dos componentes que se mezclan, comenzamos
a distinguir ya dos sonidos, pero la cualidad sonora de la mezcla sigue siendo aspera y
rugosa.
d) Conforme aumenta la distancia entre las frecuencias de los dos componentes, la cua-
lidad sonora se va haciendo cada vez menos rugosa, hasta que, una vez superada hol-
gadamente la anchura de su banda crtica, llega un momento en el que percibimos con
nitidez los dos sonidos.
Para experimentar esto, he fabricado, a partir de fotogramas construidos mediante
Matlab, un vdeo con cuatro sonidos en los que se mezclan dos componentes simples
de la misma amplitud. Las frecuencias de los dos componentes se van distanciando pro-
gresivamente: en todos los casos la frecuencia del componente grave es 220 Hz, un la3
temperado; en el primer sonido, la frecuencia del componente agudo es 233,1 Hz, que
corresponde al sib3 de la escala temperada habitual, de modo que la distancia frecuen-
cial respecto al componente grave es de 13,1 Hz; en el segundo sonido, la frecuencia del
componente agudo es 246,9 Hz, el si3 de la escala temperada, con lo que la distancia
respecto al grave es de 26,9 Hz; en el tercer sonido, la frecuencia del componente agudo
es 261,6 Hz, el do4 de la escala temperada, con lo que la distancia respecto al grave es de
41,6 Hz; y en el cuarto sonido la frecuencia del componente agudo es 311,1 Hz, el mib4
de la escala temperada, de modo que la diferencia con el componente grave es de 91,1
Hz.

Figura 5: Vdeo que muestra la importancia de la banda crtica en la percepcion individual de


dos sonidos proximos.

En el primer sonido, donde los componentes estan separados 13,1 Hz, omos una nota
simple tremolada, con unos batidos muy rapidos y muy profundos, similares a los que
hemos odo en los primeros casos del vdeo de la figura 3. En efecto, como la distancia
frecuencial es menor de 15 Hz, estamos ante un caso de una mezcla en la que se percibe

12
un solo sonido, pero en la que se producen batidos de primer orden, como hemos visto
en el apartado anterior. Lo he incluido aqu para que podamos comparar su sonido con
el de los siguientes casos. La altura tonal que percibimos corresponde a una nota situada
entre el la3 y el sib3 , pues, al ser igual la amplitud de ambos componentes, la frecuencia
del sonido resultante es la media aritmetica entre ellos, es decir, 226,6 Hz.
En el segundo sonido , cuando la distancia entre las frecuencias de los dos componentes
es de 26,9 Hz, no omos ya ninguna nota musical, ni una sola nota tremolada, ni tampoco
las dos notas por separado, sino un sonido aspero y rugoso, como un zumbido. Ello se
debe a que, cuando la diferencia aritmetica entre las frecuencias de los dos componentes
supera los 15 Hz aproximadamente, la frecuencia de los batidos es tan rapida que nuestro
sistema auditivo es incapaz de seguirlos. Por eso ya no podemos distinguir un solo sonido
simple tremolado, sino que omos un sonido sucio y rugoso, un zumbido borroso en el
que no omos en absoluto los componentes individuales de la mezcla.
En el tercer sonido, en el que la distancia entre las frecuencias es de 41,6 Hz, podemos
apreciar ya las dos notas por separado, el la3 y el do4 , aunque la cualidad de la mezcla
que omos sea sucia y borrosa.
En el cuarto sonido, sin embargo, cuando la distancia entre las frecuencias es de 91,1
Hz, distinguimos con nitidez dos notas individuales, el la3 y el mib4 , y el caracter rugoso
de la mezcla anterior ha desaparecido, siendo sustituido por una sonoridad mucho mas
clara y eufonica.
Estos fenomenos son de orden psicoacustico, es decir, se deben a las peculiaridades de
nuestro sistema auditivo, en concreto, a la fisiologa de nuestro odo interno. Como con-
secuencia de ello, para poder distinguir dos sonidos simples simultaneos es necesario que
la separacion entre ellos supere una distancia mnima. La anchura de la banda crti-
ca vara en funcion de la zona frecuencial de los sonidos que se superponen,
incrementandose conforme los sonidos son mas agudos. En los casos del vdeo
la anchura de la banda crtica esta en torno a los 40 Hz. Ello explica que no hayamos
sido capaces de distinguir en el vdeo los componentes simples cuando la distancia entre
sus frecuencias era inferior a esta cantidad y, sin embargo, en el ultimo caso, cuando la
separacion excede en mucho a la anchura de la banda crtica de esta region frecuencial
los omos con claridad.
Es oportuno aclarar que, si en lugar de sonidos simples, se hubieran superpuesto notas
normales es decir, compuestas por varios armonicos, hubieramos podido distinguir-
las con facilidad, pues la distancia entre sus armonicos superiores hubiera excedido la
anchura de su banda crtica correspondiente.

13
6. Mezcla de dos sonidos simples cuyas frecuencias estan en relacion
de conmensurabilidad proxima: Consonancias

Cuando las distancias entre las frecuencias de dos sonidos simples que se superponen
sobrepasan holgadamente la anchura de la banda crtica, de modo que ya no percibimos
zumbidos o rugosidades, hay ocasiones en las que se produce una mezcla tan bien amal-
gamada que los dos sonidos casi parecen fundirse en uno. Esta mezcla recibe el nombre
de consonancia.
Antes de continuar, conviene hacer una aclaracion. El concepto de consonancia que va-
mos a estudiar en estos captulos no hace referencia al caracter mas o menos eufonico que
resulta de la mezcla de los sonidos, sino al especial acoplamiento fsico entre las vibra-
ciones sonoras que se produce cuando sus frecuencias son cercanamente conmensurables.
Por ejemplo, el acorde de septima disminuida puede perfectamente ser considerado hoy
en da eufonico, pero nunca sera una combinacion consonante.
Si bien las consonancias entre los sonidos reales de la musica, cada uno de ellos formado
habitualmente por muchos componentes armonicos, se estudiaran mas adelante (en el
captulo dedicado al modo en el que reconocemos el sonido musical), primero es conve-
niente entender en que consiste la consonancia entre sonidos simples. As pues, a conti-
nuacion vamos comprobar, mediante nuestra experiencia auditiva directa, que cuando
se superponen dos sonidos simples cuyas frecuencias mantienen entre s una
relacion de conmensurabilidad proxima se produce una consonancia.

6.1. Conmensurabilidad proxima

Empecemos puntualizando que es la conmensurabilidad proxima. Dos cantidades son


conmensurables cuando tienen una medida comun, es decir, cuando la relacion entre
ellas puede ser expresada mediante un numero racional o, lo que es lo mismo, mediante
el cociente de dos numeros enteros. Por ejemplo, 11:7 o 23:12.
Ahora bien, en fsica, astronoma, otras ciencias en general y en la musica en particular,
hay circunstancias en las que es relevante que esa razon sea sencilla. Podemos conside-
rar que una razon es sencilla cuando, expresada como fraccion irreducible, sus terminos
estan comprendidos entre los primeros numeros enteros positivos. Diremos en ese caso
que su conmensurabilidad es proxima. As pues, dos numeros estan en razon de
conmensurabilidad proxima cuando los terminos de la fraccion irreductible
que los relaciona son alguno de los primeros numeros enteros positivos. Con-
forme menores sean los terminos de la fraccion irreducible, mas sencilla sera la razon y
mas proxima la conmensurabilidad. En este sentido, 2/1 es una razon mas sencilla que
3/2, y esta mas sencilla que 4/3.
En lo que concierne a la musica, esta sencillez tiene que ver con los lmites de nuestro
sistema auditivo. La proximidad de los terminos de la razon entre las frecuencias de

14
dos sonidos simples va a permitir que nuestro odo perciba su superposicion como una
buena mezcla y los reconozca como consonantes: cuando las dos frecuencias que se
superponen son cercanamente conmensurables, las vibraciones de los sonidos
coinciden de modo periodico cada pocos ciclos, lo que hace que el patron de
repeticion de las coincidencias sea lo suficientemente sencillo como para que
nuestro sistema perceptivo sea capaz de seguirlo. De ese modo podemos or la
mezcla como un sonido perfectamente amalgamado.
Cuando las frecuencias de los dos sonidos componentes estan en una relacion doble, 2/1,
sucede que mientras una vibracion completa un ciclo entero, la otra completa exactamen-
te dos; cuando estan en una relacion sesquialtera, 3/2, ocurre que mientras una vibracion
realiza dos ciclos, la otra hace exactamente tres. Por eso conforme mas proxima es la
conmensurabilidad, mas unitaria resulta la mezcla de las vibraciones de los dos sonidos
simples, hasta el punto de que en la octava, 2/1, la mas perfecta de las consonancias,
practicamente omos un solo sonido.
As pues, la consonancia, mas que un hecho fsico externo, viene dada por
la capacidad de nuestro odo para reconocer un sonido unitario cuando se
combinan dos vibraciones cuya periodicidad coincide cada pocos ciclos. Por
eso, conforme la conmensurabilidad se aleja, percibimos un sonido cada vez mas comple-
jo: cada vez omos menos el resultado de la mezcla y los componentes individuales van
adquiriendo mas presencia.
La cuestion sera precisar hasta donde podemos considerar que una razon expresa una
conmensurabilidad proxima. La teora musical creada por los antiguos, que realizaba los
calculos atendiendo a la longitud de la cuerda y no al valor de la frecuencia, consideraba
que solo los intervalos formados por razones cuyos terminos estaban comprendidos entre
los cuatro primeros numeros enteros eran consonantes. De acuerdo a este criterio, dentro
del rango de la octava, seran consonantes las mezclas de sonidos que estan en razon doble
(2/1), es decir, que estan a distancia intervalica de una octava; en razon sesquialtera
(3/2), los que estan a distancia de un intervalo de quinta; o en razon sesquitercia (4/3),
en un intervalo de cuarta. No en vano estos intervalos son los que han estructurado las
escalas musicales de Occidente.
Desde el punto de vista de nuestra percepcion musical, la relacion 5/4 podra incluirse
tambien entre las razones simples, pero lo cierto es que el intervalo de tercera mayor (al
que, en principio, correspondera en nuestras escalas) queda ya bastante alejado de esta
razon: el intervalo de 5/4 esta 14 cents por debajo de la tercera mayor temperada y 22
cents por debajo del dtono que surge en la afinacion por quintas justas de 3/2.

6.2. Consonancias entre sonidos simples

Una vez entendido que es la conmensurabilidad proxima en acustica y por que da lugar
a las mezclas consonantes, vamos ahora a experimentar como son las senales de au-
dio de las mezclas de dos sonidos simples cuyas frecuencias, expresadas como fraccion

15
irreducible, son uno de los cuatro primeros numeros enteros positivos. Siguiendo el pro-
cedimiento habitual, he fabricado varios vdeos mediante los cuales podremos comprobar
que en esos casos nuestro odo reconoce con claridad la buena mezcla, lo que llamamos
la consonancia.
En el vdeo de la figura 6 podemos escuchar las consonancias que se pueden establecer
entre los cuatro primeros numeros enteros positivos: la consonancia de octava, la de
doble octava, la de octava y quinta, la de quinta y la de cuarta.
En todos los ejemplos del vdeo la frecuencia del componente grave es 220 Hz (la3 ). En
el primer caso la frecuencia del componente agudo es 440 Hz (la4 ), por lo que ambos
sonidos mantienen la razon 2/1, que es la que define el intervalo de octava. En el se-
gundo, el componente agudo tiene una frecuencia de 660 Hz (mi5 natural), por lo que
los dos componentes estan entre s en razon 3/1, la que define el intervalo de octava y
quinta natural. En el tercero, el sonido agudo es de 880 Hz (la5 ) y la razon respecto al
componente grave es 4/1, por lo que entre ambos forman un intervalo de doble octava.
En el cuarto, el componente agudo es de 330 Hz (mi4 natural) y forma respecto al grave
una razon de 3/2, que corresponde al intervalo de quinta natural. En el quinto caso, la
frecuencia del sonido agudo es 293,3 Hz (re4 natural) y su razon respecto al grave es 4/3,
con el que forman un intervalo de cuarta natural. Para que se distingan mejor los dos
componentes, la amplitud de cada uno de ellos es diferente: la del componente grave es
0,2 y la del agudo 0,1.

Figura 6: Vdeo con las consonancias definidas por los cuatro primeros numeros enteros.

Si ponemos un poco de atencion, en todos estos ejemplos, ademas del sonido resultante
de la mezcla, tambien podemos or cada uno de los dos componentes por separado.
Solamente en el primer caso, cuando las frecuencias estan en razon 2/1, predomina la
tendencia a percibir un solo sonido, en lugar de dos sonidos simultaneos distintos que se
mezclan bien. Pero incluso ah, si orientamos un poco nuestra escucha para hacerla mas

16
analtica, podemos apreciar las dos notas individuales.
Para entender por que percibimos en todos los casos la superposicion de los dos sonidos
componentes como una mezcla consonante, vamos a fijarnos en la forma de la vibracion
de cada uno de los ejemplos que vemos en el osciloscopio del vdeo. Para poder comparar
unas formas con otras, la figura 7 representa un fragmento de la senal de audio de cada
uno de los ejemplos del vdeo.

Figura 7: Formas de la vibracion de las consonancias entre los cuatro primeros numeros enteros.

En los tres primeros casos podemos observar que cada vez que el componente grave, el de
color magenta (el sonido de 220 Hz, que es comun a todos ellos) realiza un ciclo completo,
el componente agudo, el de color azul, completa exactamente un numero entero de ciclos:
dos ciclos en el caso de la octava (de ah la razon 2/1); tres en el caso de la octava y
quinta natural (de ah la razon 3/1); y cuatro en el caso de la doble octava (de ah la
razon 4/1). Ello hace que en todos estos casos el sonido resultante de la mezcla tenga
el mismo periodo que el del componente mas grave, como podemos comprobar en las
graficas.
En la cuarta grafica, en el caso de la quinta natural, vemos que cada dos ciclos del
componente grave, el componente agudo completa exactamente tres (de ah la razon
3/2). Por ello, el periodo del sonido resultante es el doble que el del componente mas
grave o, lo que es lo mismo, el triple del periodo del componente mas agudo.
En la ultima grafica, en el caso de la cuarta natural, observamos que cada tres ciclos
del componente grave, el componente agudo completa exactamente cuatro (de ah la

17
razon 4/3). De esta forma, el periodo del sonido resultante es el triple del periodo del
componente mas grave y el cuadruple del mas agudo.
As pues, en este vdeo y en las graficas correspondientes, hemos podemos observar que
la conmensurabilidad es la causa de la aparicion de una periodicidad en la
mezcla resultante.
Podra parecer que esta periodicidad debera haber dado lugar a la percepcion de la
altura tonal correspondiente a la mezcla. Si esto hubiera sido as, en el cuarto caso,
por ejemplo, deberamos haber odo la nota la2 , que correspondera al periodo de la
mezcla resultante, en lugar de las notas individuales la3 y mi4 bien amalgamadas y
formando la consonancia de quinta. Sin embargo, esto no ocurre as, salvo que el equipo
de musica en el que estemos oyendo los ejemplos distorsione y provoque la aparicion
de componentes espurios, como veremos un poco mas adelante. La explicacion de ello
reside en que nuestra percepcion es frecuencial, de modo que, como estudiaremos en el
captulo correspondiente, omos dos notas y no una sola nota mas grave correspondiente
a la senal resultante.

6.3. De la consonancia a la disonancia

Pero, debido a los margenes de nuestra percepcion, las fronteras entre lo que nos suena
consonante y lo que nos parece disonante son algo difusas.
Para observar donde acaba la consonancia y donde empieza la disonancia, he fabricado un
vdeo con varios casos en los que se mezclan dos sonidos simples cuya distancia intervalica
esta en torno a la quinta: la quinta natural o quinta justa (la que propiamente esta en
razon 3/2), la quinta temperada, la quinta disminuida y una quinta desafinada. He elegido
el ambito intervalico de la quinta por dos razones: primero porque la quinta justa es la
consonancia en la que se pueden distinguir con mas facilidad los dos componentes; y,
segundo, porque en nuestro sistema musical tambien se encuentran la quinta temperada y
la quinta disminuida, por lo que estamos familiarizados con ellas y podemos compararlas.
He anadido la quinta desafinada para permitir apreciar la diferencia.
En todos los ejemplos la frecuencia de la nota grave es 220 Hz (la3 ). En el primer caso
la frecuencia de la nota aguda es 330 Hz (mi4 natural), por lo que estan exactamente
en razon 3/2 y forman el intervalo de quinta natural o justa. En el segundo caso la
frecuencia de la nota aguda es de 329,6 (mi4 temperado) por lo que forman un intervalo
de quinta temperada (700 cent) con la nota grave (la quinta temperada esta solamente
2 cent por debajo de la quinta justa). En el tercer caso la frecuencia de la nota aguda es
325,8 Hz (mi4 desafinado) y forman un intervalo de quinta que esta 20 cent por debajo
del que formara con el mi4 temperado. Y en el cuarto caso la frecuencia de la nota
aguda es 311,1 Hz (mib4 ) y forma un intervalo de quinta disminuida (600 cent) con la
nota grave. Para permitir que se distingan la amplitud del componente grave es 0,2 y la
del agudo 0,1.

18
Figura 8: Vdeo que ilustra el paso de la consonancia a la disonancia.

En todos los casos omos los dos sonidos de forma independiente, pues la distancia entre
ellos excede con mucho la anchura de la banda crtica de esa zona frecuencial, que esta en
torno a los 55 Hz, lo cual, como hemos visto en los apartados anteriores, es una condicion
necesaria para que podamos reconocer con claridad ambos sonidos. Analicemos con un
poco de detenimiento lo que ocurre en cada caso.
a) En el primer caso, cuando las frecuencias de los componentes estan exactamente
en razon 3/2 y forman la consonancia de quinta natural, omos una mezcla muy bien
amalgamada y observamos en el osciloscopio que la forma de la vibracion resultante
permanece totalmente estable. En efecto, el maximo comun divisor de las frecuencias
de los dos componentes (220 y 330) es 110. Esto quiere decir que la forma de la vi-
bracion de la mezcla resultante se repite 110 veces por segundo y que, por lo tanto, su
periodo es 1/110 s, o sea, redondeando, 9 milesimas de segundo. As pues, cada 9 ms
aproximadamente ambos componentes se sincronizan: el sonido grave completa 2 ciclos
mientras que el sonido agudo completa 3, como podemos comprobar en el osciloscopio
si detenemos el vdeo. Este periodo de 9 ms esta dentro del rango temporal en el que
nuestro sistema auditivo es capaz de detectar periodicidades en la forma de la vibracion.
Por eso, aunque seguimos oyendo los dos componentes por separado, percibimos que se
combinan muy bien, por lo que obtenemos una clara sensacion de buena mezcla, una
mezcla sin perturbaciones que no vara a lo largo del tiempo.
b) En el segundo caso, en el que se mezclan dos sonidos que estan en intervalo de
quinta temperada, la razon entre sus frecuencias, redondeadas a decimas de hercio, es
3296/2200. Esta razon expresada como fraccion irreducible es 412/275, la cual no es para
nada una razon sencilla, por lo que las frecuencias de los componentes estan muy lejos
de mantener una relacion de conmensurabilidad proxima. Sin embargo, la diferencia
entre la frecuencia del componente agudo (329,6 Hz) y la del componente agudo del
caso de la consonancia de quinta natural (330 Hz) es solamente de cuatro decimas de
hercio. En efecto, bastara con subir 0,4 Hz la frecuencia de la nota aguda para obtener

19
la razon simple 3/2. Por ello tambien ahora omos un intervalo de quinta cuyas notas
se mezclan bien, lo que coincide con la cuasi-periodicidad que observamos en la senal
verde del vdeo. Ahora bien, la mezcla que omos ya no es totalmente estable como en
el caso anterior, sino que, si prestamos atencion, podremos or que va acompanada de
una lenta y periodica evolucion de la cualidad sonora, lo cual tambien se refleja en la
cclica evolucion de la forma de la senal resultante que observamos en el osciloscopio,
una forma que parece estirarse y encogerse como si se tratara de una goma elastica. En
el siguiente apartado, en el que se estudian los batidos de segundo orden, se explica a
que se debe este fenomeno.
c) En el tercer caso, en la superposicion de dos sonidos que forman un intervalo de
quinta desafinada (20 cent menos que la quinta temperada), vemos que la razon entre
sus frecuencias es 3258:2200, que expresada como fraccion irreducible es 1629:1100, la
cual esta muy alejada de ser una razon simple y, por lo tanto, de mantener una con-
mensurabilidad proxima. El sonido agudo, el de 325,8 Hz, es 4,2 Hz mas grave que el
sonido agudo de la mezcla consonante justa, que tiene 330 Hz. Es decir, le faltan 4,2
Hz para mantener, respecto al sonido grave, la razon simple mas cercana, en este caso
la razon 3:2. Y esta diferencia es ya significativa. Por ello ahora percibimos que esta
mezcla nos produce una sensacion de inestabilidad. El ritmo de las modificaciones de
la cualidad sonora es ya tan rapido que dificulta la buena amalgama de los dos compo-
nentes y percibimos ahora claramente los batidos de segundo orden. Podemos apreciar
tambien esa inestabilidad en el osciloscopio del vdeo, donde la senal resultante modifica
constantemente su forma.
d) En el cuarto caso, en el que se superponen dos sonidos que estan en un intervalo
de quinta disminuida, omos una disonancia. Percibimos con claridad cada uno de los
sonidos componentes, pero ahora ya no tenemos la sensacion de que se amalgamen
el uno con el otro. As mismo vemos en el osciloscopio que la forma de la vibracion
cambia constantemente. Si atendemos a sus frecuencias (220 Hz y 311,1 Hz), vemos
que la razon entre ellas es 3111:2200, que es ya una fraccion irreducible, por lo que su
conmensurabilidad es muy alejada: el sonido grave tendra que completar 2200 ciclos y el
agudo 3111 para que sus fases volvieran a sincronizarse y se repitiera de nuevo la forma
de la vibracion. El periodo de la senal resultante sera, por lo tanto, de 10 segundos, lo
que, a efectos de nuestra percepcion, es equivalente a decir que no hay ningun periodo.
Con la finalidad de expresar este intervalo como una razon mas simple, podramos bajar
la afinacion del sonido agudo 1,1 Hz y atribuirle una frecuencia de 310 Hz. En ese caso
la razon simple entre las frecuencias expresada como fraccion irreducible sera 31:22, por
lo que cada 22 ciclos del sonido grave, el sonido agudo completara 31. Pero, incluso
en este caso, la conmensurabilidad seguira siendo muy alejada el periodo de la senal
resultante sera ahora un segundo por lo que percibiramos esa mezcla tambien como
una disonancia.
En resumen, en el intervalo de quinta natural omos una mezcla perfecta y totalmente
estable; en el de quinta temperada el ritmo con el que se producen las alteraciones de
la cualidad sonora es tan lento que no apreciamos ninguna inestabilidad, por lo que la

20
sensacion de mezcla es casi perfecta, e incluso notamos que esa pequena inexactitud
dulcifica y da calor al sonido resultante; en el intervalo de quinta desafinada la mezcla
esta perturbada por un cierta inestabilidad provocada por unas rapidas y periodicas
alteraciones de la cualidad sonora; y en el intervalo de quinta disminuida no tenemos
para nada la sensacion de que los componentes se hayan mezclado entre s.
Mediante este vdeo hemos podido experimentar que, si bien solo percibimos exacta-
mente como una buena mezcla la superposicion de dos sonidos simples cuyas frecuencias
estan en conmensurabilidad proxima, nuestra percepcion auditiva permite ciertos marge-
nes de tolerancia dentro de los cuales se encuentran los ajustes propios de las escalas
temperadas. Hemos comprobado que, mas alla de esos margenes, cuando no se produce
una razon matematica simple entre las frecuencias de los componentes, los periodos de
ambas vibraciones solo se sincronizan tras un periodo de tiempo demasiado largo como
para que nuestro odo sea capaz de reconocerlo, por lo que no omos una buena mezcla,
sino dos sonidos independientes que van cada uno por su lado y su combinacion nos
resulta disonante.
As pues, hemos podido experimentar que la consonancia entre sonidos simples
se debe al reconocimiento de una periodicidad en la vibracion resultante.
Esta periodicidad no da lugar a la desaparicion de los sonidos individuales en la mezcla
resultante, pues nuestra audicion es principalmente frecuencial, pero en el caso de los
sonidos simples es la unica razon que explica que percibamos la especial buena mezcla a
la que llamamos consonancia.

6.4. Grados de consonancia segun la conmensurabilidad

Nuestra percepcion auditiva no es igual para todas las consonancias, sino que el grado de
perfeccion de la consonancia disminuye conforme la conmensurabilidad entre las frecuen-
cias de los dos sonidos simples que se mezclan se hace mas lejana. Para experimentar
este fenomeno he confeccionado un vdeo con cinco ejemplos en los que se mezclan dos
componentes simples, dentro del rango de una octava. En todos los casos sus frecuencias
estan en una razon simple proxima y, por lo tanto, forman una consonancia, pero su con-
mensurabilidad se va alejando, desde el unsono (1/1) hasta la consonancia de tercera
mayor natural (5/4).
En todos los ejemplos la frecuencia del componente grave es 440 Hz, un la4 en la afinacion
habitual. La frecuencia del componente agudo va cambiando: en el primer caso es tambien
440 Hz, por lo que ambas notas forman un unsono (1/1); en el segundo, es 880 Hz, un
la5 , por lo que forman una octava (2/1); en el tercero es 660 Hz, un mi5 , formando un
intervalo de quinta natural (3/2); en el cuarto caso, redondeando a decimas de hercio, es
586,7 Hz, un re5 , por lo que forman un intervalo de cuarta natural (4:3); y en el quinto
caso la frecuencia aguda es 550 Hz, un do#5 , formando una tercera mayor natural (5:4).
En este vdeo he elegido como nota grave la4 , una nota que esta en una octava mas aguda
que la de los vdeos anteriores, para evitar que en la consonancia de tercera mayor las

21
frecuencias de los dos sonidos se aproximaran a la anchura de la banda crtica y se
generara alguna rugosidad en la mezcla resultante. Como referencia para nuestro odo,
a fin de facilitar la escucha individualizada de los componentes del intervalo de octava,
he incluido tambien el unsono.

Figura 9: Vdeo con las consonancias de unsono, octava, quinta, cuarta y tercera mayor.

En el osciloscopio del vdeo podemos apreciar que la forma de la vibracion permanece


totalmente estable en todos los casos y que en cada uno de ellos omos con claridad
una mezcla consonante. En efecto, al mantener las frecuencias de los dos sonidos una
relacion de conmensurabilidad proxima, el periodo de la senal resultante esta dentro de
los margenes en los que nuestro sistema auditivo es capaz de detectar la sincronizacion
de ambas vibraciones, de modo que percibimos una buena mezcla.
Pero si escuchamos con un poco de atencion nos damos cuenta de que no todas las
mezclas son igualmente armoniosas, sino que, a medida que avanza el vdeo y la con-
mensurabilidad entre las frecuencias se va alejando, se produce una perdida progresiva
de la sensacion de buena mezcla. Conforme la conmensurabilidad de las fre-
cuencias es mas alejada, el periodo de su sincronizacion es mayor y la forma
de la vibracion resultante adquiere mayor complejidad, por lo que cada vez
se hace mas difcil percibir las coincidencias periodicas entre los dos sonidos.
Ello da lugar a la progresiva disminucion de la sensacion de buena mezcla: desde la
octava, en la que la amalgama de los dos componentes es tan fuerte que se hace difcil
su escucha individualizada, hasta la tercera mayor natural, donde la sensacion de buena
mezcla es ya bastante debil.

6.5. La fase inicial en la mezcla consonante

Veamos ahora como afecta la fase inicial a las consonancias. En el caso de la mezcla unso-
na hemos visto que la diferencia de fase entre los componentes modifica notablemente

22
la amplitud del sonido resultante y, en consecuencia, el volumen sonoro que percibimos.
Pero, a diferencia del unsono, los desfases entre dos componentes consonantes,
si bien modifican la forma de la vibracion resultante, no alteran el volumen
sonoro que omos, ni ninguna otra cualidad sonora, al menos de un modo
claramente perceptible.
Para observar que la forma de la vibracion viene determinada por la fase inicial de los
sonidos componentes y experimentar que nuestro odo no aprecia diferencias significa-
tivas, he confeccionado un vdeo con seis ejemplos en los que se mezclan dos sonidos
simples, todos ellos en consonancia de octava, pero con diferentes desfases entre sus
componentes.
En todos los casos las frecuencias de los sonidos son las mismas: 220 Hz (la3 ) y 440 Hz
(la4 ). La fase inicial del componente grave es siempre 0o , pero el sonido agudo se va
adelantando sucesivamente 60o respecto al caso anterior: en el primero es tambien de 0o ;
en el segundo es 60o ; en el tercero, 120o ; en el cuarto, 180o ; en el quinto, 240o ; y en el
sexto, 300o . La amplitud del componente agudo es 0,3 y la del grave 0,1.

Figura 10: Vdeo de dos sonidos en consonancia de octava con diferentes desfases.

Podemos ver en el osciloscopio que la forma de la vibracion es diferente en cada caso.


Pero, hasta que punto las diferencias en la forma de la vibracion que aparecen en el
osciloscopio pueden ser percibidas por nuestro odo? Comprobamos que no es sencillo
reconocer diferencias. Si prestamos mucha atencion y omos repetidas veces los diferentes
ejemplos, puede que apreciemos alguna sutil diferencia entre ellos, pero se trata de algo
que es practicamente irrelevante. Como mucho, podemos reconocer un pequeno cambio
de volumen o una ligersima modificacion en la cualidad sonora.
Lo mismo hubiera sucedido si hubieramos elegido cualquier otra consonancia. La conclu-
sion, as pues, es que las diferencias de fase entre los sonidos componentes de una mezcla
consonante no son reconocidas por nuestra percepcion auditiva.

23
7. Mezcla de dos sonidos simples cuyas frecuencias se alejan un poco
de la conmensurabilidad proxima: Batidos de segundo orden

Cuando las frecuencias de dos sonidos simples que se superponen se alejan ligeramente
de las que deberan tener para estar en una razon de conmensurabilidad proxima y
ser, por lo tanto, consonantes se produce una modificacion periodica de la forma de la
vibracion resultante, la cual es percibida por nuestro odo como una oscilacion regular
de la cualidad sonora. Este fenomeno recibe el nombre de batidos de segundo orden.
Estos fenomenos recuerdan mucho a las interferencias que se producen entre sonidos
muy proximos al unsono (es decir, los batidos de primer orden), pero sus causas y sus
efectos no son exactamente los mismos.
He fabricado un vdeo que nos va a permitir experimentar como se producen los batidos
de segundo orden cuando se mezclan dos sonidos cuyas frecuencias estan muy proximas
a la consonancia de octava. En todos los casos la frecuencia del componente mas grave
es de 220 Hz (la3 ). En el primer caso la frecuencia del componente agudo es de 446 Hz,
con lo que la diferencia respecto a la frecuencia que debera tener para estar en razon
doble (440 Hz) es de 6 Hz; en el segundo caso la frecuencia del componente agudo es
de 444 Hz, es decir, tiene una diferencia respecto a la consonancia de octava de 4 Hz;
en el tercer caso la frecuencia aguda es de 442 Hz con lo que su diferencia es de 2 Hz;
y en el cuarto caso la frecuencia del sonido agudo es de 440 Hz, con lo que la razon
que mantiene con el sonido grave es exactamente la de octava. Para que se distingan
bien los dos componentes y para que se aprecie mejor el fenomeno de los batidos de
segundo orden, la amplitud de cada componente es diferente: la del primero es 0,3 y la
del segundo 0,1.

Figura 11: Vdeo con los batidos de segundo orden de dos sonidos cuyas frecuencias estan muy
proximas a la octava.

24
En los tres primeros sonidos podemos observar que la forma de la vibracion resultante
cambia periodicamente, como si se tratara de una goma elastica, mientras que su am-
plitud, al margen de los cambios de posicion que acompanan la evolucion de la forma,
permanece practicamente constante. En el ultimo caso, por el contrario, cuando son per-
fectamente consonantes, la senal permanece totalmente estable. En todos ellos, el ritmo
con el que la forma de la vibracion evoluciona coincide con la variacion periodica en la
cualidad del sonido que omos. Estas variaciones periodicas dan lugar a los batidos de
segundo orden. Los batidos de segundo orden se repiten tantas veces por segundo como
la diferencia que hay entre la frecuencia que tiene el sonido agudo y la que debera tener
para mantener la razon exacta de octava (440 Hz): en el primer caso, 6 veces por segun-
do; en el segundo caso, 4 veces por segundo; y en el tercero, 2 veces por segundo. En el
ultimo caso, al mantener la frecuencia de los dos sonidos la razon 2:1 exacta, desaparecen
los batidos y los dos sonidos se funden perfectamente.
Veamos la explicacion de este fenomeno. En el vdeo de la figura 10, donde los dos sonidos
mantienen exactamente la razon 2/1, hemos visto que los desfases entre los sonidos
dan lugar a diferentes formas en la vibracion resultante, pero, puesto que esos desfases
permanecen constantes durante la emision de cada sonido, la forma de la vibracion
resultante se mantiene estable en todos los casos. Pero ahora las frecuencias de los dos
sonidos que se mezclan no estan exactamente en la razon 2/1, sino que el sonido agudo
difiere en algunos hercios del que debera tener para que la mezcla fuera exactamente
una octava.
Esta ligera diferencia da lugar a que el desfase entre ambas senales vaya aumentando,
haciendo que la forma de la vibracion resultante no permanezca constante, sino que
vaya cambiando a lo largo del tiempo. Estas modificaciones en la forma de la vibracion
se repiten cclicamente, pues el progresivo incremento de los desfases hace que cada
cierto periodo de tiempo ambos sonidos vuelvan a estar en fase y comience un nuevo
ciclo. Los batidos de segundo orden son los cambios cclicos en la forma de
la vibracion que nuestro odo percibe como una periodica oscilacion en la
cualidad sonora.
As pues, la razon por la que se producen tanto los batidos de primer orden como los de
segundo orden es la misma: la evolucion en el desfase entre los dos componentes cuando
se alejan ligeramente de los numeros que definen las razones exactas del unsono (1/1)
o de las consonancias (2/1, 3/2, 4/3).
Sin embargo, la naturaleza de los batidos de primer orden (que se producen en lo que
podramos llamar cuasi-unsono) y los de segundo orden (que se dan en lo que podramos
llamar cuasi-consonancia) es distinta. Los primeros provocan una evolucion cclica de la
amplitud y son percibidos por nuestro odo como un tremolo en el sonido resultante,
mientras que los batidos de segundo orden no afectan a la amplitud de la senal resultante,
sino que producen una modificacion, tambien cclica, de la forma de la vibracion y son
percibidos por nuestro odo como una variacion periodica de la cualidad sonora. En el
captulo dedicado a la fisiologa de la audicion estudiaremos la causa de que, siendo

25
nuestra audicion frecuencial, percibamos estos batidos de segundo orden.
En el caso de la cuasi-consonancia de octava, el numero de batidos por segundo es la
diferencia entre la frecuencia que tiene el sonido mas agudo y la que debera tener para
mantener la relacion exacta 2/1, como hemos podido apreciar en el vdeo de la figura
11.
En lo que respecta a la cuasi-consonancia de quinta, el numero de batidos por segundo
es el doble de la diferencia que hay entre la frecuencia del sonido agudo y la que debera
tener para mantener la razon exacta de 3/2. En efecto, si volvemos al vdeo de la figura 8,
podemos apreciar que la desafinacion del intervalo de quinta provoca batidos de segundo
orden. Donde se perciben mas claramente es en el ejemplo en el que la quinta esta bajada
20 cent. All el componente agudo tiene una frecuencia de 325,8 Hz, cuando debera tener
330 Hz para mantener la razon exacta de quinta, 3/2, con el componente grave de 220
Hz. La diferencia es de 4,2 Hz y el numero de batidos que percibimos por segundo es
8,4, el doble de esa diferencia. En el caso de la quinta temperada la diferencia es de 0,4
Hz y el numero de batidos por segundo de 0,8.
En el caso de la cuasi-consonancia de cuarta el numero de batidos por segundo que
percibimos es el triple de la diferencia entre la frecuencia que tiene el componente y la
que debera tener para mantener la razon exacta de la cuarta, 4/3.

8. Distorsion y componentes espurios en la mezcla de dos sonidos sim-


ples

Por ultimo, para concluir este captulo quiero explicar, aunque sea brevemente, lo que
puede suceder en la mezcla de dos sonidos simples si el equipo de sonido que los reproduce
presenta una distorsion significativa.
En un sentido amplio, distorsion es cualquier modificacion que sufre la senal de audio
al pasar por un sistema, como ocurre, por ejemplo, en un equipo de musica provisto de
ecualizador, donde la intensidad de las diferentes bandas de frecuencia puede ser ampli-
ficada a voluntad. De hecho, toda senal que pasa por un sistema que no sea idealmente
plano sufre algun tipo de distorsion, pues algunos componentes son amplificados mas
que otros. Por ejemplo, mediante un ecualizador, podemos reforzar la presencia de los
graves o de los mas agudos, o bien de los medios, y todo ello ocasionara modificacio-
nes en la forma de la vibracion y en la cualidad del sonido que omos. Sin embargo, en
otras ocasiones la alteracion de la importancia de las bandas de frecuencia puede ser un
problema, como cuando la acustica de una sala de conciertos refuerza en exceso unos
determinados componentes en detrimento de otros.
Pero ahora vamos a referirnos a la distorsion en un sentido mas limitado: aquellas de-
formaciones de la senal de audio que provocan la aparicion de nuevos componentes fre-
cuenciales que no estaban en la senal original. Esta distorsion es muy importante, pues

26
no se limita a tenir o matizar los componentes de la senal original, sino que introduce
en ella componentes espurios.
Cuando la senal de audio consta de un solo componente sinusoidal esta distorsion pro-
voca que surjan en la senal nuevos componentes que son armonicos del componente
original, por lo que recibe el nombre de distorsion armonica. Se llama armonica porque
los componentes que se introducen son armonicos del sonido simple original, es decir,
sus frecuencias son multiplos de este. Como veremos en el captulo dedicado al sonido
armonico, esto quiere decir que si el sonido original es un sonido simple de 220 Hz, por
ejemplo, el sonido resultante sera un sonido que, ademas de este componente original,
tendra otro u otros componentes cuyas frecuencias sean multiplos de la de ese compo-
nente original. Es decir, sera la suma del componente original de 220 Hz, mas otro en
440 Hz, y tal vez otro en 660 Hz, y as sucesivamente en funcion de la importancia de la
distorsion.
En el caso de que la senal de audio este compuesta por dos o mas sonidos simples, el
resultado de la senal distorsionada estara formada no solo por los armonicos correspon-
dientes a la distorsion de cada uno de los sonidos que intervienen en la mezcla, sino
tambien por nuevos componentes que seran la suma y la diferencia de las frecuencias de
los componentes originales. Esta distorsion recibe el nombre de distorsion de intermo-
dulacion y altera considerablemente la senal original, de tal modo que, a partir de cierto
nivel, dificulta seriamente la audicion de la musica.
Si bien las razones de esta distorsion exceden nuestro objetivo, a continuacion voy a
mostrar un caso particular de distorsion de intermodulacion, la cual ha dado lugar a que
en ocasiones se haya interpretado mal el fenomeno de la mezcla de dos sonidos simples.
Vamos a ver lo que puede suceder si el equipo reproductor presenta cierta cantidad de
distorsion cuando los dos componentes que se mezclan forman un intervalo de quinta
natural (3/2). En los vdeos de la figura 6 y de la figura 8 hemos podido apreciar que
ambos se oyen como una consonancia de quinta. Sin embargo ahora vamos a poder
experimentar que si el equipo presenta una distorsion relevante pueden ser odos como
si se tratara de un solo sonido cuya frecuencia fuera una octava mas grave que la del
mas grave de los dos componentes. He elegido este caso precisamente para mostrar hasta
que punto es facil confundir el resultado de un proceso producido por la distorsion con
una propiedad derivada de la mezcla entre sonidos.
En el vdeo que vamos a ver a continuacion se han mezclado dos componentes simples
cuyas frecuencias son de 440 Hz (la4 ) y 660 Hz (mi5 natural), ambos de igual ampli-
tud.

27
Figura 12: Vdeo que ilustra el efecto de la distorsion en la mezcla de dos sonidos simples.

En el osciloscopio podemos ver en color verde, en torno al valor de 0,4 la senal resultante
que omos y debajo, en color azul, centrada en el valor -0,4, la senal original tomada
como referencia para apreciar el efecto de la distorsion. Si nuestro reproductor de sonido
no distorsiona (en caso contrario igual es buena idea probar con unos auriculares), en
el primer caso debemos or dos notas consonantes muy bien mezcladas. Vemos en el
osciloscopio que la senal verde, la que estamos oyendo, y la senal azul, la original, son
totalmente identicas.
En el segundo caso, en el que artificialmente he provocado una distorsion de intermodu-
lacion, omos un solo sonido que esta a una octava mas grave que el la4 , es decir, omos
el la3 , pero con una cualidad sonora mas rica que la de un sonido simple. Si nos fijamos
en la forma de la vibracion (podemos parar el reproductor de vdeo) y comparamos la
senal resultante, ahora distorsionada, con la referencia original de color azul podremos
apreciar que la senal verde no es capaz de continuar hacia abajo cuando desciende, re-
produciendo el movimiento de la senal azul, sino que da lugar a una clara deformacion
respecto a la senal de referencia, la original. Esta deformacion provoca que la senal verde
no este ahora formada unicamente por los dos componentes originales, sino que tenga
nuevos componentes.
Los componentes mas destacados han sido los que resultan de la suma y de la diferencia
de los componentes reales: un componente en 1100 Hz y otro en 220 Hz. Luego, los que
son el doble de los originales: uno de 880 Hz y el otro de 1320 Hz. Si los reordenamos todos
sucesivamente nos encontramos con que tenemos los siguientes componentes: 220, 440,
660, 880, 1100, 1320. Como veremos en el captulo dedicado al sonido armonico, estos
componentes forman una serie armonica, pues todos ellos son los sucesivos multiplos
de 220 Hz. Y esta es la razon por la que ahora omos el la3 (220 Hz) como la nota
fundamental y no oigamos ya los dos componentes aislados, las notas la4 y mi5 formando
una consonancia.
En el tercer caso tenemos la misma situacion, pero ahora con una distorsion mucho mas

28
exagerada. Vemos que incluso los movimientos descendentes han sido transformados en
gran medida en ascendentes. El resultado es similar al anterior, solo que ahora todava
apreciamos una cualidad sonora mas plena. Esto explica por que, de una manera apa-
rentemente paradojica, la distorsion nos puede dar lugar a un resultado enganoso y nos
puede hacer pensar que la mezcla de dos componentes simples en relacion de quinta
ocasiona un nuevo sonido una octava mas baja. Este error aparece a veces incluso en
algun libro de texto y por ello me ha parecido oportuno explicarlo aqu.
Cuando lleguemos al captulo dedicado al analisis espectral podremos entender mejor
las causas de que la distorsion pueda alterar las propiedades de la mezcla de los sonidos,
ya que podremos observar con mas detalle los componentes espurios que surgen como
consecuencia de esta distorsion de intermodulacion.

9. Conclusion

En este captulo hemos podido experimentar que cuando dos sonidos simples suenan
simultaneamente se producen diferentes fenomenos acusticos y psicoacusticos, los cuales
dependen de la diferencia aritmetica entre sus frecuencias, de la anchura de la banda
crtica de nuestro odo en esas frecuencias y de la razon numerica que hay entre ellas.
Estos fenomenos, que fundamentan una parte importante de nuestro lenguaje musical,
pueden ser resumidos de la siguiente manera:
- Si los dos sonidos simples tienen la misma frecuencia, el resultado es un solo sonido sim-
ple de esa frecuencia, cuya amplitud depende no solo de la amplitud de sus componentes,
sino tambien del desfase que hay entre ellos.
- Si la diferencia aritmetica entre la frecuencia de los dos sonidos simples es menor de
unos 15 Hz, percibimos un solo sonido simple, cuya amplitud oscila sinusoidalmente
dando lugar a un efecto de tremolo (batidos de primer orden) y cuya frecuencia se situa
entre la de los dos componentes, aproximandose mas a la del que tiene mayor amplitud.
La frecuencia con la que se repite la oscilacion de la amplitud (el numero de batidos por
segundo) es la diferencia aritmetica entre las frecuencias de los dos sonidos componentes.
Estos batidos, al permitir determinar con precision la diferencia entre la frecuencia de los
dos componentes, posibilitan afinar con facilidad los instrumentos musicales y establecer
con exactitud los intervalos que dan lugar a las escalas.
- Cuando la diferencia aritmetica entre las frecuencias de los dos sonidos simples su-
pera aproximadamente los 15 Hz, nuestro sistema auditivo no puede seguir el ritmo de
los batidos y dejamos de percibir un solo sonido simple tremolado. Si esta diferencia
esta dentro de la anchura de la banda crtica correspondiente a esa zona frecuencial,
omos un sonido aspero y rugoso, a modo de zumbido, en el que no podemos distinguir
individualmente los dos componentes. Cuando esta diferencia se aproxima al lmite de la
anchura de la banda crtica, aunque la cualidad del sonido siga siendo rugosa, progresi-
vamente pasamos a reconocer los dos componentes individuales. Y cuando la diferencia

29
supera con cierta holgura esa anchura de la banda crtica desaparece la sensacion de
rugosidad y percibimos ya ntidamente los dos componentes por separado.
- Cuando las frecuencias de los dos sonidos simples mantienen una relacion de conmen-
surabilidad proxima (razones entre los primeros numeros enteros positivos), la mezcla
sonora resultante es periodica y la forma de la vibracion es lo suficientemente sencilla
como para que nuestro sistema auditivo pueda reconocer las coincidencias periodicas en-
tre los dos componentes. A consecuencia de ello, si las frecuencias de estos componentes
superan la anchura de la banda crtica, percibimos una sensacion de buena mezcla que
explica la consonancia musical entre dos sonidos simples.
- Cuando las frecuencias de los dos sonidos simples se alejan ligeramente de una razon de
conmensurabilidad proxima, percibimos un cambio periodico en la cualidad de la mezcla
resultante (batidos de segundo orden). A diferencia de los batidos de primer orden, los
batidos de segundo orden no son el resultado de una oscilacion de la amplitud, sino que
se producen porque nuestro sistema auditivo es capaz de reconocer cambios cclicos en
la forma de la vibracion.
- La distorsion de intermodulacion puede dar lugar a una mala interpretacion de los
resultados de la mezcla de sonidos.

30

You might also like